華為重大發布:將重塑千行百業!

來源: 21世紀經濟報道 2023-07-08 00:23:54 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (9083 bytes)

作 者丨倪雨晴 , 畢永豪

編 輯丨駱一帆 , 陳思穎

圖 源丨圖蟲

2023 年,大模型的大競爭時代開啟,目前全球已經有數百個大模型亮相,而戰場上的主角們還在不斷進化。

7 月 7 日,在華為開發者大會 2023(Cloud)上,華為雲發布了盤古大模型 3.0 版本。華為常務董事、華為雲 CEO 張平安表示,盤古大模型 " 不作詩,隻做事 ",將重塑千行百業

事實上,華為對大模型的探索很早就開啟,2019 年 ~2020 年,盤古大模型就已在華為雲內部立項,並且完成了與合作夥伴、高校的合作搭建。2021 年 4 月,華為雲盤古大模型正式對外發布。

從盤古大模型麵世之初,就主要麵向盤古大模型 3.0 是一個麵向行業的大模型係列,包括"5+N+X" 三層架構,分別是基礎大模型、行業大模型、專用大模型

2021 年,盤古的多模態大模型、科學計算大模型還在規劃中,如今的 3.0 版本,盤古的大模型體係已經頗為豐富。不僅從基礎通用大模型發展出行業大模型,還針對細分場景提供更細致的大模型服務。

張平安在會後接受 21 世紀經濟報道等媒體采訪時表示,對於盤古大模型的下一步計劃,內部有非常激進的 roadmap(路線圖)。在盤古大模型的發展上,有團隊在研究有更多參數讓 AI 大模型發展更好,也有團隊在研究將參數通過量化,以更少的算力需求來滿足服務。另外更重要的是,現在華為雲已經在鐵路、煤礦、金融等行業裏做了模型,在行業的垂直深度還要更深一些。

盤古大模型 3.0 來了

張平安介紹道,最新版本的盤古大模型共有三層架構。其一為基礎大模型(L0 層),主要提供通用技能,支撐企業各類應用,具體包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型。

在參數方麵,盤古 3.0 提供 100 億參數、380 億參數、710 參數和 1000 億參數的係列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。

同時,大模型也提供一致的能力集,包括 NLP 大模型的知識問答、文案生成、代碼生成以及多模態大模型的圖像生成、圖像理解等能力,這些技能都可以直接調用。

對於基礎大模型的煉成,華為的技術專家在會上指出,盤古大模型的特色是可伸縮、高可擴展的稀疏 - 稠密語言大模型,在數據訓練方麵,預訓練數據超過 3 萬億個 token(AI 大模型的數據單位),指令微調數據的規模在千萬級。

基礎大模型之外,第二層架構是 N 個行業大模型(L1 層),華為雲既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,製造,礦山,氣象等大模型;也可以基於行業客戶的自有數據,在盤古大模型的 L0 和 L1 層上,為客戶訓練自己的專有大模型。

在此基礎上,華為雲還提供了大模型行業開發套件,通過對客戶自有數據的二次訓練,客戶就可以擁有自己的專屬行業大模型。同時,根據數據安全與合規訴求,盤古大模型還提供了公用雲、大模型雲專區、混合雲多樣化的部署形態。

華為雲人工智能領域首席科學家、國際歐亞科學院院士、IEEE/CAAI Fellow 田奇談道,通用大模型在落地行業上麵臨三大挑戰,分別是知識雖多、價值挖掘快但數據安全難保障、通用性強但專業性弱。

而盤古大模型通過分層解耦架構從而更好應用到千行百業,從基礎大模型迭代出行業大模型。田奇表示,實現行業大模型有四大關鍵舉措,分別是沉澱行業知識、淬煉行業技能、對話專業工具和保障安全合規

行業大模型之上就是 N 個專用大模型(L2 層),提供了更多細化場景的模型。比如,更加專注於政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、台風路徑預測等具體行業應用或特定業務場景,提供 " 開箱即用 " 的模型服務。

而大模型的發展離不開算力,在大會上,華為雲宣布推出昇騰 AI 雲服務,並在烏蘭察布和貴安同時上線。據悉,昇騰 AI 雲服務可以提供更長穩的 AI 算力服務,達到每秒 200 億億次浮點運算能力,千卡訓練 30 天長穩率達到 90%,斷點恢複時長不超過 10 分鍾。

張平安表示,華為要構建 AI 算力的另一極," 現在有數百個項目在排隊,算力都來不及建設,GPU 價格高、交貨周期很長,中國算力緊缺,滿足不了需求。華為首先在中國先立足和紮根,滿足中國行業客戶的需求,立誌成為算力的另一極。"

行業大模型深入應用

事實上在 OpenAI 引爆熱潮之前,華為等大企業就已經在鑽研 AI 大模型,此前幾年大模型在學術界早就是熱門話題,2023 年才徹底引燃大眾市場。

對於華為而言,人工智能自然是必爭之地,雲、計算都是華為升級轉型的重要方向。一方麵,華為雲盤古大模型並非今年才進入市場,而是已經曆經迭代根據業務的需求發展而來,並且已經形成一個係列。

另一方麵,需要指出的是,盤古大模型和 ChatGPT 並非在一個賽場,它們屬於兩個概念。ChatGPT 是 GPT 係列大模型的一個應用場景,可以直接麵向 C 用戶群體,而盤古大模型的應用場景更多聚焦在 B 端的千行百業,華為本身 B 端起家,在產業端有天然的優勢和稟賦。

此前,田奇向 21 世紀經濟報道記者表示:"AI 是華為雲的核心競爭力之一,我們持續在 AI 領域投入研發,大模型是 AI 的重要技術方向。未來三年,我們認為將會是大模型是風起雲湧的三年,AI 將會和各行各業深度結合,AI for industries 將是我們的主要方向。"

目前,盤古大模型已在政務、金融、製造、煤礦、鐵路、製藥、氣象等諸多領域進行深耕。比如在政務領域,華為雲攜手深圳市福田區政務服務數據管理局,上線了基於盤古政務大模型的福田政務智慧助手。在煤礦領域,盤古礦山大模型已經在全國 8 個礦井規模使用,一個大模型可以覆蓋 1000 多個細分業務場景。

在製造領域,過去單產線製定器件分配計劃,往往要花費 3 個小時以上才能做齊 1 天的生產計劃。盤古製造大模型學習了華為產線上各種器件數據、業務流程及規則以後,能夠對業務需求進行準確的意圖理解,並調用天籌 AI 求解器插件,1 分鍾即可做出未來 3 天的生產計劃。

在氣象領域,盤古氣象大模型是首個精度超過傳統數值預報方法的 AI 預測模型,同時預測速度也有大幅提升。原來預測一個台風未來 10 天的路徑,需要在 3000 台服務器的高性能計算機集群上花費 5 小時進行仿真。現在基於預訓練的盤古氣象大模型,通過 AI 推理的方式,研究者隻需單台服務器上單卡配置,10 秒內就可以獲得更精確的預測結果。

7 月 6 日,國際頂級學術期刊《自然》 ( Nature ) 雜誌正刊發表了華為雲盤古大模型研發團隊研究成果——《三維神經網絡用於精準中期全球天氣預報》(《Accurate medium-range global weather forecasting with 3D neural networks》)。數據顯示,這是近年來中國科技公司首篇作為唯一署名單位發表的《自然》正刊論文。

眼下,國內外的巨頭們都已經在大模型賽場上落子,隨著 AI 產業 "iPhone 時刻 " 的到來,AI 如何融合產業進行升級變革、如何進行商用也將備受關注,產業界也更加期待中小開發者們也像雨後春筍一樣湧現,構建起更完善的 AI 生態。

大模型成為 WAIC 最火關鍵詞

7 月 6 日至 8 日,2023 世界人工智能大會(WAIC)在上海舉辦。本屆大會聚焦科學前沿和產業發展,首次設置 " 邁向通用人工智能 " 主題展區,集中展示國內外總計 30 多款大模型,大模型成為今年 WAIC 的最火關鍵詞。

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”