11月16日,知情人士向觀察者網透露,華為將於下周發布AI領域突破性技術成果,有望解決算力資源利用效率難題。據透露,該技術延續
“以軟件補硬件”
的創新思路,可將GPU、NPU等算力資源利用率從行業平均30%-40%大幅提升至70%,顯著釋放算力硬件潛能。
該知情人士提到,華為這項新技術將對標英偉達2024年底收購的以色列公司Run:
ai的核心技術,旨在通過軟件創新,實現英偉達、昇騰以及其他三方算力的統一資源管理與利用,屏蔽算力硬件差異,為AI訓練推理提供更高效的資源支撐。
2024年12月,英偉達宣布以7億美元(約合人民幣51億元)價格,收購2018年成立的以色列公司Run:ai。過去7年,這家公司做的產品隻圍繞一件事——怎麽高效使用GPU,比如提供業務看板、GPU權限分配、任務分配等等直觀可視化操作工具,本質是在做GPU的“數據產品經理”。
對於有雄厚研發實力和AI積累的大公司來說,這樣的內部工具自研可能並不是問題,但對於中小規模、非AI行業的用戶來說,Run:ai這套技術卻很關鍵。
彼時有媒體報道,Run:ai的用戶包括全球打印機巨頭斑馬技術、用端到端技術一鳴驚人的自動駕駛公司Wayve、倫敦醫學影像與人工智能中心等等。其中Wayve通過Run:ai提供的工具,將原先不足25%的GPU集群效率,提升到80%以上。
在收購的同時,英偉達還宣布開源Run:ai的所有平台技術,買英偉達GPU就能免費用。
黃仁勳這麽做的原因,是因為英偉達在AI芯片領域占據壟斷地位,控製著高端GPU市場80%的份額,幾乎100%的AI計算份額,且一直在尋求構建產品+生態的立體優勢。
長期以來,黃仁勳和英偉達一直想做的,就是AI行業的垂直整合,從芯片到工具再到軟件應用,打造一個能滿足任何AI用戶的一站式商店,讓客戶對其生態形成依賴。
然而,對當下中國來說,恰恰要避免對英偉達的過度依賴,尤其是在先進製程受限、單卡算力存在劣勢的情況下,國內產業界更需要“係統補單點”、“軟件補硬件”,支撐AI產業發展。
今年以來,華為曾推出多項關鍵技術,彌補芯片方麵的短板。比如昇騰384超節點,該技術發揮華為在通信、存儲和基礎軟件等方麵的大雜燴優勢,突破了互聯瓶頸,實現了算力規模的趕超。再比如華為前不久開源的UCM(Unified
Cache Manager)推理記憶數據管理技術,充分利用了不同存儲介質的特性,降低AI推理對高端HBM的依賴,還能平衡成本。
AI是一項係統工程,算力更是一個高成本的代表。在中國先進芯片受限的情況下,華為即將發布的新技術,將如何提升算力資源利用的效率,無疑值得關注。
