當地時間3月7日消息,在遭遇多次挫折之後,微軟消費者人工智能部門負責人穆斯塔法·蘇萊曼(Mustafa
Suleyman)似乎正在穩步推動微軟降低對OpenAI的依賴程度。知情人士透露,微軟正在自主研發人工智能推理模型,旨在與OpenAI展開競爭,並計劃將這些模型推向市場,供開發者使用。
知情人士稱,2024年秋季,蘇萊曼在與OpenAI高層的視頻會議中,針對雙方技術協作機製提出了質疑。此次會議焦點集中於OpenAI最新研發的o1大模型底層邏輯透明度問題——蘇萊曼要求OpenAI技術團隊提供該模型“思維鏈”(Chain-of-Thought)的具體實現文檔,但未能獲得令其滿意的結果。
根據微軟之前與OpenAI達成的戰略協議,微軟130億美元的戰略投資不僅獲得OpenAI技術成果的優先使用權,更包含核心算法的共享權益。此次會議因OpenAI未能履行協議中的技術透明條款而提前終止,直接暴露出雙方在人工智能核心技術控製權上的深層矛盾。
作為微軟人工智能戰略的掌舵者,蘇萊曼自2024年3月履職以來始終麵臨雙重使命的平衡難題:微軟既需要保持與OpenAI的深度協同,確保其技術紅利持續反哺微軟產品矩陣,同時又需加速自研AI技術的突破,減少對OpenAI的技術依賴。
自研模型
據知情人士透露,蘇萊曼的副手卡倫.西蒙尼揚(Karén
Simonyan)率領的團隊,近期完成了微軟內部代號MAI的係列模型的訓練工作。在通用基準測試中,這些模型的表現幾乎與OpenAI和Anthropic的先進模型不相上下。該團隊同時還在訓練推理模型,這些模型運用“思維鏈”技術來解決問題,未來極有可能與OpenAI的模型形成直接競爭態勢。
蘇萊曼團隊已著手在微軟的Copilot中嚐試替換OpenAI的模型,轉而采用性能更為強勁的MAI模型。據知情人士透露,微軟計劃於今年晚些時候將MAI模型作為應用程序接口(API)予以發布,讓外部開發者能夠將其集成至各自的應用程序中。這一計劃此前從未被公開披露過,這意味著微軟的模型將與OpenAI及其他人工智能實驗室的API產品展開直麵競爭。
在蘇萊曼的統籌指導下,微軟還通過測試OpenAI競爭對手的模型,進一步推進風險分散策略。這些模型涵蓋了Anthropic和埃隆·馬斯克(Elon
Musk)的xAI,以及DeepSeek和Meta的開源模型。它們將被用於支持Copilot——微軟內置於Windows、Edge瀏覽器及其他產品中的人工智能工具,而目前這些工具主要依賴OpenAI的技術。蘇萊曼在一次采訪中表示:“這是一個充滿激烈競爭與強大創造力的時代。我們正在幕後測試幾乎所有主要實驗室的模型,包括全部開源模型。我們對它們進行測試與實驗,這一情況並非此前任何人所預料到的。”
目前,尚無法確定蘇萊曼這位人工智能領域的明星人物,能否成功助力微軟實現人工智能領域的自給自足。盡管西蒙尼揚團隊對MAI模型的性能頗為自信,但這些模型既未公開發布,也未在微軟內部廣泛應用,因此其實際質量難以評估。知情人士透露,MAI模型的訓練曆時近一年,期間遭遇了技術難題、戰略調整以及核心人才流失等問題。部分核心人才的離職,源於他們對蘇萊曼的管理方式和技術路線存在分歧。與此同時,OpenAI已完成多批尖端模型的訓練與發布。
這些挫折致使一些外部人士對蘇萊曼能否達成其宏偉戰略持懷疑態度。風險投資家、專注於人工智能初創企業投資的納撒尼爾.貝納奇(Nathan
Benaich)表示:“從外部視角來看,目前仍不清楚在蘇萊曼領導下,這個團隊過去一年取得了哪些實質性成果。他們需要讓Copilot成為ChatGPT的有力競爭者,但我並不明晰他們將如何達成這一目標,也不清楚他們除了緊跟OpenAI的步伐外,是否還有其他獨特策略。”
對微軟而言,在人工智能領域的投入至關重要。微軟在今年2月向股東披露,其所有業務中與人工智能相關的年化營收已超130億美元,相較於3個月前100億美元的年化營收有了顯著增長。其中,大部分收入來自微軟Azure雲計算部門,包括OpenAI對Azure的大量使用,以及麵向企業客戶、基於OpenAI技術的Office
365產品和開發者工具(如 GitHub
Copilot),而這些業務並不在蘇萊曼的職責範圍內。相反,他的職責範疇主要集中在微軟的消費級應用領域,如必應和Windows。
不過蘇萊曼認為,他的核心目標是為微軟在未來十年實現人工智能自給自足奠定堅實基礎,而非著眼於短期成果。盡管他所負責的業務在微軟整體業務中占比較小,但其管理的產品可能對公司未來發展產生深遠影響。蘇萊曼指出:“我們在微軟人工智能部門真正需要達成的,並非過度關注今明兩年的業績,而是要著眼於未來十年的長遠發展。我們必須確保公司能夠在內部構建出全球最卓越的模型,並與各界攜手合作,共同推動技術進步。”
空降微軟
2023年底,蘇萊曼加入微軟。在此之前,他與OpenAI曾有一段“驚險”的過往。彼時,OpenAI瀕臨崩潰邊緣,其非營利性董事會解雇了首席執行官山姆.奧特曼(Sam
Altman)。這一動蕩局麵令微軟深感不安,畢竟微軟在當年年初才剛推出基於OpenAI技術的必應聊天機器人,且對與OpenAI的後續合作有著宏偉規劃。幾周之後,OpenAI重新聘用奧特曼,大部分反對他的董事會成員也相繼辭職,這才讓微軟稍稍鬆了一口氣。
然而,微軟董事會依舊對這種動蕩狀況心存憂慮,進而向微軟首席執行官薩提亞.納德拉(Satya
Nadella)施壓,要求其調整公司的人工智能戰略,不能再完全依賴OpenAI。數月後,納德拉聘請了蘇萊曼。蘇萊曼是人工智能領域的先驅人物,他是穀歌2014年收購的人工智能初創公司DeepMind的聯合創始人。蘇萊曼從自己創辦的創業公司Inflection
AI加入微軟,入職時還帶來了一份價值6.5億美元的許可協議,使微軟能夠獲取Inflection的技術。
蘇萊曼迅速對微軟內部的人工智能團隊進行重組,將原本分散於不同項目的團隊整合為一個全新的模型開發部門,由他的聯合創始人、Inflection的首席科學官西蒙尼揚負責領導。他新組建的團隊中,還包括時任必應首席執行官的米哈伊爾.巴拉金(Mikhail
Parakhin),巴拉金此前負責將OpenAI的產品整合到搜索引擎中。
在納德拉的支持下,蘇萊曼從其他部門調配了多名工程師,其中就有之前負責微軟小型語言模型Phi家族的研究團隊成員。其他部門的高管,比如曾領導開發早期必應模型的索拉布.蒂瓦裏(Saurabh
Tiwary),以及負責Phi項目的Azure高管米沙.比倫科(Misha Bilenko),也開始向蘇萊曼匯報工作。
不過,整合這些分散的人工智能團隊並非易事。2024年3月底,蘇萊曼加入微軟僅僅幾周後,巴拉金便因失去對必應業務的控製權而辭職。幾周之後,巴拉金似乎在公開場合表達了對蘇萊曼的不滿。在蘇萊曼發表關於人工智能對人類安全風險的TED演講後,一些批評者對他的觀點提出質疑,風險投資公司安德森.霍洛維茨基金的合夥人馬丁.卡薩多(Martin
Casado)便是其中之一,他在社交媒體平台X上稱這些言論 “徹頭徹尾的胡說八道”。
此後,微軟持續出現人才流失現象。2024年8月,比倫科和蒂瓦裏都離開微軟,加入了穀歌的DeepMind部門。與此同時,一些必應工程師對蘇萊曼的管理方式頗有微詞,認為身為企業家和高管的蘇萊曼,不像前任巴拉金那般關注人工智能開發的具體細節。巴拉金過去會定期與工程師開會審查代碼,而蘇萊曼采取了不同做法。
蘇萊曼目前每月舉行一次全員會議,向團隊成員傳達他設定的優先事項以及對人工智能行業的看法,並且每兩周組織一次10到20人的小組討論會。據知情人士透露,這些會議在製定組織整體議程方麵頗有助益,但討論內容常常涉及非技術性話題,例如員工的業餘愛好。最近,蘇萊曼開展了一係列引人注目的招聘行動,包括今年早些時候從穀歌DeepMind招募了四名前研究人員。
挑戰與進展
在蘇萊曼加入微軟之前,微軟在開發自有人工智能模型方麵已取得一定進展,這些模型未來有望取代OpenAI的模型。其中,Phi模型最為突出,它由側重於學術研究領域的微軟研究部門(Microsoft
Research)於2023年首次開發。
微軟的研究人員借助OpenAI的技術生成所謂的合成數據,以此來訓練Phi模型。因而,Phi模型僅需消耗OpenAI技術所需算力和成本的一小部分,就能達到與OpenAI模型相近的性能。微軟很快便開始在其Copilot產品中,用Phi模型替換部分OpenAI模型,以此節省成本,同時在Azure雲計算平台上向開發者提供Phi模型。
蘇萊曼加入微軟後,Phi模型的主要研究員塞巴斯蒂安.布貝克(Sébastien
Bubeck)開始直接向他匯報工作。在蘇萊曼的指導下,布貝克著手將自己的AI訓練方法應用於類似OpenAI的大模型,這些大模型旨在處理Phi模型及小模型難以勝任的更為複雜的任務。
據兩位參與該項目的人士透露,在蘇萊曼的領導下,Phi團隊迅速獲得了比在微軟研究部門時規模更大的計算機集群,用於訓練新模型。然而,更多的算力資源並未助力該團隊取得預期成果。據參與項目的人士稱,該團隊至少有三次針對大模型的訓練,每次耗費數百萬美元,但結果均不理想。這些模型產生虛假或誤導性結果(即幻覺)的比例頗高,且在提供簡潔答案方麵,不如OpenAI的模型可靠。蘇萊曼和西蒙尼揚認為,這些問題源於布貝克運用AI生成數據訓練Phi模型的方法;而布貝克認為問題出在訓練過程的後期階段。
到了2024年9月,布貝克離開了蘇萊曼的團隊,重回微軟研究部門。他向同事表示,該團隊計劃繼續訓練比之前版本至少大五倍的Phi模型。此後,微軟研究團隊持續發布Phi模型的更新版本。到了10月,布貝克離開了微軟,加入OpenAI。據兩位參與相關項目的人士稱,在OpenAI,他繼續使用合成數據訓練模型,還從微軟挖走了多名前研究員。
布貝克離開微軟前後,蘇萊曼對OpenAI的不滿日益加劇。後者開發出o1模型,能夠通過較長時間的響應,更為精準地解決數學和邏輯問題。然而,OpenAI不允許微軟查看o1推理過程中的
“思維鏈”,這使得蘇萊曼及其團隊難以在微軟自身的AI模型中複製相關編程。
即便麵臨這樣的阻礙,蘇萊曼的AI團隊在後續幾個月中,仍成功複現了OpenAI的部分成果。由西蒙尼揚領導的模型訓練團隊開始運用
“思維鏈” 推理方法,以此提升輸出質量,這一舉措助力他們克服了模型訓練數據所帶來的挑戰。
但OpenAI並未停止前進的腳步。其模型的發展速度超過了微軟。在過去兩個月裏,OpenAI發布了o3的預覽版,這是一款更為強大的推理模型,此外還推出了迄今為止規模最大的模型GPT-4.5。微軟通過自主開發的模式能否追上OpenAI的步伐,仍有待進一步觀察。