正文

剛剛,Gemini「靈魂人物」官宣加盟xAI!馬斯克火速轉推背書

(2025-09-21 02:40:53) 下一個

https://mp.weixin.qq.com/s/iUZiBp6602BLqAMNVD5U6A

新智元導讀】Gemini核心開發者Dustin Tran昨日官宣跳槽xAI!馬斯克也已轉發推文確認。在穀歌的8年,從Gemini 1到最新尚未公布的Gemini,背後都有他的身影。他的到來,能為Grok帶來哪些變化?

Gemini核心開發者Dustin Tran,昨天官宣從穀歌DeepMind跳槽到xAI,研發新一代Grok!

馬斯克也於第一時間轉發推文,確認了這位新同事的加盟xAI消息屬實:

從官宣中得知,Dustin Tran已經加入xAI至少幾周了,參與了Grok 4 Fast的開發,但直到今天才修改自己的對外頭銜介紹,甚至慢於馬斯克轉發推文。

這也被眼尖的網友發現並調侃了:

Dustin Tran的新同事,xAI創始成員,同時也是之前從穀歌DeepMind跳槽過來的Toby Pohlen,也於第一時間轉發推文歡迎新同事:

也有網友關心競業條款帶來的限製:

加州禁止競業條款,得以讓人才能在公司間自由流動,這也被普遍認為是加州的創新活力源泉的重要保障。

圖片
Dustin Tran,Gemini核心開發者

Dustin Tran,是Gemini從誕生之初到最新模型的核心開發者。

2014年,他畢業於加州大學伯克利分校,取得數學與統計本科學位,隨後進入哈佛大學攻讀統計學博士學位,兩年後又轉入哥倫比亞大學攻讀計算機科學博士,並於2018年取得了博士學位。

他目前的論文總引用量已超過2.4萬。

他也在讀博期間斬獲了包括穀歌博士獎學金在內的多項大獎:

他的工作履曆相當簡潔:2017年在OpenAI研究崗實習,同一年進入穀歌大腦研究崗實習並留任長達8年。

在官宣離職的長推文中,他飽含深情地回顧了在穀歌的8年工作,從混沌中摸索出霸榜的Gemini的心路曆程,以及因為xAI的海量算力而選擇加入xAI:

我正式告別穀歌DeepMind,結束了8年的旅程。這一路有滿滿的美好回憶從最早在穀歌大腦參與一些奠基性的論文(和 @noamshazeer、@ashvaswani、@lukaszkaiser 一起做 Image Transformer、Tensor2Tensor、Mesh TensorFlow),到後來負責Gemini的後訓練評測,在100天內追趕並上線;接著帶領團隊實現躍升,拿下LMArena第一(並穩居榜首一年多!);最後還參與了Gemini在IMO和ICPC上斬獲金牌的推理創新(和 @HengTze、@quocleix 一起)。

Gemini的旅程跌宕起伏,不斷經曆範式的轉變:最初,我們改造了LaMDA模型(第一個類指令式的聊天機器人!),讓它從單純的聊天機器人進化為能通過RLHF給出更長、更有內容的回答;之後,我們探索通過長鏈條思維訓練、新穎環境和獎勵頭來增強推理和深度思考能力。剛開始時,外界普遍並不看好,很多人覺得穀歌會因為搜索的曆史包袱和內部政治而注定失敗。但如今,Gemini不僅在用戶偏好上長期穩居第一,還不斷推動新的科學突破,大家反而覺得穀歌贏是理所當然的 ????。(以前每次穀歌有新成果時,OpenAI 總會靠積壓的想法先一步發布,從而搶占 AI 的新聞周期;但可以說,他們的「庫存」如今已經耗盡了。)

之後我加入了xAI。秘訣其實很清楚:算力、數據,以及大約 O(100) 個聰明又拚命努力的人,這就是拿下前沿級大語言模型所需的一切。xAI對此 真的 深信不疑。在算力方麵,即使在穀歌,我也從沒見過這種「人均芯片」的規模(而且Colossus 2上還有10 萬+的GB200/30 萬+的GB300即將到來)。在數據方麵,Grok 4做出了RL和後訓練規模化的最大押注。xAI現在則在數據擴展、深度思考和訓練配方上下注。團隊行動也極其迅速在這麽短的時間裏,沒有任何一家公司能在AI能力上達到 xAI 現在的水平。正如@elonmusk 所說,一家公司的一階和二階導數才是最關鍵的:xAI的發展勢頭是最快的。

我很興奮地宣布,在加入的頭幾周,我們就推出了Grok 4 Fast。Grok 4是一個出色的推理模型,依然在ARC-AGI和新基準(如FinSearchComp)上排名第一。但它運行較慢,本來也不是麵向通用用戶需求的。而Grok 4 Fast則是最好的輕量級模型之一在LMArena上排名第 8(Gemini 2.5 Flash是第 18!),在核心推理評測(如 AIME)上,它能與Grok 4比肩,同時成本卻低15倍。特別感謝 @LiTianleli、@jinyilll、@ag_i_2211、@s_tworkowski、@keirp1、@yuhu_ai_。

Gemini如今取得如此亮眼的成績,也讓我們對Dustin Tran能為Grok 5帶來的驚喜多了一份期待。

圖片
Colossus 2的海量算力
召喚一個強大的Grok 5

我們在此前的文章中,也對馬斯克在緊鑼密鼓地建設中的Colossus 2進行了詳細剖析:馬斯克狂燒14萬億,5000萬H100算力五年上線!終極爆衝數十億

Colossus 2的海量算力,體現著馬斯克毫不掩飾的野心:實現AGI乃至ASI,是Grok 5乃至xAI更後麵的模型要追求的目標。

馬斯克作為世界首富,要用天文數字般的算力,讓所有對手望而卻步。

最頂級的算力,吸引了最頂級的人才。

建設斷檔式強大AI的所有生產要素,馬斯克一樣也不想落下。

讓我們拭目以待,Dustin Tran的加盟,能為我們帶來多麽強大的Grok 5。

[ 打印 ]
評論
目前還沒有任何評論
登錄後才可評論.