俗話說得好,欲練神功,必先自宮。
為了應付接下來的車企混戰,馬斯克提刀就往自己身上砍?
就在幾天前,彭博社報道了一則消息,說特斯拉突然叫停了研發六年的芯片項目 Dojo ,這是連命根子都不要了啊。
不僅工作全部白幹,而且整個研發團隊也直接作鳥獸散。
項目負責人彼得·班農原地辭職,還有約 20 名工程師也早已提桶跑路,投奔一家名為 DensityAI 的初創公司去了。
巧的是,這家公司的老板正是在 2021 年首次發布 Dojo 芯片的前特斯拉總監,加內什·文卡塔拉馬南。
可以說,特斯拉裁員裁出了一家公司。。。
而於此同時,留在特斯拉的,就隻剩一地雞毛。
甚至有消息說,連 Dojo
的專利都不在特斯拉自己手上,以後想再繼續幹也沒有機會了。
呃,這確實有點出人意料。
畢竟 Dojo 這玩意兒剛出來的時候,大家都還寄予了厚望。
眾所周知,特斯拉智駕的特點是純視覺算法,這個方案雖然上限很高,但下限也很低,關鍵就看算法的能力,而因為端到端架構,你要迭代算法,靠的就隻有沒日沒夜的訓練。
特斯拉開啟 Dojo 項目的初衷,就是奔著訓練來的,如果它做成了,就能讓特斯拉 FSD
直接封神。
要知道,過去給智駕做訓練的 GPU ,並不是為深度學習訓練而設計的,而這個 Dojo 通過分布式 2D
架構,解決了高帶寬和低延遲的問題,並且通過存算一體的設計,讓訓練的能效也更高。
這麽一來,相比市場上主流的英偉達A100 , Dojo 在相同成本下的性能可以達到它的 4
倍。這對特斯拉來說,不僅能更好的訓練智駕,還能打破英偉達在芯片上的壟斷,讓特斯拉成為真正的人工智能企業。
所以對於這個 Dojo ,老馬認為它是 “ 實現完全自動駕駛的關鍵 ” ,摩根士丹利也預測, Dojo 將會給特斯拉帶來
5000 億美元的市值增長。
但結果呢?上個月還說 Dojo 2 量產倒計時,現在說沒就沒,就有點搞人心態了啊。
很多人會覺得,是不是特斯拉開始走下坡路了?為了省錢,連自己最關鍵的芯片業務也要裁?
脖子哥認為,確實有一部分原因,如今的特斯拉,真不比當年。
咱們打開財報咱們就知道,今年 Q1 和 Q2 季度,特斯拉最關鍵的營收指標開始下滑,同比分別減少了 9.23% 和 11.78
% 。
而在這背後的銷量數據就更是雪崩, 7 月份,特斯拉全球齊跌,在英國同比暴跌 60% ,德國則下滑 55.1%
,甚至在基本盤的中國也達不到過去的熱度。
但是吧,特斯拉還遠遠沒到山窮水盡的地步。前幾天,它還花了 43
億美元買LG的磷酸鐵鋰電池,甚至還用 165 億美元定了三星的芯片單子。
區區十幾億的 Dojo ,特斯拉完全還是投的起的。
那要問背後原因是啥,老馬其實自個兒就發帖說了,這麽做主要是因為“ 沒有必要分散資源同時開發兩種不同 AI 芯片
”。
沒錯,目前特斯拉確實是有兩條芯片研發路線。一條是它的 HW
係列(Hardware,真不是華為),用在特斯拉的汽車上,另一條就是這個 Dojo ,是用在智駕訓練上。
過去這是完全不同的兩條平行線,但這次的 AI6(HW 6.0)明顯有點超預期了,顯著提升了算力和帶寬,不僅能做 FSD
的終端芯片,也可以用於智駕訓練,Dojo 存在的必要性就被打上了問號。
按老馬的性格,肯定不會把錢和精力浪費在毫無意義的地方。
當然,還有一個原因就是,Dojo 的研發進度確實不盡如人意。目前 Dojo 2 還沒量產,而
Dojo 1 也因為性能缺陷,成本奇高,基本沒啥市場競爭力。
所以和更成熟的 HW 芯片相比,老馬毫無疑問砍掉了根本看不到前景的 Dojo 。
不過呢,你要說 Dojo 從一開始就是一個錯誤嗎?我真覺得未必。
馬斯克其實看得很透徹,他曾公開表態 “ 我認為 Dojo 的前景渺茫。但值得一試,因為回報可能非常高。”
說白了,有點賭狗的意思。
但這場豪賭並不是沒道理的,咱們得結合當時情境,從頭開始說起。
最早,特斯拉隻有 HW 芯片,而且 1.0 版本用的還是 Mobileye 的全套產品。
但問題是,當時的 Mobileye
隻是一個黑盒,不允許特斯拉參與修改算法,也不能共享數據,甚至功能也偏向保守,和特斯拉的理念實在合不來。
最終由於 2016 年發生的 Model S 智駕事故,讓特斯拉下定決心分手,結局不歡而散。
我估計是因為這次和 Mobileye
的失敗合作,讓老馬就看清了一件事:和別人合作永遠做不了自己想做的事,自研才是唯一的出路。
所以在此之後,特斯拉先是自研智駕,芯片用英偉達過渡了幾年以後,到 2019 年,HW3.0 就開始走自研路線了。
之後的 HW4.0、HW5.0 ,也就是現在說的
AI4、AI5,其實也都是特斯拉做的框架設計、神經網絡優化和係統集成,隻是利用了三星和台積電的工藝進行生產。
總之在智駕芯片上,老馬踢掉了老黃,很快嚐到了自研芯片的甜頭。
隨後老馬很快又把矛頭轉向智駕訓練。不過,因為 HW 的分離式內存架構更適合推理,而非訓練,老馬必須另起爐灶。
於是在 2019 年,馬斯克在特斯拉自動駕駛日上,提出用 Dojo 來訓練自動駕駛。隨後,在 2021 年的 AI DAY
上,特斯拉就實現了 Dojo 超算的核心——7nm 的 D1 芯片(還是這個老哥)。
這裏大夥兒可能比較迷糊,馬斯克把 Dojo 稱為超級計算機,那和這個 D1 芯片有啥關係呢?
咱們可以這麽來理解,其實 Dojo 就是一個體係森嚴的算力盒子,從低到高分為內核、芯片、瓦片、模組、機櫃和
ExaPOD。
一塊 D1 芯片,其實是由 354 個核心(CPU)組成,而 25 個 D1 芯片,則組成一個瓦片,6 個瓦片就是一個模組,2
個模組是 1 個機櫃, 10 個機櫃是 1 個 ExaPOD 訓練集群,最終算力能達到 1.1 EFLOP 。
總之呢,從 D1 芯片到最後的訓練集群,其實並沒有那麽簡單。
2021 年特斯拉隻是展示了 D1 芯片和瓦片,而後一年,才安裝了首個機櫃,當時的目標,是在 2023 年建成七台 ExaPOD
。
然而很快,到 2023 年馬斯克才發現,Dojo
並沒有那麽十全十美,反而有可能將訓練成本提高十倍以上,成功的可能性並不高。
但此時,老馬的賭性占據了上風,開始左腦互搏右腦了。。。
隨後特斯拉不僅繼續砸重金去做 Dojo ,動輒好幾億美元,而且還接連提出了 Dojo 1.5、Dojo 2 和 Dojo 3
,要真正實現 Dojo ,幾乎是個無底洞。
然而結果呢,老馬斥巨資打造的 Dojo 超算,性能也隻和英偉達 H100 係統相當,於是隻能把希望寄托在了 Dojo 2
上。
相比 Dojo 1,第二代 Dojo 采用了台積電最新的InFO-SoW
晶圓級封裝技術,尺寸更小,損耗更低,效率也更高。
不過嘛,結局依然不理想。
雖然 Dojo 2 的 D2 芯片算力,從之前的 362 TFLOPS 提升到了 3.62 PFLOPS,是 D1 的 10
倍,但因為過於強調視覺訓練,實際在通用 AI 場景中,依然打不過英偉達的 H200 GPU 集群。
並且,芯片雖然由台積電代工,但良品率並不高,初期隻有 37% ,在成本上沒有任何優勢。
說白了,Dojo 2 還遠不夠成熟,想要打敗英偉達,還有很多的細節需要打磨。但時間不等人,如今的 AI6 徹底擊穿了 Dojo
的未來,難道還要指望 Dojo 3 ?
這錢還不如留著應對一下關稅。老馬當機立斷放棄 Dojo ,再次想起了老黃這個備胎。。。
而後他解釋到,如今的 AI5 和 AI6 ,從某種意義上,就是 Dojo 3 。
但是吧,這個 AI6 至少要到 2027 年量產,用的是三星的
2nm(SF2)製程技術,良品率奇低,隻有40%-50%,差不多做兩片,扔一片。
雖然特斯拉給了三星 165
億美元的巨款,但三星依然是賠錢在給特斯拉供貨,所以這塊餅究竟能做成什麽樣子,現在咱們也隻能看看罷了。
總而言之,Dojo 這事兒就是馬斯克的一場豪賭,隻不過賭輸了而已。
為了不深陷泥潭,馬斯克選擇投降輸一半,把全部精力投到更有希望的 “ 神功 ” 上去。
但是話又說回來,Dojo 這事對車企來說,真算不上什麽反例。
因為自研,本來就是條困難但必須走的路。