隻比馬斯克矮一點,特斯拉人形機器人震撼宣布!

來源: 2021-08-19 23:25:16 [博客] [舊帖] [給我悄悄話] 本文已被閱讀:

全球最快的 AI 訓練速度王座,剛剛易主了。

不是英偉達 GPU,也不是穀歌 TPU……

馬斯克治下的特斯拉,自研 AI 訓練芯片D1,自研 AI 超級計算機Dojo ExaPod,首秀即巔峰,登場就是全球第一。

此外,馬斯克還帶來了另一個特斯拉新品:

汽車機器人,搭載了特斯拉包含芯片在內的軟硬件係統,但跟百度的不同,不像汽車更像人。

這就是特斯拉年度 AI 開放日上,馬斯克再次帶來的一係列激動人心的大進展。

特斯拉自研 AI 訓練芯片 D1 發布

馬斯克說:要有一個超快的計算機來訓練 Autopilot 在內的整個自動駕駛係統。

於是 DOJO 誕生了。

DOJO,取名源自日語裏 " 練武 " 專用的道場,顧名思義,DOJO 就是特斯拉 AI 不斷精益功夫的道場。

DOJO 是一種通過網絡結構連接的分布式計算架構。它還具有大型計算平麵、極高帶寬和低延遲,以及分區和映射的大型網絡。

實際上,在 CVPR 2021 現場,特斯拉就已經劇透過 DOJO 的相關性能。

當時總算力達1.8EFLOPS,讀寫速度高達 1.6TBps,一度被認為超越全球排名第一的超級計算機富嶽,創造超算新紀錄。

但那時 DOJO 用的是英偉達的 A100 GPU,單卡算力 321TFLOPS,共計5760張,節點數高達 720 個。

而現在,DOJO 更進一步,自研了 " 心髒 "芯片

特斯拉首款 AI 訓練芯片D1,正式發布。

7nm工藝,單片 FP32 達到算力 22.6TOPs,BF16 算力 362TOPs。

特斯拉發布會現場,還用圖展示性能,拳打英偉達 GPU,腳踢穀歌 TPU。

一句話概括,比現在市麵上任何芯片都強。

特斯拉也用 "Pure Learning Machine",純學習機器,來稱呼 D1 芯片。

此外,D1 芯片強的不隻是單兵作戰能力,還有集團軍作戰能力,它們可以無縫融合,變成超大規模計算陣列。

能有多大,接下來,特斯拉就揭曉了之前預熱海報上的 " 神秘物種 ":

集合了 25 塊 D1 芯片的訓練模塊!

這也是特斯拉首個訓練模塊,而把多個模塊集合,就能形成更大算力的訓練陣列:

至此,特斯拉自研超算 DOJO完整真身亮相!

超過 50 萬個訓練節點。每個模塊算力為 9 petaflops,帶寬為 36TB/s。

DOJO 的可怕之處在於,不同於世界其他超算需要承擔多種不同任務,DOJO 的唯一使命就是 AI 訓練,或者可以說聚焦到自動駕駛算法的訓練。

因為專注,所以首秀即巔峰。

AutoPilot、FSD,特斯拉的其他 AI 訓練任務,都能在 DOJO 裏更高效練就。

另外,特斯拉官方還繼續劇透:這不是終點,下一代 DOJO 還會有 10 倍性能的提升!

所以到這裏就完了?拿衣服。

最後也是最強,特斯拉 D1 支持下的終極大殺器登場:

ExaPOD,集成 120 個訓練模塊,包含 3000 個 D1 芯片,超過 1 百萬個訓練節點。算力達到1.1EFLOP

而且每單位能耗下的性能比當今最強超算高 1.3 倍,但碳排放僅為 1/5。

速度和性能,冠絕業內。

於是特斯拉明確:這就是全球最快的 AI 訓練計算機。

有意思的是,2019 年美國能源部曾放言要花 6 億美元建 E 級算力的超算,2023 年問世 ……

萬萬沒想到,這個目標被 " 車企 " 特斯拉率先實現了。

最強 " 煉丹爐 " 為誰而建?

所以問題來了,自研 D1 芯片有了,最強 AI 訓練超算 DOJO ready 了,接下來特斯拉會有怎樣的改變?

特斯拉 AI 技術主管 Andrej Karpathy(李飛飛高徒)登場,介紹了 D1 芯片和 DOJO,主要服務的對象——特斯拉的在自動駕駛方麵領先所有對手的 " 靈丹妙藥 ":

純視覺方案

事故頻出,爭議四起,甚至中國絕大部分玩家都轉向了視覺 + 激光雷達的綜合方案,但特斯拉依然堅持。

Karpathy 詳細介紹了特斯拉高純視覺方案的思路,和現行 8 攝像頭方案的特點,以及它為什麽能 work。

特斯拉純視覺方案,基本構建原則是把自動駕駛係統看作一個生物,有眼睛、有神經、有大腦。

目前的方案有八個攝像頭,背後是被稱為 HydraNets —— " 九頭蛇網絡 " 的多任務學習神經網絡。

" 九頭蛇網絡 " 可以同時處理目標檢測、交通標誌識別、車道預測等等任務,其關鍵在於對各種數據的特征提取,包括不同種類數據的特征共享、對不同任務的分別調參,以及參數緩存,用來加快調參速度。

這也是實現 FSD 敏捷開發,半年內迭代 2-3 個版本的關鍵。

接下來,Karpathy 描述了純視覺方案的曆史,以及方案發展到今天的邏輯,他展示了一段特斯拉處理其圖像數據的視頻。

他說過去 的 FSD 雖然很好,但事實證明這樣的係統不夠完善,每個攝像頭能夠檢測到工程師預期的目標,但背後神經網絡的矢量空間是不夠的。

於是,特斯拉如重新設計了神經網絡,就是上麵的 " 九頭蛇 "。

另外相機校準、緩存、隊列和優化等等環節都做了最大程度簡化。

特斯拉方麵還比較了多攝像頭方案和單攝像頭方案的差別,相同的場景下,單攝像頭方案識別率明顯低於多攝像頭方案。

特斯拉車輛上的 8 個攝像頭獲取原始輸入後,係統會創建各種分辨率的圖像,用於各種功能和目的。

這些不同的圖像會被分別喂給處理不同任務的神經網絡,作為整個自動駕駛係統的決策依據。

接著,Karpathy 介紹了特斯拉的 " 終極建築師 ",即車輛在行駛過程中可以實時對車道、環境建模。

車道線實時建模,其實就是特斯拉自己的高精地圖能力。

中國自動駕駛玩家,強調 " 高精度地圖 " 的不少,但特斯拉的思路," 現成資源 " 不是本質能力,本質能力應該是 " 創造資源 " 的能力。

最後,Karpathy 談了 AI 公司常見的數據標注問題,他認為,把數據外包給第三方去做手工標注並不好,所以特斯拉選擇自建團隊來給數據打標,目前已經從 2D 圖像標記升級到 4D 矢量空間的標記。

這也是特斯拉自動駕駛不斷快速進化的核心所在。

依靠人工標注,顯然無法應對量產車上路後的大規模數據,所以隻有自動化標注,才能形成數據閉環。

開放日上,特斯拉也展示了如何從車道線、2D 圖像 …… 一點點躍遷至 4D 標注和建模的。

行人、車輛、樹木,建築物 …… 清清楚楚,而且還有意圖識別。

特斯拉方麵也強調,基於類腦一樣的感知係統、自動化標注能力,以及仿真,確保了特斯拉為什麽可以基於純視覺實現更高維度的自動駕駛。

仿真,簡單講就是利用現實數據,將真實世界的實時動態景象,在計算機係統實現重新構建和重現。

這套模擬程序,用特斯拉的話說,就是一個以自動駕駛為玩家的視頻遊戲。

在這套係統裏,任何要素都可以被添加其中,包括奇葩的極端場景。

比如這裏,人太多導致目標難以標注,車輛極多:

特斯拉這裏還不忘補刀一下毫米波雷達——純視覺也能做很好,所謂的雷達冗餘作用有限。

特斯拉方麵還披露,現在標注和仿真係統,可以模擬數量高達 3.71 億的數據及場景。

當然,自動駕駛最後還得解決從比特世界走向原子世界應用的問題。

這次特斯拉主要披露了控製和規劃方麵的進展。

特斯拉自動駕駛總監 Ashok Elluswamy,分享了特斯拉針對複雜場景的規劃方案—— " 混合規劃係統 "。

主要思路和技術方法是基於蒙特卡洛樹搜索,實現最佳路徑規劃。

最後,整個特斯拉自動駕駛從感知到決策規劃,一圖概括如下:

One more thing:特斯拉 " 機器人 "

最後的最後,就在大家都以為發布會完全就是自動駕駛相關內容之際 ……

" 簡短茶歇 " 環節,竟然來了一段 " 機器人熱舞 " ——宛如衣服 Model 一樣的穿著,樣子非常 " 矽基 "。

這是特斯拉的行為藝術?

不不不,再次出乎意料。

馬斯克再次登台,然後鄭重其事發布:特斯拉機器人

身高 5 英尺 8 英寸,約為 172cm;重量 125 磅,約為 56.7kg;承載能力為 45 磅,約為 20kg。

它的麵部是一個顯示屏,用來顯示重要信息。

從外形上看,四肢和人類一樣。

為了實現平衡性和敏捷性,四肢使用了 40 個機電推杆。

同時,特斯拉各項 AI 和芯片技術,都會應用其中。

比如使用 Autopilot 的攝像頭充當感知係統,胸腔裏內置特斯拉自研芯片—— FSD 同款,還會加持多項特斯拉已開發出的技術,如多攝像頭視頻神經網絡、規劃能力、標記。

而且馬斯克強調,這不是玩具周邊,它會最終實現——可能明年就會正式推出,這是特斯拉電動車的下一步

矽穀鋼鐵俠還說,他會是一個非常有用的機器人,由人打造,為人服務,而且會確保一直對人友好,能把人從危險的、重複的,無聊的任務中解放出來。

甚至還能跟已經高度自動化的特斯拉車輛生產進一步結合協作。但按照馬斯克的意思,首要的應該是 " 做家務 "。

有意思的是,隨著特斯拉這個 " 機器人 " 發布,太平洋兩岸都把 " 機器人 " 作為了智能車變革的下一步。

中國這邊,百度李彥宏剛剛推出了一款 " 汽車機器人 ",不過更像 " 汽車 " 而不是 " 人 "。

美國那頭,馬斯克的特斯拉機器人,更像 " 人 " 而不是 " 汽車 "。

這種區別,也可能跟馬斯克的那個江湖綽號有關。

伊隆 · 馬斯克,不就是現實版鋼鐵俠嗎?