今年 4
月中旬,特斯拉采購團隊來到寧波一家供應商的廠區,做人形機器人量產前的最後一次審廠。門口一輛車上,盯梢的人對上了車牌,拍下照片發給
“上線”:“特斯拉來審廠了。”
值得這麽麻煩。第二個交易日,這家公司股價照例漲停。從特斯拉 2022 年 10 月第一次對外展示人形機器人至今,A
股機器人概念板塊漲了 93%,同期滬深 300 指數隻上漲約 1%。
一周後,數千個組裝完成的核心零部件在寧波裝船,頂著高昂關稅,發往美國加州弗裏蒙特的特斯拉工廠。
這裏沒有一點萬億概念板塊的樣子。弗裏蒙特工廠二樓的機器人製造專區,沒有手臂和腦袋的機器人係著鐵鏈,掛在架子上。工程師測試完零件後,會把它們手工拚裝成新款人形機器人。地麵上散落著電線和塑料包裝。
自特斯拉 2022 年亮相機器人後,全球的風險投資者、特斯拉及供應商已為此投入超過 1000
億元。到目前為止,人形機器人的生產比勞力士機械表還要手作。據我們了解,特斯拉下的零部件訂單,隻要求今年交付不少於 5600
套。中國公司中,宇樹今年預計出貨約 4000 台,智元預計賣出超千台。按照目前的進展,今年全球人形機器人行業預計出貨近 2
萬台,大約是勞力士一個星期的產量。
從完全遙控參與的北京亦莊機器人馬拉鬆、宇樹機器人拳擊賽,到特斯拉自己公布的機器人倒垃圾、清理桌麵視頻。人形機器人還遠不是科幻片裏想象的靈活形象,也沒有在任何一個工廠被證明有直接替代藍領工人的效率。
但期望已經被打滿,不隻因為股票市場的投機,也因為人們確實期望技術能解決現實困境。咖啡店、奶茶店,年輕店員忙到崩潰已經成為一種新聞模板,工廠招不到年輕人也早已不是歐美獨有的問題。對便宜商品的渴望,對重複工作的厭惡,不知疲倦的機器人看著像是最容易的解法。
大規模生產還沒開始,但跨越國境,幾千工程師已經忙活了好幾年。一位接近特斯拉機器人關鍵供應商三花智控的人士說,特斯拉美國工程師現在每天工作
16 個小時,很多供應商也是按照同樣的節奏工作。以至於雙方每天有 8 小時交集,毫無時差問題。
去年底, 特斯拉終於與部分供應商簽訂供貨協議。這是一個實驗品走出實驗室,走向工廠變成嚴肅工業品的關鍵一步。它的 Optimus
也是唯一一個進入量產階段、可以說有完整供應鏈的人形機器人。
過去半年,我們訪談了 30
多位人形機器人相關從業者,有特斯拉員工和它的供應鏈人士,也有中國的創業者和相關分析師,我們以特斯拉機器人的研發、生產為例,呈現人形機器人作為一個產品和產業的現實。
用精密製造還原血肉之軀
人體是人類科學目前無法企及的精妙設計。比如當你俯身抱起 20
公斤的大箱子,全身肌肉都會參與聯動:力從腳底開始,腳踝關節微曲,讓重心下沉,大小腿的肌群隨即接管;腰腹部的深層核心肌肉鎖住腰椎,防止損傷;當雙手抱住箱子時,肩胛已經收緊,為手臂提供支點;起身則是腿和臀一同上蹬,將力量沿著軀幹、肩胛送到前臂,讓箱子平穩離開地麵。而控製這一切,人的大腦基本都不太需要工作。
人形機器人不能像人一樣裝 600 多個電機再協作,這太過於複雜。不算最複雜的雙手,一台特斯拉最新第三代機器人的動作,完全靠約 30
個執行器完成。
你可以把執行器想象成機器人的肌肉,任何運動都是執行器把電能轉換成動作的過程。這也是機器人最貴的部分,執行器占整個機器人 55%
的硬件成本。
之前,幾乎所有人形機器人的執行器都是旋轉關節,用單個電機讓手腕或者膝蓋翻轉,多個關節聯動就能行走、抓取。這項技術路徑明確,零件都是現成的:一個關節裏,電機經減速器放大扭矩並帶動軸承;編碼器把運動反饋成電信號,力矩傳感器監測載荷。但旋轉關節有個致命弱點——沒法幹活,因為力量來自電機的扭矩,在人類體積下,扭矩有限,於是承重受限。
特斯拉改用直線關節:電機繞絲杠旋轉,把旋轉變成直線推拉,像擰螺絲。絲杠既當 “骨頭” 也當
“肌肉”。普通絲杠摩擦大、精度差,業界在螺紋裏加滾珠,把滑動摩擦變滾動摩擦,卻仍撐不起所需重量。
工程師於是把滾珠換成數十根小螺杆,讓它們環繞主絲杠滾動、自轉,像行星繞太陽,既減摩擦又增加承載力,才滿足直線關節的力量和精度要求。
這就是行星滾柱絲杠,目前特斯拉選定的供應商包括舍佛勒、新劍傳動和北特科技。特斯拉在 2023
年展示,人形機器人腿部的直線執行器可以掛住半噸重的鋼琴。
行星滾柱絲杠 來源:優仕特精密的 Youtube 視頻。
左為旋轉執行器,右為直線執行器。來源:特斯拉。
滾柱絲杠保證機器人的操作具備足夠精度,且機械結構足夠強韌。但要讓機器人有足夠的力氣,還要加裝另一個同樣關鍵的部件——減速器。
高速轉動的小齒輪帶動減速器的大齒輪,能在降低轉速的同時,放大小齒輪的扭力,控製機器人發出的力道。特斯拉目前使用的 RV 減速器最高可以把電機輸出的扭力放大 200 倍,供應商為哈默納科和綠的諧波。
哈默納科減速器。來源:哈默納科官網。
執行器人形機器人的肢體有足夠的自由度,可以盡可能模擬人的操作。要讓它站穩、學會走路,還要給機器人加裝陀螺儀、力傳感器、速度傳感器和控製器。
直到現在,所有人形機器人都無法做到安靜行走,它們每走一步,腳都會重重砸向地麵,沒有公司能做到精確控製機器人行走時腳的力度。不少公司選擇給機器人穿上鞋來緩衝。
很多機器人的腳是一塊鐵板,無法精確感知行走時路麵的反饋,工程師的解決思路是在腳踝上安裝六維力傳感器,感受重心變化。
六維力傳感器的工作方式與電子秤類似,但更複雜。它通過內部三根交叉的彈片的變形程度來測量三個方向產生的不同的壓力,彈片每壓彎一些,傳導出的電信號就增強一些,反饋給控製器,轉化成電機可以理解的語言,確定向哪個方向轉動,速度是多少。目前業內最先進的六維力傳感器對力距的測量誤差小於 0.2%。
六維力傳感器售價超過 1.2 萬元人民幣,對大部分機器人公司來說太貴了。特斯拉等公司意圖優化軟件來替代它,但還沒人成功。目前特斯拉采用的六維力傳感器來自美國得州的合成材料公司 ATI(和 AMD 收購的加拿大 GPU 芯片公司 ATI 沒什麽關係)。
ATI 的六維力傳感器。來源:ATI。
讓機器人能夠像人一樣使用各種工具,關鍵在於手。人手有 27 個自由度(關節能向 27 個方向單獨彎曲或旋轉)、行動靈活,遍布高敏感的觸覺神經,力控能力強大。一位靈巧手公司創始人說,靈巧手的複雜度比機器人其餘硬件加起來都複雜。目前主流的人形機器人自由度在 20~50 個,而靈巧手的自由度就有 20 個以上。
特斯拉機器人團隊專門設置了靈巧手部門,與運動控製等部門同級。過去三年多,特斯拉的工程師嚐試了至少三種差別極大的方案模擬人手,小改動不計其數。
特斯拉 2024 年 10 月亮相的第三代 Optimus 靈巧手。來源:特斯拉。
現在特斯拉用鋼絲製成的繩驅來模仿人手肌肉組織,他們希望盡量減少機器手運動時產生的動力損耗和遲滯。
工程師們把提供力量的電機放置到手腕裏,電機連著鋼絲來控製手指彎曲伸展,原理類似提線木偶,目前已經複刻出至少 22 個自由度。
傳感器是模擬人類感知能力的關鍵。業內相對成熟的新型傳感器是柔性力傳感器——所謂電子皮膚
。通過把諸多微型力傳感器集成到柔軟的材料上,以模擬皮膚的觸覺。力傳感器在電子皮膚上的排列方式類似於像素點在顯示屏上的排列,力傳感器密度越高,它對物體輪廓、摩擦力的感知就越細致。
電子皮膚供應商帕西尼可以做到在食指第一節指腹放置超過 100 個力傳感器。一家國內的電子皮膚公司創始人說,他們能讓機器手摸清楚雞胸肉後麵雞骨頭的位置和輪廓。目前大部分機器人公司都隻在機器人指頭和手掌處使用電子皮膚。
最後,旭升股份和拓普提供的鋁合金結構件最終將各個關節部位連接起來,做成人的樣子,就構成了特斯拉人形機器人的基礎形狀。
特斯拉等公司還仍在探索更多新型傳感器模擬人的感知能力。供應商們萌生了很多新奇想法,如用類似煙霧報警器的技術製造嗅覺傳感器,用電子羅盤製造位置傳感器,但少有公司把它們用到產品中。
幾百家供應鏈公司的全新冒險
2022 年上半年,特斯拉美國的汽車製造生產(Manufacturing Production)部門陸續聯係全球數百家公司,要求研發、生產特定零部件。
其中有一些全球領先的老牌精密製造公司,有為月球車造零件的日本諧波減速器製造商哈默納科、德國數控機床公司舍佛勒、做了 80 年傳感器的美國霍尼韋爾、精密軸承製造商日本精工等。
還有數百家中國公司收到了邀請——主要是特斯拉的汽車零部件供應商。特斯拉的工程師列出數百種零件的規格要求,讓供應商報價、送樣,但沒說用在哪裏。一家當時隻有 20 人的中國觸覺傳感器創業公司也接到了問詢,他們以為是用於汽車座椅按鈕。
很快供應商們就發現了這次的訂單不同尋常:零部件設計在快速迭代,有時半個月就改一版;精度要求比以往的汽車訂單高很多,有的公司自己怎麽也搞不定,最後還是特斯拉的工程師給了解決辦法。
等到那年 10 月 1 日,渾身外露電線和風扇的第一代 Optimus 機器人在特斯拉 AI Day 登台,一些公司到此時才知道自己參與了人形機器人的研發。發布會上,馬斯克允諾這將是 100 億台保有量的超級生意,會改變全球經濟結構。
難度在於馬斯克不接受波士頓動力等公司過去 30 年的設計思路,要求做到擬人:
- 身高、體重要接近成年人,不能隻有 1.3 米高;
- 可以筆直站立的兩條腿,不是輪子,也不能像波士頓動力機器人一樣為平衡永遠彎曲;
- 手臂末端得有能靈活運動的 10 根手指,而不是一個圓形鐵球或夾爪。
他認為,隻有把機器人造得像人,機器人才能使用人類的工具,出入一切為人類設計的工作空間,於是得到更廣泛的使用,實現規模化從而降低成本,進入正向的商業循環。這和他造火箭是一個思路。
“最開始很糾結,如果你不信,別人信了,那機會就是別人的,你不僅要信,還要信得比別人早。” 一位參與研發的供應商的高管說。到現在他們公司已經為此累計投入超過 50 億元。
三花智控和拓普集團是最支持特斯拉的供應商。過去 10 多年,依靠與特斯拉的合作,從小型汽車零部件公司成長為千億市值公司。
“鄔建樹(拓普集團創始人)歲數很大了,在公司內部複盤自己的職業生涯說,核心就是 ‘財運好’,抱上了特斯拉這個新能源時代最粗的大腿,拓普的戰略就是相信特斯拉,相信馬斯克。” 一位接近拓普的人士說。
給特斯拉供貨不僅意味著訂單,還有技術扶持。特斯拉幾乎重新設計了機器人用到的 6 種電機,提升功率密度,讓 Optimus 變得更瘦更輕的同時,力氣更大。
一位知情人士稱,一家特斯拉選定的供應商做了兩年無框力矩電機,依然無法滿足特斯拉要求,特斯拉就把圖紙和技術方案授權給他們,讓他們代工生產。
“做機器人麵罩的塑料沒有技術含量。但你能做特斯拉的生意,那就不一樣。” 一位二級市場投資人說。目前仍有數十家公司持續給特斯拉送樣,以期成為供應商。
一些公司送樣隻是為了得到特斯拉對樣品的反饋,知道零件技術參數的要求。這可能幫他們成為其他人形機器人公司供應商。
供應商們將這場行動形容為跑馬拉鬆——持續有人掉隊,掉隊的人失去機會,可能再也追不上。因為技術和設計一直在迭代,哪怕隻有一輪迭代沒跟上,就無法進入新的開發階段。
到現在,整個供應鏈數百家公司已經陪特斯拉做了三年機器人硬件開發,搭起了第一條完整的人形機器人供應鏈。宇樹、波士頓動力等公司都自己設計並製造大量零部件,很少大規模外采關鍵零件。他們也很難像特斯拉這樣得到整條供應鏈的鼎力支持。
6 萬美元的成本,敵不過月薪 5000 元的工人
特斯拉正在同時生產第二代和第三代人形機器人,第三代產品硬件設計 80% 已經定型。這並不意味著這 80% 的零件已經足夠好,無需改進,而是以現有的加工能力和相對可接受的成本下,能做到的程度。具體是這樣的:
- 身高 1.72 米,體重 55 公斤,自由度是人類的五分之一,有 50 個以上可以活動的關節。
- 身體骨架由鋁合金製成,外殼是 peek 樹脂材料,抗拉伸強度是鋼鐵的 2 倍,但更輕。
- 胃裏裝著十多節圓柱電池,滿電情況下能支撐它工作 5 個小時,和人吃飽飯後的工作時長接近。
- 頭部、胸口都遍布攝像頭當眼睛,特斯拉堅持純視覺路線,機器人依靠攝像頭傳輸的圖像信息識別周圍。但也有公司給機器人加上激光雷達。
- 驅動手指的電機都放置在直徑和成人手臂相當的前臂中,五指承載力為 5 公斤 。
- 雙臂大概能搬動 20 公斤的重物,這已經高於中國《職業病防治法》對工人最多搬運 15 公斤重物的要求。
- 一小時能走 8~10 公裏,和人類小跑速度相當,但有可能會摔倒,第二代測試時隻有 60% 能走完 1.5 公裏不摔倒。
- 神經係統由內部的電線和局部以太網構成,傳輸速度遠低於人類神經,且因為傳感器技術尚不完善,機器人神經傳輸的電信號比人類神經簡單很多。
按照上述硬件方案,特斯拉最新的人形機器人造價大概是 6 萬美元。離馬斯克追求的 2 萬~3 萬美元還有很大差距。並不是說 6 萬美元買個機器人就能一直用。
一個關鍵問題是關節裏的行星滾柱絲杠一根單價超過 4000 元,而每台機器人需要 14 根,裝在大腿、手臂上。
特斯拉對行星滾柱絲杠的要求是滾完 3.15 厘米的距離後,位置的誤差小於 6 微米,誤差值隻有總長度的 1/50000——允許的誤差空間,連細菌都鑽不進去。
價格更低,絲杠精度就會降低,這會讓機器人運動時產生震動和異響,就像人類骨骼錯位會發出聲音。多餘的震動和摩擦會降低關節的使用壽命。
有供應鏈公司人士說,最初隻有舍弗勒的滾柱絲杠能滿足特斯拉的工程要求。但這個關鍵零件的產能也是問題。一位曾給特斯拉送樣的絲杠供應商說,去年底他們工廠每個月隻能生產 300 根符合要求的行星滾柱絲杠,隻夠造 10 多台機器人。
為了平衡成本和產能,特斯拉機器人去年底降低滾柱絲杠的精度要求,從 C0 級下調至 C3 級,削減一半的絲杠成本。
特斯拉最近發布的視頻顯示,第三代人形機器人能靈活跳芭蕾,也會使用多種工具完成任務,如拿鍋鏟炒菜、撕廚房紙、用刷子清理桌麵、掀開垃圾桶蓋丟垃圾。但這隻是精心挑選的視頻片段,加速後效率也遠遠比不上正常人。
特斯拉發布的原速視頻與加速對比。來源:特斯拉視頻截圖。
每個零件運轉時產生的誤差會互相影響,最終讓機器人摔倒。零件越輕,關節運動時慣性越小,算法對操作的控製精確度就會越高。
Optimus 最像人的地方可能是長時間工作後會疲憊。機器人長時間工作時,關節中的電機和減速器溫度會超過 70 度,會因為過熱而降頻。機器人采用的電機參數與無人機電機類似,但無人機可以通過氣流散熱,機器人不行。
這本質上是材料問題,“要讓電機不發熱,就得降低電阻,換言之,需要室溫超導材料,才能完全解決電機發熱問題。” 一位電機工程師說。
一位機器人公司高管稱,Optimus 在汽車工廠工作的平均速度隻有人類的 20%~30%,極個別簡單動作能到人類速度的 60%。
60000 美元一台的機器人不隻是效率比人低,它的實際成本也遠遠高過造價。
從走路到拿東西,機器人的運動及與物體的碰撞,都會磨損機體,而且不會像人體那樣自我修複。比如諧波減速器等精密器件的使用壽命普遍為 8000 小時,8 小時工作製下能用不到 3 年,但壞了隻能換。行星滾柱絲杠的使用壽命更低。
特斯拉當前的方案解決了手指動作的連貫性難題,但也削弱了手指的力量,整個結構的負載能力都要靠鋼絲和電機支撐,且連接手指和手腕的鍵繩很容易斷。
“目前市場上能買到的靈巧手,最大的問題還不是不夠 “靈巧”,而是不耐摔。” 一位機器人工程師說,因為算法缺陷難,大部分靈巧手的大拇指、小拇指都難以感應手放下來的力度,導致磕壞。
質量差的靈巧手隻能連續用一個月左右,好一點的能撐三個月。而且靈巧手摔壞很難維修,隻能換。中國公司現在能把 20 個自由度靈巧手的單價壓到 5 萬人民幣,兩隻手每三個月換一次成本是 10 萬。一位靈巧手公司創始人說,他們正在想辦法把飛機機翼上的高強度材料用到機器人手上,讓它更耐摔。
硬件天花板下的 AI 賭注
硬件很難在短時間內有大幅提升,許多人形機器人從業者希望用軟件解決硬件問題,讓機器人有更好的表現。
過去 70 年,機器人運動控製技術都由控製理論主導。波士頓動力是這一路線的代表,他們的機器人經過數十年的優化,可以翻跟頭。這些高難度肢體動作背後,實際上是機器人根據規則回放動作。
它的進步來自工程優化,工程師畫出完美的行動軌跡,一遍遍校準坐標,修正參數,讓它的動作變得柔順高效,無限接近數學上的完美結果。
波士頓動力 Atlas 機器人 2017 年就已經會後空翻。來源:波士頓動力。
過去十年,機器人行業引入強化學習技術,訓練機器人的運動控製算法,依托大量真實采集和仿真模擬生成的數據不斷強化機器人底層運動控製算法,讓它們更熟練地奔跑、跳舞,甚至像模像樣的格鬥。
不過它的底層邏輯是用強化學習替代軟件規則運動控製,這種方式依然很難讓機器人產生真正的智能。
宇樹機器人已經可以完成難度更高的側空翻。來源:宇樹科技。
一位人形機器人創業者舉了個例子,數萬次調試可以讓機器人可以熟練操控重心,學會行走。但如果你讓機器人端一個放著鐵球的箱子行走,算法教給它的能力就會失效,它無法處理鐵球滾動對重心的影響。
機器人每遇到新的特殊情況,工程師就需要重新訓練模型,再教機器人一次。它們很難擁有大家期待的 “泛化性”,不會觸類旁通。
“如果要讓人形機器人學會像人一樣,把全中國的工程師都堆過來寫規則也不夠。” 這位創業者說。有些公司一度養了 3000 人寫規則,都解決不了自動駕駛問題。而自動駕駛隻是人形機器人需要解決的成千上萬個問題中的一個而已。
人形機器人行業希望像大模型和端到端自動駕駛一樣,依靠大量數據訓練,機器人自己學習如何理解世界、然後執行任務。
比如文生圖模型中,工程師讓模型理解馬和宇航員的特征後,會產生泛化性,畫出宇航員騎馬這種現實世界並不存在的畫麵。研究者們相信,機器人模型可以有類似的效果,學會兩種不同的動作後,會自己推理組合出第三種動作。
這是業內目前認可的主流的機器人大腦訓練方案—— VLA( vision-language-action ,視覺語言動作模型)。用戶提出任務後,語言和視覺融合模型,可以理解周圍的環境,並與用戶指令結合,形成運動軌跡,然後調動執行模塊完成任務。
最理想狀態下,機器人使用的模型會是 “端到端” 的,人類告訴機器人動作指令,如要求機器人下樓倒垃圾,模型就能輸出電機轉速控製參數,讓它完成任務。在這一路線下,強化學習等也是提高人形機器人運動控製能力的一部分,就像經過強化學習的大語言模型,能夠變得更強那樣。
但這個路線做出來的人形機器人,完成基礎動作的時候相當遲緩,大多數公司展示視頻都是加速播放,有一些公司放出來未加速視頻,還會被吐槽為美國前總統的模擬器。
數據是目前機器人大腦發育最大的障礙。研究者訓練大語言模型,可以從互聯網上收集文本、圖像等公開數據,汽車公司可以通過數百萬輛汽車上的攝像頭等傳感器不斷獲取新數據。
現在所有機器人公司喂給模型的數據規模,還無法驗證 VLA 路線是否能夠像大語言模型那樣有效。一位機器人公司技術負責人說,初步檢測 VLA 的學習能力,至少要 1000 萬條高質量的真機數據,但大部分公司隻能提供不到 100 萬條有效數據。而這 “ 1000 萬條” 的數據要求,也是猜測。
這些真機數據需要靠人穿戴 VR 設備或動捕服裝采集,有限且昂貴,擴展性也不好。我們了解到,國內頭部的人形機器人創業公司采集一條真機數據的成本是 10 元,數據采集員每小時大概能生產 2 條有價值的訓練數據。為了訓練機器人的應變能力,采集數據時通常一人拿手柄操作機器人,一人幹擾機器人,比如在機器人即將拿到杯子時,把杯子移開。
工程師依靠動作捕捉設備訓練 Optimus 。來源:特斯拉。
他們認為,真機數據是提高人形機器人模型能力的關鍵,在虛擬環境中仿真、視頻數據都是輔助。
逐際動力創始人張巍說,從第一性原理出發,讓機器人學會部分基礎操作並不需要真機采集數據,“告訴機器人拿杯子時需要抓住把手這件事,需要 1 萬條數據嗎?這是個常識,互聯網級別的數據就能訓。”
用視頻數據訓練機器人,第一步是給視頻裏的人類關節標點,抽取人類行動的軌跡數據,再同步映射到機器人的執行器關節,通過運動控製算法得出電機旋轉的速度和機器人肢體末端的坐標信息。
用互聯網數據訓練機器人的下一步是用 AI 生成的視頻訓練機器人。這種方式的訓練效果取決於工程師對視頻的理解,“沒有好的理解,就沒有好的生成。” 張巍說。
仿真模擬數據供應商光輪智能創始人謝晨說,簡單的仿真和視頻圖像中並不包含物理信息,訓練機器人最重要的數據,應該是機器人與物理世界的交互數據。機器人要像人一樣與物理世界接觸,而不是像自動駕駛車那樣總是避免物理碰撞。
光輪智能正在探索用仿真模擬生成出各種場景、動作下的物理信息來訓練機器人。他們會讓工程師帶著力距測量儀器,去開數百種冰箱門,收集不同的冰箱門外形和開冰箱的力的數據,以此完成建模,並模擬生成物理力學屬性,包括冰箱門的質量、摩擦力、角動量以及鉸鏈結構的磁吸力、阻尼等。
當以上 Real-to-Sim (現實到模擬)步驟完成後,還需要 Sim-to-Real (模擬到現實),即通過數據泛化的手段改變虛擬環境中冰箱的位置、光線、角度、材質等,讓生成的數據覆蓋不同的現實場景,讓機器人真正學會認識現實世界的 “冰箱”。
我們問了十多位具身智能
模型的研究者:現在主流的機器人大腦訓練路線,真的能讓機器人舉一反三嗎?沒人給出肯定回答。
機器人行業的大部分公司都寄希望於具身智能模型釋放人形機器人的能力,風險投資者也願意給押注模型的公司更高估值。他們認為,機器人的 ChatGPT 時刻很快就會到來。
剛成立 2 年的智元機器人,估值已經不低於成立 9 年的宇樹。成立 15 個月、隻研究具身智能模型的 Physical Intelligence,估值已經超過 20 億美元。而 Figure 估值達到 395 億美元。
但波士頓動力 CTO 亞倫·桑德斯(Aaron Saunders)評價說,現在的人形機器人行業,隻是把解決智能難題推給海量數據,訓練機器人的模型盡可能簡化,但圍繞著模型的一切都更複雜了。
已經有公司對標泡泡瑪特,想用情緒價值找出路
四月底,我們見到了人形機器人領域中最樂觀的一批投資者。那是北京亦莊機器人馬拉鬆結束後的第三個交易日。他們原以為這場馬拉鬆是 “空頭辦的”,全程遙控不說,現場大部分機器人都跑掉了自己的零件,摔倒了被人扶起來。
但隨後的幾個交易日,機器人供應鏈的股價還是連續走高,讓他們恢複了信心。提及比賽第二名跑一半腦袋掉了,一位基金經理說:“頭掉了怎麽了,頭掉了不也跑完了,腦袋不重要。”
敘事可以繼續,但實際造機器人的公司已經開始麵對現實問題。特斯拉今年生產的人形機器人,主要工作是在特斯拉得州奧斯汀工廠搬東西,比如把傳送帶上的 4680 電池拿下來放到料箱裏。6 萬美元相當於當地搬運工 15 個月的薪資,不算維護成本可以勉強用一下。
不過按計劃,特斯拉今年就要造 5000 多台機器人,但取代所有搬電池的工人隻需要幾十台。那剩下來的幾千台要做什麽?“可能是放倉庫裏吧。” 一位接近特斯拉人形機器人團隊的工程師說。
其實撿電池本來就不用人工,比如寧德時代電池生產線是用更便宜的工業機器臂直接成批把電池抓進料箱,一個人都不用。
其他公司的生產進展更差。去年聲稱已經將一隊機器人送到寶馬工廠 “工作” 的美國公司 Figure 近期被曝出,其機器人隻是在寶馬的車身車間練習拾取和放置零部件,僅在非生產時段運營。還有一家中國公司的人形機器人在汽車工廠上班一周後,被工人開叉車送了出來。
在中國替代藍領更難。中國任何一個地方的工廠都可以用每月幾千元人民幣的成本雇傭到一雙靈活的手,做複雜得多的事情。今年的上海車展,小鵬、長安等公司都開始用人形機器人當車模。這才是人形機器人當下最常見的用途。
一位投資了機器人領域的一級市場投資人說,現在已經有人形機器人開始對標泡泡瑪特,“現階段都以提供情緒價值為主”。他的一位同行則說,能做成泡泡瑪特就很強了,畢竟它市值已經超過 3000 億港元。
特斯拉今年第一季度電話會上,馬斯克下調了人形機器人產量目標,年產 100 萬台機器人的時間點從 2027 年推遲至 2029 年。
特斯拉 20 年前做電動車時,它不需要重新設計方向盤、輪胎。人形機器人的零件數量大概 7000 個,比汽車少 30%,但大部分都要重新做。
如一位人形機器人從業者所說,做人形機器人就像是重新發明一次汽車,並同步解決自動駕駛問題。