英偉達和MIT研究出新“魔法”:讓機器人“推不倒”

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數
英偉達和MIT研究出新“魔法”:讓機器人“推不倒”

讓雙足機器人走路已經不是難題,但是想讓它們表演“跳舞”或“打拳”,卻十分有挑戰。機器人的運動方式越接近人類,就越能夠自然融入人類環境,而無需改變人類原有的生活和工作空間,因此,研究怎麽讓機器人的運動能力更貼近人類,是一個長期課題。

但機器人姿態動作的改變背後,不僅涉及物理形態的變化,更涉及到控製精度、平衡保持和動作連貫性的深層考驗。

就像小孩學走路,站立和行走隻需掌握重心轉移和平衡,而“轉身跳舞”則需全身協調,涉及手臂、腿部和核心肌肉的配合。機器人也麵臨類似挑戰——行走僅需控製腿部,而跳舞或打拳則要求全身精準協同,任何細微延遲或誤差都會導致動作生硬、不連貫,甚至摔倒。

在這種全身控製方麵,傳統的機器人控製係統就像“遙控車”,依靠提前寫好的“動作劇本”,逐幀執行預設的動作指令。這種“定格動畫”式的控製方式在簡單任務中表現良好。

但當環境發生變化,或者需要執行連續的動態動作時,問題就暴露了——動作僵硬、卡頓明顯。

12月18日,英偉達、MIT、加州大學聯合發布了一項最新研究,提出了讓機器人更能富有表現力的控製全身係統ExBody2,可以幫助機器人打破“固定劇本”帶來的運動局限,教會機器人如何靈活應變,ExBody2的工作方式則更像是一位智慧的“舞蹈教練”,不再拘泥於“每一幀的動作指令”,而是教會機器人理解“運動的節奏和方向”。

通過這種方式,ExBody2增強了雙足機器人的平衡和適應能力,使得它們在麵對輕推、複雜地麵等場景時能表現得更加穩定。

簡單來說,ExBody2的控製邏輯更像人類的運動方式——人類在跳舞時不會死記每一步的具體位置,而是靠節奏感和動作的連貫性來完成整段舞蹈,它關注關鍵部位的運動節奏和方向,幫助機器人在動態環境中實時調整動作。得益於這種方法,讓機器人具備連續流暢和相對穩定的運動能力,實現“即興表演”的效果。

在這項研究中,研究人員使用了宇樹G1和H1人形機器人進行測試:



(G1機器人戶外轉換步態)



(機器人打拳)

此外,ExBody2不僅能在虛擬環境中訓練機器人,還能將這些技能遷移到現實世界中,在Sim2Real(從虛擬到現實)環節幫助機器人順利走向真實世界。

從虛擬課堂到真實表演:機器人如何“上課”?

在傳統的機器人動作控製方法裏,讓機器人模仿人類複雜的花式動作,就像讓大象去爬樹,不僅不切實際,還可能把它“累趴下”。就像一個人在跳舞時,每一步都要精確地盯著腳和手的每個動作,生怕出錯。這種“逐幀控製”的方法一旦某一幀出現偏差,後續的動作就會變得不穩定,像是“連鎖反應”一樣讓動作越來越僵硬。

ExBody2的做法更像是讓機器人學會“跟著節奏跳舞”,而不是死記硬背每一個動作。它將控製邏輯拆分為關鍵點跟蹤(控製動作的關鍵位置)和速度控製(調整動作的節奏),兩者獨立運作。

相比傳統的“全局控製”,ExBody2采用了局部關鍵點映射,就像在機器人身上安裝了一個“局部導航係統”,每個動作隻需要關心自己負責的部分,而不必關注全局。這樣一來,即使某個動作有輕微偏差,也不會“牽一發而動全身”,機器人依然能流暢完成動作。

除此之外,在動作設置上,ExBody2的設計者們也用了新思路:與其讓機器人挑戰不可能,不如給它挑選一些真正適合的動作。從海量的動作數據集中,他們像挑選課本一樣,把這些動作分門別類,做了“分級處理”。



(來源:論文《ExBody2: Advanced Expressive Humanoid Whole-Body Control》,不同數據集下機器人關鍵點跟蹤、關節精度和速度控製誤差評估;D₅₀、D₂₅₀、D₅₀₀、DCMU,是四種不同的數據集,代表從簡單到複雜的動作難度。)

他們將數據集分成了四個“動作難度包”:

● D50:入門版,就像小學一年級的課本,內容簡單易學,包括站立、行走等基本動作;

● D250:進階版,開始加入跑步和簡單舞蹈動作,難度適中,剛好適合“穩步進步”;

● D500:高級版,包含了更複雜的動作,比如單腳跳躍和旋轉,稍顯棘手,但也更具挑戰性;

● DCMU:完整版,囊括了所有動作,從普通的步態到高難度的翻滾和地板動作,幾乎“無所不包”,但也帶來了大量噪聲和不可完成的任務。

這種分級篩選的過程,就像為一個孩子挑選適齡的書籍一樣。大人不會指望一個剛剛學會認字的孩子去讀莎士比亞,機器人也一樣,學習過程需要逐步推進。如果一開始就讓它麵對“高難度關卡”,它可能會在錯誤的嚐試中迷失方向,甚至徹底放棄。

有趣的是,實驗發現,D250數據包表現最佳。它的難度設計恰到好處,既包含了多樣化的動作,又沒有加入那些讓機器人望而卻步的“極限挑戰”。與之相比:

● D50數據包雖簡單高效,但內容過於基礎,導致機器人難以應對稍複雜的任務;

● D500和DCMU數據包則因動作過於複雜,增加了無效訓練的噪聲,拖累了整體效果。

D250就像一本結構合理的練習冊,既讓機器人有挑戰,又不會讓它壓力過大。通過這樣的篩選,ExBody2為機器人打造了一條學習之路,讓它能夠穩紮穩打地掌握動作技能,最終在真實世界中自信地“展現舞姿”。

有了優質的數據集,ExBody2的教學進入了第二階段,即“老師-學生”架構的核心過程,這裏麵包含在虛擬環境中的“老師機器人”和真實環境裏的“學生機器人”兩種角色。

在這個架構中,“老師機器人”是主導者,它生活在一個虛擬環境裏,擁有豐富的“特權信息”,比如關節的位置、速度和身體的物理反饋。就像一個經驗豐富的舞蹈教練,老師機器人通過強化學習算法(PPO)不斷優化自己的動作,從單腳跳到連續旋轉,每個細節都打磨到位。

而“學生機器人”的學習條件就沒那麽優越了,它進入真實世界時,麵臨的環境複雜且變化多端,沒有老師那樣的“特權信息”,隻能依靠曆史數據和觀察到的反饋。這就像一個學生隻能通過看錄像模仿舞蹈,而無法直接從教練那裏獲得詳細指導。

為了彌補信息的缺失,ExBody2采用了一種叫“DAgger”的算法,它將老師的複雜指令簡化成學生能理解的觀察數據。這個過程類似於把一部高清視頻壓縮成清晰的GIF動畫,雖然少了一些細節,但核心動作得以保留。

真實環境大考驗:ExBody2如何從“課堂”走向“實戰”

ExBody2是不是一套真正“聰明”的機器人學習係統,最終的檢驗要看它在真實環境中的表現。就像一個學生考試時,課堂上表現得再好,如果在考場上發揮失常,也不能算作優秀的學習者。因此,ExBody2不僅在“課堂”中訓練機器人,還通過一係列的實際測試,檢驗機器人在不確定環境中的表現,來驗證證明這套係統的“聰明之處”。

在這場考驗中,研究團隊設計了一場機器人間的“現場大比拚”。他們將機器人放置在各種動態環境中,比如不平的地麵、動態的障礙物、突然的輕推等,模擬出真實世界中常見的突發情況。麵對這些“考驗”,機器人需要做出迅速的反應,調整自己的站姿、步伐和動作節奏,保持穩定並完成任務。



(人形機器人在現實世界中執行各種富有表現力的全身動作)

最有趣的測試是“推擠測試”。在實驗中,研究人員故意輕輕推一下行走中的機器人,模擬在家庭環境中孩子不小心撞到機器人的場景。結果顯示,ExBody2的機器人反應相當靈敏,能迅速調整重心,穩穩站住腳跟。相比之下,采用傳統控製方法的機器人要麽停滯不前,要麽直接摔倒,顯得“手足無措”。這種穩定性得益於係統的高效學習方法,使得機器人不僅能在理想環境中行動自如,還能在不確定的動態環境中靈活應變。

除了“推擠測試”,ExBody2的機器人還通過了“複雜地形行走”考驗。實驗室模擬了崎嶇的地麵環境,比如帶有小台階和傾斜的路麵。普通機器人在這種環境中經常“腳步不穩”,容易滑倒。而ExBody2的機器人就像一個穿著防滑鞋的登山者,步伐穩健,能夠調整步長和姿態,從容跨越台階和不規則的地麵。這種表現背後的關鍵在於,機器人能夠“記住”之前的動作調整,並在遇到類似的環境時迅速做出“類似的反應”。這種記憶能力使它在不斷變化的環境中也能“步步為營”,不像傳統的機器人隻會在固定的環境中反複做一成不變的動作。

這些測試不僅是在實驗室中做的“花架子”,也具備一定的實際意義。比如,當家中的清潔機器人在打掃地麵時,地上突然出現了一個小玩具,普通的機器人可能會直接被卡住,或嚐試多次繞行,但ExBody2的機器人卻能迅速“明白”前方的變化,做出合理的繞行決策。

此外,在工業流水線中,這種“靈活反應”同樣至關重要。傳統的工業機器人隻能在指定位置“拿放物件”,但如果流水線上突然出現了一塊偏移的物料,ExBody2的機器人會迅速調整位置,主動適應物料的位置變化,就像流水線上的“超級工人”,不再是一個“死板的機械手”。

為了驗證ExBody2在不同場景中的表現,研究團隊還量化了幾項關鍵的性能指標,比如在關節位置精度(下表中的Eₘₚⱼₚₑ) 上,ExBody2的機器人誤差降低,而普通的機器人誤差則要高出數倍,這一差距直接反映在動作的精準度上。

在其它指標比如關鍵點位置誤差(Eₘₚₖₚₑ)、速度誤差(Eᵥₑₗ)方麵,ExBody2均有優勢。



(ExBody2與其他方法在宇樹G1和H1上的性能對比結果)

總結來看,ExBody2的成功不僅體現在課堂中的“標準化訓練”,更體現在真實環境中的“靈活應變”。通過應對“推擠”、“複雜地形”和“動態物料變化”等考驗,ExBody2的機器人展現了比傳統機器人更高的穩定性和靈活性。配合關鍵指標的量化表現,證明了這套係統的優越性。無論是在家中還是在工廠,ExBody2的機器人都不再是“機械的螺絲工人”,而是能夠“見招拆招”的“智能工作夥伴”,不論是家用服務場景,還是工業生產場景,ExBody2給人形機器人帶來新的可能性。

查看評論(5)