機器人真的有意識了 突破狹義AI的自我學習機器人問世
創事記 2019-02-03 08:23
文/金金、大明、張乾
來源:新智元(ID:AI_era)
【新智元導讀】哥倫比亞大學打造一隻“從零開始”認識自己的機器人,這個機器人在物理學、幾何學或運動動力學方麵沒有先驗知識,但經過35小時訓練,能夠100%完成設定任務,具備自我意識。
“有意識的機器人”在春節前現身。
過去幾十年來,擁有自我意識的機器人一直是科幻小說最喜歡的題材之一,現在,這個過去隻存在與科幻小說中的事物離我們越來越近了。
哥倫比亞大學工程學專業的研究人員打造了一種“從零開始”認識自己的機器人,這個機器人在物理學、幾何學或運動動力學方麵沒有先驗知識,最初並不知道自己是蜘蛛、蛇還是手臂,不知道自己長什麽樣子。
在經過35個小時的“初步學習”之後,機器人創建了一套自我模擬。然後利用自模擬器來考慮和適應不同的情況,處理新任務,甚至能檢測並修複機體損傷,繼續處理任務。
最近,這項成果近日發表在Science Robotics上。
成功率100%,堪比人類閉眼睛拿一杯水
成功率100%,堪比人類閉眼睛拿一杯水
雖然人類和動物都可以通過思考來進行自我調節,但目前對大多數機器人來說,仍在學習使用人類提供的模擬器和模型,或者通過費力耗時的試驗來糾正錯誤。機器人還沒有學會像人類那樣模擬自己。
論文作者之一,哥倫比亞大學機械工程學教授、創意機器實驗室主任Hod Lipson和他的博士生讓一個四自由度的鉸接式機械臂能夠思考,具體過程如下:
最初,機器人會進行隨機移動,收集大約1000個移動軌跡,每個軌跡中包括100個點。然後利用深度學習,來創建一個自我模型
不過,創建出的第一個模型是非常不準確的,機器人並不知道自己是什麽,也不知道自己的關節是如何連接的。但經過不到35小時的訓練,自我模型已經和機器人的真實情況高度相符。
這個模型會在閉環係統中執行“拾取和放置”任務,使機器人能夠完全基於內部自我模型,在移動軌跡的每一步上相對原始位置進行重新校準。通過閉環控製,機器人能夠抓取地麵上特定位置的物體,並將它們放入指定容器中,成功率高達100%。
即使在開環係統中,機器人也是完全基於內部自我模型來執行任務,沒有任何外部反饋,機器人完成拾取任務的成功率為44%。
看上去很簡單,但機器臂跟流水線上的機器臂不同,後者是設定好的固定程序,而前者完全是自主學習。
“這任務就好像閉著眼睛撿起一杯水,即使人類也很難完成。”論文一作、Lipson的計算機科學係博士生Kwiatkowski說。
檢測自我損傷,再次模擬自我
這個機器人的強大之處還在於,它可以檢測到自身的損傷。
研究人員利用3D打印打造了一個變形的部件(下圖紅色部件)來模擬機體損傷,結果機器人能夠檢測到這一變化,並重新訓練自我模型。新模型能夠以很少的性能損失為代價,重新成功執行拾取和放置任務。
此外,自我建模機器人還可以用於完成其他任務,比如使用標記筆書寫文本。未來,可能會自己寫對聯?
Hod Lipson說,迄今為止,機器人需要通過人類明確地模擬指令來實現操作。 “但是,如果我們希望機器人能夠獨立、快速適應無法預見的情景,那麽它們就必須學會模擬自我。”
抽取自我模型,無需額外實驗完成多項不同任務
自建模(self-modeling)並非新技術,很多機器人係統都采用端到端訓練的方式,在完全無模型的情況下學會一項任務。但是,通過這種方式學會的任務,往往無法擴展,也即機器人隻能完成被訓練好的那一項任務。
因此,如何實現無模型的擴展,也即通用端到端,就成了一個需要被解決的問題。
考慮到這台機器人本身(從設計上)是可以用來完成多項任務的,研究人員便想,何不從中抽象出一個的“自我模型”(self-model),然後以此為基礎,讓機器人學習各種新的任務,在此過程中不斷調整原有的自我模型。這樣一來,不就能夠實現持續的自監督學習了嗎?
於是,他們讓機器人(或者準確說,機械臂)自行隨機運轉,就像嬰兒自己亂動手腳一樣,得到的數據集用於訓練一個專門設計的神經網絡,也即生成一個原始的“自我模型”。
接下來,機器人使用自我模型,開始完成不同的任務(上圖步驟3),即“抓取並放置”(Pick-and-place)和“寫字”(Handwriting)。無論從機械臂運行的軌跡和下手輕重,這都是兩個完全不同的任務。
作者解釋說,閉環控製讓機器人能通過從位置傳感器接收到的反饋重新校準沿軌跡上每個步驟的實際位置。相比之下,開環控製則完全基於內部的自我模型,沒有任何外部反饋。
由上圖可見,從“抓取並放置”改為“寫字”時,機器人發現前後不一致,為了模擬全新的任務,形態發生了突然改變(上圖步驟4),並使用新數據更新了最初的自我模型(步驟5)。更新自我模型後,機器人迅速轉變狀態,開始繼續執行任務(寫字)。
作者特別強調,他們提出的這種新方法能夠讓機器人自動完成多兩種不同的任務,並且不需要進行額外的物理實驗。從某種意義上說,做到了“無模型可擴展的第一步”。
突破狹義AI,邁向自我意識機器的重要一步
Lipson教授同時也是哥倫比亞大學數據科學研究所的一員,他的研究傳播最廣的應該屬2007年的TED演講,當時也展示了自我感知機器人。
Lipson指出,對自我的想象,是讓機器人突破所謂的“狹義AI”的限製,具備更普遍的能力的關鍵。
“機器人會逐步認識自我,這可能和新生兒在嬰兒床上所做的事情差不多。”他說,“我們猜測,這種優勢也可能是人類自我意識的進化起源。雖然我們的機器人這種能力與人類相比仍然很粗糙,但我們相信,這種能力正在為具備自我意識的機器的誕生鋪平道路。”
Lipson認為,機器人和人工智能可以為我們理解這個古老的意識之謎提供一個新的窗口。
“幾千年以來,哲學家、心理學家和認知科學家一直在思考自然意識的問題,但一直進展不大。我們現在仍然在使用'現實畫布'之類的主觀詞匯,來掩蓋我們對這個問題理解不足的現實,但現在機器人技術的發展,迫使我們將這些模糊的概念轉化為具體的算法和機製。”
不過,Lipson教授和Kwiatkowski博士也認識到這其中可能帶來的道德問題。他們警告說:“自我意識將導致彈性和適應性更高的係統,但也意味著失控的可能性更大了。這確實是一項強大的技術,但我們應謹慎行事。”
參考鏈接:
https://engineering.columbia.edu/press-releases/lipson-self-aware-machines
http://robotics.sciencemag.org/content/4/26/eaau9354/tab-pdf