這兩天的機器人大會竟被吐槽為“蠟像博覽會”,我翻了翻大家現場發回的視頻和照片——可以理解成“賽博聊齋”或“恐怖穀嘉年華”,大概就是這麽個意思。
“機器人”的確不必像人,但性愛機器人還是越像越好——至少大多數人是這麽期望的。
十年之後……丨Giphy
甚至很多人還會迫不及待給出一個自己的預測——一個性愛機器人“進入千家萬戶”的具體時間:
2014 年,皮尤研究中心預測,機器人性伴侶將在十年內很快普及;
2015 年,英國媒體預測,大約2025年前後,人類與機器將能夠建立性關係;
2016 年,一家為公關公司做未來趨勢預測的機構,十年左右,性愛機器人將進入中高收入群體。
2014-2016,正是上一輪AI和機器人被廣泛討論,並被給予厚望的時代,就如同今天一樣。十年過去了,說好的性愛機器人呢?(我沒急!誰急了?!)
我最期待的科技進步之一丨Giphy
一萬美元的溫存
大多數機器人是不必執念於“做個人”的。工廠裏的機械臂伸出來是“螃蟹鉗”,擰螺絲、搬重物,早就比真人好使多了;
還記得這一集麽?也許一隻“手”就夠了……丨Giphy
商場、酒店裏的來回跑的,專業的名字叫“服務型機器人”,“沒臉”,輪子上頂個帶 iPad 的“床頭櫃”,在這樣的空間中,輪子比雙足跑得又穩又快;
而至於如今最常見的機器人,則是滿大街跑的蔚小理、特斯拉,除非能變形,不然更是和人形沒有半點關係。
但一類機器人,必須像人。性愛機器人(Sex Robot),人形機器人的終極“聖杯”,要模仿人製造出生理功能,在每一次動作、表情、接觸中都不讓人產生“恐怖穀效應”;滿足人的情感訴求,將機器“人”的每一項技術要求“拉滿”。
設計成這個形象,你很難說工程師在想什麽~丨Giphy
打開目前最先進的性愛人偶官網,隨便選擇一款叫做“Novax”的sexrobot(機器人的性別隻有女性可選),基礎版本標價 7199.99 美元。
Novax 是模塊化設計的,以防萬一哪天你厭倦了她的長相或身體。她的脖子、眼睛、嘴、眉毛都可以做“有限製的”運動。這家公司做人體模型和情趣玩偶起家, Novax 們的外形都十很“寫實”,臉部仿生度很高。使用者甚至可以和她接吻,但小心有浸液風險,因為她的芯片和線路大多布在後腦。
就是這個網站,但其他宣傳圖實在不敢放出來……丨網站截圖
嵌入機器人下體的傳感器,需要另外付錢。它可以模擬人體的接觸,檢測使用者的運動,反饋給機器人,讓她做出逐漸興奮的反應——但目前也僅僅是聲音上的。
如果你想要對五官、形體、器官等特征做一些特殊“愛好”的自定義,估計還要再多付 5000 美元。
這種性愛玩偶其實仍無法被嚴格地稱為“機器人”,但相比多年前的產品已經能體現出更複雜的交互和更好的使用體驗。
初代Roxxxy,呃……丨官方宣傳資料截圖
比如,曾經美國性玩具品牌 Roxxxy 推出的性愛玩偶,有男女兩個版本,隻是在內部嵌入了鉸鏈金屬骨架,以實現手動擺出並固定各種姿勢……在當時售價就要近一萬美元。
如果你真的被 Novax 打動,並且覺得這錢花得真值,把你的機器伴侶接回家之後,或許才是麻煩的開始……
愛的姿勢與套路
某個深夜,孤枕難眠,你搬出了你可人的伴侶——“寶貝兒,先凹個造型~”,但“寶貝兒”的身體忽然不聽使喚了,就像是卡殼的洗衣機,惱人的蜂鳴聲中,她停在了一個貞子一般的姿勢,還直抽抽。
這個流暢程度,恐怕……丨Giphy
你氣得找售後理論,“買的時候,說挺好,無縫更換姿勢。”客服解釋道:“這就跟人上了年紀,身體沒那麽活泛一樣,這機器人的關節還是沒法跟人比的。”
目前最火的人形機器人特斯拉“擎天柱”來舉例,它身上有 40 個驅動器(軀幹 28 個,雙手 12 個),可實現全身 200 多個自由度,手部 11 個自由度。相比之下,人類(按照大多數人將關節定義為兩塊骨頭相交的地方)大概有 350 個關節。
我總覺得,要靈活到這樣才行吧丨Giphy
機器人若想實現精準的動作,需要運動控製算法將各“關節”的軌跡規劃出來,並給出各關節的控製參數(比如力度,角度,速度等)。
一些先進的控製策略,旨在提高機器人的自主性和對環境的判斷力。比如MPC(Model Predictive Control,模型預測控製),在每一個采樣瞬間,求解未來一段時間內達到最佳狀態的一序列動作,再回過頭來確定當前動作。例如,觀察到斜坡上有水,就放慢速度;預見後麵要騰空,就加幾個墊步過渡,使連接更流暢。
但在此之前,機器人得有一套盡可能全的動作庫,和一張描述了它行動路線的地圖。
靈巧無雙丨Giphy
你或多或少也聽明白了,從“智能”程度上來說,“Atlas (來自波斯頓動力)們”還是一個編程好的機器人,與工廠裏機械的單任務裝配線工具無異。環境感知和運動控製算法的能力的提升,讓它的“表演”看上去是自發性的,但還遠稱不上智能。
這就好像,你的性愛機器人隻被“調教”過公主抱。有一天,你對它嬌嗔:“舉高高~”。先不說,它的“雙手”會不會把你肋骨掐得生疼,最怕,它會把你一頭塞進天花板。
可以腦補一下,如果在床上發生這種失誤……丨Giphy
原因是傳統機器人的運動控製方法不具備泛化性。進入全新的、開放的環境中的前提是得建立環境準確的模型。
拆解目前市麵上人形機器人的各部分,其實可以勉強做出對應真實人體的類比:“身體”,機器人本體(構型,材料等)和負責各功能的硬件模塊;
一些“小腦”問題……丨Giphy
“小腦”,運動控製係統,向上承接大腦給出的任務指令,向下控製本體整機的運動;
以及“大腦”,負責推理、規劃、決策,和環境感知和交流——以目前的技術成熟度來說,機器人的身子強於腦子,硬件本身領先於智能水平。
前戲,有戲
人類對於機器人“智能”的定義,十分模糊,各執一詞。但又幾乎都能矯情到一個點上,比如要求朝夕相處的機器人,在含情脈脈看向你時,得知道你是你,不能把你認成別人。如果認錯了,就跟人類伴侶在睡夢醉酒中,夢囈著他人名字一樣。
過去,機器人要知道你是你,得事先給它看人在各種樣子、角度、光線下的照片,穿衣服的裸體的、長發的短發的、化妝的素顏的……
將大語言模型作為“大腦”,它能在過往訓練數據中學習到共性,將知識遷移到一個全新問題上,做到聞一知二、舉一反三。大模型在自然語言理解和邏輯推理能力的進步,正在改變機器人的人機交互和決策規劃方式(也是機器人擺脫智障標簽的關鍵)。
機器人聽到“幫我從冰箱裏拿一個蘋果”的指令後,通常分四步:定義任務;做任務分解和動作拆分(來到冰箱前-開門-取蘋果-關門-到你跟前-遞給你蘋果);為每一步調取機器能讀懂的符號式指令;執行。過去機器人靠自己隻能完成最後一步,前麵都由人類工程師設計,編程好。而現在機器人可以直接處理自然語言指令,如果指令複雜就自行按邏輯拆解成一序列步驟,按步解決。
Figure的驚豔表現得益於多模態AI的加持丨官方視頻截取
測試者對正在做家務的 Figure AI 機器人說,“你能把它們收到那裏嗎?”一並指了指桌台上的收納筐。它“秒懂”,還知道把洗好的杯子倒放,盤子立著疊——上下文模糊指代,說話抽象,這些人類的對話習慣,機器人也懂了。
還是某個深夜,你又孤枕難眠了,搬出伴侶後,你問它:“達令~你愛我嗎?”它回複:“根據斯滕伯格的愛情三元理論,愛情由親密、激情和承諾三種成分構成。論親密,你經常跟我講老板的八卦;說到激情,我們剛剛才體驗到生理上的興奮;而我願意與你維持這樣的關係下去。”
不對,性愛機器人不能是過於順從的“電子舔狗”。
有效交互式營造氛圍重要的一環丨Giphy
我們期待的靈魂(機器)伴侶,大概是這樣的:你一句“我累了”,它或許隻是坐到床邊,靜靜陪伴你,並在必要時給你一個擁抱。
你對 Figure AI 機器人說“我餓了”,它會思考片刻後,拿一隻蘋果給你。不耐煩的人類伴侶要小心了,看來機器人真的準備好提供情緒價值了。
在機器甜心麵前,不必偽裝
除了決策,控製,交互,一個合格的“機器尤物”還要具備通用感知能力。感知也是實現上述這些的前提。
人類的感知天然是多模態的,五感會對應一個 token 存儲在人腦中。不同感知方式互為補充,構成對現實世界盡可能全麵的體驗和理解。
力反饋對於人來說,是再普通不過的事。機械“關節”想握雞蛋而不碎,需要非常精準的扭矩控製,其驅動係統的軟硬件之間,要做大量配合和調試,這在過去更多靠內部感知(力矩、IMU 等)。
如今很多“靈巧手”聲稱具備了環境感知能力和力控算法。特斯拉“擎天柱” Gen2 就曾展示了“輕鬆拿捏雞蛋”。有了這雙手,機器人就能把控好力道,在安慰時輕輕撫摸,而不是給一個“大比兜”。
對於性愛機器人來說,觸感是最必要的“模態”——壓力的變化,強度和頻率的變化,讓機器人判斷出對方,是興奮中,還是興奮過頭了……
然而觸感之外,還需要機器伴侶懂得你情緒的變化,床幃之間,或許是一些聲音,或許是一些微表情。人最擅長心口不一,他們情感複雜又多變。即便正常人類能捕捉到的情緒,也不過是他人的“表麵工夫”。
據說,今天的 AI 已經能“感受”到人的情緒了。
就像在 GPT-4o(雖然一再跳票)的語音交互展示裏,AI 能聽懂語氣詞,會說人話,對話有來有回,流暢自然,且有情感,延時控製在一個字之內。
在大模型湧現出人類情感模仿的能力之前,就有情感引擎(Emotion Engine)之類的技術,在試圖解決機器人情感理解,共情回應問題。
聲音,表情識別(聲音、視覺模態)之外,如果輔以 PSiFI (個性化皮膚集成麵部接口)技術,能采集到說話者麵部微小肌肉運動和聲帶振動,並加以分析其中蘊含的情感信息。諸如此類,更多模態和精細的傳感器將被開發出來,讓複雜的情感識別不成問題。
讀懂表情這件事,對人來說也不簡單丨Giphy
人類一句話中,含驚訝量、含悲傷量、含興奮量等……各有多少,人工智能勢必要搞清楚喜極而泣,和強顏歡笑,哪一種才是真正的快樂。
擁抱電子皮膚能分泌真實催產素麽?
先是傳統的充氣或矽膠娃娃,然後是能擺姿勢的性愛玩偶,最終期待是會噓寒問暖的機械姬……
性愛機器人的命題若想成立,它們需要擁有可雙足直立的軀幹構型和擬人化的運動控製;轉得快的大腦;會回應,甚至主動表達情緒;模擬真實的生理接觸等等一些極為基本的類人的行為表達,和生理特征。
對,最好還能變形,比較好偽裝丨Giphy
但是其中隨便一點拿出來,都是技術還沒攻克的難題。而且這是一個既技術棧複雜,又長鏈條的行業。
機器人維持身體平衡很難(所以才會不斷有被踹不倒的魯棒性測試),所以無法完成下蹲,彎腰等重心改變的動作。
如果你仔細回想,是不是總覺得機器人的走路姿勢別扭?那是因為它們的腿都站不直。因為彎曲是為了提高運動可控性,讓關節可達空間變大,補償行走時重心有所浮動,讓機器人有更好的緩衝能力。如果隻是讓機器人走得更快更穩,有其他很多替代方式。
大模型這個“通用的認知引擎“如何落到機器人的運動控製上,解決機器人的任務泛化和通用性難題,是接下來的重點。“擎天柱”們當前也隻是在工廠裏揀揀貨,安安零件,相比之下,像整理好隨手亂丟的衣服這些生活裏的隨機事件,是對通用機器人更難的命題。
嗯……也許有人也能接受吧……丨Giphy
臉是人類所擁有的帶寬最高的通信工具。人類已經能讓 AI 生成各式各樣,聽上去也自然的聲音。關鍵是,聲音得配合著麵部表情來,做到準確,生動,無延遲。
有研究者試著用 26 個微小電動機,模擬肌肉在做表情時的狀態。當機器人看到人類嘴角似乎上揚,眼睛似乎微微眯起,就判斷人類是想微笑。通過這種模仿、預測、修正,以至未來能自發作出表情反應。
但現實是,拿到各大展會上進行展示的機器人在做完張嘴、眨眼、轉動眼球一些基本麵部動作後,還不“死機”,就挺不容易了。
性愛機器人被認為是人形機器人的終極“聖杯”,而將性愛機器人做到“極致”,是機械工程與仿生學的結合。運用仿生學原理,通過模仿人類的身體結構和運動規律,為機器人創造類似“骨骼”、“關節”、“肌肉”和“皮膚”係統的機械結構。
布滿電子皮膚是一項更高的要求丨Giphy
有機器人試圖在指腹處配置柔性觸覺傳感器,就是為了模仿人類皮膚的功能,靠它可以檢測出觸摸到的基礎力度、溫度、濕度、震動、材質、軟硬等特性。
如果要將“電子皮膚”鋪滿全身,需要大約兩平方米,一家供應商估計光是這些傳感器成本就要超過三萬人民幣。
這樣一看,一萬美元的玩偶也不覺得貴了。好好待“它”,真機械姬到來之前,“它”還得陪你度過無數個漫漫長夜。