上周台灣鴻海聯手日本軟銀以及大陸的阿裏巴巴推出一款人形機器人Pepper。這款手售價約1萬元人民幣的機器人,首批300台在推出1分鍾內就被搶購一 空。Pepper具有識別表情和對話的能力,可用於導購和照顧老人病患。它是世界最著名的電子生產企業與IT風投公司、互聯網公司的一次強強聯合,昭示著 機器人正在從科幻、科研、生產逐步走入人們的生活中。
日本暫時領先
東芝美女機器人 仿生機器人是一種在外觀上模仿人類或其他生物的機器人。日本人對於其中的人形機器人有著近乎狂熱的追逐,全世界有四成機器人在在日本,日本也是世界上擁有機器人最多的國家。
日本在機器人方麵的強大是有其深厚工業基礎的,控製機器人精密動作的伺服電機主要被日本、德國、美國所壟斷,其中包括了被大眾熟知的鬆下、三菱等企業。
在日本,有非常多的公司已推出機器人成型產品,包括麵向企業和大眾。這些人形機器人價格不菲,從幾萬美元到幾百萬美元都有。其中最有名的當屬日 本本田公司的ASIMO機器人,他外形酷似宇航員,具備聽覺和視覺。ASIMO可以識別人類的麵部表情和聽懂人類語言,最重要的是他的手和腳都可以完成複 雜的動作。他的手可以完成擰開杯蓋的動作,甚至能打出手語,雙腳可離地奔跑,最高時速可達9公裏。
今年CES上,東芝公司推出了一款“美女”,“她”能夠實現手語交流,並擁有全球最高級的麵部表達能力。可以通過43個氣壓傳動裝置提供安靜、迅速、流暢的肢體運動。它的主要用途是為老人和病患提供幫助。
除日本企業外,美國也有公司在研發類似產品,其中一家名為“波士頓動力”近期開始步入公眾視野,該公司成立於1992年並在前年被穀歌公司收購。波士頓動 力一直與美國軍方有合作,最著名的是BigDog的機器狗項目。這種機器狗可以在各種複雜地形包括光滑冰麵行走,被人踹後也能保持平衡而 不倒。同時,該公司也有Atlas雙足站立的機器人,也由美國軍方讚助,他擁有兩套視覺係統和在崎嶇地形行走攀登的能力。美國企業顯然是看中了機器人在戰 爭中搜索偵查和背馱貨物的能力。
人形機器人在機械方麵還存在著不少問題,由於人類四肢的複雜度,對於機械部件設計有著很高的要求。而且直立行走能力還有很大的改進空間,從近期國外舉辦的機器人奔跑大賽中可以看出,直立行走對於技術積累不足的企業還是很大的挑戰。
鑒於日本企業幾十年來在硬件上的技術積累,他們能在人形機器人上取得如此成就也就不足為奇了。這一方麵讓人感歎日本機械和電子工業的發展高度,另一方麵也讓人產生疑問:日本是不是對機器人的外觀太過於執著而忽視了內在。
美國專注內在
波士頓動力機器狗 美國企業對於仿生機器人的關心程度不如日本那樣強烈。除了機械方麵,美國在機器人的內在,即人工智能方麵的研究,要比日本要深入得多。
早在上世紀90年代,國際商用機器公司(IBM) 就在研發專門用於國際象棋的超級電腦深藍,這台電腦在經曆首次挑戰失敗後,於1997年打敗了當時的國際象棋冠軍,名噪一時。第一次引發了人們對於未來人 工智能技術的擔憂。IBM並未停下腳步,隨後開發了人工智能計算機係統“沃森”(Watson)。它在2011年參加了美國的電視智力節目,並打平了兩位 人工對手。“沃森”的處理速度相當於每秒讀完100萬本書,而且並未聯網,如此強大的知識儲備遠非人類所能比擬,它的問題主要在於對描述較少問題上的無 力。上個月沃森完成了對1900個TED公開課課程的學習,這些內容足以讓一個人從生到死都學不完。
美國一家軟件公司Wolfram於2009年推出問答搜索引擎Wolfram Alpha(W | A)。這一搜索引擎不同於我們通常所用的穀歌與百度,W | A會直接給出問題的答案,作為一家數學軟件公司,Wolfram Alpha能輕易回答各類數學問題,解答數學問題不必借助軟件,直接在搜索中求解。而且W | A還可以回答物理化學乃至人文曆史等方麵的問題,比如詢問“現任美國總統夫人是誰”、“喬布斯的生卒日期”,W | A均能直接給出答案,從而省去了在搜索結果中自己組織答案嗯過程。W | A強大的問答係統已經被蘋果公司的Siri語音助手采用。
在語音識別技術上,美國三家科技公司蘋果、穀歌、微軟都 在加緊布局,Siri、Google Now、Cortana三款智能語音助手已經成為各家操作係統的一大賣點。蘋果Siri得益於布局早以及iOS設備較高的普及度,Google Now憑借穀歌十幾年在搜索引擎上的深耕,微軟Cortana則利用在PC操作係統上的霸主地位,三家各具優勢,未來還將在該領域繼續廝殺。
同時,穀歌、微軟、Facebook等公司在圖像識別領域也開始發力。以圖搜圖、識別圖像內物品、人像識別都是圖像識別的重要應用。而今年穀歌推出的 Photos應用打開了圖像識別技術實用化的大門,Photos智能整理照片的功能初露端倪,未來圖像識別的發展方向即代替人類進行繁複的整理審查工作。
總之,與日本企業不同,自計算機技術革命以來,美國一直在軟件領域處於領先地位。
在家用機器人硬件還無法進入尋常百姓家的情況下,美國企業首先在軟件方麵發力,依托於互聯網上的雲計算技術和手機、PC等現有移動設備,將“機器人”引入生活。這條道路顯然比日本要好走得多。
中國暫露頭角
訊飛語音 相比日本企業對機器人的鍾情,在中國國內,由於技術積累的劣勢,人形機器人落後於美日等國家,仍然主要處於高校研究的階段。
目前,哈工大、清華、上海交大等高校的機器人研究在國內頗具名氣。企業方麵,如新鬆等知名機器人公司還是以提供工業生產為主,尚未有人形的民用級產品問世。
在軟件方麵,中國科技企業與西方國家的差距並沒有硬件那麽大,諸多實用化的人工智能產品已經問世。其中,最大的中文搜索引擎百度近來在圖像識別 方麵奮起直追,招募了一些像吳恩達、餘凱這樣的人工智能專家。今年初百度也聲稱識別錯誤率上已經低於微軟和穀歌。不過,本月ImageNet爆出百度作弊 的“醜聞”,讓原本公布的研究成果不可信,也為百度人工智能團隊抹上了一層陰影。
中國另一家科技公司——科大訊飛無疑在中文語音識別上處於領先地位。借助智能機的發展,科大訊飛推出了手機上的語音輸入法和語音助手。而在這之前,該公 司的文字轉語音技術就曾在北京奧運會期間投入使用。相較於美國企業,本土企業在中文語音技術上具有民族情感與政策扶持的優勢,已在中國的人工智能研究中率 先展露頭角。
結語
Pepper機器人 日前,鴻海與軟銀、阿裏巴巴合作推出的“機器人”Pepper有著明顯的日係特征,1萬元人民幣的價格雖不算太貴,但和手中移動設備相比,並不具備價格優 勢,若和美國亞馬遜推出的180美元智能音響Echo相比則劣勢明顯。而Echo也一樣能做到語音識別和語音合成發聲的功能。
從亞洲文化來看,日本與中國企業的合作顯然是要做出一款外形友善的智能機器人,它承載著更多情感的角色,而非呼之則來揮之即去的助手。我們對Pepper也不必期望過高,畢竟它隻是第一代產品。況且1萬美金的價格和試水的發售量,也讓我們對它背後的技術支持產生懷疑。
Pepper的推出是亞洲地區的企業在機器人領域的一次成功嚐試,但若要在這個領域有更大作為,日企、台企和大陸企業還應該在軟件上奮起直追,而不是把機器人做成徒有其表的玩具。