七、鹿死誰手
AlphaGo和李世乭之間的世紀大戰將從明天開始舉行。究竟誰會取勝?很多圍棋高手在看完AlphaGo和樊麾的對局後認為,雖然AlphaGo棋藝高強,但與李世乭相比仍有一段距離,因而此回李世乭輕取穀歌送來的一百萬美金應該是情理之中的事。不過由於機器沒有感情,不會焦慮、煩躁,所以懸念依舊存在。
即使AlphaGo此番敗北,那麽發生在“深藍”和卡斯帕羅夫之間的事會不會重演?誰能說AlphaGo不會繼續改進算法,來年再度挑戰世界級圍棋選手,並最終取得勝利?
也許正是因為電腦圍棋問題困擾了人工智能專家太多年,才使得AlphaGo打敗樊麾這件事能夠在世間產生如此巨大的反響。人們忽然感到了一種幻覺,認為機器能像人一樣思考問題了,而且思考的是代表人類智慧結晶的圍棋問題。但是,在理解了其基本算法之後,我們看到,AlphaGo的智力水平並不像媒體上宣傳的那麽神奇。AlphaGo的勝利,並非機器智慧的勝利,而是人類算法的勝利。
雖然全世界對深度神經網絡的研究正如火如荼,並已取得很多令人驚異的進展,然而筆者以為,當前機器的智力水準依然處於嬰兒階段。
要說機器使人類望塵莫及,我們可以隨手舉出很多圍棋以外的例子。比如,機器可以將任何一個數字在毫秒量級的時間內開方至小數點後幾萬位,機器可以在同樣短的時間內在一個幾百萬字的文檔裏找到你所需要的關鍵字,機器可以快速地完成傅立葉變換,給文件加密解密,可以根據天空中的雲形做出未來幾周的天氣預報……但是,這些例子都有一個共同點,那就是必須是一種在絕對特定條件下的單項操作。
因此,就像當年“深藍”打敗卡斯帕羅夫一樣,即使明天AlphaGo真的打敗了李世乭,其重大意義也不過就是往這類單項操作的名單裏新添一項。
AlphaGo的成功,不是由於某種新算法的出現(像雷米發明蒙特卡羅樹搜索),而是由於幾種不同的技術被完美地結合在一起,使得它們能夠彼此取長補短,共同發揚光大。但作為技術本身,其突破性並非石破天驚。
深度思維公司的員工也表示:雖然AlphaGo獲得了巨大的成功,但電腦依舊隻能解決非常特定的問題,電腦圍棋也不例外。
人類的智力依然擁有許多機器所無法效仿的特征。比如,人具有無與倫比的適應性,能夠運用現有的知識對未知的局麵作出相對準確的判斷。
我們小時候隻見過解放牌卡車和吉普車,當有一天我們突然在電影上看見了方的、圓的、扁的各類大小汽車時,我們並沒有產生“這是什麽”的感覺,而是自然而然地知道我們看見的是汽車。我們小時候隻見過小鼻子小眼的黃種人,當我們第一次看見長得闊鼻大口的黑人時,我們誰也沒有覺得自己看到的是一隻猩猩。雖然沒有人用這些我們沒有見過的物體來訓練我們,我們依然不會犯判斷上的錯誤。
一個小孩從生下來之後,隻需見過幾種動物───天上的鳥、地上的貓、狗、雞、河裏的魚───腦子裏便會產生“動物”這個概念。此後這個小孩即使見到了從未見過的動物,也絕對知道那就是一種動物,不管這動物的外形長得又多怪。
而神經網絡呢,雖然我們可以訓練它識別人臉,識別各種不同物體,然而我們卻無法訓練它懂得“動物”這個簡單得不能再簡單的抽象概念。
電腦的適應性究竟有多差?讓我們假想下麵一個場景:AlphaGo經過多年頭懸梁錐刺股的不懈努力,終於打敗了中國的柯傑或韓國的樸廷桓。它心想,這下阿爺可是天下第一了,名副其實的天下第一!然而正當它沾沾自喜、不可一世之際,旁邊忽然傳來一個奶聲奶氣的聲音挑釁說,阿爾法,你也忒得意了,敢不敢和我下一盤有點兒創意的棋?
AlphaGo聞聽,心中暗惱,它尋思排名世界第一的著名九段都被我打敗了,哪裏來的小毛孩子竟敢在本大爺麵前撒野?於是甕聲甕氣地回答:來者何人,棋藝幾段,要不要俺送你幾兩棉花,拿去在那宇宙互聯網上紡(訪)一紡(訪),待查清了灑家的段位再來挑戰不遲!
小孩依然不緊不慢地說,俺是個無名小輩,剛剛學下圍棋一年多,不瞞您說,現今連個業餘段位都沒拿到。隻是聽說阿爺這幾年征戰南北,打遍天下無敵手,所以今日特地前來領教您老的厲害。我琢磨著阿爺總和他們下那老規矩的圍棋,肯定早就厭煩了。今天就算我陪阿爺消遣,咱們下一盤有點兒小改動的圍棋來提提興趣,阿爺總不會不敢應戰吧?
AlphaGo勃然大怒:咋不敢?你說吧,隻要你立出規矩,俺老阿就敢應戰!
小孩子不慌不忙地說,說起改動呢其實也沒啥,所有規則還和以前一樣,隻不過把圍棋的棋盤變一變,從19x19變為17x21。
啊!這個……AlphaGo呆呆地瞪著兩眼,半天說不出一句話。它心想,從來沒有人用17x21的棋局來訓練我。所以我現在隻能用拖延戰術,跟小孩說改日再戰,回頭趕緊讓“深度思維”的弟兄們用新的棋局去來訓練我,不過……這世界上到哪兒去找17x21的對局棋譜呢?
是的,僅僅是這麽一個小小的變動,人類棋手可以毫不費力地適應,可是電腦棋手嘛,哈,可要徹底崩潰了。
至少在今天,人類與生俱來的適應性依然是電腦所望塵莫及的。人類在無需重新學習的情況下不但能輕而易舉地應對17x21的棋盤,就是再加上些更為詭異的變化,例如把圍棋盤變成21x21、25x25、甚至鋸掉一、兩個角、在中間挖個洞、把棋盤變成圓形的、菱形的……人類棋手依然能在其間遊走自如,無需任何準備。
所以,人類完全不必因為發明了一個能戰勝九段的機器而沾沾自喜,在人工智能這條道路上,前麵的路還長著呢。
正是因為這個原因,筆者希望李世乭取勝,殺一殺人工智能專家們的威風,激勵他們發明出更新更好的算法。
對人工智能的現狀吐了這麽多槽,並不代表筆者不相信人工智會有美好的未來。正相反,筆者對人工智能的發展充滿信心,並堅信它會給人類帶來繼蒸汽機革命、電力革命、微電子革命之後的第四次翻天覆地的革命———暫稱其稱為“人工智能革命”。這場革命給世界帶來的影響和衝擊將遠遠超過前三次革命的總和,人類的生存方式將被徹底改變。
隻不過,神經網絡並非打開人工智能大門的鑰匙,至少不是唯一的鑰匙。
誰也不知道真正的鑰匙什麽時候才會找到。也許需要十年,也許需要一百年,也許就在明天……
最後以筆者小時候讀過的一則科幻故事來結束全文,希望能給大家帶來一些啟發。
教授歐米伽帶著機器人阿爾法來到一個遠離太陽係的荒涼星球,他要在這裏進行一項星際科學考察。
歐米伽在一塊較為平坦的空地上建好營地之後,便囑咐阿爾法看好營地。最後他特別強調說,任何人想要進入營地都必須先回答正確的口令,這口令便是……歐米伽附在阿爾法耳邊輕聲說完口令,便離開營地,到外麵考察去了。
歐米伽忙碌了一整天,在獲得了該星球的很多第一手資料後,筋疲力盡地回到營地。當他見到機器人阿爾法時,便急忙迎上前去。他太累了,很想一頭鑽進營地,好好地解解乏,同時還可以讓阿爾法給自己端來些火腿腸和啤酒什麽的。
“口令!”哪知阿爾法卻冷冷地向教授發問。
教授心想,這阿爾法還真是挺盡責,不愧是自己一手調教出來的機器人。他正想張嘴回答,卻發現自己親自傳授給阿爾法的口令早被忘到九霄雲外去了。
“阿爾法,是我呀!”教授和顏悅色地說,“你難道不認識我嗎?我是歐米伽教授啊。”
“我不能肯定,您長得很像歐米伽教授,可是,任何人想要進入營地,都必須先回答正確的口令。這個命令是歐米伽教授自己下達的,我必須嚴格執行。現在,請回答口令。”
不論歐米伽怎樣解釋,阿爾法就是不允許教授進入營地。
歐米伽施展了各種手段,包括威嚇、利誘、蒙騙、狡辯、討好、據理力爭……但阿爾法就是不買賬。
歐米伽隻好承認說:“其實口令我是知道的,隻是現在想不起來了。現在請你把口令告訴我,好讓我進去,行嗎?”
阿爾法很堅定地回答:“歐米伽教授沒有說可以把口令告訴任何人。”
“混賬,我就是歐米伽教授,現在我命令你把口令說出來!”歐米伽教授簡直憤怒了。
“對不起,在沒有回答出口令前,我不能肯定您的身份。請回答口令!”
歐米伽教授被折騰得快要虛脫了,他打算先找一個地方休息一會兒,回頭再和阿爾法理論。
然而走出去沒多遠,他就感覺自己快要堅持不住了。如果再不回到營地,自己的命就要丟在這個荒涼的星球上了。歐米伽教授不顧一切地轉過身,向營地撲去。才走了兩三步,他竟一頭跌倒在地。昏昏沉沉之中,教授拖著沉重的身子,一點兒一點兒向前爬行。
機器人阿爾法正在精神抖擻地執勤,忽見遠處慢慢悠悠爬來一個怪物。這個怪物是阿爾法從來沒見過的:長得有點兒人形,卻不用腿走路,而用四肢爬行。臉上全是塵土,兩眼深陷,這更不符合人的特征。嘴裏發出的聲音倒有點像人類的語言,可是一個個單詞都連不成句,而且聲音又是那麽沙啞、虛弱和無力。這肯定是一種自己從未見過的動物。
眼見這動物向著營地就爬來了。阿爾法開始了進一步的思考:該不該讓這個似人非人似狗非狗似熊非熊的家夥進去呢?阿爾法再次重溫了歐米伽的話:任何人想要進入營地都必須先回答正確的口令。
任何人想要進入營地都必須先回答正確的口令。眼前這個在地上爬的家夥明顯不是人,而是一種奇怪的動物。既然教授沒有對動物作任何限製,那我就讓這家夥進去吧。
歐米伽教授終於得救了。
預祝AlphaGo和李世乭在比賽中取得優異的成績!
全文完
階梯講師原創作品•謝謝閱讀
我在文中想要強調的是機器不具備適應性這一點。小孩提出用17x21的棋盤下,機器是無法立即作出調整的。它必須請開發人員把程序改寫,改變數組尺寸,去掉神經網絡,重新編譯,重新調試,才有可能再來下棋。等17x21的程序開發好了,小孩再提一個新尺寸,機器照樣下不了。
所以我覺得,開發通用型人工智能軟件比死磕隻能做一件事的人工智能軟件意義大得多。
AlphaGo與眾多圍棋程序不同之處不在蒙特卡洛樹搜索,而是在神經網絡的運用上。樓主前一篇博文未能對此詳解是有原因的,因為Google對此並未透露太多!正是在這一點上AlphaGo勝過了CrazyStone等,使得它不像其它圍棋程序那樣會犯人看來常識性的錯誤。也就是說,它基於統計規律建立的神經網絡具備了一定的“常識理解”,並可用這種理解去應付從未遇到過的局麵。