圍棋 - 人類最後的智力驕傲要被人工智能打敗了嗎?(ZT)

昨日,不少網友可能都被一條消息給“震住了”——“麵對穀歌圍棋AI,人類最後的智力驕傲即將崩塌”①。這則消息講的是穀歌公司旗下團隊研製的計算機程序“阿爾法圍棋”首次在沒有讓子的情況下,戰勝裏人類職業圍棋選手。這個事情是真的嗎?如果是真的,能說是人類被電腦打敗了嗎?《較真》為你解讀。

 

 

查證過程

1、人工智能打敗職業圍棋選手確有其事

這次“阿爾法圍棋(Alpha Go)”打敗人類職業圍棋選手的新聞,來自國際知名的科學期刊《自然(Nature)》的最新一期封麵論文,穀歌旗下的這支團隊在論文中介紹了如何大幅度提高裏人工智能圍棋的水平。被“阿爾法圍棋”5:0比分打敗的這名職業棋手叫樊麾,是連續幾年的歐洲冠軍。有讀者或許清楚歐洲圍棋水平遠不如東亞,但樊麾本人是來自中國的棋手,在中國取得了職業二段證書。雖然樊麾定段的年代比較早,但終究也是職業棋手,與現在活躍的頂尖高手李世石、柯潔等,最多也就讓兩子水平的差距。

歐洲圍棋冠軍、職業二段樊麾歐洲圍棋冠軍、職業二段樊麾

所以,至少可以認為,“阿爾法圍棋”的水平已經摸到了人類職業棋手的邊了,如果能在接下來在今年三月的人機大戰中戰勝曾經統治棋壇的李世石九段,其意義就相當於當年IBM超級電腦“深藍”戰勝國際象棋世界冠軍卡斯帕羅夫。按國內職業高手李喆六段的初步判斷,“阿爾法圍棋”在棋譜中展現的棋力,“大約是頂尖棋手讓先或讓先倒貼的實力,離戰勝人類還有一小段距離”,但這是去年10月的水平,今年3月會有怎樣的表現,非常值得期待。

2、回顧電腦圍棋的發展曆史,“阿爾法圍棋”的成就確實令人震驚

棋類運動,通常都是“完全博弈”,即所有信息都在棋盤上呈現,勝負完全不取決於運氣,被認為是智力競賽的極佳載體。在圍棋之前,人工智能早已打敗幾乎所有棋類領域的人類專家,最典型的如國際象棋——電腦程序已經幾乎研究透所有的開局庫、殘局庫,中局計算的深度也遠超人類,更重要是幾乎從不犯錯,已經沒有任何人類能打敗程序。

而來自東方的、具有數千年曆史的圍棋則不同,圍棋被認為是“人類發明的最複雜也是最美的遊戲”(穀歌團隊就這個觀點)。稱圍棋最複雜,是因為其變化非常之多——在國際象棋的任何一個回合,平均可能的走法有35種。但圍棋的走法卻能達到250種。而且,國際象棋或象棋的目標非常明確,就是“殺王”,每一個著法之後,對“殺王”有多少好處較易通過函數評估,而圍棋是“地多者勝”,這個目標要相對抽象,導致估值函數非常不平滑,差一個子盤麵就可能天翻地覆。人類高手可以輕易駕馭圍棋,但程序卻相當困難②。

可以非常粗略地把電腦圍棋的發展曆史分為三個時期。在電腦圍棋發展的早期,主要是通過“人類手把手教電腦”的方式,來提升電腦圍棋的水準——人類告訴電腦在特定情況下有哪些招法,告訴電腦怎麽評估一手棋的好壞,然而這種函數評估都是“靜態”的,而且很不準確,非常不善於應對變化,一般隻對處於棋局初期的局麵有一定作用,當棋局進入激烈廝殺後的中後盤後,往往就亂下一氣。

早期圍棋程序,是基於“特征識別”來對局麵進行靜態評估,這種方法成就有限早期圍棋程序,是基於“特征識別”來對局麵進行靜態評估,這種方法成就有限

在網站computer-go.info上麵,有個記錄人機圍棋大戰曆史( Human-Computer Go Challenges)③的頁麵 ,從中可以看出電腦圍棋程序挑戰人類業餘圍棋高手乃至職業選手的艱苦曆程。圍棋人機對戰最早從1986年就有記錄,但一直發展到2005年,電腦程序還隻能在被讓15個子的情況下,與人類業餘棋手苦苦抗衡。所以2008年的時候,聶衛平九段還認為“電腦圍棋水平還停留在被人讓二十多個子”。這足以說明早期圍棋電腦程序實力還相當有限。

不過重大的變化在2005、2006年已經發生了,圍棋程序普遍用上了一種叫“蒙特卡洛樹搜索(MCTS)”的方法,來改進其算法的估值函數,這可以算作電腦圍棋發展的第二個時期。“蒙特卡洛樹搜索”是一種概率論的方法,通俗地來說,在一個特定的局麵下,電腦大概有幾個著點可以選擇,怎麽判斷哪個著點最好?就是每個點都“試一下”,“試”的方式如下:選定一個著點後,用隨機著法模擬完對局,模擬幾千幾萬盤後,看勝率如何,勝率最高的著點就是最好的著點。使用這種方法改進算法後,電腦圍棋的水平有裏大幅度的進步,2007年,一個叫“MoGo”的程序在9路棋盤上打敗了人類職業棋手。隨後湧現的“Zen”、“Crazy Stone”等程序,慢慢達到了業餘圍棋好手的水平,與職業棋手的差距在四、五個子左右。

然而這種方法有其極限,其實質是一種“窮舉法”,但圍棋的變化實在太多了,再先進的硬件也無法窮舉完所有變化,電腦計算能力變強也無濟於事。而且,在很多人工智能的研究者看來,就算以後超超級計算機能夠用窮舉法戰勝人類,也不能說解決了人工智能。直到最近幾個月,以“蒙特卡洛樹搜索”為核心的圍棋程序還與職業棋手有鴻溝般的差距。

去年下半年的時候,大部分圍棋程序麵對人類高手(名字後麵帶去年下半年的時候,大部分圍棋程序麵對人類高手(名字後麵帶"p"的,表示職業)仍有4個子以上的棋力差距,“阿爾法圍棋”能在平等條件下(Even)橫掃2p,令世人震驚

這就是為什麽“阿爾法圍棋”的橫空出世極具震撼性。據《自然》上的這篇論文,“阿爾法圍棋”不僅5:0戰勝了樊麾二段,還在對陣其他圍棋程序中,取得了495局比賽中494次勝利的成績(99.8%)④。甚至在“阿爾法圍棋”讓其他程序四個子的情況下,還取得了絕對優勢。這可以說是電腦圍棋發展曆史的第三個時期,目前距離人類頂尖水準已經非常接近了,而其中關鍵,正在於電腦已經能夠“真正地”向人類學習如何來下棋,這與國際象棋程序“靠計算能力打敗人類”有著本質上的不同。

3、“阿爾法圍棋”取得如此成就的原因:機器學習

穀歌旗下團隊之所以能夠取得如此的重大突破,並不是毫無預兆的,與同樣正在攻關電腦圍棋的Facebook團隊一樣,他們都應用了一種叫做“深度卷積神經網絡”的技術。這是人工智能領域非常熱門的一項技術,廣泛用於圖像和語音的智能識別方麵。

從廣義的層麵來說,“深度卷積神經網絡”是“深度學習”的一個分支,而“深度學習”又是“機器學習”的一個分支。機器學習,指的是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的算法,是人工智能的熱門領域⑤。這個說法聽起來沒有什麽稀奇之處,然而,“深度學習”是一種模仿人類大腦神經元工作的技術,加上這一技術強調的是“自動”,所以深度學習會給人一種“活物”的感覺。在穀歌團隊的論文裏,多處用到了“訓練”這個詞——“阿爾法圍棋”之所以這麽厲害,就是因為團隊用職業棋手的棋譜“訓練”它,讓它總結出職業高手下棋的招法和規律——用愛丁堡大學教授Amos Storkey的話來說,程序“並不是希望找出最優走法,而是學習人類的下棋風格,然後對人類棋手進行有效的複製。”⑥穀歌團隊的論文也提到,“在與樊麾的比賽中,阿爾法圍棋在評估位置方麵要比深藍與卡斯帕羅夫比賽時所評估的位置少幾千倍”。

在穀歌團隊的論文中,提到“我們用19X19的圖像來傳遞棋盤位置”,來“訓練”深度神經網絡⑦在穀歌團隊的論文中,提到“我們用19X19的圖像來傳遞棋盤位置”,來“訓練”深度神經網絡⑦

與初期的“人類手把手教電腦下圍棋”相比,“自動學習”無疑是革命性的。據穀歌團隊的說法,用這種方法做出的圍棋程序水平,輕易就達到了最先進的蒙特卡洛樹搜索算法的級別,兩者再一結合,就達到了接近職業棋手的程度。

4、這是否能說明人工智能已經可以打敗人類?說不定會全方麵來臨

電腦圍棋真的戰勝人類圍棋高手了,到底有什麽意義呢?能說明人類被人工智能打敗了嗎?很多人不以為然——“人工智能不也是人類創造出來的嗎,即使人類下圍棋下不過電腦了,那也不過是人類打敗人類,怎麽能說人類的智力驕傲崩塌了呢?”

一個深度學習的典型過程:通過具象到抽象,機器能夠自動提取出分析對象的特征,從而完成“學習”一個深度學習的典型過程:通過具象到抽象,機器能夠自動提取出分析對象的特征,從而完成“學習”

從某種意義上來說,這種說法不算錯。但在很多“未來學家”眼裏,這種“青出於藍而勝於藍”的景象,說不定是令人恐懼的。機器並不是通過“死算”,而是通過“自我學習”,在能夠象征人類智慧的棋類項目上戰勝人類,在其他一些以前看起來隻能人類做到而機器人無法做到的領域——諸如自動駕駛、人工智能客服等等,智能機器人說不定都能勝於人類,這種現象說不定會全方麵地來臨。到時候普通的人類們該如何自處呢?雖然這種人工智能還不具備“自我意識”,與科幻電影中那些跟人類無異的機器人還相去甚遠,但會讓這個世界會發生怎樣的改變,恐怕也已經很難想象了。

《較真》欄目微信公眾號已開通,歡迎掃描二維碼或微信公號搜索“全民較真”,查看更多內容,提供疑似不實新聞,並與我們進行互動。
結論

人工智能打敗職業圍棋選手確有其事,而且關鍵之處在於,人工智能並不僅僅是具有強大的計算能力,還能夠通過“自動學習”的方式模仿人類的行動。人工智能的最新發展正展示著一個廣闊而未知的未來。

 

參考資料



更多我的博客文章>>>

所有跟帖: 

沒啥新東西呀,打敗一個職業二段就炒飯天了。 -羊排- 給 羊排 發送悄悄話 (0 bytes) () 01/29/2016 postreply 08:36:49

看介個深度學習的描述也是靠大量記憶來學習,模仿人類,俺覺得醬紫超過人類的希望不大 -blueVelvet- 給 blueVelvet 發送悄悄話 blueVelvet 的博客首頁 (0 bytes) () 01/29/2016 postreply 08:37:05

電腦有一點確實比人類有優勢;就是應該不受情緒影響,出昏招的可能性小 -板凳球迷- 給 板凳球迷 發送悄悄話 (98 bytes) () 01/29/2016 postreply 08:39:52

你錯了,依俺跟機器下棋的經驗,機器會瞎JB搞,剛才還挺正常的,突然就亂下了, -blueVelvet- 給 blueVelvet 發送悄悄話 blueVelvet 的博客首頁 (89 bytes) () 01/29/2016 postreply 08:46:11

情緒穩定隻保證平均水平,大家關注的是巔峰表現。你的例子讓俺想起了那年總決的空調事件,哈哈 -羊排- 給 羊排 發送悄悄話 (0 bytes) () 01/29/2016 postreply 08:46:54

.我在想像:是均衡地把棋下得長一點,還是屠龍,人會思想激烈鬥爭。機器會嗎?會保守,會冒險,會怯陣嗎? -板凳球迷- 給 板凳球迷 發送悄悄話 (0 bytes) () 01/29/2016 postreply 08:55:20

空調事件是一事故。馬刺和騎士都在高溫下烘烤,機會均等。哈哈 -板凳球迷- 給 板凳球迷 發送悄悄話 (0 bytes) () 01/29/2016 postreply 08:56:16

比如老聶,下了三個小時就要吸氧,體力也跟不上了 -I751- 給 I751 發送悄悄話 I751 的博客首頁 (182 bytes) () 01/29/2016 postreply 10:02:48

老孽那小身板隨時掛 -Redcheetah- 給 Redcheetah 發送悄悄話 (0 bytes) () 01/29/2016 postreply 11:41:00

感想 -路邊野花不採白不採- 給 路邊野花不採白不採 發送悄悄話 路邊野花不採白不採 的博客首頁 (497 bytes) () 01/29/2016 postreply 10:12:07

請您先登陸,再發跟帖!