ZT 李喆:寫在第五局之前 AlphaGo展現的新世界

李喆:寫在第五局之前 AlphaGo展現的新世界

2016年03月15日13:21    新浪體育 微博 我有話說(469人參與) 收藏本文
 
韓國棋手李世石韓國棋手李世石

  寫在第五局之前

  首先對我之前兩篇文章簡單回顧,之後梳理李世石在第三局、第四局中的策略行為,最後,以自己職業棋士的立場看待此次人機對決

  0 對前兩篇文章的回顧

  第一篇《李世石的策略與AlphaGo的弱點》的開頭,分析李世石第一次麵對AlphaGo時所采用的試探和策略。然後指出傳統意義上AlphaGo下出的失誤和好棋。之後談到AlphaGo失誤在算法上的原因,以及人和AI對失誤的不同定義。第5節,通過對棋譜和算法的分析明確提出AlphaGo的兩個弱點:邏輯缺失、逃避劫爭。第6節,針對這兩個弱點對李世石第二局的策略進行了預測和建議:套路開局、製造劫爭。

  在第二篇《這兩盤棋,沒人比李世石做得更好》,首先分析了“協議禁劫”為什麽不可能。

  之後討論了AlphaGo的算法決定其落子的決策基於“勝率”而不是“最優”,並分析了李世石在第一局的策略和表現。在此基礎上,分析了李世石第二局的策略和行為,指出AlphaGo的強大(和不完美),以及誤判它實力的原因。之後,指出李世石麵對AlphaGo所做出的種種努力,以及圍棋Ai作為參照者對於人類探索圍棋的重要意義。第5節,分析了後三盤可能的情況。最後,由算法得出向AlphaGo學棋的陷阱和巨大價值。  

  1 第三局李世石的策略

  讓我們進入正題。我將AlphaGo為我們敞開的新世界留在下一篇來描繪,在這一篇,我們還是切入李世石的視角,看看在第三局和第四局中他究竟做了什麽,又是如何得到了第一次勝利。

  在前兩局,李世石通過不同的策略得到了很多可以轉化為人類語言的信息,概述如下:

  第一局

  1,過“無譜布局”得知AlphaGo不依賴背譜

  2,通過“避開定式”得知AlphaGo選點基於全局

  3,通過“開放式複雜局麵”得知AlphaGo不怕亂戰

  4,通過“細棋局麵”得知AlphaGo存在邏輯缺失導致局部虧損的弱點(因算法導致的優勢退讓)

  第二局:

  1,通過“常規布局”得知AlphaGo會有“創新”下法

  2,通過“均衡局麵”得知AlphaGo此局麵下後半盤極強

  3,通過對手下法得知AlphaGo存在逃避劫爭的傾向(在第一局也能看到,但第二局更為明顯)。

  如果你獲得了這些信息,你會如何麵對第三局?

  在上一篇文章的第五節,我預測李世石會試一試劫爭,雖然可能並沒有用。另外我認為空中開局會比較有趣,或許能見識到很多新東西。

  從爭勝的角度,還是用“常規布局”優於“無譜布局”。這是因為,對於人而言,“常規布局”是曆史上棋手整體的經驗結果,而AlphaGo不背譜,常規與否對於它並無差異。

  確定了布局方法之後,還要製定布局策略,才好最終選擇布局。在第二局中,李世石得知均衡局麵下AlphaGo後半盤極強,“失誤”減少。如果選擇均衡將很難取勝,因此寄希望於前半盤取得較大優勢。

  1,常規布局;2,爭取大優…。。滿足這兩個條件最好的開局是——大模樣!

  李世石選擇了左下先掛的高中國流,這是現代最典型的大模樣開局

  大模樣開局的特點是:一,容易形成攻殺局麵;二,優劣出入比較大。

  果然,AlphaGo第12手掛入,給了黑棋開局攻殺的機會。

  李世石13、15兩手。都是在有兩種選擇的情況下選擇了最為凶狠的下法。

  第二局結束之後,很多人質問李世石為什麽失去了血性,為什麽那麽穩健地輸了。在我看來,這是李世石的策略而已,他在第一局找到的電腦可能的弱點,在第二局中以這樣的方式來針對。即使他並不擅長從頭到尾均衡平和的局麵(那是李昌鎬所擅長的),他仍然堅定地貫徹了這一策略。當然,針對性策略在某種程度上確實會束縛住他,加上心理上不可避免的壓力,在技術上難以發揮到極致,這是不應苛責的。

  也有一種觀點是,幹嘛要去找電腦的弱點,做好自己就行了。去找對手的弱點本身就做得不夠好。

  的確,大部分棋手都不會考慮對麵坐著的是AlphaGo,隻要下好自己的棋。但是,每個棋手在每局棋中都會有麵臨兩難選擇的時候,此時如何選擇,在我看來都是做自己。

  《孫子兵法》雲“知己知彼,百戰不殆。”了解對手,既是為了更好地爭勝,也是對對手極大的尊重。

  如前麵所說,如果沒有李世石前三局根據AI的回應而不斷變換的進攻手法,我們就不可能如今天這般全麵地了解AlphaGo在圍棋盤上的特點,也難以取得第四局這樣艱難而酣暢的勝利。反過來想,即使真的在第一局就出現了第四局這樣的情況,我們對AlphaGo的誤判將會達到什麽程度?

  回到第三局,李世石布下了大模樣開局,在對方深入之時選擇了最為強烈的攻殺手段,希望在棋局前期取得大優。

  但是,我們看到了AlphaGo近乎完美的處理。

  白16,這手棋基本上否定了黑15的下法。過程中黑21應有疑問,但這是作為對局者在實戰之前很難確認的事情。

  白32,基本上宣告了李世石此局策略的失敗。

  對於AlphaGo而言,它本身並沒有“治孤”這樣的概念,但在第三局,它麵對李世石選擇的這種局麵時,表現出強大的能力。

  基本上所有的棋手在第三局之後都認可了AlphaGo的實力在人類棋手之上,這是因為,AlphaGo以所有棋手都看得懂的方式輕易地化解了李世石開局的淩厲攻勢,取得了完勝。

  這局棋,白棋的反擊得手之後,已經是李世石崩潰的局麵。但李世石的強大之處在於,在這樣的局麵下他仍然做出了新的試探。

  黑77手,考驗AlphaGo處理局部與全局關聯的能力。

  黑115手以下,考驗AlphaGo殺棋的能力。李世石在對陣人類選手時雖然也會有劣勢下考驗對方的手段,但這一手顯然是隻針對機器。

  最終,李世石在下方做出了一個劫爭,這一結果雖然與AlphaGo在優勢下的退讓有關,但也確實是李世石才能做到的事情。

  某種意義上,當我們見識了AlphaGo第三局這般漂亮的前半盤,就很難在同一盤棋中再見到AlphaGo第二局那般強大的後半盤。作為棋手,對這一點感到些許遺憾,這是它基於勝率的算法所決定的。

  至於後麵的劫爭,對於很多人而言是證偽了“AlphaGo不會打劫”和“協議禁劫”這兩件事情,但在我看來不過是對邏輯推理得出的確定結論的一次事實呈現。

  由於前二局的信息,這一局李世石製定了在前半盤爭勝的策略,采取了大模樣戰法。采用這一方法的原因其實有一點無奈,因為在第二局結束之後李世石表示“沒有找到AlphaGo的弱點”。於是他隻能從“均勢下AlphaGo後半盤極強”這件事來逆推,得出需在前半盤爭勝的結論。但是,在爭勝策略失敗之後,李世石在後半盤的努力卻為第四局的勝利埋下了伏筆。

  2 第四局李世石的策略

  籠統地說,李世石在前三局考驗了AlphaGo麵對亂戰、細棋、治孤時的能力,AlphaGo的應對非常有說服力。

  但是,李世石在第三局賽後的感言中已經不像第二局那般毫無頭緒。他找到了或許是最後一種針對AlphaGo的攻擊方式:讓AlphaGo攻殺。

  也就是說,李世石選擇導入自己治孤的局麵。

  這策略是僅有的可選策略之一,第三局AlphaGo在下方的攻殺退讓也增強了施展這一策略的決心。

  從計算的意義上,攻殺比治孤更難。

  這是因為,治孤隻要求自己做活,隻要找到自己能活的圖就可以;

  而攻殺要求殺死對方的棋,必須防範對方所有可能的反撲,對於AlphaGo而言,需要搜索的空間就大幅增加。

  李世石找到這一策略,是相當聰明的選擇。

  也正是李世石出乎AlphaGo預料(在搜索樹排名靠後)的一手棋(78),使AlphaGo在優勢下突然崩潰,一舉逆轉取得了勝利。

  AlphaGo第23手在此時靠,對於職業棋手而言是不可思議的一手。我會在後一章描寫我看到的圍棋新世界裏詳細闡述這一手為何出乎預料,又有什麽精妙的含義。

  總之,李世石在左邊選擇了實地,任憑黑方築起外勢。雖然左邊的下法在職業棋手看來是白棋過於忍讓,但考慮到李世石的策略,加上對23手的認知,就會明白李世石為什麽這麽下。

  白40,進入“先撈後洗”的局麵,逼迫AlphaGo攻殺。

  黑47-51——又是非常值得學習的新穎下法,具體的解析我想放在下一篇文章。

  “神之一手”,白78挖!

  很多棋手已經解釋過,這手棋原本並不足以逆轉,黑棋有數種應對可保優勢。

  比如1位頂吃,白棋並無生路。

  另一種下法是在1位拐吃,如此則白棋可以通過打劫聯絡,但黑21跳出後形成轉換,仍然是黑方勝勢。

  雖然第78手本身不足以逆轉局勢,但無法抹殺這一手的閃耀光芒!

  這是人類思維靈感湧動的時刻!

  這一手很可能滿足了如下幾個條件:

  1, 跳出了AlphaGo之前的搜索範圍

  2,使變化更多,增加了局麵的分支

  3,涉及到可能的劫爭

  同時滿足這三個條件,非常不容易。

  ,

  至於AlphaGo為何會出現實戰那樣的失誤,大家可以參考Facebook田淵棟博士的分析,以及期待Deepmind五局賽後的官方回應。

  在上一篇文章裏,我這樣評價李世石前兩盤的表現:

  “李世石麵對AlphaGo,並未因五個月之前的棋譜而有絲毫輕視,他做了非常充分的準備。他拋開人類的偏見和自負,試圖理解AlphaGo運算的機理,並找出其中可能存在的弱點。在比賽伊始,他就對AlphaGo可能存在的弱點進行了直指要害的攻擊,並且在失敗後迅速調整,繼而展開了第二次、第三次針對性攻擊。正是他的策略針對性,使人們更好地理解了AlphaGo的強度和特點,以及不同於人類的決策模式。他在第二局中就已經找到了足以在中盤接近甚至抗衡AlphaGo的布局策略,使人類第一次見識到AlphaGo夢幻般的後半盤。”

  在第四局之後,相信會有更多人理解我當時對李世石的這一評價。

  而對於李世石在第三、四局裏的表現,我想這樣評價:

  “李世石在找不到AlphaGo弱點的情況下,仍然繼續尋找策略展開進攻。經過前三局不同方式的失敗,李世石在第四局又找到了新的策略,並非常好地執行了策略。這一次,他成功了。AlphaGo在麵對“神鬼莫測”的第78手時,終於展現出足以被人類擊敗的弱點。雖然這一突破所需的條件目前尚不能完全肯定,但無疑李世石已經成功。這場勝利,是對他前三場努力的最佳回報。”

  3 作為職業棋士如何看待人機之戰

  對於我而言,這一場人機之戰給我最大的震撼來自於棋譜。AlphaGo下出了許多完全在人類棋手經驗之外的著法,這些著法在目前尚不能得到人類棋手統一的理解。

  但是,我隱隱讀到了這些著法背後壯美的天地,這壯美天地當然不是AlphaGo所創造,而是有四千多年曆史的圍棋本身所自有的豐富與遼闊。

  AlphaGo並不是解開了圍棋之謎,它離窮盡圍棋還有非常遠的距離,它隻是向我們展開了這樣一個新世界。

  我們需要用多久才能理解?或許一年、五年、十年……但我相信,人類一定能夠用理性的方式去不斷地理解這些數據給出的信息,AlphaGo的出現恰恰證明了人類理性的重要價值。

  由於圍棋是一個封閉空間,其變化數雖然巨大,但仍然是有限的、在理論上可窮盡的。如上一篇裏談到的,如果把窮盡看做天,把入門看做地,人類在圍棋的天地之間到底處於什麽位置,這是值得每一個對圍棋有感情的人去認真思考的問題。而AlphaGo的出現既使我們有了一個參照者,使我們居於這天地之間不再孤獨;又使我們能夠更好地接近圍棋真理哪怕一點點。

  這是我在第二局後喜極而泣、心生無限歡喜的根本原因。

  感謝李世石,感謝AlphaGo。

  在第一篇文章的結語,我說

  “如果我們隻用人類思考圍棋的方式來理解AlphaGo,或許我們將永遠都不知道是怎麽輸的。”

  現在更多的職業棋手已經知道AlphaGo在棋盤上做出決策的方式特點。接下來,要做的事情是:

  “將AlphaGo展現出的新世界以人類理性的方式來理解,這是作為棋士對圍棋和人類理性最好的致意。”

  讓我們共同期待傳世的第五局!

  (轉載自喆理圍棋)

請您先登陸,再發跟帖!