陳經技術分析：穀歌圍棋算法存在巨大缺陷，達不到人類最高水平

來源: 唵啊吽於 2016-02-03 04:53:39 [檔案] [博客] [舊帖] [給我悄悄話] 本文已被閱讀：次 (43352 bytes)

陳經技術分析：穀歌圍棋算法存在巨大缺陷，達不到人類最高水平

陳經
- 中科大風雲學會研究員，《中國的官辦經濟》

發表時間：2016-02-01 07:20:50

字號：A-A A+

關鍵字: 圍棋人工智能穀歌圍棋程序圍棋程序戰勝人類AlphaGo李世石樊麾策略網絡價值網絡蒙特卡洛

2016年1月28日，穀歌圍棋程序AlphaGo以5:0戰勝職業棋手的消息，震動了圍棋圈。這兩天有很多的討論，主要是新聞性的。我也在第一時間進行了常識性的介紹。

本文進一步從圍棋和人工智能技術的角度，深入分析AlphaGo棋藝特點，評估其算法框架的潛能，預測與人類最高水平棋手的勝負。下文中出現的策略網絡、價值網絡、蒙特卡洛法請參考前文，理解具體圍棋局麵也需要一定的棋力，但是與算法推理相關的內容理解起來並不難。

AlphaGo是如何下棋的

所有人，包括職業棋手，看了AlphaGo戰勝樊麾二段的五盤棋，都說這程序下得像人了，和以前的程序完全不同。柯潔九段（公認目前最強棋手，一年獲得三個世界冠軍，對李世石6:2，古力7:0）的看法是：

“完全看不出來。這五盤棋我也仔細地看了一眼，但我沒看名字，不知道誰執黑誰執白，完全看不出誰是AI。感覺就像是一個真正的人類下的棋一樣。該棄的地方也會棄，該退出的地方也會退出，非常均衡的一個棋風，真是看不出來出自程序之手。因為之前的ZEN那樣的程序，經常會莫名其妙的抽風，突然跑到一個無關緊要的地方下棋。它這個不會。它知道哪個地方重要，會在重要的地方下棋，不會突然短路。這一點是非常厲害的。”

連笑七段讓四子對DolBaram。棋譜可參考附錄的sgf文件，看看電腦是如何搞笑的。

先來看我上一篇文章中提到的DolBaram被連環劫搞昏的局麵。右下角白是連環劫淨活，電腦卻不知道，耗費了很多劫材來回打。這是因為電腦是用蒙特卡洛樹形搜索（MCTS）下的，一直模擬下到終局，看各個選擇的獲勝概率。人一眼就知道打劫是沒用的，你提這個我必然提回那個。電腦模擬時的選點卻不會隻有那一招，就會發現，如果對手不提另一個劫走了別的，那電腦就能吃角了，所以就去提劫。直到劫材損光，電腦才會恍然大悟，吃不掉，但這已經過去幾十手，超過電腦的搜索能力了。

看到電腦被連環劫搞昏，樂開花的連笑

2014年日本UEC杯軟件決賽，Zen執黑對CrazyStone。完整棋譜可看附錄的文件。

再來看Zen和CrazyStone兩個過去最強的程序間的一個局麵。黑61威脅白右上角和中上，白卻不應，在下麵62切斷，黑繼續63吃掉右上角。最後白在上麵損失慘重，為了救中上幾個白子，下麵又被黑先動手，沒有收益。為什麽CrazyStone不應上麵？因為程序沒有價值的概念。白不應上麵，黑要把白右上吃掉，還需要很多手，中上的白子活不活更不好說，這已經超出了電腦蒙特卡洛模擬的能力。因為電腦不知道要對著上麵猛算，它不知道上麵是焦點，可能花了很多計算在下麵或者其它地方，認為62手下麵切斷勝算更大，上麵的損失它模擬得不對。這個局麵能說明蒙特卡洛樹形搜索法（MCTS）的局限性，這個弱點很要命。

那麽AlphaGo會如何解決這兩個問題？連環劫問題，DolBaram可能得打個補丁。AlphaGo也是基於MCTS的，但是它的策略網絡是深度學習高手對局的招法訓練出來的，更為準確，有可能提劫這手就不會給多大概率，因為高手們麵對這個局麵不會去提劫。另一種可能是，AlphaGo有一個價值網絡，不用來回打一堆劫就能直接判斷下一招後，獲勝機會如何。由於價值網絡是訓練出來的，包含了3000萬局的最終結果，對於右下那塊白棋的死活是有判斷的。當然也可能AlphaGo針對連環劫有補丁。

CrazyStone犯錯這個圖，假設AlphaGo執白，在考慮第62手。61、62、63這些著手顯然都會在AlphaGo的策略網絡的選點中。你要讓它用MCTS模擬出右上和中上白棋幾個子是怎麽回事，估計也是不行的，手數和分支太多。因為這不是一個簡單的死活問題，白可以不要一部分甚至都不要，隻要在其它地方有足夠的補償。但是AlphaGo有價值網絡，它會在模擬到63手時，用價值網絡快速評估一下，發覺白必敗，於是迅速否定62這手棋，在上麵下棋。因為價值網絡的3000萬個樣本中，上麵這種白棋類似棋形導致失敗的棋局會有一些。

這裏我們看出來，AlphaGo相比前一代軟件的革命性進步，是有了一個價值網絡。實際上，AlphaGo可以不用搜索，直接用策略網絡給出一些選點，用價值網絡判斷這些選點的價值，選一個最好的作為著手，就可以做出一個非常厲害的程序。這個簡單程序就可以打敗其它軟件，達到KGS（一個圍棋網，人工智能程序一般在上麵打級） 7D，這是非常驚人的。Facebook的Darkforest也可以不搜索，用策略網絡給出一些選點，選其中概率最大的點（最像是高手下的那招棋），這樣可以達到KGS 3D。在此基礎上再加上MCTS，把Darkforest提升到了5D。這說明AlphaGo的價值網絡對棋力提升的價值，可能比MCTS還要大。

有了高效的價值網絡，AlphaGo就容易知道局麵的焦點在哪，不會在非關鍵的地方走。可以預期，其它軟件開發者要跟上AlphaGo，就得把價值網絡搞出來。但是這非常難，需要模擬海量的對局，對局水平還不能低，需要的投入很大。

AlphaGo想要戰勝業餘高手，策略網絡、價值網絡就夠了。但要戰勝業餘頂尖，就還得加上MCTS。這相當於對策略網絡、價值網絡的選擇，進行驗算。策略網絡有兩個，一個是給出當前局麵的選點，一個是在MCTS模擬中快速給出一些選點。價值網絡給出判斷，有價值的搜得深。整個決策過程非常象人類高手的思維過程了：麵對局麵，給出一些選點；然後對各個選點推演下去，有的推幾步就判斷不行終止，有的會推得很遠；有時算不清，就根據感覺下；有時沒時間，直接感覺，都不推理了。

所以AlphaGo的算法框架很強大，和人類高手很像。而且它沒有情緒波動，每一步都會穩定地用MCTS進行驗算，人類不一定做得到。樊麾二段就是敗在這上麵，不少著都沒有仔細驗算，衝動地下了被AlphaGo反擊吃大虧。

AlphaGo還不如人類高手的地方

分析AlphaGo的弈棋算法，可以相信，AlphaGo到了一定的局麵以後就是必勝，因為它不會在此後犯錯。實際之前的Zen、CrazyStone也是這樣，到了後盤必勝局麵，就靠MCTS，它們都能知道必勝了。這時電腦會下得特別猥瑣，“贏棋不鬧事”，勝多勝少一樣。而人類高手後半盤勝局被翻盤很常見，官子沒時間算清楚，穩定性比電腦差得多。

樊麾對AlphaGo的第二局就有這樣一個局麵。AlphaGo執黑，由於在右下角大占便宜，這時已經必勝了。黑下135，放白136活（如破上麵的眼，白借O16的連出再做出一眼）。中韓職業高手劉星七段和金明完四段都指出，黑135右移一路，下在O18，是能夠殺死白棋的。

但是AlphaGo為什麽不下？我們可以試著推理一下，如果黑強殺，接下來局麵會是這樣：

黑135下三角一著強殺，白提一子，黑137退。白138先手切斷右上黑棋，雖然是靠劫。接下來白有ABC甚至更多“搗亂”的方法，但職業棋手一眼就能看出來，白的搗亂必然失敗，因為白角也沒幾口氣，還要撐劫，黑肯定能對付。但是AlphaGo作不出這種推理！

劉星說，AlphaGo肯定知道白是死的，但選擇了穩當的下法。筆者認為恐怕不是這樣。AlphaGo的搜索框架裏，並不一定能斷定白是死的，因為需要的手數不少，打劫雖然更不利於白，但增加了推理手數。它並沒有一個搜索任務叫“殺死白右上角”。如果硬要去這麽搜索是做得到的，但是如果它這樣去想問題，棋力反而會下降，因為圍棋很複雜，殺棋付出代價太多會敗。AlphaGo推理時會發現，放活白，100%勝，殺白，有風險（雖然實際沒風險，但它很可能沒去算）。所以AlphaGo集中搜索放活的必勝下法，最後選擇是放活。如果局麵是不殺不勝，那AlphaGo就會發現其它招不行早早放棄，就會去集中算殺棋的那些招。

也就是說，一些對於人類非常明顯的死活，對AlphaGo反而是麻煩的。人類高手在這個局麵很可能就去吃棋讓對手早點認輸，因為沒有任何風險。AlphaGo就不行，它沒有分配足夠的計算資源去算這個死活，而是去算它認為勝率更高的分支，這些分支要消耗非常多的MCTS局麵。人類一眼能看出來的死活，AlphaGo卻需要“足夠”的計算資源才能算出來。有時因為局麵的焦點問題，它還真就分配不出來。隻有其它分支不行，被價值網絡與MCTS早早砍掉，這塊棋的死活才會獲得足夠資源算個通透。

這不會影響AlphaGo的勝利，但已經可以看出，它的思維其實和人不一樣。它並不是一定能算清的，隻有你逼得它沒辦法了，它才會去算清。但是人就有優勢了，人看一眼就知道結果，AlphaGo以及基於MCTS的這些程序，都得去算不少步才知道。程序並不像人一樣，對於棋塊能給出結論。人給出結論需要計算，但是算一次就行了，然後就一直引用那個結論，直到條件變化。但是程序得去算，算到死了才是死，有一些局麵計算甚至是活的，它隻是概率性地在那選擇，並沒有給出確定性的結論。

再看一個局麵，第三局樊麾執黑對AlphaGo。金明完四段指出白60扳，62打，都是走在黑空裏的損著。還不隻是虧空，本來白不走，右中的白棋粘在S7位，是有一個眼的，現在沒有眼了，對中間的攻防戰影響不小。

這是AlphaGo確定無疑的虧損錯著。但是證明這個結論，需要黑能夠對付白Q3長搗亂，要殺掉白右下。職業棋手也要花一點時間，但不難。結論是，因為中下的黑子夠厚，所以沒有棋。要是沒有H4J4這兩個黑子，就有棋了。這裏涉及到的手數和分支是不少的，雖然結論是明確的。下麵是一個白搗亂失敗的參考圖。

對於AlphaGo來說，這個局麵就很麻煩了。如果逼得它不得不做活，它會用MCTS一直模擬下去，最後認為還是死。但現在局麵還很空曠，局麵選點很多，它並不知道去開一個“任務”算右下角的死活。

在很多高手對局裏，類似這個角的局麵就是有棋的，甚至沒有棋，高手也會下類似60這樣的棋“留餘味”，例子很多。所以AlphaGo的策略網絡會給出60這個選點。但是高手會迅速否定掉60，因為做不活，而且會損右中白棋的眼。

AlphaGo不會有“損眼”這種概念，它得模擬到很多步以後，才能知道右中的後手眼很關鍵。60提出來以後，MCTS救不了它，因為手數和分支太多。價值網絡也救不了它，因為這裏死了，白也隻是吃了虧，並不是明顯敗局。價值網絡背後的3000萬局裏，60及其後續搗亂手段可能出現過不少勝局，會給60這招一個好分。

這裏我們能看出來AlphaGo的巨大不足了，它對於圍棋中的很多“常識”其實是沒有概念的，例如“後手眼”、“先手眼”，“厚薄”。有一定水平的人類棋手都明白圍棋概念很多，開發者根本就沒有準備去建立這些概念，而是自己想了一個決策過程。表麵上看AlphaGo和人類高手一樣先選點，再推理驗算，但這隻是表麵的相似，內在機理是完全不同的。

AlphaGo的策略網絡可能和人類最高手沒有水平差別，甚至更厲害都可能，因為可以考慮更多選擇。但是接下來的價值網絡和MCTS驗算的區別就大了。人類高手是進行複雜的概念推理，大多數情況下可以把“棋理”講清楚，為什麽這麽選擇，幾個變化圖就夠了，高手們就取得了一致。但AlphaGo是不行的，它隻能死算。在封閉局麵，死算表現是很穩定，超過人類高手。但是在前半盤的開放局麵，它不知道去算什麽，其實也是東一下西一下沒有邏輯地在那撞運氣地推理。

由於圍棋的複雜性，它增多推理的局麵數並不能帶來多高的棋力提升。Distributed AlphaGo（1202個CPU，176個GPU）的計算能力是“單機版”AlphaGo（48個CPU，8個GPU）的很多倍，但互下隻有78%的勝率。

我們可以得出一個重要結論：

在早期的開放局麵或者中間複雜局麵中，AlphaGo的算法有時會走出明顯吃小虧的錯招，如果“思考”時需要較多的手數與搜索分支，就可能超過它的搜索能力。而人類高手能看出來程序的錯誤，有能力避免這類錯，因為會進行高級的概念推理。這是人類高手的巨大優勢。

為什麽AlphaGo的這個弱點表現得並不明顯？這是因為開發者用各種辦法進行了“掩蓋”，而且對手必須很強才行。這個弱點隻對高手才存在，甚至象樊麾這樣的職業二段都無關緊要。這局樊麾根本沒利用白棋損了一眼這個錯誤，自己先在中間行棋過分被抓住。人類對手麵對的各種考驗更多，局部出了錯被AlphaGo一通死算抓住就鎖定敗局完蛋。人類對手需要自己先穩住，不能出“不可挽回”的錯著。就算是頂尖職業高手也不一定做得到，之所以出了錯在職業圈裏勝率還可以，是因為對手又送回來了。

AlphaGo開發者沒有在程序中提出圍棋常識概念，甚至所有開發者都不是高手（隻有第二作者Aja Huang是弈城8d，高手讓三四子都可能），很多高深的棋理不明白。但是他們用深度神經網絡的辦法，隱性地在多層神經網絡中實現了很多圍棋概念。為什麽一個13層的神經網絡，幾百萬節點係數相乘相加，就能預測高手在19*19的棋盤上的行為？通過訓練，這些神經網其實已經隱含了很多概念，一層層往下推。所以它下的很像人，確實和人的神經係統類似。

機器用多層神經網絡識別圖片的能力，甚至超過了人。但在圍棋上，這其實是一種“掩蓋”。人識別圖片時是沒太多概念的，直接看出結果，機器也這樣。但在下棋時，其實不是在識別棋局，還是有明確的建立在“常識”基礎上的概念，越是高手概念越多，而且說得清，能教給學生，是一個知識係統。

AlphaGo的策略網絡和價值網絡，那些神經網絡各層裏，是些什麽“概念”沒人說得清，也不好控製。DeepMind小組其實也不想去搞清楚，就是暴力堆數據，信奉大數據暴力破解。

但圍棋是很精微複雜的。某種概念，可能用幾百個棋局能說明清楚。但是一大堆概念混在一起，有些概念還沒有明確結論，怎麽訓練？比如前麵的“後手眼”概念，人一解釋很清楚，DeepMind的人想去改進程序讓AlphaGo減少這類失誤，就很麻煩。可能要去堆一大堆這類棋局進行訓練。先不說能不能找到足夠的棋局，在3000萬個棋局裏，加進一些棋局進行訓練會產生什麽影響，就很難控製。

AlphaGo的策略網絡、價值網絡、MCTS三大招數確實很強大，但也存在很不好解決的內在矛盾，就是沒有概念推理的能力，很簡單的都做不到。

AlphaGo與人類棋手對局預測

假設AlphaGo仍然維持現有的算法框架，但在持續的研究中，增加CPU，增加訓練局數，打些小補丁，不斷提升能力，那麽可以對它的棋力進行推測。

這些改進就是讓強的越強，但是本質的弱點無法消除。也許可以加一些程序代碼，處理連環劫、多劫之類的bug型局麵。AlphaGo的策略網絡和價值網絡已經很好了，對人類有優勢或者不吃虧。AlphaGo的MCTS能力對於鎖定勝局、抓對手大錯誤足夠了，但還不足以消除自身的錯誤，增加CPU也不會有本質提高。雖然鎖定勝局時，這種死算比人類更靠譜，但對於開放式局麵仍然遠不夠用，這是算法本質的問題。

對於大多數業餘棋手，AlphaGo隻用策略網絡和價值網絡，連MCTS都不用，就能輕鬆獲勝了。而且下棋速度特別快，隻是算神經網絡的輸出值，0.1秒就可以，對人類等於不花時間。這個版本可以很容易放到手機上。

對於強業餘五段、六段高手，PC版的AlphaGo可以一戰了，需要用上MCTS，但不需要好到48個CPU。

對於頂尖業餘棋手、衝段少年、等級分不高的二三線職業棋手，AlphaGo會有相當高的獲勝概率，48或者1202個CPU隻會在概率上有些小差別。當人類棋手在中後盤出小錯，或者局部出惡手時，立刻就會輸掉，無法翻盤。

對於頂尖職業棋手，AlphaGo會有較低的獲勝概率。當頂尖職業棋手發揮好時，是可以做到沒有明顯錯著的，甚至有個別方向性大局性的錯誤也不要緊，隻要不是局部惡手被抓住。但是頂尖棋手狀態不好或者心理波動的可能性是有的，甚至不小，所以AlphaGo也是有勝機的，甚至在三番五番棋中取得勝利都是可能的。

但是如果AlphaGo獲勝，職業棋手們的評價會是人類出了明顯的錯著，而不是機器壓倒性的勝利。反過來，人類頂尖高手如果發揮正常，可以對AlphaGo壓倒性地全盤壓製。

三月李世石與AlphaGo的對局，如果李世石輸掉，一定是因為他出了惡手。而機器也會被多次發現明顯的問題手，因為李世石總有能力在五局中表現人類的高水平。

這個情況有點類似於1997年深藍戰勝卡斯帕羅夫。卡斯帕羅夫輸了，但當時不少輿論認為是他發揮不佳甚至收錢放水，後來直到2006年都有人類在比賽中戰勝了程序。當然後來國際象棋程序越來越強，真正全麵碾壓人類棋手，甚至可以讓人類一個兵或者兩先，等級分比人類最強者高幾百分。從當時的機器算法框架看，國際象棋程序徹底戰勝人類隻是個時間問題。

圍棋的格局會有不同，不會被機器打得這麽慘。如果開發者不提出新的算法框架，AlphaGo這樣的人工智能程序無法戰勝狀態良好的人類最高水平棋手，甚至能看出明顯的棋力短板。當然由於圍棋人工智能不犯大錯，抓錯的水平很高，對職業棋手群體勝率會比較高，甚至參加世界大賽都有奪冠可能。但職業棋手們仍然掌握著最高水平的圍棋技術，這些技術具有真正的藝術性，如果在和人工智能程序的較量中讓世界認識到這一點，也有利於提高圍棋的影響力。

AlphaGo已經取得的成就，無疑是非常了不起、令人震驚的。但通過仔細分析它的算法框架，人類棋手也不需要恐慌，它還達不到人類棋手的最高水平。當然不排除人工智能又搞出另外的高招取得突破，但這不好預測，而且會是非常困難的。

分析清楚AlphaGo的強大與不足，有利於破除迷信，“祛魅”。這也引出了更多哲學性的問題，例如：概念是什麽？人工智能的極限在哪裏？如何把人類積累的智慧和洞察力用到未來的人工智能科研中？

作者簡介：筆名陳經，香港科技大學計算機科學碩士，中國科學技術大學風雲學會研究員，棋力新浪圍棋6D。21世紀初開始有獨特原創性的經濟研究，2003年的《經濟版圖中的發展中國家》預言中國將不斷產業升級，挑戰發達國家，2006年著有《中國的“官辦經濟”》。

致謝：感謝風雲學會會長袁嵐峰博士（@中科大胡不歸）與其他會員的寶貴意見。

本文係觀察者網獨家稿件，文章內容純屬作者個人觀點，不代表平台觀點，未經授權，不得轉載，否則將追究法律責任。關注觀察者網微信guanchacn，每日閱讀趣味文章。

附錄

1.連笑讓四子對DolBaram的sgf棋譜。將下麵的文字存成一個sgf文件，用MultiGo軟件打開，或者直接Copy下麵的文字，在MultiGo裏選擇“粘貼棋譜”。

(;GM[1]FF[4]

SZ[19]

DT[2015-11-15 17:17:42]

PB[石子旋風]BR[P1D]

PW[連笑]WR[P7D]

KM[0.00]HA[6]RU[Chinese]US[風月手談]AP[風月手談(OurGameweiqi)]

SO[http://www.ourgame.com]EV[美林穀杯首屆世界計算機圍棋錦標賽人機大戰三番棋第3局 2015-11-15 07:28:06]

AB[dp][pd][dd][pp][dj][pj]

;W[qf];B[of];W[qn];B[on];W[nq];B[pm];W[qp];B[qq];W[pq];B[oq];W[pr]

;B[op];W[or];B[qo];W[rp];B[ro];W[rq];B[jd];W[ph];B[pg];W[qh];B[qg]

;W[rg];B[oh];W[ri];B[qe];W[rf];B[pf];W[qk];B[pk];W[ql];B[qm];W[dm]

;B[fp];W[ch];B[eh];W[df];B[dg];W[cf];B[cg];W[bg];B[ef];W[ee];B[de]

;W[ff];B[eg];W[be];B[fe];W[ed];B[dc];W[ec];B[eb];W[ge];B[fd];W[fc]

;B[gd];W[fb];B[hd];W[db];B[gb];W[ea];B[hh];W[nc];B[fm];W[ld];B[oc]

;W[lf];B[kg];W[je];B[kd];W[ke];B[lc];W[id];B[ic];W[ie];B[gf];W[hc]

;B[gc];W[jc];B[kc];W[ib];B[nb];W[md];B[ga];W[fa];B[mc];W[nd];B[kb]

;W[kh];B[lg];W[ih];B[ig];W[jg];B[jf];W[jh];B[if];W[hf];B[hg];W[mb]

;B[ma];W[kf];B[lh];W[gg];B[he];W[gh];B[gf];W[hi];B[hf];W[li];B[mi]

;W[fi];B[gj];W[gi];B[fg];W[lj];B[mf];W[oi];B[mj];W[mh];B[mg];W[nh]

;B[ng];W[og];B[lk];W[kk];B[ii];W[ki];B[ij];W[mk];B[ll];W[nj];B[ml]

;W[ni];B[il];W[rn];B[kl];W[jk];B[ik];W[nl];B[nm];W[cj];B[dk];W[jl]

;B[jm];W[di];B[ei];W[nf];B[oh];W[ob];B[lb];W[og];B[bf];W[af];B[oh]

;W[km];B[ol];W[og];B[ne];W[me];B[oh];W[nk];B[og];W[mm];B[ln];W[lm]

;B[mn];W[mp];B[kn];W[jn];B[jo];W[im];B[kp];W[hp];B[ho];W[go];B[gp]

;W[io];B[ip];W[hn];B[hq];W[cq];B[cp];W[bp];B[dq];W[br];B[bo];W[co]

;B[cn];W[do];B[dn];W[eo];B[en];W[fo];B[cr];W[bq];B[qj];W[rj];B[ep]

;W[bn];B[bm];W[ao];B[re];W[rm];B[np];W[mq];B[lr];W[cm];B[em];W[lq]

;B[kq];W[iq];B[jp];W[hr];B[gq];W[jr];B[kr];W[gr];B[fr];W[er];B[dr]

;W[fs];B[eq];W[fq];B[jq];W[ir];B[fr];W[es];B[ho];W[pc];B[od];W[hp]

;B[gs];W[hs];B[ho];W[na];B[oa];W[hp];B[ds];W[fq];B[ho];W[fr];B[in]

;W[js];B[jm];W[cs];B[hp];W[bl];B[hm];W[po];B[cl];W[am];B[pn];W[so]

;B[mr])

2.ZEN執黑對CrazyStone的棋譜。

(;CA[gb2312]LT[]LC[]KO[黑貼6.5目]GK[1]TC[]TE[0]AP[MultiGo:4.4.4]RD[2014-03-16]PC[東京都調布市電氣通信大學]

PB[ZEN]BR[]PW[CrazyStone]WR[]TM[]RE[黑中盤勝]MULTIGOGM[1]

;B[pd];W[ep];B[dd];W[qp];B[lj];W[ql];B[dj];W[dm];B[jd];W[ch];B[eh];W[ce];B[cd];W[ef]

;B[dg];W[de];B[fe];W[bd];B[ee];W[cc];B[dc];W[cb];B[pi];W[qf];B[pf];W[pg];B[of];W[qc]

;B[qe];W[ob];B[pc];W[pb];B[rc];W[lc];B[kc];W[ld];B[df];W[bf];B[nq];W[je];B[ie];W[kd]

;B[jc];W[qb];B[pp];W[qg];B[rf];W[rg];B[og];W[oh];B[mg];W[nj];B[qo];W[po];B[qn];W[pn]

;B[rp];W[qq];B[pm];W[nn];B[nc];W[qm];B[rd];W[if];B[jf];W[ke];B[rq];W[oc];B[nd];W[nb]

;B[lb];W[mb];B[kb];W[jg];B[mc];W[he];B[id];W[kf];B[ih];W[nh];B[kh];W[jh];B[od];W[ji]

;B[nl];W[rb];B[sb];W[li];B[pl];W[pj];B[qk];W[hd];B[hb];W[hc];B[ib];W[ng];B[nf];W[gb]

;B[cf];W[be];B[fc];W[sf];B[kj];W[ki];B[jj];W[ra];B[ma];W[me];B[qd];W[pk];B[op];W[ol]

;B[om];W[gc];B[ja];W[gf];B[ff];W[qj];B[ml];W[ha];B[la];W[ne];B[oe];W[ro];B[rn];W[fg]

;B[gi];W[fi];B[fh];W[gg];B[eg];W[fj];B[gh];W[ij];B[gj];W[rm];B[so];W[ik];B[fk];W[gk]

;B[gl];W[ln];B[rk];W[hk];B[el];W[dk];B[ek];W[im];B[gn];W[dl];B[cj];W[em];B[fm];W[ho]

;B[fp];W[fo];B[go];W[gp];B[fq];W[fn];B[hn];W[eq];B[gr];W[hq];B[in];W[jn];B[io];W[jp]

;B[ip];W[iq];B[er];W[cq];B[gq];W[hp];B[jq];W[on];B[ok];W[jo];B[ir];W[hm];B[gm];W[di]

;B[ei];W[sm];B[sl];W[rj])

您的位置：文學城 » 論壇 » 科技世界 » 陳經技術分析：穀歌圍棋算法存在巨大缺陷，達不到人類最高水平

所有跟帖：

• AlphaGo的算法還是人類的程序員編製的。真正的人工智能是計算機自己生成算法、自己編程、自己修改自己的係統程序。 -宇之道- ♀ (0 bytes) () 02/03/2016 postreply 06:38:36

• 其實對於我們這種業餘小白來講，隻用一種能在瞬間算清局部死活的程序就足夠到網上裝高手了，雖然這很猥瑣。 -天方化戟- ♂ (0 bytes) () 02/10/2016 postreply 00:22:06

• 哪裏可以下載這個軟件？ -宇之道- ♀ (0 bytes) () 02/10/2016 postreply 10:31:01

• 我的希望而已，目前沒發現，如果你有時間可以自己寫一個我來下載。 -天方化戟- ♂ (0 bytes) () 02/10/2016 postreply 18:48:08

• 我隻想寫個AI，其餘讓AI替我搞定了。 -宇之道- ♀ (0 bytes) () 02/11/2016 postreply 05:30:15

• 最好界麵友好一點，可以hook進任何遊戲。 -天方化戟- ♂ (0 bytes) () 02/11/2016 postreply 13:59:07

• 這次不戲說了，正經八百地說。 -京城夜- ♂ (11936 bytes) () 11/06/2016 postreply 11:55:28

• 圖片 -京城夜- ♂ (87 bytes) () 11/06/2016 postreply 12:11:00

• 圖片 -京城夜- ♂ (315 bytes) () 11/06/2016 postreply 12:12:27

請您先登陸，再發跟帖！

陳經技術分析：穀歌圍棋算法存在巨大缺陷，達不到人類最高水平