最近看了不少關於AlphaGo的油管視頻,其中一個是一位台灣棋手講解AlphaGo Zero和李世石版本的AlphaGo對弈的棋譜,棋手講得是感慨萬分,我聽得也是感慨萬分。
李世石版本的AlphaGo 是根據人類的棋譜發展而成的,處處有人類所理解的棋理,當年就以4:1擊敗李世石,自學習之後,棋力當然遠超人類。後來的Master版本橫掃所有與之對弈的職業高手,除了掉線那盤,保持了全勝記錄。
而AlphaGo Zero是直接從圍棋的規則出發,沒有受人類棋理的影響,它自學習40小時之後,就已經能夠擊敗人類最高手(包括李世石版本的AlphaGo)了。而受人類棋理影響的AlphaGo,一開始進步很快,但40小時後就基本沒有進步。
這兩盤棋,受人類棋理影響的李世石版本的AlphaGo就好象一個努力捍衛人類尊嚴的機器人,雖然竭盡了全力,但依然被AlphaGo Zero無情碾壓,毫無還手之力。
我粗看Alphgo Zero的行棋方式,隱隱有當年吳清源的下棋的味道。主要有兩點讓我印象深刻。第一,吳清源和AlphaGo都極其注重中腹。第二,當年吳清源經常脫先,讓對手在某個地方糾纏半天最後還撈不到好處,而自己在別的地方連下數手,模樣就建起來了。這裏第一局AlphaGo Zero就是這麽對待李世石版本的AlphaGo。
所以我覺得,對於圍棋的理解,吳清源應該是最接近AlphaGo Zero的人類了。AlphaGo Zero在職業圍棋界是被當作神一樣的存在,吳清源看來是最接近圍棋之神的人類。
關於AlphaGo Zero的研究論文發表在自然雜誌,鏈接在此: