人類史上最重要的一次智力對抗

來源: 幽幽茶香於 2016-02-12 07:02:14 [檔案] [博客] [舊帖] [給我悄悄話] 閱讀數 : (7465 bytes)

前幾天看到Google研發的AI人工智能“阿爾法圍棋”（AlphaGo）以5：0的絕對優勢打敗歐洲的圍棋職業冠軍——來至中國的圍棋二段樊麾。一時之間震驚不已，在收看了新浪圍棋的多項電視品論之後，對整個事件有了一個比較全麵的了解。

據悉，在三月份AlphaGo將和韓國九段棋手李世乭在首爾一戰，獎金是由Google提供的100萬美金。李世石是何許人？愛下棋的人個個對這個名字如雷貫耳，就像是當年深藍對抗的卡什帕羅夫一樣的頂尖棋手，在上個十年間獲得最多世界冠軍頭銜的天王。多說一句，李世石在去年和中國頂尖棋手古力的十番棋對抗中，居然將同歲的中國頂尖棋手，打到降級的地步。

十幾年前的電腦深藍，擊敗了人類的頂尖棋手卡斯帕羅夫。預示在國際象棋領域，電腦已經完勝人腦。當西方媒體哀鴻一片之時，作為一個中國人引以為傲的是，在圍棋領域，這個有著兩千年曆史的古老東方智力遊戲，電腦還是完全無法對抗人腦。

作為一個有三十年愛好的資深棋迷，我對於曆年研發的圍棋軟件，經常下載和電腦下棋。早年的電腦就連我這樣的業餘棋手（在弈城達到過四段，穩定在三段），也能讓四子以上。去年在網上下載了天頂圍棋，號稱當今最強的圍棋軟件。我至今和天頂下過約二十餘盤棋，在設定最強棋力的情況下，我還是贏過兩盤，基本上天頂比我稍強到讓先倒貼目的狀態。所以新浪圍棋直播中羅洗河九段在讓天頂六子的情況下，可以狂虐電腦。

在此之前，我一直認為，電腦要在圍棋領域戰勝人腦，大約還要有十至二十年時間。現在看來我還是大大低估了科技的發展。有人要問，為什麽深藍十幾年前就可以打敗人類，而十幾年的電腦科技發展，如今電腦卻還不能在圍棋上打敗人腦呢？

國際象棋的狀態複雜度是 2^{^64} 次方，而圍棋則達到 2^{^128} 次方，網上有很專業的評述介紹，我就不要重複了。做個不太準確但形象的比喻，我時常對兒子聊天，講到國象和圍棋的難度差異，就像跳棋和國象的差異一樣。從變化莫測的廣度深度來講，假如圍棋是太平洋，國際象棋大約是個遊泳池吧。

國際象棋高手之間時常會以平局告終，應為某一種開局之後的優劣變化，雙方都已經是了如指掌，誰也不願意去改變。而圍棋號稱千古無同局，許多局部定式至今尚未了解清楚，許多定式的優劣判斷，多年以後隨著棋風思維的改變，又會重新定義，更不要講全局的判斷了。

圍棋中有許多比較虛的地方，作為人類思維，很容易去理解，但是作為電腦，卻很難用數字之類的去衡量判斷。比方厚和薄，虛和實，棄子轉換，打劫等等，這是人類思維比較高級的地方，也是AI人工智能挑戰人類最感困難的地方。

AlphaGo似乎在這些地方都有突破。

AlphaGo 的核心是兩種不同的深度神經網絡。“策略網絡”（policy network）和 “值網絡”（value network）。它們的任務在於合作“挑選”出那些比較有前途的棋步，拋棄明顯的差棋，從而將計算量控製在計算機可以完成的範圍裏，本質上和人類棋手所做的一樣。

這樣的思維就是接近人腦的判斷了。

第二種是學習。

日本著名棋手到了晚年，時常會紀念一下勝局達到1000局的記錄，加上失敗的局數，往往一生有接近兩千局棋的經曆。比方中國的古力九段就剛剛達到一千局勝局的記錄。每一盤棋局都是一次學習的經曆。早年間中日本棋手有過一段對話，好像是劉小光問小林覺吧：每年對局數是多少?小林覺說一線棋手大約是8-90局，普通棋手大約是4-50盤棋比賽。劉當時很感慨，中國棋手加上升段賽，一年才十幾盤棋。

而AlphaGo每天可以自我對弈達100萬盤棋，從自我對局中學習提高。從現在到與李世石比賽，大約有三十天。AlphaGo還可以有3000萬盤棋來提高學習。這是一個多麽驚人的情景。用一日千裏來形容AlphaGo的進步一點都不為過。

所以每個評論的棋手都認為，AlphaGo在和樊麾對局時展現的實力，完全不等於幾個月後和李世石對局時的棋力。

有些人認為樊麾才是個職業二段，哪能和頂尖的李世石相比，更有人認為年初中國的柯潔戰勝了李天王，柯潔才能是對抗AlphaGo的代表。

其實達到職業棋手，相互間的棋力相差是很小的，能夠戰勝職業二段，戰勝李世石就絕不是一個不可逾越的鴻溝。

AlphaGo戰勝樊麾二段的五局棋，除了第一盤是謹慎的細棋之外，後麵幾盤樊麾都是脆敗，毫無還手之力。其中印象很深的是第二盤，樊麾想將局麵弄得複雜一些，走出一個比較難測的變化，結果被電腦抓住了誤算，中盤崩潰。

基本上樊麾在第三局之後，就是處於一種置之死地而不勝的狀態。

以我對電腦下棋的經驗來講，電腦是不會恐懼、猶豫、膽怯、激動、後悔、生氣等等棋手常見情緒來幹擾對局，不會疲勞不會遺忘，永遠冷靜判斷。電腦下的每一步棋都會牢牢地記住，絕不會因為時間長而忘掉定式的某一個變化。在局部的死活上絕不會誤算，想通過戰勝人類的某些方式，在麵對電腦時是無效的。而當人類發生某個失誤時，電腦絕對會抓住不放的。這是電腦最強的地方。

李世石的棋風號稱僵屍流，將某塊死棋保留有種種餘味，後盤通過劫爭、轉換等方式起死回生。中日韓三國棋手對此都深懷懼意，由此產生極大的心理壓力，因為李世石在算路和判斷上極其精準。從而在許多大賽中，原本無理過分的行棋，因為對手在心理上產生的壓力，影響了判斷，讓李世石在很多次對抗中絕地反擊轉敗為勝。但在電腦的算路麵前，這樣的棋就沒有什麽壓力威脅可言，反而是一個可能脆敗的弱點。

從心情上講，我希望李世石此次能夠維護人類最後的光榮。但是實際上AI打敗人腦已經是早晚無疑的事了。

李世石要贏這一百萬美元，不容易吧。

急切的期盼五番棋的到來，從人類的長河中，人類最優秀的選手，在最複雜的遊戲中，首次對抗機器的挑戰。

更多我的博客文章>>>