前幾天看到Google研發的AI人工智能“阿爾法圍棋”(AlphaGo)以5:0的絕對優勢打敗歐洲的圍棋職業冠軍——來至中國的圍棋二段樊麾。一時之間震驚不已,在收看了新浪圍棋的多項電視品論之後,對整個事件有了一個比較全麵的了解。
據悉,在三月份AlphaGo將和韓國九段棋手李世乭在首爾一戰,獎金是由Google提供的100萬美金。李世石是何許人?愛下棋的人個個對這個名字如雷貫耳,就像是當年深藍對抗的卡什帕羅夫一樣的頂尖棋手,在上個十年間獲得最多世界冠軍頭銜的天王。多說一句,李世石在去年和中國頂尖棋手古力的十番棋對抗中,居然將同歲的中國頂尖棋手,打到降級的地步。
十幾年前的電腦深藍,擊敗了人類的頂尖棋手卡斯帕羅夫。預示在國際象棋領域,電腦已經完勝人腦。當西方媒體哀鴻一片之時,作為一個中國人引以為傲的是,在圍棋領域,這個有著兩千年曆史的古老東方智力遊戲,電腦還是完全無法對抗人腦。
作為一個有三十年愛好的資深棋迷,我對於曆年研發的圍棋軟件,經常下載和電腦下棋。早年的電腦就連我這樣的業餘棋手(在弈城達到過四段,穩定在三段),也能讓四子以上。去年在網上下載了天頂圍棋,號稱當今最強的圍棋軟件。我至今和天頂下過約二十餘盤棋,在設定最強棋力的情況下,我還是贏過兩盤,基本上天頂比我稍強到讓先倒貼目的狀態。所以新浪圍棋直播中羅洗河九段在讓天頂六子的情況下,可以狂虐電腦。
在此之前,我一直認為,電腦要在圍棋領域戰勝人腦,大約還要有十至二十年時間。現在看來我還是大大低估了科技的發展。有人要問,為什麽深藍十幾年前就可以打敗人類,而十幾年的電腦科技發展,如今電腦卻還不能在圍棋上打敗人腦呢?
國際象棋的狀態複雜度是 2^64 次方,而圍棋則達到 2^128 次方,網上有很專業的評述介紹,我就不要重複了。做個不太準確但形象的比喻,我時常對兒子聊天,講到國象和圍棋的難度差異,就像跳棋和國象的差異一樣。從變化莫測的廣度深度來講,假如圍棋是太平洋,國際象棋大約是個遊泳池吧。
國際象棋高手之間時常會以平局告終,應為某一種開局之後的優劣變化,雙方都已經是了如指掌,誰也不願意去改變。而圍棋號稱千古無同局,許多局部定式至今尚未了解清楚,許多定式的優劣判斷,多年以後隨著棋風思維的改變,又會重新定義,更不要講全局的判斷了。
圍棋中有許多比較虛的地方,作為人類思維,很容易去理解,但是作為電腦,卻很難用數字之類的去衡量判斷。比方厚和薄,虛和實,棄子轉換,打劫等等,這是人類思維比較高級的地方,也是AI人工智能挑戰人類最感困難的地方。
AlphaGo似乎在這些地方都有突破。
AlphaGo 的核心是兩種不同的深度神經網絡。“策略網絡”(policy network)和 “值網絡”(value network)。它們的任務在於合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控製在計算機可以完成的範圍裏,本質上和人類棋手所做的一樣。
這樣的思維就是接近人腦的判斷了。
第二種是學習。
日本著名棋手到了晚年,時常會紀念一下勝局達到1000局的記錄,加上失敗的局數,往往一生有接近兩千局棋的經曆。比方中國的古力九段就剛剛達到一千局勝局的記錄。每一盤棋局都是一次學習的經曆。早年間中日本棋手有過一段對話,好像是劉小光問小林覺吧:每年對局數是多少?小林覺說一線棋手大約是8-90局,普通棋手大約是4-50盤棋比賽。劉當時很感慨,中國棋手加上升段賽,一年才十幾盤棋。
而AlphaGo每天可以自我對弈達100萬盤棋,從自我對局中學習提高。從現在到與李世石比賽,大約有三十天。AlphaGo還可以有3000萬盤棋來提高學習。這是一個多麽驚人的情景。用一日千裏來形容AlphaGo的進步一點都不為過。
所以每個評論的棋手都認為,AlphaGo在和樊麾對局時展現的實力,完全不等於幾個月後和李世石對局時的棋力。
有些人認為樊麾才是個職業二段,哪能和頂尖的李世石相比,更有人認為年初中國的柯潔戰勝了李天王,柯潔才能是對抗AlphaGo的代表。
其實達到職業棋手,相互間的棋力相差是很小的,能夠戰勝職業二段,戰勝李世石就絕不是一個不可逾越的鴻溝。
AlphaGo戰勝樊麾二段的五局棋,除了第一盤是謹慎的細棋之外,後麵幾盤樊麾都是脆敗,毫無還手之力。其中印象很深的是第二盤,樊麾想將局麵弄得複雜一些,走出一個比較難測的變化,結果被電腦抓住了誤算,中盤崩潰。
基本上樊麾在第三局之後,就是處於一種置之死地而不勝的狀態。
以我對電腦下棋的經驗來講,電腦是不會恐懼、猶豫、膽怯、激動、後悔、生氣等等棋手常見情緒來幹擾對局,不會疲勞不會遺忘,永遠冷靜判斷。電腦下的每一步棋都會牢牢地記住,絕不會因為時間長而忘掉定式的某一個變化。在局部的死活上絕不會誤算,想通過戰勝人類的某些方式,在麵對電腦時是無效的。而當人類發生某個失誤時,電腦絕對會抓住不放的。這是電腦最強的地方。
李世石的棋風號稱僵屍流,將某塊死棋保留有種種餘味,後盤通過劫爭、轉換等方式起死回生。中日韓三國棋手對此都深懷懼意,由此產生極大的心理壓力,因為李世石在算路和判斷上極其精準。從而在許多大賽中,原本無理過分的行棋,因為對手在心理上產生的壓力,影響了判斷,讓李世石在很多次對抗中絕地反擊轉敗為勝。但在電腦的算路麵前,這樣的棋就沒有什麽壓力威脅可言,反而是一個可能脆敗的弱點。
從心情上講,我希望李世石此次能夠維護人類最後的光榮。但是實際上AI打敗人腦已經是早晚無疑的事了。
李世石要贏這一百萬美元,不容易吧。
急切的期盼五番棋的到來,從人類的長河中,人類最優秀的選手,在最複雜的遊戲中,首次對抗機器的挑戰。