個人資料
多吉 (熱門博主)
  • 博客訪問:
正文

揭秘 AlphaGo 共同第一作者 Aja Huang 黃士傑(弈城賬號 DeepMind)

(2016-03-10 01:58:21) 下一個

 

(ZT)  揭秘AlphaGo作者之一 Aja Huang 黃士傑(弈城賬號 DeepMind)
作者:張曉茵  出處:新浪博客“曉茵的人生漫舞” (2016-02-08)


【我為什麽支持AlphaGo 除夕有感】 (張曉茵)

首先,看到Google DeepMind的計算機圍棋人工智能AlphaGo戰勝樊麾二段的消息,的確有些意外,當然,也有一些恐懼。因為我知道樊麾的實力確實是職業棋手,而且是不會放水的,所以新聞一定是真的。

再來,看了各方圍棋界大量的在討論這則新聞,非常精彩!第一時間,我腦中立刻浮現出一個人:Aja Huang黃士傑。2007年我就讀台灣師範大學研究所期間,召集師大對圍棋有興趣的學弟妹來創辦圍棋社,當時聯係到了就讀資訊工程研究所的Aja學長,他是業餘6段,也是唯一一位在圍棋社年紀比我大的學長,他很熱心地來指導學弟妹,有關於圍棋AI的知識都是那時聽他說的。

那時圍棋AI公認最強的程序是Zen,大約業餘5段,而Aja學長所設計的程序Erica棋力也不俗,曾在榮獲TAAI 2009年計算機圍棋競賽19路銀牌及9路銅牌等佳績。Aja學長的碩士跟博士論文都是在台灣師範大學資訊工程研究所林順喜教授的指導下完成,分別是2003年的碩士論文《計算機圍棋打劫的策略》(The Strategies for Ko Fight of Computer Go)和2011年的博士論文《應用於計算機圍棋之蒙地卡羅樹搜尋法的新啟發式算法》(New Heuristics for Monte Carlo Tree Search Applied to the Game of Go),博士論文中Rémi Coulom為共同指導教授。

後排左一為Aja學長,照片為2007年台灣大專杯圍棋賽師大圍棋社合影

我在2007年時第一次聽Aja學長介紹蒙地卡羅樹搜尋法,我後來也上網查了一下,原理應該是:通過隨機抽樣的方法,以隨機事件出現的頻率估計其機率,或者以抽樣的數字特征估算隨機變量的數字特征,並將其作為問題的解。假設我們要計算一個不規則圖形的麵積,那麽圖形的不規則程度和分析性計算的複雜程度是成正比的。假想你有一袋豆子,把豆子均勻地朝這個圖形上撒,然後數這個圖形之中有多少顆豆子,這個豆子的數目就是圖形的麵積。當你的豆子越小,撒的越多的時候,結果就越精確。藉助計算機程序可以生成大量均勻分布坐標點,然後統計出圖形內的點數,通過它們占總點數的比例和坐標點生成範圍的麵積就可以求出圖形麵積。所以,Aja學長說他們每天都喂程序吃很多職業棋士的棋譜,那時我隱約覺得,隻要程序吃的棋譜夠多,一定能比人類還要強,沒想到,這天來的這麽快!

此外,這幾年他們可能還加入了policy network及value network等關鍵技術。這次Nature雜誌上關於AlphaGo的論文,有心的人應該會發現,第一作者是David Silver & Aja Huang.
(參見http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html)

看到Aja學長也是AlphaGo的研發團隊之一,而且是並列第一作者,代表在團隊中的貢獻度不小,感到與有榮焉。我知道Aja學長博士畢業後到英國,2014年曾托我買了整套2013年《圍棋天地》雜誌合刊本,專門寄到英國給他。Aja學長為人低調,去年他加入DeepMind我也是最近才知道,而且在最近的報導中,他仍保持低調作風,一切貢獻以團隊為主,我在Facebook上想跟他多了解一些AlphaGo的訊息,他說是整個團隊的貢獻,而且很多事情目前都需要保密,等到三月跟李世石九段比賽後之後才能說。

關於最近有網友發現在弈城上有一個deepmind的賬號,揣測是否就是用來測試AlphaGo程序的賬號。1月29日,在台灣的書呆弈討論區中,Aja學長已正式回應,那個賬號是他個人在使用的。原文如下:

「奕城的deepmind是我本人(Aja Huang)在用的賬號,並不是AlphaGo,而且deepmind應該是在14年底之前、在AlphaGo團隊出現之前就創建了。如果我記得沒錯,我是在Google收購DeepMind之前就在奕城用deepmind下棋了,那時候我打到奕城8d。我本人喜歡下圍棋,棋力是台灣業餘六段,去年在德國的比賽我甚至贏過一位日本職業棋手。但AlphaGo肯定是比我強太多了。」

「職業水平的圍棋軟件,應該最慢在1-2年之內就會在市麵上普及。我相信Zen的作者目前正在全力實作我們公布在<自然>雜誌上的方法,或許Zen可以在不久的將來追上AlphaGo,我個人十分樂見這樣的發展。我估評7d的Zen目前距離5個月前的AlphaGo還有3子以上的差距。」
(來源:http://www.yigo.org/modules/newbb/viewtopic.php?topic_id=9845&viewmode=flat&order=ASC&type=&mode=0&start=20)

依照Aja學長這樣的回複,AlphaGo的真正實力應該有職業水平,不容小覷。加上Google肯定是有一定的把握,從去年開始經過縝密的籌備及醞釀,直到今年初公開消息,是有完整準備的。當亞洲圍棋強國在為夢百合世界大賽冠軍爭奪時,英國的DeepMind團隊已悄然走在超越人類世界冠軍的道路上。

三月對戰李世石,AlphaGo研發團隊堅持不透漏各種保密協議的內容,這使我更看好AlphaGo。我不是不支持人類,而是除了棋手個人的棋力強之外,我更相信人類集體智慧的結晶成果,即Google DeepMind團隊合作的智慧。

這裏我想說一個題外話,可能不是很重要,但是或許也可以從側麵多了解一點線索。一般人會覺得計算機工程師一定是整天麵對著計算機和大量的數據,思考必須非常理性。能夠開發出打敗人類的圍棋程序,研發者的思維一定非常嚴謹,做事一板一眼。但是接觸了Aja學長,發現並不是這麽回事。他們也是人,而且,Aja學長還很喜歡音樂,甚至自己能夠用MIDI作曲並彈奏。我自己從小一直是學音樂的,聽到Aja學長的作品都覺得有專業水平,而且非常感性,我今天翻出來聽都還是耐人尋味。

我在想,這樣一位理性感性兼備的計算機工程師所在的團隊,其開發出來的計算機程序,或許會想過把一些人性的元素放進去。

很高興,Google團隊裏有這麽一位台灣人,Aja學長說要低調,因為AlphaGo的團隊成員很多,不是他一個人做出來的。但是,為什麽我們不能說,AlphaGo的團隊成員很多,但是其中有一位台灣人,而且擁有業餘6段的棋力也是團隊中棋力最高的,可謂「台灣之光」!身為師大校友、台灣人,甚至亞洲人,Aja Huang能在英國的團隊中貢獻所學,都應該為之喝采。此時,是否我們可以用一種更寬大的胸懷,這群研發團隊代表人類突破了圍棋人工智能,大家應該共同身為如此神奇的人類而讚歎。就算AlphaGo至今尚未打敗人類世界冠軍,但我相信這一天並不會太久,我樂見其成。

 

 

[ 打印 ]
閱讀 ()評論 (4)
評論
多吉 回複 悄悄話 AlphaGo幕後推手黃士傑 曾擊敗圍棋最強程式
https://video.udn.com/news/454470
多吉 回複 悄悄話 強者在此!AlphaGo 棋手黃士傑 是台師大博士
http://www.appledaily.com.tw/realtimenews/article/life/20160310/813118/%E5%BC%B7%E8%80%85%E5%9C%A8%E6%AD%A4%EF%BC%81AlphaGo%E6%A3%8B%E6%89%8B%E9%BB%83%E5%A3%AB%E5%82%91%E3%80%80%E6%98%AF%E5%8F%B0%E5%B8%AB%E5%A4%A7%E5%8D%9A%E5%A3%AB
多吉 回複 悄悄話 AlphaGo 的係統分析
http://zhuanlan.zhihu.com/yuandong/20607684
多吉 回複 悄悄話 http://blog.sina.com.cn/s/blog_774831150102w5qb.html
登錄後才可評論.