正文

人機大戰第三局 – 人的勝利, 人的失敗?

(2018-05-31 10:02:10) 下一個
人機大戰第三局 – 人的勝利, 人的失敗?
圖片昨天AlphaGo對李世石的人機大戰第三局幾無懸念的以AlphaGo的壓倒性優勢獲勝,創造了人工智能機器挑戰人類圍棋的曆史性時刻。縱觀第三局整個棋局,機器狗在一開始由李世石故意導入的左上局部複雜戰鬥中以完美精確的落點讓李世石每步棋決策都非常難辦,機器狗的每步下法似乎看來對令人類無法擊破,大概到四十七八手時當下圍棋第一人柯潔認為李世石已經不可能贏了,這也是幾乎所有觀戰職業高手的內心感覺。相比前兩局人們還在棋局中後盤一度有一些希望AlphaGo會可能犯錯而讓李世石贏一盤的心情,在這一局的第五十手很多人大概已經絕望。後麵李世石堅韌不屈向機器狗下出不同尋常的挑戰手法,無論是局部還是全局的謀算,機器狗全部成竹在胸無懈可擊,甚至在最後李世石造出的複雜打劫過程中脫先一手也令李世石沒有任何的機會。整個棋局上的搏殺仿佛令人看到了非洲平原上憤怒野鹿對獅子的反擊,鴉片戰場上僧格林沁馬隊向英法聯軍發起的衝鋒,以及二戰中勇敢的波蘭騎兵向德軍坦克陣型發起的衝擊...。對弈的黑白雙方根本不在一個量級之上。從統計概率的角度看,其實也很容易理解。圍棋盤上三百六十一點,黑白一人一手下滿盤大概每方一百八十手。從開始落子的第一步算,每步棋的正確概率機器永遠不會比人低,這些概率全部乘在一起,機器獲勝的總概率應該是幾何級數倍數的人類獲勝的總概率。從AlphaGo背後設計者的理解看,機器狗的深度學習,與網絡大數據結合,理論上讓機器狗的超級大腦能夠學習囊括人類有史以來的全部知識。在最近幾個月三千萬棋局的模擬訓練之後機器狗贏棋的概率應該是大於99.9999%,所以這也是他們一開始認為是機器狗5比0一邊倒的結果,雖然很多不理解人工智能的人從人類感情上難以想象難以相信。三比零已經意味著兩歲半的AlphaGo超越了人類圍棋有史以來的全部水平,是最接近圍棋之神的絕頂高手。

 

圖片

二十年前的大學期間有幸跟導師屈梁生教授接觸了人工智能的一些基礎知識,當時的博士論文題目是“基於多傳感器能信息融合方法的機器智能診斷技術研究”,就是研究根據機器收集到的各種傳感器信號做信息處理並借助人工智能推理的一些方法進行信息融合和決策診斷,以求得出比人類憑經驗判斷更可靠的機械設備故障診斷結果。九十年代國內的大學界正值人工智能神經網絡,專家係統,數據挖掘,基因遺傳算法,模糊集/粗燥集合,分形,混沌,證據推理,小波分析等國際熱門方向的研究熱潮。許多大學不同學科的研究生博士生都在利用這些人工智能的數學方法特別是人工神經網絡作為工具搞自己領域的應用研究。總體來講,國內大多數的研究其實是把國外人家真正研究出來的東西山寨山寨添枝加葉看能不能用於自己的學術領域產出一些意想不到的結果。傳統僵化體製的問題導致當時幾乎很難有創新的思考和發展。不管怎樣,記得是當時交大的第一個人工神經網絡課程,由信控係的殷勤業教授講解,吸引了一大批的研究生聽課。上課在一個大教室,每次感覺都是人滿滿的,我每次都坐在最後幾排,因為總有人會提前去占座位。文革中自學成才七八年考上交大的殷教授在學校非常有名,他為人嚴謹學術認真,教的課程有些是用國外的教材或者英文的文獻,由他自己一點一點翻譯領悟之後教給我們,這些在互聯網剛剛興起傳到國內的大量外國先進知識大大開拓了我們的視野,深受同學們喜愛。殷教授的另一門課時頻信號分析也很受歡迎,記得他用了一個德州農機大學畢業的在美國虛擬儀器公司高工錢石諤發表的專著,內容通俗易懂,讓人一下子就理解了高級信號處理的一些基本理論。誕生於四十年代並在五六十年代興起的的人工神經網絡是一個了不起的成就,它從信息處理角度對人腦神經元網絡進行簡單抽象,建立起某種簡單數學模型,按不同的連接方式組成不同的網絡。這種運算模型由大量的節點神經元之間相互聯接構,而每個節點代表一種特定的稱為激勵函數輸出函數。每兩個節點間的連接都代表一個對於通過該連接信號的加權值,這相當於人工神經網絡的記憶。網絡的輸出則依網絡的連接方式,權重值和激勵函數的不同而不同。一旦神經網絡數學模型被建立起來,就可以按照給定目標通過輸入大量樣本進行人工訓練,讓網絡神經記住類似樣本的特征數值,這些數值被存儲到每個神經元鏈接權重裏,而用於未來目標的分類和識別。另外權重還可以根據經驗進行調整,使人工神經網絡能夠帶有自動適應和自動學習的能力。人工神經網絡從最初的感知器模型,到後來的誤差反向傳播BP模型,遺傳基因算法,以及最近幾年興起的大型卷積網絡模型,大大使得人工智能在機器學習,目標分類,數據挖掘,決策分析等等領域取得了巨大的突破。這次Google所擁有的蒙特卡羅搜索深度學習卷積神經網絡等一起的人工智能AlphaGo三局完勝李世石已經證明人類在人工智能領域的巨大突破,機器狗的這種自學習自進化自適應模擬高級人類抽象思維能力的超級本領,未來將會在許多領域得到廣泛應用。就在AlphaGo贏了李世石的第一盤那天早上上班途中就聽到美國國家廣播電台NPR訪談GoogleAlphaGo勝利之後的商業應用。

然而,任何事物有好的一麵就會有不好的一麵,就像硬幣有兩麵性,世界千變萬化最終化為01一樣,宇宙萬物似乎逃脫不出老子的陰陽學說。人工智能即將帶來的巨大效益可能是深刻而革命性的,但同時所帶來的人類挑戰也同樣可能出乎意料。比如智能機器人的迅速發展可能會大大減少就業崗位,造成大量失業。去年在美國上市的LendingClub宏偉目標就是打算用人工智能機器代替所有銀行的人工服務,讓未來所有的銀行櫃台可能消失,而全部轉向機器背後的智能高效服務。另外人工智能機器人帶來的服務可能讓未來人們的生活變得無趣無意義,傳統人們是通過勞動收獲得到自我滿足自我幸福的感覺可能消失,這也是令人深思的問題。令人擔心的未來人工智能的發展會不會讓機器的智慧超過人類而奴役指揮人類,像某些科幻電影或者小說裏描述的黑暗生命什麽的,也不是沒有可能。

Google總裁施密特在人機大戰賽前表示,這次對抗無論誰勝誰負,實際上都是人類的勝利。然而,AlphaGo的取勝到底是人類的勝利,還是人類的失敗,我想許多人都有疑問,且憂心忡忡。在集古老人類智慧與其人性之美的圍棋棋盤上AlphaGo就是贏得再多,也無法為勝利開心一笑,人類的喜怒哀樂柔情與夢想是智能機器人永遠無法感受的。

 

PS:這幾天隨阿爾法狗學了幾招,昨天立即用在網上一個三段身上並取得意想不到的勝利。今天聽說羅洗河九段也同樣用阿爾法狗的下法爆冷擊敗了周睿羊九段。阿爾法狗,有史以來最強大的圍棋高手,將是未來人類圍棋的老師,並改變棋手對圍棋技藝的重新認識。)

[ 打印 ]
閱讀 ()評論 (0)
評論
目前還沒有任何評論
登錄後才可評論.