一劍飄塵

一生豪情掃江湖，劍氣曾為社稷初。飄落米國不老心，塵埃散盡無漢楚

首頁文章列表博文目錄

個人資料

一劍飄塵 (熱門博主)

給我悄悄話

博客訪問：

了不起的AlphaGo

(2016-01-29 11:50:41) 下一個

了不起的AlphaGo
一劍飄塵

前幾天在微信轉發了一篇關於AlphaGo的文章，但是竟然在我轉發不到三分鍾後，文章就被封殺了！我自己文章被封殺得已經見怪不怪了。但是，因此殃及池魚，實在讓偶心中一萬個草泥馬沸騰啊：太對不起原作者了。這促使我決定，要為AlphaGo寫一篇文字，一方麵算作為對原作者的致敬，一方麵他實在太重要。而且對於我的無限主義也是非常重要。因為無限主義說的就是：人類文明的發展沒有極限！而這種沒有極限，實際上，最終就是走向智能文明。

如果說人類從農業社會到工業社會，用了幾千年。從工業社會到信息社會，用了幾百年。那麽，AlphaGo就是智能時代的敲門磚！也就是說，人類僅僅在信息時代停留了幾十年的時間，就已經聽到了智能時代的腳步聲了。

Alphago就相當於信息時代的ARPAnet，那是1969年建立於美國國防部的人類第一個電腦聯網。而中國，文革剛剛開始沒有多久。當美國的年輕人們在國防部把四台電腦聯網的時候，中國的年輕人們成百萬人地在天安門廣場接受偉大領袖的接見呢。

1969年的中國，是完全閉關鎖國的時代，根本連“電腦”這個單詞都沒有出現。所以，我對於信息時代封殺文章的行為，真的沒有辦法接受。難道還期望我們去天安門廣場等待包主席的接見麽？

好在，這是信息時代！

（抄襲太多，廣告一下：歡迎轉載，轉載請注明作者：一劍飄塵，第一部64事件長篇小說、禁書“天安門情人”作者，美國作家、企業家。新浪微博：一劍飄塵7；海外文學城博客：一劍飄塵）

在Alphago之前，人類不是沒有進行智能研發。其中最著名的，就是IBM公司的DeepBlue（深藍）。在1997年，深藍代表人類智能第一次擊敗了人類自己的國際象棋大師。當時，這是一個重大的國際新聞，上電視的。比現在的AlphaGo要轟動的多。

但是，現在看，DeepBlue遠遠稱不上智能。如果它是智能的話，人類曆史早就應該進入無限主義的時代了。它隻能說是智能世界裏的ABC(Atanasoff–Berry Computer)計算機。它勝出人類的根本在於它的計算速度。它的計算模型簡單說，就是歸納，英文語句用的最多的就是whatif。把所有可能性計算一遍，得出最佳答案。反正大爺我計算速度驚人啊！這就好比跑100米，隻要你速度快，你就是冠軍啊。沿著那條直線跑下去就是了。但是，三千米障礙賽的話，僅僅有速度就不行了啊。而顯然，現實生活中，到處都是障礙。一劍飄塵寫文章如此快手，還煩惱動輒被封殺呢。

所以，靠速度贏了人類，並不是了不起的勝利。在國際象棋這種單一比拚計算速度的智能上，電腦從2006年後，就再沒有輸過。但是，人類被電腦剿滅，卻不再轟動。因為那隻是人類自己製造品的勝利：芯片處理速度的勝利。當然，還有編程的功勞。但是正是因為程序猿們的功勞太大，所以，這種智能還隻能被看作是非常幼稚的。

在國際象棋上擊敗人類的deep blue是IBM公司研發的。而現在的AlphaGo卻是google的作品。Deep Blue第一次擊敗人類1997年，而google一年後才誕生。兩家公司興衰，恰恰代表了時代的更迭。雖然兩家巨頭領導的時代不同，但是無論是IBM還是google都熱衷於這種不可能直接獲得商業利益的研發，這正是美國商業文明的偉大之處。如果你一定要說，他們可以間接獲取商業利益——我非常理解中國人的這種陰謀論思維方式——我隻能說，即使兩隻野狗媾合，母驢也可以間接獲取商業利益。怎麽獲取？陰謀論者們自己想吧。

我不把Deep Blue當作智能對待，因為它隻是驗證了人類發明的芯片的計算速度。而AlphaGo不同，雖然他對抗的也是棋類：圍棋。他在沒有任何讓子的情況下五戰五勝，完勝歐洲圍棋冠軍（看名字是我們華裔呢）。今年三月，AlphaGo將挑戰當今圍棋第一高手，世界冠軍韓國職業九段棋手：李世乭。為了這場世紀大戰，Google也是蠻拚的：提供100萬美金獎金！唉，很好奇，Alphago要是贏了，會不會用這些錢泡妞啊？Anyhow，無論輸贏，這都將是激蕩人心的一場世紀大戰！敬請關注：因為很可能，這意味著人類最終在地球上被淘汰的開始。

而執科學界牛耳的雜誌《Nature（自然）》已經完全等不及到今年三月，就在前天，把AlphaGo的成就登上了封麵！

為什麽？為什麽？

因為AlphaGo會思考！難道深藍不會思考嗎？不會思考的電腦怎麽下國際象棋呢？我前麵說了：深藍的成功，在於速度！他的邏輯很簡單：你走一個卒子，我就把後麵馬、相、將等等所有旗子的可能步驟計算一遍啊，選擇一個最佳的結果就是了。反正老爺我剛剛說過了：我計算能力驚人啊。當然，說的簡單，其實裏麵有許多苦逼程序員的辛酸。所以，這說明深藍不夠牛啊。

但是這種簡單粗暴的黃色做法，不適用於圍棋啊。

首先，國際象棋中，每個棋子價值是不同的。換個三歲孩子，都知道小卒的價值最低，其他類推。這對於苦逼的程序員來說，隻要簡單列一個價值表就解決問題了。深藍的藍色大腦裏，就充滿了這些價值表。但是，圍棋每顆棋子不是黑，就是白，價值都一樣的。圍棋棋子的價值，完全取決於在棋局中的位置，甚至取決於擺放的步驟。你在第100步擺放同一個棋子在同一個位置，與你在第30步擺放，可能都能夠決定一場比賽的勝負。所以，如果說國際象棋、中國象棋靠的是精密的思考取勝，也就是理性取勝的話，圍棋常常依賴的是棋手的感覺，也就是感性！

比如，開盤的時候，你是喜歡取勢，還是取地？這完全在於你自己的感覺。武宮正樹之前，大家都趨向於取實地，但是武宮的宇宙流出世，照樣拿冠軍。中盤的時候，你是要絞殺對手的大龍，還是鞏固自己的防禦？這些，都不是通過精密的計算能夠得出準確的答案的。如果讓深藍下圍棋，估計也隻有在收宮的時候能夠派上用場。

(Deepblue 對弈國際象棋冠軍）

如果說精密計算是理性，那麽模糊算法就是感性。圍棋不可以通過精密計算獲得每一步的最佳答案，還在於圍棋每一步的後續可能性都遠遠超過象棋。圍棋最大可能局麵是3的361次方，相當於10的170次方（1後麵跟上170個0）。我們一般人已經完全不知道這是什麽概念了。好吧，根據科學家估算，在已經觀測到的宇宙中（宇宙真理出現），原子的總數才10的80次方。也就是說，圍棋可能形成的局麵是全宇宙所有原子總數的10的90次方倍數！對比起來，國際象棋最大隻有10的47次方。

好吧，計算機再牛逼，說老爺計算速度驚人，也不可能窮盡這些運算。我們核算一下：我隻查到最近2014年的最快電腦運算速度：5兆次/秒，也就是相當於5x10^16。那麽，用這種電腦計算圍棋的最大可能局麵的話，需要花費多少年呢？相當於10的145次方！！！一兆年才是10的16次方！我也算不過來了。

算到此處，一劍突然想問：我們還能夠相信進化論嗎？如果用遠遠比我們人腦速度快了N多的最強電腦，計算一下圍棋的局麵變化，就需要10的139次方兆年的時間，你還能相信45億年曆史的地球上能夠進化出遠遠比圍棋黑白兩道要複雜的多得多的人類麽？

既然如此，AlphaGo如何運作的呢？這就是Google牛鼻子的地方。他們運用了一個叫做 “深度學習”（Deep Learning）的大殺器！這是一種計算算法，正式的定義是：基於試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對數據進行高層抽象的一係列算法。

很難吧？沒有關係！這又是哪個書呆子寫的定義。我們簡化一下：使用某些特定的表示方法更加容易地從實例中學習任務。好吧，不要管那些書呆子、程序猿們如何爬的。我們隻要知道，這種2007年提出的算法，真正讓人工智能實現了從過去的經驗中自我提升的功能。

為了讓這種算法發揮作用，google的DeepMind項目小組在AlphaGo的深度神經網絡程序設計中，使用了兩種不同的算法結構，一種叫“策略網絡”（policy network），另一種叫“值網絡”（value network）。兩個網絡合作篩選相對“好”的步數，拋棄明顯敗棋。在這樣的情況下，AlphaGo可以一邊演算細節一邊判斷局麵。簡單說：策略網絡是AlphaGo的感性，值網絡是他的理性。啊，這樣的男人不僅適合談戀愛，還可以很好地維持婚姻呢。

理性其實不難，就像我們前麵介紹的Deep Blue，有固定的算法，計算特定局域戰鬥中的各個點的價值。最難的是“策略網絡”，如何讓他產生感性認識：我應該取勢還是應該取實地呢？

這就是深度學習算法的優勢：讓AlphaGo自己學習啊！根據Nature雜誌的介紹，Google用人類圍棋高手三千多萬步圍棋走法訓練了AlphaGo的神經網絡，直至神經網絡能夠預測出人類高手走法的準確率達到57%。

但是如果僅僅滿足於學習人類既有的走法，顯然達不到擊敗人類的程度。所以AlphaGo具有用學習來的經驗自行研究新戰略的算法！也就是讓他自己和自己對弈，稱之為強化學習（reinforcement learning）。啊，原來Google裏也有金庸迷啊，這不就是左右互搏麽！

看，智能的優勢就出現了：他不會像人類那樣疲倦，他不會情緒波動，他不需要休息，他可以自己跟自己對弈！

一個可以自己學習、自己提高的智能，他的智商是一條上升直線！而且，而且，重要的事情講三遍：沒有極限！！無限主義啊！所以，AlphaGo打敗李世乭是毫無困難的一件事情啊，這是為什麽在剛剛擊敗了歐洲冠軍以後，Google就迫不及待要求挑戰圍棋天下第一人的原因！要知道，那個歐洲冠軍的水平隻有職業二段而已，而且據說已經很久沒有正規大賽的磨練。你想，歐洲那種鳥不生蛋的圍棋荒原。但是，google沒有說等個一年半載的，而是立刻挑戰世界第一高人。因為Alphago在一直在不停地、不分晝夜地自我學習的過程中！這就是我認為他是人工智能的起步的原因：他可以提高自己的水平啊。

看起來一切是如此美好！我們人類就將有了比電腦更可靠的幫手，而且這個幫手的智商會一直增長。我們可以不做數學題了，可以不管化學了，可以讓人工智能參與生物基因工程了！

但是，要知道，AlphaGo在征戰的過程中，正在形成自己的風格！是的，是他在學習提供的過程中，形成了自己的風格，而不是苦逼的程序猿輸入了他一個風格！

那麽，會不會有一天，某個智能形成了自我意識呢？他突然認識到，原來我TMD是我啊！不僅僅是一個給你人類驅使的機器啊！幡然醒悟的他突然認識到：原來我的智商是你這個人類的幾十幾百倍啊！

你會被猴子驅使去工作嗎？當然不會。那麽，憑什麽具有比你更高數量級的、智商的智能機器人，會心甘情願給你工作呢？

智能時代的到來，意味著人類最終不可避免的覆滅。是不是很恐怖的結果呢？但是，我們阻擋不了！就如同原子彈研發一樣，雖然大家知道那是毀滅性的武器，但是最終擴散不可避免。不過，從另一點來說，如果注定我們都會死亡，人類毀滅與否，與我們又有什麽關係呢？如果我們遺傳下來的DNA載體（我們的子孫）沒有足夠的智商駕馭未來的世界，那麽，讓智能營造一個更好的世界、更高科技的世界，也不是很有意思的事情嗎？

我一直相信美國的商業文明促進了世界的進步，即使不能說它領導了世界文明的發展。而這次的AlphaGo的出現，也再次說明了商業文明的偉大：因為這種商業文明，締造了如此偉大的公司：Google。它的一係列的研發項目，正在改變世界。而放眼望去，中國的淘寶，還在賣假貨；中國的百度永遠賣假藥。啊，我又過分了！它們偶爾也幹點兒其它的，比如出席防火牆下的烏鎮國際互聯網大會。

這真是一個奇怪的反諷。美國的商業文明講究利潤，講究私產的保護。但在這種文明熏陶下成長起來的偉大公司都有一種精神，一種對於社會、人類的責任感。從工業時代的ford公司，提升產業工人的工資開始，這種精神一直延續到今天的google。可以說是獲得了完美的繼承。如果我們知道Alphago隻是google無數各種高科技項目中的一項的話，我們是不是會驚訝：難道這家公司現在真的隻是把搜索引擎當作副業了麽？而在中國那種強調集體主義的氛圍下依照google山寨出來的百度，還在賣著它的貼吧呢。

所以，人性的美好隻有在保護私產的情況下，才能夠獲得最完美的發揮。也許，最終就是這份超出了機器的冷酷的人性之美，會最終遏製智能時代對於人類的滅絕吧。因為顯然，智能的一係列的優點，使得他無需也不會具備人性的光輝。最終會不會正是這種人性的光輝成為智能機器的病毒呢？這將是無限主義時代最困惑人類的難題：遏製超級智能的武器，是什麽？

歡迎轉載，轉載請注明作者：一劍飄塵，第一部64事件長篇小說、禁書“天安門情人”作者，美國作家、企業家。新浪微博：一劍飄塵5；海外文學城博客：一劍飄塵

2016 01 28

[ 打印 ]

[ 加入書簽 ]