請教一下AlphaGo程式的算法

它用蒙地卡羅模擬許多可能,再用算法決定最好的一步。所以這一步是唯一的。那它開局應該每手棋都一樣啊?當然據說它會從下過的棋學習。那第四盤它輸了它怎麽知道是那幾手下錯了?前三盤李輸了,它也能知道李那幾手下錯了?

所有跟帖: 

AlphaGo的思路可能已經不是人類可以理解和可以解釋清楚的了。 -宇之道- 給 宇之道 發送悄悄話 宇之道 的博客首頁 (133 bytes) () 03/13/2016 postreply 12:56:16

第四局前十一手與第二局完全相同,李第十二手下對了 -fourwaves- 給 fourwaves 發送悄悄話 (68 bytes) () 03/13/2016 postreply 13:35:12

既然,AlphaGo已經贏了。Google會不會關掉它的幾個模塊,進行一下科學實驗。 -宇之道- 給 宇之道 發送悄悄話 宇之道 的博客首頁 (50 bytes) () 03/13/2016 postreply 14:12:00

不符合西方人最重視的運動精神 -fourwaves- 給 fourwaves 發送悄悄話 (0 bytes) () 03/13/2016 postreply 14:15:44

符合科學探索精神。 -宇之道- 給 宇之道 發送悄悄話 宇之道 的博客首頁 (0 bytes) () 03/13/2016 postreply 15:16:16

圍棋是運動 -fourwaves- 給 fourwaves 發送悄悄話 (0 bytes) () 03/13/2016 postreply 15:40:33

如果AlGo團隊有優秀的數學和控製論人才,在算法的研究上估計問題不會太大,但算法變成電腦程序的過程中要做到完美無瑕極不容易 -RCHZ- 給 RCHZ 發送悄悄話 (698 bytes) () 03/13/2016 postreply 21:49:46

它選擇獲勝幾率最大的那一步棋,按概率來說,從狗的勝率就可以反推出它估算的勝利域值是多少。 -天方化戟- 給 天方化戟 發送悄悄話 天方化戟 的博客首頁 (0 bytes) () 03/14/2016 postreply 06:40:21

看來它的問題還是很大 -fourwaves- 給 fourwaves 發送悄悄話 (92 bytes) () 03/14/2016 postreply 12:10:27

蒙特卡羅樹這種算法本身就缺陷很大,電腦下圍棋應該走一條不同的路子。 -天方化戟- 給 天方化戟 發送悄悄話 天方化戟 的博客首頁 (65 bytes) () 03/14/2016 postreply 16:58:56

同意。應該使用...... -宇之道- 給 宇之道 發送悄悄話 宇之道 的博客首頁 (238 bytes) () 03/15/2016 postreply 05:11:42

請您先登陸,再發跟帖!