它用蒙地卡羅模擬許多可能,再用算法決定最好的一步。所以這一步是唯一的。那它開局應該每手棋都一樣啊?當然據說它會從下過的棋學習。那第四盤它輸了它怎麽知道是那幾手下錯了?前三盤李輸了,它也能知道李那幾手下錯了?
請教一下AlphaGo程式的算法
所有跟帖:
•
AlphaGo的思路可能已經不是人類可以理解和可以解釋清楚的了。
-宇之道-
♀
(133 bytes)
()
03/13/2016 postreply
12:56:16
•
第四局前十一手與第二局完全相同,李第十二手下對了
-fourwaves-
♂
(68 bytes)
()
03/13/2016 postreply
13:35:12
•
既然,AlphaGo已經贏了。Google會不會關掉它的幾個模塊,進行一下科學實驗。
-宇之道-
♀
(50 bytes)
()
03/13/2016 postreply
14:12:00
•
不符合西方人最重視的運動精神
-fourwaves-
♂
(0 bytes)
()
03/13/2016 postreply
14:15:44
•
符合科學探索精神。
-宇之道-
♀
(0 bytes)
()
03/13/2016 postreply
15:16:16
•
圍棋是運動
-fourwaves-
♂
(0 bytes)
()
03/13/2016 postreply
15:40:33
•
如果AlGo團隊有優秀的數學和控製論人才,在算法的研究上估計問題不會太大,但算法變成電腦程序的過程中要做到完美無瑕極不容易
-RCHZ-
♂
(698 bytes)
()
03/13/2016 postreply
21:49:46
•
它選擇獲勝幾率最大的那一步棋,按概率來說,從狗的勝率就可以反推出它估算的勝利域值是多少。
-天方化戟-
♂
(0 bytes)
()
03/14/2016 postreply
06:40:21
•
看來它的問題還是很大
-fourwaves-
♂
(92 bytes)
()
03/14/2016 postreply
12:10:27
•
蒙特卡羅樹這種算法本身就缺陷很大,電腦下圍棋應該走一條不同的路子。
-天方化戟-
♂
(65 bytes)
()
03/14/2016 postreply
16:58:56
•
同意。應該使用......
-宇之道-
♀
(238 bytes)
()
03/15/2016 postreply
05:11:42