AlphaGo用了兩個學習算法。一個是supervised learning。一個是reinforcement learning
所有跟帖:
• 如果對手下了一子它沒看過,它如何下? -fourwaves- ♂ (0 bytes) () 02/19/2016 postreply 18:23:36
• 具體我也不清楚。你如果有興趣,可以讀一讀他們的論文。 -宇之道- ♀ (0 bytes) () 02/19/2016 postreply 18:35:40
• 它沒有看過的下子怎麽學習?這是自相矛盾的邏輯 -fourwaves- ♂ (0 bytes) () 02/19/2016 postreply 19:27:35
• 它自己和自己下了至少3000多萬盤棋。裏麵大多數局麵應該都是它沒見過的。讀一下論文,應該可以了解個大概。 -宇之道- ♀ (0 bytes) () 02/19/2016 postreply 20:22:03
• 這是歐洲冠軍下輸的真正原因吧,他下錯的棋已經在這3000多萬盤棋中 -fourwaves- ♂ (0 bytes) () 02/20/2016 postreply 07:45:56
• 肯定不在。圍棋諺語是“千古無同局”。如果它一直沒停,那麽目前它應該已經下上億盤棋了。 -宇之道- ♀ (0 bytes) () 02/20/2016 postreply 11:24:55
• 這也是它能贏的原因吧,自己和自己下,不需要什麽智能 -fourwaves- ♂ (0 bytes) () 02/20/2016 postreply 14:18:59
• 看你對智能的定義是什麽了。 -宇之道- ♀ (84 bytes) () 02/20/2016 postreply 15:44:55