“All games of perfect information have an optimal value function, v(s), which determines the outcome of the game, from every board position or state s, under perfect play by all players.”
正解是存在的。下麵的一句是AlphaGo論文正文的第一句。
所有跟帖:
• 不知道這個v(s)是如何判斷的,估計也沒有數學證明這個函數有多逼近原函數,它這個論文可能並不嚴謹。 -天方化戟- ♂ (0 bytes) () 02/22/2016 postreply 18:23:29
• 這句話應該是公認的了。我選擇相信它。你如果認為他們錯了,你可以嚐試一下,挑戰他們。 -宇之道- ♀ (53 bytes) () 02/22/2016 postreply 18:40:02
• 這句話隻不過描述了一下程序的基本過程,並不涉及這個判斷函數本身有何憑據,談不上挑戰不挑戰。 -天方化戟- ♂ (1101 bytes) () 02/22/2016 postreply 19:39:19
• 我相信,像極高目等下法,不會對AlphoGo起作用。你如果有興趣,可以讀一下他們的論文,看看有什麽破綻。 -宇之道- ♀ (0 bytes) () 02/23/2016 postreply 05:38:47