他公布的方法不複雜,直覺性很強
所有跟帖:
• 如果, alphago 馬上把輸的結果歸納進測試程序進行再訓練, AI 就補上了那個缺陷。 -WaldenPond- ♂ (0 bytes) () 03/23/2023 postreply 20:44:27
• 如果這樣不能解決問題, 那麽 alphago 設計有缺陷。這樣的反饋學習成本非常高。 -WaldenPond- ♂ (0 bytes) () 03/23/2023 postreply 20:47:35
• 據說是知道了上次的錯誤,光憑此經驗仍可能不知道正確的走法,除非訓練過程作大的改變 -ScottGu- ♂ (155 bytes) () 03/23/2023 postreply 21:51:11