如果, alphago 馬上把輸的結果歸納進測試程序進行再訓練, AI 就補上了那個缺陷。
所有跟帖:
•
如果這樣不能解決問題, 那麽 alphago 設計有缺陷。這樣的反饋學習成本非常高。
-WaldenPond-
♂
(0 bytes)
()
03/23/2023 postreply
20:47:35
•
據說是知道了上次的錯誤,光憑此經驗仍可能不知道正確的走法,除非訓練過程作大的改變
-ScottGu-
♂
(155 bytes)
()
03/23/2023 postreply
21:51:11