如果, alphago 馬上把輸的結果歸納進測試程序進行再訓練, AI 就補上了那個缺陷。

來源: WaldenPond 2023-03-23 20:44:27 [] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (0 bytes)
本文內容已被 [ WaldenPond ] 在 2023-03-23 20:45:19 編輯過。如有問題,請報告版主或論壇管理刪除.
回答: 他公布的方法不複雜,直覺性很強ScottGu2023-03-23 20:37:40

所有跟帖: 

如果這樣不能解決問題, 那麽 alphago 設計有缺陷。這樣的反饋學習成本非常高。 -WaldenPond- 給 WaldenPond 發送悄悄話 (0 bytes) () 03/23/2023 postreply 20:47:35

據說是知道了上次的錯誤,光憑此經驗仍可能不知道正確的走法,除非訓練過程作大的改變 -ScottGu- 給 ScottGu 發送悄悄話 ScottGu 的博客首頁 (155 bytes) () 03/23/2023 postreply 21:51:11

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”