據說是知道了上次的錯誤,光憑此經驗仍可能不知道正確的走法,除非訓練過程作大的改變

來源: ScottGu 2023-03-23 21:51:11 [] [博客] [舊帖] [給我悄悄話] 本文已被閱讀: 次 (155 bytes)

網上對此原因有些分析。AlphaGo Zero是without human knowledge。如果訓練過程作針對性改變,就是輸入了human knowledge。

請您先登陸,再發跟帖!

發現Adblock插件

如要繼續瀏覽
請支持本站 請務必在本站關閉/移除任何Adblock

關閉Adblock後 請點擊

請參考如何關閉Adblock/Adblock plus

安裝Adblock plus用戶請點擊瀏覽器圖標
選擇“Disable on www.wenxuecity.com”

安裝Adblock用戶請點擊圖標
選擇“don't run on pages on this domain”