據說是知道了上次的錯誤,光憑此經驗仍可能不知道正確的走法,除非訓練過程作大的改變
來源:
ScottGu
於
2023-03-23 21:51:11
[
博客
] [
舊帖
] [
給我悄悄話
] 本文已被閱讀:次
網上對此原因有些分析。AlphaGo Zero是without human knowledge。如果訓練過程作針對性改變,就是輸入了human knowledge。