大模型的底層訓練模式是:答對有獎勵,加入循環-----對科學實驗有指導意義。

來源: 2025-10-09 12:29:11 [舊帖] [給我悄悄話] 本文已被閱讀:

但對人文思想卻不:答對的標準不一樣。