大模型的底層訓練模式是:答對有獎勵,加入循環-----對科學實驗有指導意義。
來源:
隻關心中股
於
2025-10-09 12:29:11
[
舊帖
] [
給我悄悄話
] 本文已被閱讀:次
但對人文思想卻不:答對的標準不一樣。