LLM隻不過是從token串預測下一個token,最準確的ground truth還是原始數據,而不是什麽學到的東西

來源: 2025-01-29 18:51:16 [舊帖] [給我悄悄話] 本文已被閱讀:

但OpenAI不願意跟大家share 它偷到的原始數據,DS 退而求其次,用OpenAI來生成訓練數據,基於的假設是OpenAI所生成的數據跟原始數據差別不是很大。