LLM隻不過是從token串預測下一個token,最準確的ground truth還是原始數據,而不是什麽學到的東西
來源:
IT-guy
於
2025-01-29 18:51:16
[
舊帖
] [
給我悄悄話
] 本文已被閱讀:次
但OpenAI不願意跟大家share 它偷到的原始數據,DS 退而求其次,用OpenAI來生成訓練數據,基於的假設是OpenAI所生成的數據跟原始數據差別不是很大。