LLM隻不過是從token串預測下一個token,最準確的ground truth還是原始數據,而不是什麽學到的東西

但OpenAI不願意跟大家share 它偷到的原始數據,DS 退而求其次,用OpenAI來生成訓練數據,基於的假設是OpenAI所生成的數據跟原始數據差別不是很大。

請您先登陸,再發跟帖!