哎,牛頓說的,站在巨人的肩膀上。這個模型並不是完全從頭培訓的,而是用的GPT們的培訓結果,再用RL矯正,如此循環

回答: DeepSeek 的 paperrun20222025-01-26 10:12:58
請您先登陸,再發跟帖!