哎,牛頓說的,站在巨人的肩膀上。這個模型並不是完全從頭培訓的,而是用的GPT們的培訓結果,再用RL矯正,如此循環

來源: 2025-01-26 10:16:07 [舊帖] [給我悄悄話] 本文已被閱讀: