DS的主要貢獻其實是那篇論文，告訴大家怎麽用reinforcement learning快速廉價的訓練大模型

來源: 丁丁在美洲於 2025-01-28 13:22:58 [檔案] [博客] [舊帖] [給我悄悄話] 閱讀數 : (356 bytes)

回答: 現在的評論都是不完整開源。訓練數據源和審查功能都沒公開由加州lalin 於 2025-01-28 13:14:10

有了這個，Meta和其他公司也可以用同樣的方法訓練大模型。我在LinkedIn上的幾百個connect大多數都是做AI的，現在大家在上麵討論最多的不是這個模型本身，而是他們發的這篇論文，有人根據他們的方法用了這個在家用十幾台iMac搭建的cluster就訓練了一個不錯的模型

您的位置：文學城 » 論壇 » 投資理財 » DS的主要貢獻其實是那篇論文，告訴大家怎麽用reinforcement learning快速廉價的訓練大模型