DS的主要貢獻其實是那篇論文,告訴大家怎麽用reinforcement learning快速廉價的訓練大模型

有了這個,Meta和其他公司也可以用同樣的方法訓練大模型。我在LinkedIn上的幾百個connect大多數都是做AI的,現在大家在上麵討論最多的不是這個模型本身,而是他們發的這篇論文,有人根據他們的方法用了這個在家用十幾台iMac搭建的cluster就訓練了一個不錯的模型

所有跟帖: 

請您先登陸,再發跟帖!