大語言模型和強化學習結合起來就不一樣了

最後人工智能的研發還會回到強化學習為核心,Deepseek模型就是蒸餾加強化學習,現在主流的人工智能語言模型都在走這個路線。但這個路線也是有不少難題的,基礎還得是樸素的大參數模型,否則沒法蒸餾提煉。如果強化學習那麽順,穀歌也不會被OpenAI搶了人工智能的風頭。總之商業投入是要追求短期回報的,否則隻有家庭富有的人才能整天琢磨藝術(打個比方)。人類在人工智能方向的發展不可阻擋,但不見得是日新月異,天天有驚人的展示。相反,會有很長的嚴冬才有下一次的春夏

所有跟帖: 

這個的確沒有明確的通用人工智能定義 -bagel_bites- 給 bagel_bites 發送悄悄話 (459 bytes) () 11/07/2025 postreply 21:17:36

這麽跟您說吧 -bagel_bites- 給 bagel_bites 發送悄悄話 (312 bytes) () 11/07/2025 postreply 21:27:33

人家本來就是搞理論的 -bagel_bites- 給 bagel_bites 發送悄悄話 (99 bytes) () 11/07/2025 postreply 21:30:13

建議對人工智能有興趣的網友去讀一下Deepseek R-1模型的公開文獻 -bagel_bites- 給 bagel_bites 發送悄悄話 (414 bytes) () 11/07/2025 postreply 21:25:01

這是您看過後得出的結論? -bagel_bites- 給 bagel_bites 發送悄悄話 (167 bytes) () 11/07/2025 postreply 21:28:43

哦。我尊重您的意見 -bagel_bites- 給 bagel_bites 發送悄悄話 (0 bytes) () 11/07/2025 postreply 21:31:11

請您先登陸,再發跟帖!