他們隻是再次核實了 deepseek 推崇的方向:在一個比較好的 base model 基礎上,鼓勵它自己跟自己說話,用給予獎賞的 Reinforced Learning 可以得到意想不到的好效果。
也就是說,AI 已經慢慢從 generative AI, 跨入了 reasoning AI。
他們隻是再次核實了 deepseek 推崇的方向:在一個比較好的 base model 基礎上,鼓勵它自己跟自己說話,用給予獎賞的 Reinforced Learning 可以得到意想不到的好效果。
也就是說,AI 已經慢慢從 generative AI, 跨入了 reasoning AI。
•
那個核心模型的理論,也不見得是deepseek首創,或早有別人的論文,科技發展彼此互為台階很正常,加以承認就行
-老鍵-
♂
(0 bytes)
()
02/02/2025 postreply
21:21:32
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy