Information報導,臉書母公司Meta已成立了4個專門研究小組來研究量化巨頭「幻方量化」旗下的大模型DeepSeek的工作原理,並基於此來改進旗下大模型Llama。
據說DEEPSEEK並未公開其用於訓練的數據庫,
其中2個小組正在試圖了解「幻方量化」如何降低訓練和運行DeepSeek的成本;第3個研究小組則正在研究「幻方量化」可能使用了哪些資料來訓練其模型;第4個小組正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。
Information報導,臉書母公司Meta已成立了4個專門研究小組來研究量化巨頭「幻方量化」旗下的大模型DeepSeek的工作原理,並基於此來改進旗下大模型Llama。
據說DEEPSEEK並未公開其用於訓練的數據庫,
其中2個小組正在試圖了解「幻方量化」如何降低訓練和運行DeepSeek的成本;第3個研究小組則正在研究「幻方量化」可能使用了哪些資料來訓練其模型;第4個小組正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。
•
什麽都不重要,重要的是open source will prevail的理念
-CheGuevara-
♂
(0 bytes)
()
01/27/2025 postreply
13:58:53
•
that is the least important thing
-芳華萬裏-
♀
(0 bytes)
()
01/27/2025 postreply
14:10:54
•
這個是最重要的事
-凊荷-
♀
(0 bytes)
()
01/27/2025 postreply
14:17:25
•
隻要有人能做到出來,很快就會有他人複製和增強。ChatGPT 也是這樣,即使是閉源的也擋不住
-未知-
♂
(320 bytes)
()
01/27/2025 postreply
14:11:08
•
不錯。工程上最難的就是證明可行,隻要知道能弄出來,就是時間和金錢的事。AGI到現在還沒影,嚴重懷疑現有的體係行不行
-mobius-
♂
(0 bytes)
()
01/27/2025 postreply
14:15:28
•
現有的體係不行! AGI需要AI不斷自我成長並與其他模型互動
-futufutu-
♂
(0 bytes)
()
01/27/2025 postreply
14:46:36
•
This would be a bad news for NVDA
-越王劍-
♂
(255 bytes)
()
01/27/2025 postreply
14:14:34
•
True,至少短期是這樣。NVDA是活的,不是死的,也會Adapt
-未知-
♂
(153 bytes)
()
01/27/2025 postreply
14:24:22
•
I second that.
-越挫越勇2-
♂
(0 bytes)
()
01/27/2025 postreply
14:26:31
•
No, deepsek shows asic would be bad idea
-cnrhm2017-
♂
(0 bytes)
()
01/27/2025 postreply
14:34:25
WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.
Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy