臉書母公司Meta已成立了4個專門研究小組來研究量化巨頭 「幻方量化」旗下的大模型DeepSeek的工作原理

本帖於 2025-01-27 13:57:41 時間, 由普通用戶 顏陽 編輯

Information報導,臉書母公司Meta已成立了4個專門研究小組來研究量化巨頭「幻方量化」旗下的大模型DeepSeek的工作原理,並基於此來改進旗下大模型Llama。

據說DEEPSEEK並未公開其用於訓練的數據庫,

其中2個小組正在試圖了解「幻方量化」如何降低訓練和運行DeepSeek的成本;第3個研究小組則正在研究「幻方量化」可能使用了哪些資料來訓練其模型;第4個小組正在考慮基於DeepSeek模型屬性重構Meta模型的新技術。

 

 

所有跟帖: 

什麽都不重要,重要的是open source will prevail的理念 -CheGuevara- 給 CheGuevara 發送悄悄話 CheGuevara 的博客首頁 (0 bytes) () 01/27/2025 postreply 13:58:53

that is the least important thing -芳華萬裏- 給 芳華萬裏 發送悄悄話 (0 bytes) () 01/27/2025 postreply 14:10:54

這個是最重要的事 -凊荷- 給 凊荷 發送悄悄話 凊荷 的博客首頁 (0 bytes) () 01/27/2025 postreply 14:17:25

隻要有人能做到出來,很快就會有他人複製和增強。ChatGPT 也是這樣,即使是閉源的也擋不住 -未知- 給 未知 發送悄悄話 未知 的博客首頁 (320 bytes) () 01/27/2025 postreply 14:11:08

不錯。工程上最難的就是證明可行,隻要知道能弄出來,就是時間和金錢的事。AGI到現在還沒影,嚴重懷疑現有的體係行不行 -mobius- 給 mobius 發送悄悄話 (0 bytes) () 01/27/2025 postreply 14:15:28

現有的體係不行! AGI需要AI不斷自我成長並與其他模型互動 -futufutu- 給 futufutu 發送悄悄話 (0 bytes) () 01/27/2025 postreply 14:46:36

This would be a bad news for NVDA -越王劍- 給 越王劍 發送悄悄話 越王劍 的博客首頁 (255 bytes) () 01/27/2025 postreply 14:14:34

True,至少短期是這樣。NVDA是活的,不是死的,也會Adapt -未知- 給 未知 發送悄悄話 未知 的博客首頁 (153 bytes) () 01/27/2025 postreply 14:24:22

I second that. -越挫越勇2- 給 越挫越勇2 發送悄悄話 (0 bytes) () 01/27/2025 postreply 14:26:31

No, deepsek shows asic would be bad idea -cnrhm2017- 給 cnrhm2017 發送悄悄話 cnrhm2017 的博客首頁 (0 bytes) () 01/27/2025 postreply 14:34:25

請您先登陸,再發跟帖!