現在還持有NVDA和半導體的一定要花時間去研究deepseek

畢竟是中國的公司,我個人還是半信半疑,但如果被證明可行,其他的大模型應該可以去抄它的算法,那對AI芯片的需求會斷崖式下滑。

這個消息目前看還沒有發酵,花街需要的時候才會拿出來。

所有跟帖: 

算法不一定公開 -TalkToMi- 給 TalkToMi 發送悄悄話 (0 bytes) () 12/31/2024 postreply 08:06:41

不過好像是open source -TalkToMi- 給 TalkToMi 發送悄悄話 (0 bytes) () 12/31/2024 postreply 08:06:57

V-2 MIT license可以隨便抄, 現在是V-3 -當年情- 給 當年情 發送悄悄話 當年情 的博客首頁 (0 bytes) () 12/31/2024 postreply 08:09:14

不止大模型,中國在其他各種軟件方麵都在趕上來。軟件生態也會逐步建立起來,就像製造業的產業鏈。 -太陽從西邊出來- 給 太陽從西邊出來 發送悄悄話 (0 bytes) () 12/31/2024 postreply 08:11:47

用了幾次滴滴,同意 -moneytalks- 給 moneytalks 發送悄悄話 (0 bytes) () 12/31/2024 postreply 10:35:28

要是真的, 對GPU training的需求急劇下降? -遠走他鄉- 給 遠走他鄉 發送悄悄話 (0 bytes) () 12/31/2024 postreply 08:14:58

不一定。因為,會有更多應用。 -TalkToMi- 給 TalkToMi 發送悄悄話 (0 bytes) () 12/31/2024 postreply 08:17:00

Inference這塊我研究過,不管是機器人還是Phone/PC終端, 芯片都是自己研發 -當年情- 給 當年情 發送悄悄話 當年情 的博客首頁 (62 bytes) () 12/31/2024 postreply 08:18:59

是的,Deepseek的模型隻花了5M做training, 用的什麽芯片不清楚 -當年情- 給 當年情 發送悄悄話 當年情 的博客首頁 (0 bytes) () 12/31/2024 postreply 08:17:12

用的是A800,H800. 看它的open source不就知道了? 應該用了特定範圍的training -cnrhm2017- 給 cnrhm2017 發送悄悄話 cnrhm2017 的博客首頁 (0 bytes) () 12/31/2024 postreply 08:21:30

一家大機構說,等“競爭”的說法大量湧現的時候,就是該買入的時候 -coach1960- 給 coach1960 發送悄悄話 coach1960 的博客首頁 (0 bytes) () 12/31/2024 postreply 08:21:49

這個不叫競爭吧?這叫挖牆腳 -當年情- 給 當年情 發送悄悄話 當年情 的博客首頁 (0 bytes) () 12/31/2024 postreply 08:23:36

有人說DEEPSEEK3專門是針對BENCHMARK研發的,就像應付考試一樣,你怎麽看? -dividend_growth- 給 dividend_growth 發送悄悄話 dividend_growth 的博客首頁 (0 bytes) () 12/31/2024 postreply 08:53:43

這個需要後續使用階段用戶反饋來驗證,現在不好說 -當年情- 給 當年情 發送悄悄話 當年情 的博客首頁 (0 bytes) () 12/31/2024 postreply 09:34:53

如果是真的,對NVDA很不利,但有利AVGO和TSM -dividend_growth- 給 dividend_growth 發送悄悄話 dividend_growth 的博客首頁 (24 bytes) () 12/31/2024 postreply 09:21:54

請您先登陸,再發跟帖!