大家都在說deepseek,但是沒說到點子上,尤其在NVDA上

大家討論deepseek的點是什麽?無非就是通過優化算法和參數,用更少的資源達到和現有模型差不多的水平。

 

先不說NVDA。就說deepseek這個事情的意義是啥,其實就是現有模型,即使沒有底層原理的突破,目前也並不是最優的。

 

但是如果從應用上來講,兩條路子,一個是堆砌硬件和能源,一個是優化算法。但是兩者衝突麽?並不是。

 

因為現在還沒有達到scaling law的極限,就說deepseek吧,如果把OPENAI的資源給幻方,deepseek v3是不是能達到比GPT4o更優的表現?如果是,那麽對切硬件就還是有意義的。現在OPENAI肯定內部在想著優化他們算法的事情了。其他大公司也一樣。隻要scaling law還沒有達到極限,之前堆砌的硬件就還有意義,而且會繼續。

 

但是,對於小公司而言,deepseek的意義重大,因為他們搞不到OPENAI或者Tsla的資源,拿不到那麽多GPU,但是deepseek給了希望,這樣,他們也會開始搞自己的專屬模型,或許沒有那麽通用,但是在某一個方麵可以細調微調,從而達到可觀的效果。

 

 

所有跟帖: 

搞大模型沒問題,但一窩蜂的去搞就有問題。應該有個balance,個人覺得方法和算法更需要重視 -FightwtMM- 給 FightwtMM 發送悄悄話 (97 bytes) () 01/02/2025 postreply 08:45:44

為啥巨頭現在必須搞?因為AGI誘惑太大,關鍵這玩意一旦搞成,是贏者通吃,隻有老大,沒有老二。你可以仔細想想。 -bupu- 給 bupu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 08:47:24

靠堆算力和parameter上去,老命傷財,並不看好,AGI在一些領域能達到,但要所有領域,目前看不到 -FightwtMM- 給 FightwtMM 發送悄悄話 (0 bytes) () 01/02/2025 postreply 08:52:06

凡事必須有人做才能慢慢看得到,不去嚐試和試錯,永遠都看不到。但是別人一旦看到了,自己就會落伍甚至被淘汰。 -bupu- 給 bupu 發送悄悄話 (93 bytes) () 01/02/2025 postreply 08:56:30

這事有人總結過:NVDA就是淘金熱的時候賣鏟子的。 -Lisland_2013- 給 Lisland_2013 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:07:03

沒問題,這個說法好多年了。所以,隻要金子沒挖完,鏟子就可以繼續賣錢。 -bupu- 給 bupu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:21:27

NVDA 還不錯。目前各大AI 包括中國都需要它 -island09- 給 island09 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:22:06

deep seek的意義在於, -neillu- 給 neillu 發送悄悄話 (634 bytes) () 01/02/2025 postreply 08:48:19

目前沒有看到證據說scaling law失效了,如果有,希望能提供鏈接,謝謝。 -bupu- 給 bupu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 08:59:06

關於deepseek , 看這個 -island09- 給 island09 發送悄悄話 (345 bytes) () 01/02/2025 postreply 08:51:44

我的一點看法,我花了點時間學習Deepseek的training方法 -當年情- 給 當年情 發送悄悄話 當年情 的博客首頁 (688 bytes) () 01/02/2025 postreply 09:04:15

中國特色 -12qw- 給 12qw 發送悄悄話 12qw 的博客首頁 (0 bytes) () 01/02/2025 postreply 09:11:15

中國特色還沒有上路 -neillu- 給 neillu 發送悄悄話 (882 bytes) () 01/02/2025 postreply 09:25:49

沒問題,但是chatgpt離AGI還差十萬八千裏,deepseek更是,沒有跡象表明scaling law失效了 -bupu- 給 bupu 發送悄悄話 (48 bytes) () 01/02/2025 postreply 09:23:00

完全失效 -neillu- 給 neillu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:39:09

link please -bupu- 給 bupu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:39:55

現在除了斯特曼,整個AI都是這個共識啊,這半年都在議論這個 -neillu- 給 neillu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:43:26

我了解的業界情況並非如此。所以,link please -bupu- 給 bupu 發送悄悄話 (0 bytes) () 01/02/2025 postreply 09:48:04

請您先登陸,再發跟帖!