評論:DeepSeek重創矽穀!川普:是美國AI的一記當頭棒喝

wanghbhb 發表評論於 2025-01-28 19:53:15

當年前蘇聯同樣也在航天和軍事不少領域裏領先美國。這也不奇怪。美國不可能在所有領域都一直領先。不過兩國政治和意識形態的差異決定了最後肯定是美國會繼續領先。

reno2389 發表評論於 2025-01-28 13:07:37

“不過，川普認為這一進展對美國AI是一件好事，因為隨著中國找到更具成本效益的方法，就有助於美國降低開發成本，並實現相同結果。”

-----------------
根本就不可能！美國的“資本主義”根本就打不過中國的“社會主義”！
美國IT公司的員工拿著高額工資，卻work at home。中國的IT公司的員工拿著相對著很低的工資，卻996。

中國員工的效率是美國員工效率的20倍以上，美國怎麽和中國競爭？

theriver1 發表評論於 2025-01-28 12:00:19

在河邊發表評論於 2025-01-28 11:35:04
2的8次方是256，2的16次方是65536；F16的浮點位數比F8的浮點位數多了256倍，而不是多了1倍。
-------------
非常感謝您的超詳細解釋。本人獲益匪淺。我這裏所說的DS的FP8比chatgpt的FP16少了一半的計算量，不是說少了一半的數據。因為FP8的計算吞吐相比FP16提升了兩倍，所以FP8低精度訓練能比F16快兩倍，節省50%-75%的內存占用，以及節省50%-75%的數據通信量，從而有助於模型的優化和壓縮，進一步降低部署成本。

在河邊 發表評論於 2025-01-28 11:35:04

@theriver1 發表評論於 2025-01-28 09:44:09各種優化算法都有自己的優缺點，不同的公司采取不同的優化思路，說白了就是在性能、價格和結果上達到“符合本公司目標”的平衡。比如Deepseek-R1不同於ChatGPT的架構-FP8混合精度訓練框架，這裏的FP8就是二進製裏8個比特位，位數越多代表精度越高，ChatGPT是32位和16位，Deepseek-R1是8位，這就比ChatGPT少了一半的計算量和內存
----------
2的8次方是256，2的16次方是65536；F16的浮點位數比F8的浮點位數多了256倍，而不是多了1倍。
用F8並不一定數據精度會比F16低256倍，要看數據要求的精度設定以及數據運算模式（多個F8的並連運行也可以）。
例如一個距離為1公裏的距離數據，如果數據精度要求為0.01毫米，那麽用F8或者F16無區別；如果是1萬公裏，精度仍然要求0.01毫米，恐怕一個F8就無法運行（位數不夠 1萬公裏/0.01毫米），但是可以把1萬公裏拆分為數段進行運行；F16可以單個運行。
很多情況並不需要F16能力，也沒必要把數據精度搞的很高。

拾象創始人兼CEO李廣密，組織了一場關於 DeepSeek的專家閉門討論會，公開了86點要點，大體是：DeepSeek最重要的事是push智能；拆分後並聯運行，並放棄多模態，提高適用範圍與速度；第一個把複現 MoE、o1 等發出來，勝在做的早；AI 類似階躍函數，現在做追趕者的算力需求少了 10 倍，在探索方向的時候，花 1 萬張卡的效果不一定比 1 千張卡好，但可能會有一個門檻；DeepSeek 帶來的最大的震撼不是開源或者低成本，而是不需要做 SFT了；DeepSeek 在數據標注上的投入是模型效率好的關鍵之一；在蒸餾和技術路線上，R1 帶來的震撼不如 AlphaGo，但在商業上，出圈能力比 AlphaGo 要好很多；R1 和 V3 帶來的低成本、高效果，說明這是一個方向，和另一個擴硬件、漲參數的方向是不衝突的，國內是受到限製隻能走前者；開發者是否會從閉源模型遷移至 DeepSeek？目前看還沒出現大批遷移，因為領先模型的 coding 指令遵循能力是比較有利的，但不確定這一優勢在未來是否會被攻克；DeepSeek 的出現讓大家開始質疑英偉達（NVIDIA）和 OpenAI 最新的 500B 敘事。訓練資源問題目前還沒有清晰判斷，OpenAI 的 500B 敘事是給自己加救命稻草；DeepSeek 短期對美國 AI 圈衝擊大，短期上對股價有影響：pretrain 需求增速放緩，post-train 和 inference scaling 還沒有足夠快地 scale up，在相關公司的敘事上會有一個 gap；如果能力差不多，對閉源是挑戰；無限長度的 reasoning 可能是一個願景。

levinzx 發表評論於 2025-01-28 11:06:00

都說是美國的威脅，但最瑟瑟發抖的不應該是國內其他搞人工智能的公司嗎？

ajaychen_2024 發表評論於 2025-01-28 10:45:20

華為雲MaaS已適配昇騰版DeepSeek大模型上線。另外，DeepSeek的大模型也適配MATE60手機。DS將發展出基於華為自研的GPU的大模型

矽穀工匠 發表評論於 2025-01-28 10:25:19

在河邊

我的理解是synthetic data就是一個人造的假數據庫，還可以摻人造噪音。查下synthetic data 就好。這就是說建模型用的就是人造數據。人造數據可以很大很幹淨。

拾麥客 發表評論於 2025-01-28 10:20:25

華為之前不是牛逼哄哄出新手機？後來呢？這種把戲瞞老外還行

ajaychen_2024 發表評論於 2025-01-28 10:19:07

Deepseek的出現雖然不能算是AI界的從零到一的創新性突破，也時從一到一百之間的重大飛躍，它在原有的基礎上找到了一個最優化的方案，省錢省時高效，而美國那些大廠和一眾矽穀精英們隻會一味堆算力和大量砸錢，如果沒有DS的出現，人們還會一直以為AI發展隻能是這種模式呢。另外DS的開放性，本地化，能讓高高在上的ai大眾化，平民化，不再令人高攀不起。這個由DS訓練出來的小模型，讓很多第三世界國家也可以有一個十分有效有便宜的實用工具，而不是動輒幾億的被美國壟斷的AI大模型。說它是一場賽博共產主義活動也不為過。

滅獨者發表評論於 2025-01-28 06:24:33在浙江海清，我們去過幾家做LV、愛馬仕等仿冒包包的公司展覽門市部，通過關係，買一個A貨的LV隻買300元人民幣，成本也隻有100元左右，買一個A貨的愛馬仕隻要600元人民幣，成本也就200元左右。所謂A貨，就是仿造的很像真的。還要所謂B貨。更便宜。所謂DeepSeek,也隻是仿chatGPT和OPAI而已。中共有本身，自己搞出一個新的原創的發明，仿造出別人的東西，還說比別人的先進，更省錢，真是可恥至極。就像互聯網是美國發明的，結果中共每年還召開世界互聯網大會，真的很滑稽，更可笑的是中共的互聯網與世界更不就不互連。

在河邊 發表評論於 2025-01-28 09:52:36

@矽穀工匠發表評論於 2025-01-28 09:04:04
My friend, they don't need ChatGPT database. All they need is to ask ChatGPT questions and record the answers.
-----------
你不理解什麽是AI模型與訓練及數據庫關係，根本不是問題與答案的機械聯結。無真正的錯綜複雜的數據庫源數據（包括幹擾數據），AI模型不可能被驗證。靠CHATGPT的問題與答案數據是不可能產生源數據庫的，產生的也不是實際數據庫，誤差率也十分巨大。

灣區範兒 發表評論於 2025-01-28 09:50:37

別忘了中國十多年前還研製成了最先進的漢芯芯片呢。

theriver1 發表評論於 2025-01-28 09:44:09

各種優化算法都有自己的優缺點，不同的公司采取不同的優化思路，說白了就是在性能、價格和結果上達到“符合本公司目標”的平衡。比如Deepseek-R1不同於ChatGPT的架構-FP8混合精度訓練框架，這裏的FP8就是二進製裏8個比特位，位數越多代表精度越高，ChatGPT是32位和16位，Deepseek-R1是8位，這就比ChatGPT少了一半的計算量和內存，由此帶來的精度誤差用“混合精度”來彌補（對於精度要求高的數據，先用類似四舍五入的方法快速計算，再每128個數的結果交給32位的會計程序精算），最終大大壓縮了計算量，但是精度肯定遠遠不如ChatGPT。這種方法就是DS在平衡了性價比和結果後選擇的偏向性價比的優化思路。

鍾安山 發表評論於 2025-01-28 09:25:20

deepseek隻是中美競爭的開始，未來關鍵是人才。中國的年輕工程師數字龐大，80，90後年輕人對西方對美國無感，不再向往。美國政策也很奇葩，禁止中國理工科學生到美國留學。美國付國務卿已經公開宣布不歡迎中國學生到美國學習理工科，隻學文科。可以想象10，20以後，美國隻能靠印度人撐著，印度人擅長PPT，搞科研還是中國人強。想想10以後，結論早已有了。

worley 發表評論於 2025-01-28 09:16:37

@在河邊
機器學習分為有答案學習，無答案學習。
其中有答案學習是最簡單的。就相當於你有一個教授，總能回答你的問題。
無答案學習，就是沒有教授，自己尋找答案，是最難的。

Deepseek就是把chatgpt當成教授，免費的。

（術語是：監督學習，無監督學習）

在河邊 發表評論於 2025-01-28 09:11:34

你講的路數下，DEEPSEEK恐怕花的訓練費用比CHATGPT要高許多倍。僅僅靠結果反推數據庫的工作就是海量工作，比自己建立要困難與費用高許多。
明顯的是DEEPSEEK模型是種技術進步與開創了新思路，為何以政治色彩來評價？

矽穀工匠 發表評論於 2025-01-28 09:04:04

"chatgpt數據庫什麽時候公開了?公開的數據庫在哪裏?
openai公司早期產品是模型開源的,但是數據庫一直是私有的,並未公開."

My friend, they don't need ChatGPT database. All they need is to ask ChatGPT questions and record the answers.

矽穀工匠 發表評論於 2025-01-28 09:02:35

"DS隻不過是個Distill流程而已。我對軟件一竅不通，但卻對3D建模感興趣。"

No my friend, Deep Seek has built an even bigger earth than yours, from their distilled model. They built a synthetic model already, they don't need ChatGPT model anymore.

My model is more fake then yours. That is the point of DS to Open AI.

worley 發表評論於 2025-01-28 08:59:55

@在河邊
就是直接使用chatgpt的答案，進行機器學習。假設chatgpt就是專家或老師，提取知識，所以deepseek很多問題的答案跟chatgpt一模一樣。

藍天大地 發表評論於 2025-01-28 08:43:47

DS隻不過是個Distill流程而已。我對軟件一竅不通，但卻對3D建模感興趣。

最近在做一個地球模型玩，於是我花了很大的時間和資源（create a mesh，UV mapping，material，shading，geometry modification，etc.）把這個地球做出來了。

但我的牌友跟我說，這個地球上的澳洲地區森林覆蓋麵不夠廣，要再加點綠色。他就把我的模型拿過去，用shading nodes加了點綠色，使我的這個地球更漂亮些了。這個地球就是ChatGpt，這個朋友做的就是DS。

但是，如果我不把這個地球模型給他，他就不能讓這個地球更漂亮。所以，DS根本不算什麽。

所以說，DS對NVDIA的芯片根本沒有影響，華爾街那幫人不懂技術，過一陣子NVIDIA的股票就會漲回來。因為，pre-training & post-training，任然需要很多的芯片。

更進一步說，類似DS的東西有可能反而會更加推進對NVIDIA芯片的需求。DS最大的貢獻在於細分化（segmentation），這就給跟多專業的細分化公司提供了機會。它們單個公司所需要的芯片也許不多，但是如果有很多各類做細分化為專長的公司出現，那麽累計起來對NVIDIA芯片的需求還是會越來越大。

所以，我繼續看好NVIDIA，ChatGpt這類公司的前途！

毛毛們可以閉嘴了。哈哈哈哈哈哈。

在河邊 發表評論於 2025-01-28 08:42:22

chatgpt數據庫什麽時候公開了?公開的數據庫在哪裏?
openai公司早期產品是模型開源的,但是數據庫一直是私有的,並未公開.

矽穀工匠 發表評論於 2025-01-28 08:30:31

"相當於曆史上納粹德國搶先實驗成功核彈？英美這次要玩兒完了？"

It's like Mao's team invented synthetic Heroin in YanAn and disrupted Britain's monopoly on Heroin trade.

worley 發表評論於 2025-01-28 08:28:45

DeepSeek使用的是ChatGPT高質量的數據，所以它的模型並不通用。
因為並不能保證總能免費獲取高質量數據。

ChatGPT o1的那些物理、化學、數學、計算機競賽的數據和答案，是花了很多數據工程師整理的，一些是付費購買的，一些是雇傭專業人士幫助生成的，然後用於機器學習。而DeepSeek可以不花錢就使用。
但是OpenAI也不是傻瓜，肯定會限製住盜取數據。

theriver1 發表評論於 2025-01-28 08:26:25

昨晚仔細研究了一下DeepSeek-R1,終於冷靜下來了。現在基本上傾向於DeepSeek是AI拚多多的說法。因為DeepSeek算法根本就沒有什麽自己的革命性的創新！它隻不過是集成了以下一係列美國人發明（都是美國公司公開發表的論文和技術）的成熟或不太成熟的優化算法的架構模型和創新，最終達到靠壓縮整體工作量和壓榨每個任務（不讓任務閑下來）的路徑來最大限度地降低算力資源的成本：
1.MLA多層注意力架構
2.FP8混合精度訓練框架
3.DualPipe跨節點通信
4.無輔助損失的負載均衡策略
5.跨節點全對全通信內核
6.MTP技術
7.數據精篩
8.DeepSeek-R1蒸餾
其中最重要的是前兩個架構，它們都是為了壓縮工作量的，也是其與ChatGpt等美國公司大模型的最主要區別。

在河邊 發表評論於 2025-01-28 08:17:46

DEEPSEEK的8個模型進行了MIT授權開源,並且在論文裏比較詳細的公布了細節參數及過程.
今後各個小開發者可以得到授權下在平台下進行各類應用開發並推廣,今後DEEPSEEK的經濟利益也是有很大前景的.
所以deepseek對chatgpt形成了巨大衝擊,閉源與長信息鏈產品可能是路線錯了.
當然即使deepseek成功,也是會更進一步促進硬件的更多采用,隻是采用模式會改變.

Ela 發表評論於 2025-01-28 08:04:59

FaceBook 真不該公開server源代碼。

duffer 發表評論於 2025-01-28 07:52:25

DeepSeek 看來隻是一個小浪花，有利於AI 的競爭發展，目前就是這樣。

時不時來看看 發表評論於 2025-01-28 07:36:34

“美國擁有世界上最傑出的科學家，創新能力無可匹敵”

川總能意識到人才的關鍵性作用，是難能可貴的，一定要留住人才，收回用於美化中共的16億傻錢，可以留住100位高級AI人才工作10年，太劃算了

16億傻錢讓一些傻人說傻話謊話，一點都不劃算

矽穀工匠 發表評論於 2025-01-28 07:32:53

“人家DS都開原了”

DeepSeek隻是代碼給你看看。海量數據和幾萬億的parameter不開源，就想給你一個特斯拉的圖紙讓你去造車，就是要你上鉤而已。類似賣毒品的讓你“先嚐後買”。

矽穀工匠 發表評論於 2025-01-28 07:30:18

“以後OpenAI肯定會防止直接提取它們的數據（蒸餾）作為訓練，那麽就deepseek隻能去提取那些開源模型的數據。

最終很可能沒有開源項目願意花幾十億美元去整理數據了，因為會被deepseek直接免費提取。”

是的。這些數據本來就是各種街頭小報比如紐約時報采集的垃圾，現在是精煉的垃圾。但是，大家都是有政治傾向的建模型，所以都是可疑。
說實話，全互聯網scrape隻要一次也就夠了，沒必要每一個小公司都去取一次。中國公司很聰明，一個犯罪團夥搶了另一個團夥的地盤，俗話叫“砸場子”。

朝露青 發表評論於 2025-01-28 07:30:00

相當於曆史上納粹德國搶先實驗成功核彈？英美這次要玩兒完了？

haoyahaoya 發表評論於 2025-01-28 07:26:08

滅獨者發表評論於 2025-01-28 06:24:33
更便宜。所謂DeepSeek,也隻是仿chatGPT和OPAI而已。中共有本身，自己搞出一個新的原創的發明，仿造出別人的東西，還說比別人的先進，更省錢，真是可恥至極。就像互聯網是美國發明的，結果中共每年還召開世界互聯網大會，真的很滑稽，更可笑的是中共的互聯網與世界更不就不互連。

&&&&&&&&&&&&&&&&
看把您氣的，人家DS都開原了，任何人都可以去查看呀，誰模仿誰一看便知。而且人家歡迎其他人模仿。

worley 發表評論於 2025-01-28 07:08:22

以後OpenAI肯定會防止直接提取它們的數據（蒸餾）作為訓練，那麽就deepseek隻能去提取那些開源模型的數據。

最終很可能沒有開源項目願意花幾十億美元去整理數據了，因為會被deepseek直接免費提取。

TXZS 發表評論於 2025-01-28 06:55:18

懂王難得的清醒和理智，沒有胡說八道，讚一個

矽穀工匠 發表評論於 2025-01-28 06:45:19

類似星球大戰Luke一發炸彈幹掉了死星。
類似中國把精煉人造毒品運進了美國，還順便幹掉了本土黑幫。

黑幫今天好慌。商業計劃都要改寫了。

正人偽君子 發表評論於 2025-01-28 06:28:00

很高興AI被打回原型。現在都在搞大數據，學生們不學習基本理論，專研新理論新方法，就用machine learning，理論數據，就是一個博士論文。個人覺得機器能做很多事情，但永遠不能取代人的創造思維。

DANIU_S 發表評論於 2025-01-28 06:26:00

美國 AI 界企圖伸手向政府要大錢發展高緯度 AI，政府現在可以告知他們了：不需要那麽多錢，美國政府赤字已經太高！打仗就買中國的便宜大疆機器人，高科技就雇傭中國人，這樣就貌似被中國人控製了嗎？否也，美國控製的是美元，這是最厲害的武器！

滅獨者 發表評論於 2025-01-28 06:24:33

在浙江海清，我們去過幾家做LV、愛馬仕等仿冒包包的公司展覽門市部，通過關係，買一個A貨的LV隻買300元人民幣，成本也隻有100元左右，買一個A貨的愛馬仕隻要600元人民幣，成本也就200元左右。所謂A貨，就是仿造的很像真的。還要所謂B貨。更便宜。所謂DeepSeek,也隻是仿chatGPT和OPAI而已。中共有本身，自己搞出一個新的原創的發明，仿造出別人的東西，還說比別人的先進，更省錢，真是可恥至極。就像互聯網是美國發明的，結果中共每年還召開世界互聯網大會，真的很滑稽，更可笑的是中共的互聯網與世界更不就不互連。

相信事實 發表評論於 2025-01-28 06:11:39

DeepSeek的成功不過是一顆小小的縫衣針戳破了美國高科技的泡沫而已。美國的科技泡沫為什麽能夠這麽大？因為美國號稱研發AI需要投入幾十億幾百億，所以科技股就是所謂的高投入高回報，於是股價升上了天。

DeepSeek研發居然隻有區區幾百萬，而運算性能則是美國的幾十倍，這種超高性價比的東西並不是說它有多先進，而是說同樣的東西並不是美國吹噓的價錢，而是白菜價！

有了一個白菜價的比較，立刻就把美國科技的泡泡戳破了，以後美國還有誰投資幾百億去研發實際價值隻有幾百萬的東西？

矽穀工匠 發表評論於 2025-01-28 06:08:24

美國皇帝是猶太人，在FED垂簾聽政那位。猶太要世界大同，世界同看一個中央台（CNN），同用一個貨幣（數字美元），同用一個血汗工廠。猶太人在乎的不是什麽世界首富，而是印鈔權。隻要我能合法印錢，我怕誰？什麽民主法製都是猶太人的遮羞布和障眼法。這個猶太AI也是一個步驟。如果AI成功了，全世界的孩子都不需要再獨立思考，每天吃睡打遊戲就好。

wjhwsh 發表評論於 2025-01-28 06:07:45

中國內部培養的人才應對AI算法沒有問題，沒有海外學習工作背景也不是問題。中國奧數金牌獲得者都是沒出過過的。AI這個東西有個好的數學腦袋最重要，中國從來不缺

矽穀工匠 發表評論於 2025-01-28 06:05:05

deepseek的核心新算法如下。他自己的模型是基於openai的回答的基礎上。也就是說，他的模型用的就是“精料”。但是，deepseek省錢在於他用自己的精煉模型去量產synthetic data。也就是說，deepseek訓練用的是人造數據。懂了？

但是，昨天華爾街狂跌，是因為大家都知道，AI就是一個騙子。中國的AI以後是騙子，猶太人的AI以後是民主黨的。大家都知道，“AI”的狂熱可以說完了，大家都冷靜下。

嘮叨嘮叨嘮叨 發表評論於 2025-01-28 06:04:53

公平競爭才有益於發展。大牆國用人民幣管製，出口強製換匯，政府補貼，非關稅壁壘，低工資低福利這些手段把自己想發展的產業虹吸過去，大搞逐底競爭。要大家都來參與這種苦逼競爭是把世界帶回到二戰前的危險中去，必須反製。
大牆國的企業要想參與美國市場就到美國來投資生產，做不到就自己在牆內卷，別的地方卷，別來禍害美國。

ajaychen_2024 發表評論於 2025-01-27 23:41:07 競爭有得於發展，應該鬆綁比亞迪和華為，大家一起作生意才是正道。

矽穀工匠 發表評論於 2025-01-28 06:01:19

我最高興的是，中國把TEMU白菜價，一下砸給猶太騙子Altman！這個猶太騙子的視頻我看了不少，身邊的印度人都很“牛逼”。我不喜歡中共，可是我喜歡中國人砸猶太人！

altman的目的就是圈錢圈地，然後用所謂AGI的大餅去幹宣傳部夢想的齷齪事情。中國是另一個流氓團夥，我很喜歡看他們火並。

Yummy2000 發表評論於 2025-01-28 05:41:27

美國可以鬆綁比亞迪和華人，前提是：取消對比亞迪和華為的一切政府補貼，去除華為的政府和軍方背景，然後在一個平台上公平競爭。

Tesla 秒殺比亞迪。比亞迪沒有任何優勢。

=========================================================
ajaychen_2024 發表評論於 2025-01-27 23:41:07競爭有得於發展，應該鬆綁比亞迪和華為，大家一起作生意才是正道

Yummy2000 發表評論於 2025-01-28 05:38:15

算力這麽牛叉的公司，這個也搞不定？
============================================
airbus 發表評論於 2025-01-28 01:06:42這幾天我都在爭取Deepseek注冊，60秒鍾有效的驗證碼，24小時才到。

偶偶地來一發 發表評論於 2025-01-28 05:36:33

資本還沒賺夠就被打成白菜價了。

正人偽君子 發表評論於 2025-01-28 04:42:00

既然開源，有什麽新算法？主要是後麵的數據支撐。計算速度和存儲應該都不是問題。不知道有什麽好恐慌的。

花和尚團 發表評論於 2025-01-28 04:33:00

恨中人士心在滴血????

花和尚團 發表評論於 2025-01-28 04:33:00

恨中人士心在滴血????

ypb001 發表評論於 2025-01-28 03:07:19

矽穀的一群騙子,綁架了整個美國股市,原來AI隻值600萬美元,等著崩盤吧

評論: DeepSeek重創矽穀!川普:是美國AI的一記當頭棒喝