評論:Deepseek成本降低98％？“開發成本必然謊報”

luting 發表評論於 2025-01-28 17:29:55

灣區範兒發表評論於 2025-01-28 09:53:41別忘了中國十多年前還研製成了最先進的漢芯芯片呢，結果呢？

##############################################
漢芯敢於開源給國際檢視嗎？

aguafresh 發表評論於 2025-01-28 17:08:00

一個外行比美國的科技大公司、眾多投資機構都懂AI？DeepSeek開源了，還有其他機構去下載嚐試驗證，才引起這麽大的震動。

灣區範兒 發表評論於 2025-01-28 09:53:41

別忘了中國十多年前還研製成了最先進的漢芯芯片呢，結果呢？

luting 發表評論於 2025-01-28 08:49:31

你管它用了啥？看看模型大小就可以估算出算力的需求，記住，即使我的手機也可以做最頂尖NIVIDIA GPU的活，也就是慢個上百到上千倍而已。一旦算力確定，根據公司公布的NVIDIA 卡的型號，簡單的小學數學就可以估計出需要的時間和成本。個人感覺，如果這個公司有NVIDIA最新的卡，估計成本還能降半，從這點而言，科技禁運還是有用。

不過這個公司太耀眼了，估計又是將來美國針對的對象，NVIDA卡是估計沒有了。聰明點，趕緊往國產芯片上搬吧。

西岸-影 發表評論於 2025-01-28 07:59:42

再說她不過就是一個網紅，也不是專業人員，台灣竟然把這種人的觀點當回事，也是奇葩了。

西岸-影 發表評論於 2025-01-28 07:58:04

這些是並不難驗證的，她大概是不知道DeepSeek公布了算法，理論上任何人可以複製。
那麽隻需要複製就知道了。而且這東西引起這麽大的股市震蕩，不是僅靠謠傳就會這樣的，英偉達僅僅一天就損失了幾乎六千億美元，美國整個損失一萬億。
大概率是因為驗證了可行。

cacu 發表評論於 2025-01-28 06:28:00

Who is hu

xiaoxiao雨 發表評論於 2025-01-28 05:59:12

i think it is a strategy to push US to open the sales of more advanced AI chips.

時不時來看看 發表評論於 2025-01-28 03:48:44

theriver1: 我發帖招您啦？那麽多鋪天蓋地的媒體認為是真的，為啥不給他們貼標簽呢？您發帖我從來不感興趣。“必然”放在題目，您看不懂？

荒野獵人 發表評論於 2025-01-28 01:22:00

DeepSeek利用較少且不夠先進的芯片訓練出了媲美ChatGPT的模型。DeepSeek在一份技術報告中稱，它使用超過2000個英偉達H800芯片集群來訓練其參數為6710億的V3模型，而Meta訓練參數量4050億的Llama 3，用了16384塊更強的H100顯卡，花了54天。Deepseek的訓練效率為Meta的11倍。DeepSeek表示，訓練其最新模型之一的成本為560萬美元（約合人民幣4100萬元）。相比之下，人工智能開發商Anthropic的首席執行官達裏奧·阿莫迪 (Dario Amodei )去年提到的建立一個模型的成本為1億至10億美元。CNBC曾發文稱：“DeepSeek-R1因其性能超越美國頂尖同類模型，且成本更低，算力消耗更少，引發了矽穀的恐慌。”但王話鋒一轉，談到了中國人工智能企業可能為人工智能模型配備的GPU數量。他稱，“中國的實驗室擁有的H100芯片比人們想象的要多得多。”他補充道， “據我了解，DeepSeek擁有大約五萬塊H100芯片。”王認為，因為違反了美國實施的出口管製，所以DeepSeek不能談論這些。英偉達的Hopper架構GPU如H100和H200，因其優秀的算力，出口受到美國政府的管製。拜登政府於2022年通過一項規定禁止英偉達向中國出售性能遠超其舊款GPU A100 的GPU係列，迫使英偉達開發了名為H800和A800的性能削減版芯片用以替代，但一年後的2023年10月，這兩款芯片也一並被禁止。目前，英偉達已在推廣其最新一代Blackwell架構的GPU，其出口依然受到限製。王將中美之間的人工智能競賽描述為一場“AI戰爭”，並補充道，“美國將需要大量的計算能力和基礎設施，我們需要釋放美國的能量以推動這場AI繁榮。”

荒野獵人 發表評論於 2025-01-28 01:21:00

截至我的知識更新日期（2024年7月），我無法提供關於DeepSeek使用的具體芯片信息。如果你需要了解DeepSeek的技術細節或硬件配置，建議訪問其官方網站或聯係其技術支持團隊以獲取最新信息。你可以訪問 [***deepseek***](***deepseek***) 了解更多。

whaled 發表評論於 2025-01-27 21:22:39

哪那麽多廢話，有本事就all in買女大

大豬頭- 發表評論於 2025-01-27 21:00:52

雖說我不能理解為啥本論壇專家不能自己去github看公開文檔, 不過文學城群眾在自由民主思想指導下的意淫還是值得大家學習的,

至於驗證部份,我想咱爹家那些大公司比文學城專家更急於證明DeepSeek是造假, 如果有問題, 你過幾天也可以看到了. 如果沒問題, 抄作業也會立馬進行. 不知道這裏的專家在自己沒能力驗證的前提下,有啥好唧唧歪歪的

C*fusion 發表評論於 2025-01-27 20:55:57

The decision to make DeepSeek's AI model open-source is intriguing, especially given the strategic importance of AI technology. Why did the Chinese government allow DeepSeek to disclose their AI models? It doesn't quite add up. I suspect there might be something fishy.

我是bruce 發表評論於 2025-01-27 20:47:03

這女挺漂亮，是個真正的美女

秋林小屋 發表評論於 2025-01-27 20:41:13

我也不太相信這個開發成本是真實的。

theriver 發表評論於 2025-01-27 20:34:59

大豬頭- 發表評論於 2025-01-27 20:26:37
英文就是真的啦? 人家隻是轉述DS的解釋而已。DS當然要這麽說，如果說是注冊用戶太多，不就暴露了自己的大規模並行服務的能力不足了嗎？真正的網攻會隻攻擊注冊係統嗎？

theriver1 發表評論於 2025-01-27 20:27:32

京城老炮1950 發表評論於 2025-01-27 19:37:54
這家公司真的沒有使用任何一款英偉達的GPU就能把成本降低98%？如果是真的，那絕對是人類奇跡！
-----------
它要不用英偉達的GPU，我跟你姓！

大豬頭- 發表評論於 2025-01-27 20:26:37

你的網名配得上你的智商。收到攻擊，停止服務的會僅僅是注冊嗎？
===========
這位智者英文不太好?******cnbc***/2025/01/27/deepseek-hit-with-large-scale-cyberattack-says-its-limiting-registrations.html
From CNBC: DeepSeek on Monday said it would temporarily limit user registrations “due to large-scale malicious attacks” on its services, though existing users will be able to log in as usual.

大豬頭- 發表評論於 2025-01-27 20:23:50

文學城那些很懂的專家們難道真沒看過公開文檔, 還是沒看懂就自己意淫? 在幾個關鍵點上, 人家寫得明明白白, 有能力的公司, 自己去認證一下就可以.

不過剛看了“Emmy追劇時間"頻道,這貨也能是AI專家?文學城群眾對專家的理解再一此讓人歎為觀止.

李新發表評論於 2025-01-27 20:23:00

綠蛙酸了。

theriver1 發表評論於 2025-01-27 20:21:14

大豬頭- 發表評論於 2025-01-27 20:10:06
不是說受到了攻擊, 所以影響服務的嘛, 至少是咱爹的CNBC說的? 難道是文學城群眾動用了神秘的民主自由的能量把DeepSeek打癱瘓了?
----------
你的網名配得上你的智商。收到攻擊，停止服務的會僅僅是注冊嗎？

theriver1 發表評論於 2025-01-27 20:17:37

白雲藍天發表評論於 2025-01-27 20:06:06
問題是應該給出解釋，絕不能說已經正在給用戶提供服務，而事實上在睡大覺。不應該沒有給用戶解決任何一個問題之前，先給了用戶造成很大困惑。
------------
我在很多服務器在國內的App上注冊都遇到和你類似的問題，比如知乎和豆瓣。我都懷疑它們和DS用的都是同一個限製注冊的防火牆。也許這就中國大陸IT企業的一種文化，它們暫時關閉注冊但不敢告訴新用戶，怕把用戶永久性氣跑，隻敢偷偷搞小動作。另外如果公開告訴新用戶停止注冊，在國際上會很沒麵子，間接說明他們的係統不夠穩定，無法無縫實現海量並行服務。

大豬頭- 發表評論於 2025-01-27 20:10:06

不是說受到了攻擊, 所以影響服務的嘛, 至少是咱爹的CNBC說的? 難道是文學城群眾動用了神秘的民主自由的能量把DeepSeek打癱瘓了?

白雲藍天 發表評論於 2025-01-27 20:06:06

theriver1 發表評論於 2025-01-27 19:57:57
樓下，我是在新聞裏看到說DS因為太火而加入防火牆限製注冊的，我估計DS因為害怕影響性能（畢竟它還是一家小公司，而且服務器很可能在國內），如果象Tiktok那樣一開始每月注冊10億，很可能係統會崩潰。
------------------------
問題是應該給出解釋，絕不能說已經正在給用戶提供服務，而事實上在睡大覺。不應該沒有給用戶解決任何一個問題之前，先給了用戶造成很大困惑。

ajaychen_2024 發表評論於 2025-01-27 20:03:10

就算成本再增長十倍，也就是五六千萬美元，也比open Ai等模型的少很多。

過往的西 發表評論於 2025-01-27 20:02:55

人家是開源模型，自己裝一個訓練訓練不就知道了，meta已經在做了，什麽無法驗證，你是可以驗證的

白雲藍天 發表評論於 2025-01-27 20:01:50

象國內一些在國際上很火的純商業軟件 Temu（拚多多）、Trip***（攜程）就非常好用，想必 Tiktok 也是如此，比同類的軟件都方便實用，更不會存在注冊方麵的問題。

theriver1 發表評論於 2025-01-27 19:57:57

樓下，我是在新聞裏看到說DS因為太火而加入防火牆限製注冊的，我估計DS因為害怕影響性能（畢竟它還是一家小公司，而且服務器很可能在國內），如果象Tiktok那樣一開始每月注冊10億，很可能係統會崩潰。

時不時來看看 發表評論於 2025-01-27 19:51:35

DS和openai的出現，基本宣告自由時報之類的造謠媒體將無謠可造，馬大人手下留情，16億別全沒收

白雲藍天 發表評論於 2025-01-27 19:49:17

theriver1 發表評論於 2025-01-27 19:43:41
樓下，這就是國內令人無比生厭的防火牆。它故意不告訴你現在停止注冊，而是讓你一次次做無用功。
-----------------------
高級人工智能軟件應該告訴用戶是怎麽一回事，而不是造成用戶的困惑。連這個都做不到，不是在用最簡單的事實砸自己的牌子？

時不時來看看 發表評論於 2025-01-27 19:48:51

自由時報還是多報點中共高鐵沒人坐，綠皮車擠破，和三哥家的一樣買掛票，那樣流量大不少，傻錢可以多拿點

DS的代碼自由時報的編輯再學50年，到上帝那裏繼續學，估計也難搞明白

時不時來看看 發表評論於 2025-01-27 19:46:09

各大媒體鋪天蓋地，各大自媒體蓋地鋪天，花街先跌為敬，就數Wenxuecity最牛 -- 假的！

白雲藍天 發表評論於 2025-01-27 19:45:38

再說，最簡單的注冊手續太火，就搞不定了，那麽世界性的大規模使用是怎樣搞定的？

theriver1 發表評論於 2025-01-27 19:43:41

樓下，這就是國內令人無比生厭的防火牆。它故意不告訴你現在停止注冊，而是讓你一次次做無用功。

白雲藍天 發表評論於 2025-01-27 19:41:36

白雲藍天發表評論於 2025-01-27 18:51:45
非常懷疑其性能，用兩個電子郵件注冊，發給我多次驗證碼，隻有一個驗證碼在很久以後收到，已經失效。這種人工智能連注冊都搞不定，有可能強大嗎？
---------------
theriver1 發表評論於 2025-01-27 19:28:44
這個倒是冤枉DS了，他們因為這兩天注冊太火了，所以給加了限製注冊的防火牆。
----------------------
但是除了很多時候說太忙，稍後再試，其他時候都說驗證碼已發出，並給60秒時間，但事實上發了很多次驗證碼，隻有收到過一次，而且是隔了很久才收到，早已失效。作為一個高級人工智能軟件，這種錯誤也敢犯？！

theriver1 發表評論於 2025-01-27 19:39:56

bsmile 發表評論於 2025-01-27 19:21:59
訓練成本和開發不一樣，開發是程序，訓練主要是數據，容器和水的關係。訓練成本和使用的計算資源，做標注的人工費用等等相關，根據報道出來的使用gpu等等的數目和中國人工人本實質上可忽略可以看出，600萬美元是可信的。
---------------
對啊，正因為AI訓練主要依賴於訓練算法和算力資源，所以理論上訓練的成本隻取決於算力資源，所以理論上DS不可能僅以50分之一的算力資源實現類似能力的大模型。因為幾乎所有AI專家都認為新算法對訓練效率的提升不可能達到50倍，對推理效率的提升更不可能超過50倍。

京城老炮1950 發表評論於 2025-01-27 19:37:54

這家公司真的沒有使用任何一款英偉達的GPU就能把成本降低98%？如果是真的，那絕對是人類奇跡！

theriver1 發表評論於 2025-01-27 19:28:44

白雲藍天發表評論於 2025-01-27 18:51:45
非常懷疑其性能，用兩個電子郵件注冊，發給我多次驗證碼，隻有一個驗證碼在很久以後收到，已經失效。這種人工智能連注冊都搞不定，有可能強大嗎？
---------------
這個倒是冤枉DS了，他們因為這兩天注冊太火了，所以給加了限製注冊的防火牆。

時不時來看看 發表評論於 2025-01-27 19:24:09

自由時報一定不能信，不然拜總的16億傻錢直接被馬大人沒收，不信估計也逃不過馬大人的大刀，馬大人哢嚓那天，就是鬼哭狼嚎的那天

Meta一定不能信，不然20個高管都得跳槽到自由時報領傻錢，但是機器人老板Z信了就完了

OpenAI更不能信，不然隻能收日元

黃博士不能信，居然一夜之間跌個18趴，這些賣空的都是傻子，難道不抄底的也是傻子嗎？

ajaychen_2024 發表評論於 2025-01-27 19:22:46

對這些殖人，回答就是“是是是，對對對，你說得都對，都是假的，都不存在，你高興就好了”，反正AI股票崩盤又不關我事。到時美國爹不高興懷疑你們在誤導為中共打掩護放煙幕彈，抓你們祭旗也不關我們事。

bsmile 發表評論於 2025-01-27 19:21:59

theriver1 發表評論於 2025-01-27 19:19:04
我支持這位作者的觀點，今天早上我在城裏發言也說，其R1模型區區560萬美元的訓練成本非常令人懷疑！
=========
訓練成本和開發不一樣，開發是程序，訓練主要是數據，容器和水的關係。訓練成本和使用的計算資源，做標注的人工費用等等相關，根據報道出來的使用gpu等等的數目和中國人工人本實質上可忽略可以看出，600萬美元是可信的。

旁觀者XWY 發表評論於 2025-01-27 19:20:00

用美國電話注冊中國平台如大眾點評都會越到麻煩，注冊不成功。這是地區性局部網絡的問題。

theriver1 發表評論於 2025-01-27 19:19:18

我不否認DeepSeek-R1論文中提出的“大模型利用純RL（強化學習）方法引導其自主學習和反思推理”這一發現是個革命性的創新。這個創新不再使用美國模型訓練AI推理能力的傳統方法，即通過在SFT（監督微調）加入大量的思維鏈（COT）範例，用例證和複雜的如過程獎勵模型（PRM）之類的複雜神經網絡獎勵模型，來讓模型學會用思維鏈思考。這個創新選擇了一條前所未有的路徑-強化學習路徑，它完全拋開了預設的思維鏈模板（Chain of Thought）和監督式微調（SFT），僅依靠簡單的獎懲信號來優化模型行為，也就是通過一套最簡單的獎勵係統，即準確性獎勵(對了加分，錯了扣分)和格式獎勵（沒這麽做就扣分，做了就加分）來激發AI的推理能力。說白了就像讓一個天才兒童在沒有任何範例和指導的情況下，純粹通過不斷嚐試和獲得反饋來學習解題。同時為了避免任何內容特定的偏見，強製讓模型進行反思性推理或推廣特定的問題解決策略。靠著這麽一個簡單的規則，讓AI在GRPO（Group Relative Policy Optimization）的規則下自我采樣、比較、自我提升。因為DeepSeek-R1采用的這種輸入問題 → 模型生成多個答案 → 規則係統評分 → GRPO計算相對優勢 → 更新模型的流程來訓練，大大提升了訓練效率，大大降低了資源消耗，因為它省去了傳統美國模型的SFT和複雜的獎懲模型。說白了，這種訓練流程讓模型可以在非常“原始”的方法下以“頓悟”的方式學會思考。問題是，這種強化學習的AI進化的新路徑雖然高效，但是大量AI專家都一至認為它絕不可能把訓練效率提高50倍！推理效率更絕無可能超過50倍！所以要麽這些專家都錯了，要麽論文所說的560萬美元的訓練成本是在造假，二者必居其一！另外，這種新方法和美國模型采用的傳統訓練方法相比，在輸出可讀性上存在明顯缺陷，所以它能否能完全取代美國模型的傳統方法還真不一定！

theriver1 發表評論於 2025-01-27 19:19:04

我支持這位作者的觀點，今天早上我在城裏發言也說，其R1模型區區560萬美元的訓練成本非常令人懷疑！原因很簡單，就憑我的第六感覺：DeepSeek-R1論文是中國人寫的！中國人在最敏感的大模型訓練成本上早假是很容易的，因為既沒有監督和懲罰機製，又能為公司產生轟動和廣告效應！這種造假絕不是個別現象！我在天貓、淘寶、Temu網站上買的所有物品，沒有一件100%符合廣告要求，每件都存在或多或少的造假或不實！

cfol2012 發表評論於 2025-01-27 19:13:00

已經從咋天開始沒法用DS了.太多人湊熱鬧.我相信DS沒有那麽多高價的GPU.不然不至於這麽快就不行了。而且它的記憶量也明顯比其它的小多了。它的強處和弱處也非常明顯.推理方麵不輸於o1.但知識問答與4o比就差多了。所以本人覺得DS還是比較誠實.而且開源的東西相比較難以掩蓋

西門雪 發表評論於 2025-01-27 19:08:56

回複：‘白雲藍天發表評論於 2025-01-27 18:51:45
非常懷疑其性能，用兩個電子郵件注冊，發給我多次驗證碼，隻有一個驗證碼在很久以後收到，已經失效。這種人工智能連注冊都搞不定，有可能強大嗎？’

**================**

新浪微博也是一樣，美國手機注冊幾年都失敗，輸入手機號，說給我發驗證碼，結果等了一夜不睡覺都沒收到。

白雲藍天 發表評論於 2025-01-27 18:54:39

本人一直在多方麵使用Chat GPT，就先想測試一下DeepSeek，結果連最基本的操作，DeepSeek都不會！

白雲藍天 發表評論於 2025-01-27 18:51:45

非常懷疑其性能，用兩個電子郵件注冊，發給我多次驗證碼，隻有一個驗證碼在很久以後收到，已經失效。這種人工智能連注冊都搞不定，有可能強大嗎？

worley 發表評論於 2025-01-27 18:49:16

第一，直接使用ChatGPT的數據，零成本。
所以Deepdeek回答問題時自稱是ChatGPT。
第二，使用了大量Nvidia GPU，但是不能說，因為違反了製裁令。

評論: Deepseek成本降低98％？“開發成本必然謊報”