評論: Deepseek成本降低98%?“開發成本必然謊報”

隻有登錄用戶才能發表評論,點擊此處登錄    返回新聞帖
luting 發表評論於 2025-01-28 17:29:55
灣區範兒 發表評論於 2025-01-28 09:53:41別忘了中國十多年前還研製成了最先進的漢芯芯片呢,結果呢?

##############################################
漢芯敢於開源給國際檢視嗎?
aguafresh 發表評論於 2025-01-28 17:08:00
一個外行比美國的科技大公司、眾多投資機構都懂AI?DeepSeek開源了,還有其他機構去下載嚐試驗證,才引起這麽大的震動。
灣區範兒 發表評論於 2025-01-28 09:53:41
別忘了中國十多年前還研製成了最先進的漢芯芯片呢,結果呢?
luting 發表評論於 2025-01-28 08:49:31
你管它用了啥?看看模型大小就可以估算出算力的需求,記住,即使我的手機也可以做最頂尖NIVIDIA GPU的活,也就是慢個上百到上千倍而已。一旦算力確定,根據公司公布的NVIDIA 卡的型號,簡單的小學數學就可以估計出需要的時間和成本。個人感覺,如果這個公司有NVIDIA最新的卡,估計成本還能降半,從這點而言,科技禁運還是有用。

不過這個公司太耀眼了,估計又是將來美國針對的對象,NVIDA卡是估計沒有了。聰明點,趕緊往國產芯片上搬吧。
西岸-影 發表評論於 2025-01-28 07:59:42
再說她不過就是一個網紅,也不是專業人員,台灣竟然把這種人的觀點當回事,也是奇葩了。
西岸-影 發表評論於 2025-01-28 07:58:04
這些是並不難驗證的,她大概是不知道DeepSeek公布了算法,理論上任何人可以複製。
那麽隻需要複製就知道了。而且這東西引起這麽大的股市震蕩,不是僅靠謠傳就會這樣的,英偉達僅僅一天就損失了幾乎六千億美元,美國整個損失一萬億。
大概率是因為驗證了可行。
cacu 發表評論於 2025-01-28 06:28:00
Who is hu
xiaoxiao雨 發表評論於 2025-01-28 05:59:12
i think it is a strategy to push US to open the sales of more advanced AI chips.
時不時來看看 發表評論於 2025-01-28 03:48:44
theriver1: 我發帖招您啦?那麽多鋪天蓋地的媒體認為是真的,為啥不給他們貼標簽呢?您發帖我從來不感興趣。“必然”放在題目,您看不懂?
荒野獵人 發表評論於 2025-01-28 01:22:00
DeepSeek利用較少且不夠先進的芯片訓練出了媲美ChatGPT的模型。DeepSeek在一份技術報告中稱,它使用超過2000個英偉達H800芯片集群來訓練其參數為6710億的V3模型,而Meta訓練參數量4050億的Llama 3,用了16384塊更強的H100顯卡,花了54天。Deepseek的訓練效率為Meta的11倍。DeepSeek表示,訓練其最新模型之一的成本為560萬美元(約合人民幣4100萬元)。相比之下,人工智能開發商Anthropic的首席執行官達裏奧·阿莫迪 (Dario Amodei )去年提到的建立一個模型的成本為1億至10億美元。CNBC曾發文稱:“DeepSeek-R1因其性能超越美國頂尖同類模型,且成本更低,算力消耗更少,引發了矽穀的恐慌。”但王話鋒一轉,談到了中國人工智能企業可能為人工智能模型配備的GPU數量。他稱,“中國的實驗室擁有的H100芯片比人們想象的要多得多。”他補充道, “據我了解,DeepSeek擁有大約五萬塊H100芯片。”王認為,因為違反了美國實施的出口管製,所以DeepSeek不能談論這些。英偉達的Hopper架構GPU如H100和H200,因其優秀的算力,出口受到美國政府的管製。拜登政府於2022年通過一項規定禁止英偉達向中國出售性能遠超其舊款GPU A100 的GPU係列,迫使英偉達開發了名為H800和A800的性能削減版芯片用以替代,但一年後的2023年10月,這兩款芯片也一並被禁止。目前,英偉達已在推廣其最新一代Blackwell架構的GPU,其出口依然受到限製。王將中美之間的人工智能競賽描述為一場“AI戰爭”,並補充道,“美國將需要大量的計算能力和基礎設施,我們需要釋放美國的能量以推動這場AI繁榮。”
荒野獵人 發表評論於 2025-01-28 01:21:00
截至我的知識更新日期(2024年7月),我無法提供關於DeepSeek使用的具體芯片信息。如果你需要了解DeepSeek的技術細節或硬件配置,建議訪問其官方網站或聯係其技術支持團隊以獲取最新信息。你可以訪問 [***deepseek***](***deepseek***) 了解更多。
whaled 發表評論於 2025-01-27 21:22:39
哪那麽多廢話,有本事就all in買女大
大豬頭- 發表評論於 2025-01-27 21:00:52
雖說我不能理解為啥本論壇專家不能自己去github看公開文檔, 不過文學城群眾在自由民主思想指導下的意淫還是值得大家學習的,

至於驗證部份,我想咱爹家那些大公司比文學城專家更急於證明DeepSeek是造假, 如果有問題, 你過幾天也可以看到了. 如果沒問題, 抄作業也會立馬進行. 不知道這裏的專家在自己沒能力驗證的前提下,有啥好唧唧歪歪的

C*fusion 發表評論於 2025-01-27 20:55:57
The decision to make DeepSeek's AI model open-source is intriguing, especially given the strategic importance of AI technology. Why did the Chinese government allow DeepSeek to disclose their AI models? It doesn't quite add up. I suspect there might be something fishy.
我是bruce 發表評論於 2025-01-27 20:47:03
這女挺漂亮,是個真正的美女
秋林小屋 發表評論於 2025-01-27 20:41:13
我也不太相信這個開發成本是真實的。
theriver 發表評論於 2025-01-27 20:34:59
大豬頭- 發表評論於 2025-01-27 20:26:37
英文就是真的啦? 人家隻是轉述DS的解釋而已。DS當然要這麽說,如果說是注冊用戶太多,不就暴露了自己的大規模並行服務的能力不足了嗎?真正的網攻會隻攻擊注冊係統嗎?
theriver1 發表評論於 2025-01-27 20:27:32
京城老炮1950 發表評論於 2025-01-27 19:37:54
這家公司真的沒有使用任何一款英偉達的GPU就能把成本降低98%?如果是真的,那絕對是人類奇跡!
-----------
它要不用英偉達的GPU,我跟你姓!
大豬頭- 發表評論於 2025-01-27 20:26:37
你的網名配得上你的智商。收到攻擊,停止服務的會僅僅是注冊嗎?
===========
這位智者英文不太好?******cnbc***/2025/01/27/deepseek-hit-with-large-scale-cyberattack-says-its-limiting-registrations.html
From CNBC: DeepSeek on Monday said it would temporarily limit user registrations “due to large-scale malicious attacks” on its services, though existing users will be able to log in as usual.
大豬頭- 發表評論於 2025-01-27 20:23:50
文學城那些很懂的專家們難道真沒看過公開文檔, 還是沒看懂就自己意淫? 在幾個關鍵點上, 人家寫得明明白白, 有能力的公司, 自己去認證一下就可以.

不過剛看了“Emmy追劇時間"頻道,這貨也能是AI專家?文學城群眾對專家的理解再一此讓人歎為觀止.
李新 發表評論於 2025-01-27 20:23:00
綠蛙酸了。
theriver1 發表評論於 2025-01-27 20:21:14
大豬頭- 發表評論於 2025-01-27 20:10:06
不是說受到了攻擊, 所以影響服務的嘛, 至少是咱爹的CNBC說的? 難道是文學城群眾動用了神秘的民主自由的能量把DeepSeek打癱瘓了?
----------
你的網名配得上你的智商。收到攻擊,停止服務的會僅僅是注冊嗎?
theriver1 發表評論於 2025-01-27 20:17:37
白雲藍天 發表評論於 2025-01-27 20:06:06
問題是應該給出解釋,絕不能說已經正在給用戶提供服務,而事實上在睡大覺。不應該沒有給用戶解決任何一個問題之前,先給了用戶造成很大困惑。
------------
我在很多服務器在國內的App上注冊都遇到和你類似的問題,比如知乎和豆瓣。我都懷疑它們和DS用的都是同一個限製注冊的防火牆。也許這就中國大陸IT企業的一種文化,它們暫時關閉注冊但不敢告訴新用戶,怕把用戶永久性氣跑,隻敢偷偷搞小動作。另外如果公開告訴新用戶停止注冊,在國際上會很沒麵子,間接說明他們的係統不夠穩定,無法無縫實現海量並行服務。
大豬頭- 發表評論於 2025-01-27 20:10:06
不是說受到了攻擊, 所以影響服務的嘛, 至少是咱爹的CNBC說的? 難道是文學城群眾動用了神秘的民主自由的能量把DeepSeek打癱瘓了?
theriver1 發表評論於 2025-01-27 20:07:32
時不時來看看 發表評論於 2025-01-27 19:48:51
----------
這位五毛,不懂就不要跑出來搗亂。懷疑DS的R1模型訓練成本造假可不隻是小編的造謠,而是很多AI專家的理性想法。西人的文化是疑罪從無,不管這個論文中的成本有多逆天,隻要沒有確鑿的證據,西方主流媒體都會至少暫時把它當成是真的。但是以我們這些從小在中國長大和拿到大學文憑的熟悉中國文化的老中看來,這個成本的水分是非常可疑的。
白雲藍天 發表評論於 2025-01-27 20:06:06
theriver1 發表評論於 2025-01-27 19:57:57
樓下,我是在新聞裏看到說DS因為太火而加入防火牆限製注冊的,我估計DS因為害怕影響性能(畢竟它還是一家小公司,而且服務器很可能在國內),如果象Tiktok那樣一開始每月注冊10億,很可能係統會崩潰。
------------------------
問題是應該給出解釋,絕不能說已經正在給用戶提供服務,而事實上在睡大覺。不應該沒有給用戶解決任何一個問題之前,先給了用戶造成很大困惑。
ajaychen_2024 發表評論於 2025-01-27 20:03:10
就算成本再增長十倍,也就是五六千萬美元,也比open Ai等模型的少很多。
過往的西 發表評論於 2025-01-27 20:02:55
人家是開源模型,自己裝一個訓練訓練不就知道了,meta已經在做了,什麽無法驗證,你是可以驗證的
白雲藍天 發表評論於 2025-01-27 20:01:50
象國內一些在國際上很火的純商業軟件 Temu(拚多多)、Trip***(攜程)就非常好用,想必 Tiktok 也是如此,比同類的軟件都方便實用,更不會存在注冊方麵的問題。
theriver1 發表評論於 2025-01-27 19:57:57
樓下,我是在新聞裏看到說DS因為太火而加入防火牆限製注冊的,我估計DS因為害怕影響性能(畢竟它還是一家小公司,而且服務器很可能在國內),如果象Tiktok那樣一開始每月注冊10億,很可能係統會崩潰。
時不時來看看 發表評論於 2025-01-27 19:51:35
DS和openai的出現,基本宣告自由時報之類的造謠媒體將無謠可造,馬大人手下留情,16億別全沒收
白雲藍天 發表評論於 2025-01-27 19:49:17
theriver1 發表評論於 2025-01-27 19:43:41
樓下,這就是國內令人無比生厭的防火牆。它故意不告訴你現在停止注冊,而是讓你一次次做無用功。
-----------------------
高級人工智能軟件應該告訴用戶是怎麽一回事,而不是造成用戶的困惑。連這個都做不到,不是在用最簡單的事實砸自己的牌子?
時不時來看看 發表評論於 2025-01-27 19:48:51
自由時報還是多報點中共高鐵沒人坐,綠皮車擠破,和三哥家的一樣買掛票,那樣流量大不少,傻錢可以多拿點

DS的代碼自由時報的編輯再學50年,到上帝那裏繼續學,估計也難搞明白
時不時來看看 發表評論於 2025-01-27 19:46:09
各大媒體鋪天蓋地,各大自媒體蓋地鋪天,花街先跌為敬,就數Wenxuecity最牛 -- 假的!
白雲藍天 發表評論於 2025-01-27 19:45:38
再說,最簡單的注冊手續太火,就搞不定了,那麽世界性的大規模使用是怎樣搞定的?
theriver1 發表評論於 2025-01-27 19:43:41
樓下,這就是國內令人無比生厭的防火牆。它故意不告訴你現在停止注冊,而是讓你一次次做無用功。
白雲藍天 發表評論於 2025-01-27 19:41:36
白雲藍天 發表評論於 2025-01-27 18:51:45
非常懷疑其性能,用兩個電子郵件注冊,發給我多次驗證碼,隻有一個驗證碼在很久以後收到,已經失效。這種人工智能連注冊都搞不定,有可能強大嗎?
---------------
theriver1 發表評論於 2025-01-27 19:28:44
這個倒是冤枉DS了,他們因為這兩天注冊太火了,所以給加了限製注冊的防火牆。
----------------------
但是除了很多時候說太忙,稍後再試,其他時候都說驗證碼已發出,並給60秒時間,但事實上發了很多次驗證碼,隻有收到過一次,而且是隔了很久才收到,早已失效。作為一個高級人工智能軟件,這種錯誤也敢犯?!
theriver1 發表評論於 2025-01-27 19:39:56
bsmile 發表評論於 2025-01-27 19:21:59
訓練成本和開發不一樣,開發是程序,訓練主要是數據,容器和水的關係。訓練成本和使用的計算資源,做標注的人工費用等等相關,根據報道出來的使用gpu等等的數目和中國人工人本實質上可忽略可以看出,600萬美元是可信的。
---------------
對啊,正因為AI訓練主要依賴於訓練算法和算力資源,所以理論上訓練的成本隻取決於算力資源,所以理論上DS不可能僅以50分之一的算力資源實現類似能力的大模型。因為幾乎所有AI專家都認為新算法對訓練效率的提升不可能達到50倍,對推理效率的提升更不可能超過50倍。
京城老炮1950 發表評論於 2025-01-27 19:37:54
這家公司真的沒有使用任何一款英偉達的GPU就能把成本降低98%?如果是真的,那絕對是人類奇跡!
theriver1 發表評論於 2025-01-27 19:28:44
白雲藍天 發表評論於 2025-01-27 18:51:45
非常懷疑其性能,用兩個電子郵件注冊,發給我多次驗證碼,隻有一個驗證碼在很久以後收到,已經失效。這種人工智能連注冊都搞不定,有可能強大嗎?
---------------
這個倒是冤枉DS了,他們因為這兩天注冊太火了,所以給加了限製注冊的防火牆。
時不時來看看 發表評論於 2025-01-27 19:24:09
自由時報一定不能信,不然拜總的16億傻錢直接被馬大人沒收,不信估計也逃不過馬大人的大刀,馬大人哢嚓那天,就是鬼哭狼嚎的那天

Meta一定不能信,不然20個高管都得跳槽到自由時報領傻錢,但是機器人老板Z信了就完了

OpenAI更不能信,不然隻能收日元

黃博士不能信,居然一夜之間跌個18趴,這些賣空的都是傻子,難道不抄底的也是傻子嗎?
ajaychen_2024 發表評論於 2025-01-27 19:22:46
對這些殖人,回答就是“是是是,對對對,你說得都對,都是假的,都不存在,你高興就好了”,反正AI股票崩盤又不關我事。到時美國爹不高興懷疑你們在誤導為中共打掩護放煙幕彈,抓你們祭旗也不關我們事。
bsmile 發表評論於 2025-01-27 19:21:59
theriver1 發表評論於 2025-01-27 19:19:04
我支持這位作者的觀點,今天早上我在城裏發言也說,其R1模型區區560萬美元的訓練成本非常令人懷疑!
=========
訓練成本和開發不一樣,開發是程序,訓練主要是數據,容器和水的關係。訓練成本和使用的計算資源,做標注的人工費用等等相關,根據報道出來的使用gpu等等的數目和中國人工人本實質上可忽略可以看出,600萬美元是可信的。
旁觀者XWY 發表評論於 2025-01-27 19:20:00
用美國電話注冊中國平台如大眾點評都會越到麻煩,注冊不成功。這是地區性局部網絡的問題。
theriver1 發表評論於 2025-01-27 19:19:18
我不否認DeepSeek-R1論文中提出的“大模型利用純RL(強化學習)方法引導其自主學習和反思推理”這一發現是個革命性的創新。這個創新不再使用美國模型訓練AI推理能力的傳統方法,即通過在SFT(監督微調)加入大量的思維鏈(COT)範例,用例證和複雜的如過程獎勵模型(PRM)之類的複雜神經網絡獎勵模型,來讓模型學會用思維鏈思考。這個創新選擇了一條前所未有的路徑-強化學習路徑,它完全拋開了預設的思維鏈模板(Chain of Thought)和監督式微調(SFT),僅依靠簡單的獎懲信號來優化模型行為,也就是通過一套最簡單的獎勵係統,即準確性獎勵(對了加分,錯了扣分)和格式獎勵(沒這麽做就扣分,做了就加分)來激發AI的推理能力。說白了就像讓一個天才兒童在沒有任何範例和指導的情況下,純粹通過不斷嚐試和獲得反饋來學習解題。同時為了避免任何內容特定的偏見,強製讓模型進行反思性推理或推廣特定的問題解決策略。靠著這麽一個簡單的規則,讓AI在GRPO(Group Relative Policy Optimization)的規則下自我采樣、比較、自我提升。因為DeepSeek-R1采用的這種輸入問題 → 模型生成多個答案 → 規則係統評分 → GRPO計算相對優勢 → 更新模型的流程來訓練,大大提升了訓練效率,大大降低了資源消耗,因為它省去了傳統美國模型的SFT和複雜的獎懲模型。說白了,這種訓練流程讓模型可以在非常“原始”的方法下以“頓悟”的方式學會思考。問題是,這種強化學習的AI進化的新路徑雖然高效,但是大量AI專家都一至認為它絕不可能把訓練效率提高50倍!推理效率更絕無可能超過50倍!所以要麽這些專家都錯了,要麽論文所說的560萬美元的訓練成本是在造假,二者必居其一!另外,這種新方法和美國模型采用的傳統訓練方法相比,在輸出可讀性上存在明顯缺陷,所以它能否能完全取代美國模型的傳統方法還真不一定!
theriver1 發表評論於 2025-01-27 19:19:04
我支持這位作者的觀點,今天早上我在城裏發言也說,其R1模型區區560萬美元的訓練成本非常令人懷疑!原因很簡單,就憑我的第六感覺:DeepSeek-R1論文是中國人寫的!中國人在最敏感的大模型訓練成本上早假是很容易的,因為既沒有監督和懲罰機製,又能為公司產生轟動和廣告效應!這種造假絕不是個別現象!我在天貓、淘寶、Temu網站上買的所有物品,沒有一件100%符合廣告要求,每件都存在或多或少的造假或不實!
蟹粉小籠包 發表評論於 2025-01-27 19:13:10
一群腦殘狗糧們還在質疑訓練成本作假,你們比花街科技投資者還懂?
cfol2012 發表評論於 2025-01-27 19:13:00
已經從咋天開始沒法用DS了.太多人湊熱鬧.我相信DS沒有那麽多高價的GPU.不然不至於這麽快就不行了。 而且它的記憶量也明顯比其它的小多了。它的強處和弱處也非常明顯.推理方麵不輸於o1.但知識問答與4o比就差多了。所以本人覺得DS還是比較誠實.而且開源的東西相比較難以掩蓋
西門雪 發表評論於 2025-01-27 19:08:56
回複:‘白雲藍天 發表評論於 2025-01-27 18:51:45
非常懷疑其性能,用兩個電子郵件注冊,發給我多次驗證碼,隻有一個驗證碼在很久以後收到,已經失效。這種人工智能連注冊都搞不定,有可能強大嗎?’

**================**

新浪微博也是一樣,美國手機注冊幾年都失敗,輸入手機號,說給我發驗證碼,結果等了一夜不睡覺都沒收到。
白雲藍天 發表評論於 2025-01-27 18:54:39
本人一直在多方麵使用Chat GPT,就先想測試一下DeepSeek,結果連最基本的操作,DeepSeek都不會!
頁次:1/2 每頁50條記錄, 本頁顯示150, 共72  分頁:  [1] [2] [下一頁] [尾頁]