普京、施密特和雷蒙多瞄準中國AI

這是國華對讀過的書, 看過的電視/電影, 聽過的音樂, 訪遊過的地方, 經曆過的事物, 和時事的感想或點評.
打印 被閱讀次數

2025年第一天,克裏姆林宮網站刊載了俄羅斯總統普京的指示,要俄羅斯政府和最大銀行“確保與中華人民共和國在人工智能領域的技術研發方麵進一步合作。” (下圖 KAOHOOINTERNATIONAL)換句話說,普京要求俄政府和最大的聯邦儲蓄銀行通過“合作”來習中國大陸在AI領域的專長。估計普京的這一指示會讓許多俄羅斯人,尤其是精英階層人士汗顏。畢竟,聯邦儲蓄銀行在俄羅斯人工智能領域處於領先位置。更重要的是,中華人民共和國自建國伊始,便是俄羅斯的前身蘇聯的小老弟,一直接受蘇聯的援助,在蘇聯的支持下發展壯大的。曾經有這麽一句流傳甚廣的話“蘇聯的今天,就是我們(中國)的明天。”就在30多年前的20世紀90年代,俄羅斯的戰鬥機和驅逐艦還被中國軍迷視為需要追趕的先進大殺器。要知道自沙俄以來,俄羅斯、前蘇聯和接替蘇聯的俄羅斯的人民 – 從普通老百姓到社會精英乃至皇親國戚 – 都對自己生產的物品充滿信心,除非同類物品來自西邊:西歐和美國。可現在得屈尊向昔日壓根兒瞧不上眼的小弟學習,你讓曾經的老大哥情何以堪?但形勢比人強。自己技不如人,美國西方又進行製裁,轉向中國對俄羅斯來說不失為一項最好的選擇。普京能如此謙恭地要俄政府和領先的企業學習中國大陸的人工智能還有一個原因,那就是美國人都承認中國大陸的AI優秀,且對中國人在AI領域取得突飛猛進的發展感到忌憚。

筆者曾在不久前討論美中人工智能競爭的博文中提到,前穀歌董事長和首席執行官、前人工智能國家安全委員會主席施密特(Eric Schmidt)在哈佛大學和電視專訪中均對中國大陸AI的迅猛發展勢頭大喊“狼來了。” 2024年12月下旬接受ABC的斯蒂芬諾普洛斯(George Stephanopoulos)采訪時,施密特更警告美國政府和AI業界中國人正以“驚人的速度”趕上美國的領先AI技術。

施密特有理由對中國大陸在人工智能領域的進步感到壓力 – 大陸AI公司深度求索2024年12月26日新發布的DeepSeek 3 大語言模型的性能與其競爭對手相當甚至更勝一籌,但成本更低,而且免費使用。CNBC的技術平台專題主持博薩(Deirdre Bosa 下圖 CNBC)報道說,

基準測試結果顯示DeepSeek 3 大語言模型與美國同類facebook的Llama3.1、OpenAI的ChatGPT4和Anthropic的Claude 3.5 Sonnet的表現難分伯仲,而DeepSeek 3在某些地方還勝過Llama3.1和ChatGPT4,如邏輯推理、數學能力、代碼生成及軟件工程能力等的細分領域(下圖 huxiu)。

這裏有必要進一步分析DeepSeek 3.0大語言模型的性能,以更好理解中國大陸在AI突破的重大意義。通過下麵這張測試結果圖表,可以發現DeepSeek 3.0(藍柱)與Qwen2.5大模型(阿裏巴巴的通義千問2.5)、Anthropic的Claude 3.5 Sonnet大模型、Meta的Llama3.1大模型、及OpenAI的ChatGPT4大模型之間的差距(下圖 21jingji)。除了在英文(English)的6個子項,代碼(Code)的2個子項和中文(Chinese)的1個子項外,DeepSeek 3.0在執行大多數任務時的表現都要優於其它大模型。當DeepSeek 3.0執行數學和程序編碼時,它的表現更為突出,有時可以說是“遙遙領先”。如在執行數學任務時,無論是美國數學邀請賽(AIME 2024, MATH)和數學基準500題(MATH-500),還是中國北方數學奧林匹克(CNMO 2024),DeepSeek-V3都大幅超過了其他所有開源(Llama3.1和Qwen2.5)和閉源模型(Claude 3.5 Sonnet和ChatGPT4)。在編碼測試中,DeepSeek 3.0也在7個子項中勝出5項(三哥要著急了,因為許多外包給三哥的基本編碼任務,現在可由AI代行,且既快又省還清晰準確)。

尤其難能可貴的是,DeepSeek 3取得如此令人咂舌的突破,僅用了不到600萬美元(官方文件說是557.6萬美元),使用的是英偉達特供中國大陸的H800閹割版GPU芯片(下圖 CNBC)。而Llama3.1和ChatGPT4則耗資上億乃至幾億美元,使用的更是英偉達(當時)最強芯片。就這樣,DeepSeek 3硬是僅用了2048塊H800 GPU芯片,耗時2個月總計278萬GPU小時取得了對其它主流大模型的趕超。與此相對照,Meta則用了3080萬GPU完成對Llama3.1的訓練。由於成本低,DeepSeek 3的使用費用也屬最低之列 – 每100萬Token(字)0.48美元,遠低於主流大模型,質量卻不相伯仲。DeepSeek 3這是要將AI的應用做成白菜價啊。英偉達對其GPU芯片有了危機感,因為DeepSeek 3通過數據和算法的優化,而非增加硬件算力(GPU芯片)的投入,就實現了較好的模型效果。當然,DeepSeek 3也有一些短板,如比其他主流大模型的響應時間要慢(約0.9秒)。DeepSeek 3的一個主要短板就是還不能創作圖片,製作PPT等。此外,DeepSeek 3的上下文窗口為13萬Token(字),要小於平均水平。這意味著當13萬Token(字)用完時,用戶得重新開啟一個窗口,繼續中段的工作。更通俗的說,一段問答對話或一項編碼任務在進行中忽然中斷了,因為13萬Token(字)用完已耗盡。於是,得重新開啟窗口以便完成對話或編碼任務。盤古智庫學術委員、未來實驗室首席專家胡延平認為,DeepSeek 3體現了“非常中國”的工程能力,通過穿小路走捷徑實現了追趕,但尚無底層原理創新。好吧,咱接著說說這與雷蒙多女士有何關係。

正是看到中國大陸在美國的嚴密封鎖製裁下取得的驚人突破,對華科技製裁鷹派代表、即將卸任的商務部長雷蒙多(Gina Raimondo)對《華爾街日報》說,美國對中國大陸的半導體芯片封禁是“徒勞的”,出口管製隻能暫時降低中國趕超美國的速度。(下圖 X)她(雷蒙多)終於發現,“打敗中國的唯一方法就是保持領先,…… 我們必須跑得更快,創新超逾他們。”

不在其位,不謀其政。在行將解甲歸田之際,其言也善啊。筆者非常同意雷蒙多部長的話,並且在過去發出的多篇博文中均提倡美國高科技企業應當走良性循環的路 – 將已有的高科技產品高價出口到別的國家,再用獲得的豐厚利潤研發出更新更好的產品。美國得靠自身的真本事,靠不斷創新來保持對包括中國大陸在內的世界領先。不思進取貪圖享受生活又希望別人永遠安於貧困落後,想要不付出努力或偷奸耍滑的躺贏,或許短時間內能行。但時間長了,烏龜都能超兔子,更別說本身就速度不慢、每年畢業那麽多STEM專業的中國大陸了。為了美好生活,這些理工生的卷可是名聞遐邇。中國《易經》裏有句話是這麽說的:“天行健,君子以自強不息;地勢坤,君子以厚德載物”。與中國大陸過招4年,咱雷蒙多部長算是悟透了。嗨,政府應當讓我進入智囊團,或者某智庫應收我入庫 – 咱幾年前就提出了商務部長剛剛認清的形勢。(smile)

參考資料

胡延平. (2025). 胡延平:為什麽DeepSeek-V3的火爆不宜過高評價? 新浪財經. 鏈接 https://finance.sina.cn/stock/ggyj/2025-01-02/detail-inecqsvs9677357.d.html?oid=%E7%9A%87%E5%86%A0%E7%99%BB3%E7%AE%A1%E7%90%86%E7%B3%BB%E7%BB%9F%E2%86%92TG%E5%BE%AE%E4%BF%A1hga1199%E2%86%925rIn&vt=4

Haski, P. (2025). DeepSeek 3: How China's New AI Is Challenging U.S. Tech Dominance. WORLDCRUNCH. 鏈接 https://worldcrunch.com/tech-science/deepseek-chatgpt-china-response

Mehrara, M. (2025). China and Russia forge major tech collaboration to challenge US. Newsweek. 鏈接 https://www.newsweek.com/china-russia-forge-major-tech-collaboration-challenge-us-2008502

Mowshowitz, Z. (2025). DeepSeek v3: The Six million dollar model. thezvi. 鏈接 https://thezvi.substack.com/p/deekseek-v3-the-six-million-dollar

Reuters. (2025). Putin orders Russian government and top bank to develop AI cooperation with China. 鏈接 https://www.reuters.com/technology/artificial-intelligence/putin-orders-russian-government-top-bank-develop-ai-cooperation-with-china-2025-01-01/

登錄後才可評論.