DeepSeek尚不足以撼動中美AI差距格局
王維嘉 776
編者按本文是776王維嘉校友最近在一個企業家微信群裏的語音發言記錄稿,由他授權《科大瞬間》發表。
王維嘉1984年獲碩士學位,1985年赴美斯坦福大學電氣工程係攻讀博士,兩年後獲博士學位。1994年,在矽穀創辦美國通用無線通信有限公司,專注於移動互聯產業。他還著有《暗知識:機器認知如何顛覆商業和社會》。王維嘉是中科大新創基金會籌備委員會委員、第一屆籌款委員會副主席。作為一位數字信號處理、人工智能以及移動互聯網絡等領域的專家、創業者和投資人士,他對最近火爆全網的DeepSeek 有什麽洞見呢?讓我們來讀一讀。
眼下科技圈最關注的莫過於Deepseek事件。網絡上充斥著各種技術與財務分析。在此,我願分享一些個人見解,以期為諸位提供更清晰的思路。
技術創新的探索之路
我在矽穀工作了40年,對技術創新有著深刻的體會。技術創新如同探路者在大山中尋找金礦。盡管有人指出大山中存在金礦,但具體位置卻無人知曉。因此,眾多探索者湧入,各自尋找不同的方向。回顧人工智能發展曆程,自 2012 年圖像識別取得首次突破,到後來人工智能在圍棋領域的應用,我們可將其視為人工智能 1.0 階段。彼時,矽穀乃至全球人工智能行業主要聚焦於圖像識別和視頻識別領域。
2017年,穀歌推出Transformer模型,聚焦語言翻譯,尤其是英文與法文之間的翻譯。然而,穀歌在完成相關研究後,並未深入探索,因為當時業界普遍認為語言翻譯市場有限,遠不及圖像識別和視頻識別領域。
然而,OpenAI 另辟蹊徑,洞察到語言領域的廣闊前景。人類智慧多以語言呈現,因此 OpenAI 全力投入研發。盡管當時OpenAI 資源匱乏,與穀歌、微軟等巨頭相比,人力、財力均相差懸殊,但他們憑借敏銳的洞察力,於2022年11月發布了ChatGPT。
這如同在眾人行走的陽光大道旁發現了一條小岔道,OpenAI 一頭紮進去,竟意外發現了一座金礦,引發了行業的震動。眾多從業者紛紛湧入,將此領域開拓成新的陽光大道。
此後,行業預訓練模型不斷加大規模和數據量,但逐漸迷失方向。在此過程中,OpenAI 又做出了新的貢獻 —— 推理學習。研究發現,在模型規模並非極大的情況下,通過精心訓練推理能力,模型性能可實現大幅提升。2024年 9 月 24 日,OpenAI 發布 o1 model,再一次為行業開辟了新的路徑。
在這一探索過程中,全球團隊,尤其是美國團隊,發明了諸多工具,如同更鋒利的砍刀與鏟子,助力各團隊在荊棘叢生的探索之路上加速前行。
DeepSeek的開源理想和成功偶然性

在技術發展中,領先者通常會對核心技術有所保留,而落後者則傾向於通過開源匯聚全球智慧推動發展,如 Meta(Facebook)在與OpenAI 的競爭中選擇開源。因為開源是一種類似公益社區的精神,阿拉善的企業家就會比較更能理解,就是哪怕不知道有沒有收獲,但是仍會選擇付出。
美國有開源的文化,比如軟件的開源Linux,比如Wikipedia做成了全世界的字典,中國當時也來拷貝,結果做得很差。在中國,開源文化並不深厚,DeepSeek 能堅持開源,將優質成果與世界共享,實屬難得。這體現了美國開源社區精神對中國年輕程序員和企業家的影響,盡管這種影響在國內仍較為稀缺。
團隊核心人物梁文鋒自2013年便開始運用機器學習進行量化投資,團隊在機器學習領域已有十餘年的經驗積累。在技術敏感度上,他們可能早在 ChatGPT 之前就已開始使用 transformer 開發大語言模型,如 2019 年或許就已啟動相關工作。同時,團隊匯聚了一批國內頂尖人才,在技術探索中,他們利用前人開發的先進工具,在推理模型的基礎上又發現了一條新路徑 —— 完全自動訓練,區別於 OpenAI 的人工訓練方式,降低了成本。
這種自動推理訓練類似於 AlphaGo Zero 的模式。AlphaGo 擊敗李世石後,穀歌工程師嚐試讓 AlphaGo Zero 不依賴人類經驗從頭學習,結果在短時間內,AlphaGo Zero 便超越了擊敗李世石的舊版 AlphaGo。DeepSeek 在這一路徑上深入探索並取得成功,雖然其貢獻程度不及 ChatGPT 和推理訓練的發現,但也堪稱自 ChatGPT 以來第三大重要貢獻,將推理成本降低了兩個數量級。
從技術格局來看,盡管 DeepSeek 的成果縮小了中美在人工智能技術上的差距,但中美人工智能整體格局尚未被撼動。
在人工智能技術的幾個關鍵方麵,芯片領域中國仍與美國存在較大差距;在算法突破方麵,過去十年間,從 2012 年的 AlexNet 到2017 年的 Transformer,再到 2022 年的 ChatGPT 以及後續的思維鏈、RAG 和推理訓練等重大突破,大多發生在美國,法國的 Mistral 公司也有少量貢獻,DeepSeek 的貢獻占比約為 5%,但這已然十分了不起。
DeepSeek的成功在一定程度上具有偶然性。在一個充滿偶然性的科學探索過程中,眾多團隊在不同的方向上探索,總會有某個團隊率先取得突破。中國擁有龐大的 AI 基礎和工程師隊伍,經過30年的發展,已經與西方建立了良好的交流基礎。因此,中國出現像 DeepSeek 這樣的團隊並不令人意外。這類似於蘇聯在1957年成功發射第一顆人造衛星,其背後是美國在兩次世界大戰期間對蘇聯技術的開放,使得蘇聯培養了強大的技術基礎。然而,一旦蘇聯閉關鎖國,這種技術能力便迅速衰退。
AI浪潮前景廣闊,目前仍處起步階段
在商業和股市層麵,人工智能領域的發展與英偉達密切相關。我在2017 年《暗知識》一書便指出,AI 時代的芯片霸主是英偉達,當時其市值約三百億美元,此後漲幅近百倍。近期美國股市大跌,部分原因是市場認為算法效率提高會減少對算力的需求,進而降低對英偉達等芯片的依賴。但這是一種靜態思維,正如 19 世紀英國經濟學家傑文斯發現的一個現象:當蒸汽機的效率大幅提升後,煤炭的消耗量並未減少,反而大幅增加。這一現象被稱為“傑文斯悖論”(Jevons Paradox)。其背後的邏輯是:盡管單台蒸汽機的煤炭消耗量減少了,但由於蒸汽機變得更加經濟高效,人們開始在更多領域廣泛使用蒸汽機,從而導致蒸汽機的總數大幅增加,最終使得煤炭的總消耗量不降反升。
同理,AI 模型成本降低將推動 AI 應用的廣泛拓展,對芯片的需求也會隨之增長。過去,AI 應用麵臨的一大障礙是成本高昂。以 ChatGPT 為例,用戶每次提問都需要支付費用,且隨著問題複雜度的增加,計算成本呈指數級上升。例如,回答一個簡單問題如“唐朝的第一任皇帝是誰”可能瞬間完成,而回答一個複雜問題如“唐宋之變的核心原因是什麽”則需要進行深入分析和佐證,計算時間可能增加百倍甚至更多。
如今,AI 已經發展到可以作為智能代理(agent)為用戶提供全麵服務的階段。例如,用戶計劃前往巴西旅遊,AI 可以像私人助理一樣,從行程規劃到酒店預訂,再到機票購買,全程提供服務。這一過程的計算成本可能是簡單問答的萬倍以上。如果每次服務的費用高達10000元人民幣,用戶可能會望而卻步;但如果費用降至100元,用戶則會毫不猶豫地使用。因此,低成本的 AI 模型將極大地擴展 AI 的應用場景,可能實現百倍、千倍甚至萬倍的增長。
對於 Deepseek,外界關注其芯片使用量以及是否存在數據盜用問題。但從其市場定價來看,每次訪問成本僅為 OpenAI 的 1/30 且仍有利潤,這表明其在成本控製上卓有成效,至於其他問題,目前並無確鑿證據,且對其技術價值和市場影響的判斷並非關鍵。
DeepSeek 未來能否繼續取得重大突破仍是一個未知數。隨著團隊的知名度提升,政府的高要求和大公司的高薪挖角,可能會對其純粹的技術追求產生不利影響。能否在這種環境下堅守技術理想,繼續前行,是一個值得打問號的問題。
AI 浪潮的前景極為廣闊,目前仍處於起步階段,未來十年甚至二十年仍將蓬勃發展。與互聯網在20世紀90年代末和21世紀初的發展類似,AI 有望在未來十年到二十年內實現重大突破。
更為重要的是,AI 的潛力究竟有多大?目前,包括 OpenAI、Anthropic、Google、微軟在內的各大實驗室都在積極研發通用人工智能(AGI)。AGI 的定義是:機器能夠完成人類絕大部分的智力活動。根據目前的研究進展,AGI 的出現時間可能在兩年到五年之間。如果 AGI 成為現實,其市場規模將極為龐大,有望超過互聯網市場,達到數萬億美元甚至數十萬億美元的規模。
DeepSeek 的技術突破進一步證實了人類有可能以較低成本實現 AGI。如果 AI 的成本過高,甚至超過人力成本,那麽其應用範圍將受到限製。正如中國許多生產線仍然使用人工而非機器人,因為人工成本更低。隻有當機器人的成本遠低於人工時,機器人才能廣泛普及。DeepSeek 在降低 AGI 成本方麵做出了重大貢獻,這一點非常值得肯定。
總之,DeepSeek 的成功是中國 AI 領域的技術突破雖有偶然性,但更多源於團隊技術積累。在這場漫長的征程中,DeepSeek 已經邁出了第一步,未來能否繼續引領潮流,還需時間的檢驗。
編輯:許讚華
排版:俞霄
校對:劉揚
《科大瞬間》文學城編輯部
許讚華 803 | 陶李 8112
劉揚 815 | 黃劍輝 815
滕春暉 8111 | 陳錦雄812 | 餘明強 9115
陳風雷 786 | 沈濤 822 | Jay Sun 836
吳鈞 856 | 王