龍年即將結束之際,美國又被中國產品狠狠撞了一下腰。 在中國初創人工智能公司DeepSeek的暴擊之下,AI“賣鏟人”英偉達股價週一暴跌,至收盤時跌幅近17%,創2020年3月以來的最大跌幅。 英偉達週一單日的市值蒸發規模達到5600億美元,也創造了美股曆史之最。英偉達也同時失去全球市值最大公司的寶座,不及蘋果和微軟,跌至第三。 DeepSeek在美區蘋果App Store免費榜上已經排在第一位,力壓先前霸榜的ChatGPT,而排在第三的則是Meta旗下的Threads。 1 英偉達多年來一直是AI領域的“軍火商”,它的高端GPU幾乎掌控了全球大部分AI研發的算力需求,尤其是高端芯片如A100和H100,一直是全球AI模型訓練和推理的主力設備。然而,DeepSeek的成功展示了一個全新的路徑——通過對模型架構的極致優化和算力需求的精簡,它可以在性能一般的中低端顯卡上實現媲美甚至超越ChatGPT的效果。這意味著,以前隻有頂級算力才能承載的大模型,現在可以“降維”到成本更低的硬件上運行。 以DeepSeek的研發為例,它使用的是中國團隊通過開源技術改良後的算法,結合中端GPU實現的高效推理。相比之下,OpenAI為了訓練ChatGPT,動用了數以萬計的高端GPU,每塊售價高達數萬美元。這種成本上的巨大差異,直接讓投資者意識到,未來AI市場可能並不需要大量依賴英偉達的高端產品,而是會更多地轉向性價比更高的方案。 這對英偉達的長期需求預期是一次重創。 過去,隻有那些擁有雄厚資金的大公司才能負擔得起英偉達的高端芯片來開發AI模型。而現在,DeepSeek用實踐證明,中低端算力也可以支持高效的AI應用,這無疑降低了整個行業的準入門檻,讓更多企業得以參與競爭。 DeepSeek不僅衝擊了英偉達的商業模式,也讓矽穀的一眾科技巨頭感到不安。 以Meta為例,這家公司近年來在AI領域投入了數百億美元,試圖通過構建超大規模的語言模型來與OpenAI競爭。但是,DeepSeek僅用不到1000萬美元的研發成本並且大獲成功,讓人們開始質疑,這種砸錢式研發是否真的是唯一的路徑。 據知情人士透露,DeepSeek登頂App Store排行榜的第二天,Meta內部的一個高層會議就連夜召開。這種危機感,不獨Meta一家有,整個矽穀都感彌漫著一種恐慌,很多大廠開始重新評估自己的研發策略。 微軟CEO納德拉(Satya Nadella)在瑞士達沃斯世界經濟論壇上表示:“看到DeepSeek的新模型,真的令人印象非常深刻。他們切實有效地開發出了一款開源模型,在推理計算方麵表現出色,且超級計算效率極高。我們必須非常、非常認真地對待中國的這些進展。” DeepSeek還動搖了矽穀的商業信心。 在DeepSeek推出R1模型後,矽穀的風投機構紛紛調整對AI初創企業的投資策略。過去,那些高喊“我們需要更多資金購買GPU”的初創公司是資本的寵兒,而現在,投資人更傾向於尋找像DeepSeek這樣專注於低成本高效解決方案的團隊。 一個更具體的例子是,Meta原計劃在2025年推出一款對標ChatGPT的超級大模型,其研發預算高達50億美元。然而,DeepSeek的成功讓Meta不得不重新考慮是否繼續這一項目,畢竟紮克伯格的錢也不是風刮來的。 今年1月20日,國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會,聽取對《政府工作報告(徵求意見稿)》的意見建議,DeepSeek創辦人梁文鋒在會上發言。 2 DeepSeek,是一個誕生於中國杭州的公司,今年40歲的創始人梁文鋒是廣東湛江人,17歲考入浙江大學,後又在浙大攻讀信息與通信工程專業碩士。師從項誌宇,主要做機器視覺研究。 梁文鋒具體的童年成長軌跡已不可考,從公開信息唯一可知的是,梁文鋒有在採訪中提到過自己的父親是一名小學老師。 2008年,23歲的梁文鋒還在浙江大學讀碩士,當時全球金融危機爆發,市場風雨飄搖。但這位“天生的理工男”已經帶領團隊開始搞全自動量化交易了,收集數據、建模分析,把機器學習玩得風生水起。據傳,大疆創始人汪滔那時候找過他,希望一起創業。但他認準人工智能才是未來,果斷選擇獨立發展。 2010年碩士畢業時,梁文鋒的研究方向是目標跟蹤算法,但他的目光卻已經鎖定更大的舞台。同年,他和浙大的校友徐進一起創立了雅克比投資,開始把AI和量化交易結合。2015年,兩人聯手創辦了幻方科技。這家公司不到幾年時間就在量化投資圈殺出重圍,2016年推出首個AI交易模型,2019年管理規模突破百億,成為國內量化“四巨頭”之一,甚至是唯一邁過千億門檻的量化私募。 幻方的核心是什麽?算力!梁文鋒用強大的技術背景,把幻方打造成了一個“AI驅動的賺錢機器”。 到了2023年,全球AI浪潮全麵爆發,梁文鋒再次展現出敏銳的嗅覺。這一年,他決定進軍通用人工智能(AGI),成立DeepSeek,一家專注於AI大模型研發的公司。從量化投資到AI創業,梁文鋒不僅實現了跨界,還在短短幾個月內,用不到1000萬美元的成本推出了R1模型。 DeepSeek的橫空出世,不僅迅速搶佔美國App Store排行榜的榜首,更讓昔日霸主ChatGPT退居次席。 這是龍年非常有曆史意義的一個時刻。DeepSeek 這家頗有一些神秘色彩的公司,已經成為龍年最精彩的句點。 3 業界普遍認為,DeepSeek是中國AI技術的一次突破。這怎麽理解呢? 普通人可能並不關心“MLA架構”或“MoE稀疏結構”這些專業術語,也理解不了。以下是幾個簡單易懂的例子,來說明為什麽DeepSeek的R1模型會被認為是“革命性”的技術產品。 首先,DeepSeek更“聰明”,回答更接地氣。過去你用AI聊天,可能會發現它的回答“非常教科書化”,總是照搬理論,沒有什麽“人味”。比如你問ChatGPT,“如何用剩菜做一頓飯?”它可能會列出一堆標準化步驟,甚至直接說“建議新鮮食材更好”。而DeepSeek的R1模型會根據你的實際情況,給出更生活化的建議,比如“剩米飯加雞蛋做蛋炒飯,加點火腿丁或者青豆會更香,飯一定不要太軟,這樣炒出來粒粒分明。” 其次,它不僅能回答,還能幫你幹活,效率超高。假設你是一個小企業主,想做一份簡單的廣告文案,又不想請人花錢找文案團隊。現在,你隻需要告訴DeepSeek,“我要給我的餐廳做一個冬季暖湯的推廣廣告”,它會幾秒鍾內生成一段清晰、有創意的文案,甚至還能告訴你怎麽用不同的顏色和字體設計效果更吸引人。 再比如,它可以一邊聯網查信息,一邊幫你總結分析。假設你計劃一次旅行,過去你可能要打開無數個網頁,查天氣、景點推薦、交通路線,然後手動整合信息。DeepSeek可以直接幫你一站式搞定。比如你對它說:“我下周想去加拿大的班夫國家公園,幫我查查最近天氣怎麽樣,適合穿什麽衣服,順便推薦幾個適合家庭出遊的地方。”它會聯網查找最新的天氣預報、整理班夫的景點列表,然後用一段非常人性化的語言告訴你:“下周班夫溫度在-5℃到0℃,記得穿保暖羽絨服和防滑靴,可以去露易絲湖滑冰,也可以選擇溫泉泡湯,非常適合家庭放鬆。” 更厲害的是,它還能分析複雜問題,幫助做決策。比如你想買一輛新能源汽車,但對市場上的品牌、性能和價格完全不了解。過去你可能得看一堆評測文章,還得擔心信息是否可信。DeepSeek不僅能結合你的需求,快速對比市麵上幾款車的優缺點,還能根據你的預算給出推薦。比如你告訴它:“我想買一輛適合冬天開的新能源汽車,預算在30萬元左右。”它會快速篩選出符合條件的車款,並告訴你哪款車續航長、性價比高,以及在冬季使用時需要注意哪些問題。 它不僅好用,還很便宜。DeepSeek對普通用戶來說幾乎不需要太大的硬件支持,也不需要付費訂閱昂貴的服務。它甚至能在老舊手機上流暢運行,讓每個人都能負擔得起先進的AI服務。 它還能寫代碼、做設計,甚至處理複雜文件。比如你是一名初學編程的學生,遇到一個代碼問題,DeepSeek不僅能幫你修複代碼中的錯誤,還能給你詳細解釋為什麽出錯,幫你快速掌握技能。如果你是設計師,想給客戶做一個LOGO,也可以簡單告訴它需求,DeepSeek就能生成多個設計方向的初稿,幫你省下大量時間和精力。 3 DeepSeek讓美國人感到壓力,更多是因為它的性價比和針對用戶需求的本地化優化,而不完全是ChatGPT技術能力的全麵落後。 ChatGPT在技術和市場上依然是全球領先的AI產品。OpenAI投入了數十億美元,用超大規模模型和全球頂尖的算力,打造了一個“通用型AI”,它在語言生成的多樣性、邏輯性和上下文理解上仍然非常強大。例如,對於複雜的科學問題、高階編程需求或長文本的生成,ChatGPT仍然具有明顯優勢。 但ChatGPT也有短板,尤其是麵對普羅大眾的實際需求時,可能顯得有些用力過猛或不夠貼心。比如它可能回答過於學術化、不夠生活化;在涉及特定語言、地區或文化背景時,答案會顯得不夠本地化。 DeepSeek的成功,更多源於務實和精細化設計。它通過工程優化和小規模模型的蒸餾,極大降低了成本,同時對普通人的實際需求進行了深度打磨。它的回答更生活化、更接地氣,懂得用更簡單、實用的語言回應用戶的問題。 關鍵在於,它的“夠用哲學”比“極致”更容易獲得市場青睞。ChatGPT是一個極致的工具,但對於很多普通用戶來說,這種極致可能並不是必要的。 此外,DeepSeek還有一個讓市場感到壓力的關鍵點:成本和普及性。ChatGPT運行的是一個非常龐大的模型,它對算力的依賴極高,這意味著用戶需要付出更多成本才能獲得服務。而DeepSeek通過優化小模型、降低對高端算力的依賴,讓更多普通用戶能以更低的價格甚至免費體驗到AI服務。這種“普惠AI”的策略,使得DeepSeek以一種“降維打擊”的方式,在用戶規模上迅速超越ChatGPT。 4 DeepSeek的成功路徑很“中國”——在美國基礎研究的成果上,踩著巨人的肩膀,集中發力應用端,把“方便、好用、人性化”做到極致。 這類似阿裏巴巴和騰訊的早期模式。阿裏巴巴的電商平台模式有著濃厚的eBay和Amazon的影子,騰訊的社交工具從ICQ中找到了靈感。但它們的成功,並不是因為“複製了美國”,而是因為在本土化的過程中,把用戶體驗和應用層創新做到了極致。 DeepSeek的路徑,和這些互聯網巨頭如出一轍。它的核心技術框架,比如MLA架構和MoE稀疏結構,是基於近年來開源社區和學術界的研究成果,甚至很多技術最早是美國頂尖大學和實驗室提出的。但DeepSeek並沒有停留在技術層麵的炫技,而是通過工程化實現和本地化優化,讓這些技術真正走下神壇,成為普通人日常生活中觸手可及的工具。 舉個簡單的例子,ChatGPT作為矽穀最前沿的AI產品,在邏輯推理和語言生成的準確性上表現優異,但它對普通用戶的生活需求並不是十分敏感。比如,當你問ChatGPT“我要去廣州出差一周,行程怎麽安排”。它可能給出一份非常精確的回答,但內容略顯“公事公辦”,比如列出一堆高大上的會議室和景點,卻忽略了你的預算、興趣或出行便利性。而DeepSeek則會根據你的需求,給出更貼心的建議:“如果預算有限,建議選擇地鐵沿線的經濟型酒店,靠近珠江新城的地鐵站比較方便,晚上可以去天河城逛逛,那裡吃的多、交通方便,體驗也不錯。”這就是人性化打磨的結果。 DeepSeek的這種思路,與中國互聯網企業在過去二十年的發展非常相似。它不是試圖用技術來震懾用戶,顯示自己的牛逼,而是用技術來貼近用戶服務用戶。把複雜的技術隱藏在背後,把簡單好用呈現給前端,這是中國企業在應用端的強項。這種策略,恰好彌補了矽穀科技巨頭的一些短板。 所以,DeepSeek的路徑並不是全新的,它是中國科技企業在全球競爭中找到的本土化創新思路的一次延續。 新創企業DeepSeek屠殺美國AI股,“AI天才少女”羅福莉被視為是幕後關鍵人物之一。 內地“95後”AI“天才少女”羅福莉,被小米創辦人雷軍以人民幣千萬元高薪網羅至旗下。(網絡照片) 5 包括DeepSeek在內的中國互聯網產品的成功,很大程度上得益於中國這些年培養的無數工程師所帶來的人才紅利。這個龐大的工程師群體,成為了中國科技企業崛起的基石。從硬件到軟件,從基礎設施到應用端,中國的工程師數量和質量都達到了前所未有的高度,而這種人才優勢,放眼全球,也隻有美國能夠相提並論。 根據統計,中國每年培養的STEM(科學、技術、工程、數學)畢業生數量是全球最多的,其中工程類畢業生更是佔據了絕對的比例。更重要的是,這些工程師並不僅僅滿足於基礎能力的培養,而是具備了極強的執行力和落地能力。他們可以在非常短的時間內,將一項技術從概念變成產品。這種從0到1的工程能力,正是中國科技企業在全球市場中佔據優勢的原因之一。 據多位與DeepSeek有過接觸的行業人士表述,DeepSeek的優勢之處就在於人才密度極高,且多來自於中國本土市場。 DeepSeek從一開始團隊就是百人左右規模,但個個都很抗打。DeepSeek給出的薪酬待遇非常有競爭力,這讓它一直對人才有很強吸引力。 此前據多家媒體報道,雷軍曾親自出手“挖DeepSeek的人”,支付的薪酬則在千萬元級別。這個人正是DeepSeek-V2的關鍵開發者之一羅福莉,一個95後女生。 內地“95後”AI“天才少女”羅福莉,被小米創辦人雷軍以人民幣千萬元高薪網羅至旗下。(網絡照片) 據量子位整理資料發現,DeepSeek團隊最大的特點就是年輕。應屆生、在讀生,特別是來自清北的應屆生在其中非常活躍。 “隻招1%的天才,去做99%中國公司做不到的事情。”在DeepSeek麵試過的應屆生這樣評價其招聘風格。 但僅有人才紅利是不夠的,中國極具競爭性的市場環境,也在某種程度上“逼”出了這些好產品和創意。中國互聯網行業被普遍稱為“內卷”的代表——無論是電商、社交、短視頻還是AI技術,每個賽道都充滿了激烈的競爭。任何一個新想法,隻要證明有效,就會立刻湧入大量的企業爭搶市場份額。這種內卷式的競爭,雖然殘酷,卻讓中國科技企業形成了一種“超強適應性”:他們不但要快速創新,還要不斷打磨產品、優化成本,甚至通過一輪又一輪的價格戰,將產品普及到最廣泛的用戶群體。 像DeepSeek這樣的產品,就是這種內卷環境的直接產物。它不僅要在技術上有所創新,還要以極低的成本滿足普通用戶的需求,讓每個人都能用得起、用得上。相比之下,美國的科技產品更多服務於中高端市場,用戶覆蓋麵相對有限。 進一步來看,人才紅利與市場內卷的結合,並不僅僅是“多幹活”“低成本”的簡單邏輯,更是催生了一種極具韌性的創新模式。比如,DeepSeek之所以能夠在兩個月內完成研發上線,靠的不是某個天才工程師的個人靈感,而是整個團隊在高壓環境下的高效協作能力。這種能力,源於中國工程師在多年的競爭中磨煉出來的工作習慣:快速反應、高效執行、不斷試錯。這種團隊執行力,不僅在國內獨一無二,放眼全球也極為罕見。 從更大的視角來看,世界上能在科技競爭中真正較量的國家,目前也隻有中國和美國。歐洲、日本、韓國等國家雖然在某些領域具有技術優勢,但無論是人才儲備還是市場規模,都無法與中美相提並論。 中國有龐大的教育體係,每年培養出無數工程師,而美國則吸引了全球最頂尖的人才。在這種二元對抗的格局下,中國的“人才紅利+內卷環境”成為了獨特的競爭優勢,幫助中國在全球科技版圖中佔據了一席之地。 但這種優勢也值得警惕。一方麵,中國的人才紅利正在逐漸走向瓶頸。隨著高等教育的普及,工程師的數量增長放緩,而質量的提升也需要更長時間的積累。另一方麵,過度的內卷雖然催生了好產品,卻可能犧牲了長遠的創新潛力。如果企業和工程師隻能在生存壓力下進行短期優化,而缺乏長期研發的耐心,最終可能會陷入低成本拚殺的惡性循環,難以邁向技術的頂端。 內地“95後”AI“天才少女”羅福莉,被小米創辦人雷軍以人民幣千萬元高薪網羅至旗下。(微博) 6 其實,DeepSeek還揭示了一個讓美國市場更為不安的事實:中國團隊已經不再局限於模仿,而是開始在核心技術上實現突破。 DeepSeek的R1採用了MLA架構和MoE稀疏結構,這是底層注意力機製上的創新,這種技術革新不僅優化了算力效率,還降低了訓練大模型的成本。更讓人震驚的是,這種創新出現在中國,而不是美國矽穀。曾經牢牢掌控全球技術話語權的美國,突然發現,中國企業不僅能用低成本完成高水平的工程化實現,還能在技術路徑上探索出新的方向。 這種技術上的不對稱性,讓美國對自己的科技優勢感到了前所未有的焦慮。 DeepSeek的成功也在美國引發了社會層麵的深刻討論。矽穀的媒體開始逐句翻譯梁文鋒的採訪稿,而CNBC更是製作了長達40分鍾的專題片,試圖解讀這家中國公司如何在如此短的時間內引發全球轟動。對於美國科技界而言,這種高度關注並不是出於好奇,而是一種危機意識的體現。 DeepSeek的成功正在動搖美國長久以來對AI技術和市場的主導權,而這種主導權,不僅僅是經濟優勢,更是戰略安全和全球影響力的象徵。 更大的衝擊在於,DeepSeek的成功讓美國不得不重新審視自己的教育和科技生態。幾十年來,美國一直以開放的科研環境、領先的高等教育和強大的創新文化為核心競爭力。然而,近年來的變化卻讓這一競爭力逐漸削弱。美國高中數學和理工科教育的質量下滑,是一個早已被警告的問題。很多高中生在基礎數學上表現不佳,進入大學時連基本的微積分都無法掌握。這直接導致美國在理工科領域的人才儲備不足。 更令人擔憂的是,美國大學近年來為追求“多元化和包容性”(DEI),在錄取政策上降低了對理工科學生的學術要求,以實現種族平衡。這種做法雖然在短期內緩解了種族矛盾,卻在長遠上影響了高等教育的整體水平。相比之下,中國的教育體係,儘管仍然存在許多問題,卻通過高考這一相對公平的機製,為大量像梁文鋒這樣的“小鎮做題家”提供了改變命運的機會。 7 這場變革才剛剛開始,而它帶來的連鎖反應,將遠遠超出DeepSeek的故事本身。對於中國而言,這不僅是一次技術勝利,更是一次製度與環境深刻優化的契機。 DeepSeek的成功是中國互聯網式創新模式的又一次勝利。它背後的人才紅利和內卷環境,確實是其他國家短時間內難以複製的優勢。但要真正將這種優勢轉化為持續的技術領先力,中國需要的不僅是培養更多的工程師,更要為他們創造一個更寬鬆、更尊重創新規律的環境。 很多人不了解,DeepSeek誕生在杭州。多年來,杭州以“有事服務,無事不擾”的理念,為企業家和科學家提供了足夠寬鬆的創新環境。從阿裏巴巴到網易,從《黑神話:悟空》到DeepSeek,這座城市一次又一次地證明:當一個地方尊重科學、重視人才、優待民企、寬容失敗,創新的奇跡便會不斷湧現。 在即將告別龍年的最後一天,回顧DeepSeek帶來的這場變革,我們能感受到中國人在科技領域的聰明才智,也看到了世界對這種“降維打擊”的震撼。但這一切的背後,更需要我們思考:如果中國的每一座城市都能像杭州這樣,給予科學家和工程師以及民營企業更多的自由和支持,而不是束縛和幹預,會誕生多少個“DeepSeek”? 中國人是聰明能幹的,是不弱於任何種族的,從TikTok,到小紅書,再到DeepSeek,我們反覆向世界證明了這一點。隻要給他們一個寬鬆的環境,不束縛手腳,不設限框框,甚至無需額外的扶持,他們就能憑藉自己的智慧和努力,不斷創造出令人驚歎的奇跡。 新的一年,希望他們獲得更多的包容,更多的自由,讓那些埋頭鑽研、默默耕耘的人有施展才華的舞台,讓更多的創新火花能從這裡迸發。 願中國的每一座城市,都能成為孕育奇跡的沃土。尊重科學,珍惜人才,允許失敗,為世界貢獻更多像DeepSeek這樣的傳奇。 未來,不是靠約束,而是靠信任;不是靠限製,而是靠釋放。願我們用開放與尊重搭建橋樑,讓這片土地上的創造力得到盡情施展。 除夕快樂!