最近2周,DeepSeek無疑成了各類媒體的熱門話題。懂一些IT的、完全不懂的、粉紅、公知 …… 人人都要來說上幾句。有個老朋友僅僅在DeepSeek和ChatGPT上分別問了3個問題,立刻斷言SeepSeek是一堆垃圾,似乎大洋彼岸為此震驚的美國人都是傻瓜。大部分人總是懶得開動自己的大腦,而是屁股決定腦袋,根據自己既有的立場,來詮釋任何看見的現象和事物,無疑這樣的態度對我們真正認識世界沒有幫助。
對於DeepSeek這類專業性非常強的話題,我們這些普通人首先應該知道自己能力的邊界在哪裏,不要試圖對自己不懂的東西大放厥詞,那結果隻能是貽笑大方。比如DeepSeek的工作原理,她的結構、運作過程、各類參數等等,就是專家給說上一天,估計我們也領會不了些許皮毛。但是這並不妨礙我們從媒體、市場、政府和各位科技大佬的反應中,窺探出人工智能領域一些真正有價值的真相。
DeepSeek是幻方量化旗下的AI公司,創立於2023年,創始人梁文峰在量化投資和高性能計算領域有深厚背景。當年5月發布了首款模型人工智能DeepSeek V1。當時《財經十一人》報道稱,國內擁有超過1萬枚GPU的企業不超過5家,而DeepSeek就是其中之一。2024年5月,DeepSeek再次借助大模型價格戰一躍成名。當時,DeepSeek發布了DeepSeek V2開源模型,並在行業內率先降價,將推理成本降到每百萬token僅1塊錢,約等於GPT-4 Turbo的七十分之一。隨後,字節、騰訊、百度、阿裏等大廠紛紛降價跟進。中國大模型價格戰由此揭幕。
在長達一年多的時間裏,西方媒體沒有人對DeepSeek有絲毫興趣,我們自然沒有看到任何相關報道。隻到今年1月22日,微軟CEO薩提亞·納德拉(Satya Nadella )在達沃斯論壇的一檔訪談節目中表示,中國的DeepSeek發展非常迅速,在推理時間上表現非常出色,計算效率極高,給他深刻印象。納德拉的發言一石激起千層浪,頓時在世界媒體引得一片嘩然,DeepSeek-R1 就此躋身大模型競技榜前三,以開源、便宜 20 倍的“身價”與 ChatGPT-4o(2024.11.20)並列。今日 DeepSeek 應用已登頂蘋果中國地區和美國地區應用商店免費 App 下載排行榜,在美區下載榜上超越了 ChatGPT。
難道隻有微軟慧眼識珠,看出來DeepSeek的不凡之處?美國科技七巨頭哪個不是從市場的屍山血海中打拚出來的,它們肯定都會連夜加班測試Deep Seek的虛實,據IT之家的報道,Facebook 母公司 Meta 成立了四個專門研究小組來研究 DeepSeek 的工作原理,並基於此來改進旗下大模型 Llama。再看看特朗普稱讚DeepSeek取得突破是一件好事,因為不必花費大量金錢來發展大模型;美國政府正式對Deep Seek展開國家安全調查等一係列動作。應該可以確定DeepSeek是有著真材實料的人工智能,來自美國的數據表明它在和OpenAI的正麵較量中表現不相上下。
為什麽一個百多人的中國民企,居然在全世界掀起如此軒然大波。因為今天的人工智能90%是由美國公司開發和采用的,美國的科技七巨頭Alphabet (GOOGL; GOOG)、亞馬遜(AMZN)、蘋果(AAPL)、Meta Platforms (META)、微軟(MSFT)、NVIDIA (NVDA)和Tesla(TSLA),幾乎壟斷了人工智慧、雲端運算、線上遊戲以及軟硬體技術的全球市場,而它們的總市值高達11.5兆美元。現在一個名不見經傳的小公司居然要擠進來和他們平起平坐,這如何不讓人吃驚。
去年底在一場家庭聚會上,一個在澳洲知名大公司IT部門工作的朋友告訴我,3年前美國亞馬遜建議這家公司將整個IT部門外包給他們,簽訂雲服務合同,將所有業務遷移至雲端。對於這樣可以節省大量人力開銷的建議,公司權衡利弊後給予采納,然後將自家的IT部門裁掉了90%。公司高層沒有想到的是,當去年亞馬遜再來續簽下一個3年合同時,價錢上漲了300%。這時的公司已經不可能在短期內重建自己的IT隊伍,徹頭徹尾成了一隻待宰的羔羊,這就是資本和壟斷的無情力量。這也是為什麽美國經濟按照購買力平價計算約占全球GDP的20%不到,但是美國股市占比卻高達65%,其中科技七巨頭占據美國股市的25%。拿華爾街日報的話來說,它們可是全世界“會下最大金蛋的鵝”,它們的股票價格中包含著人們對其越來越高的盈利能力的期望。
美國人花了無數時間和上萬億美元構造了史無前例的科技高地,正準備像收刮澳洲公司那樣吃遍天下。誰知道天有不測之風雲,DeepSeek的出現,無疑讓美國人感到一股涼風刺骨。股市寵兒英偉達的股價在今年第一個月從近150下跌到120美元,能夠讓美國華爾街的這幫全世界最精明計算,最殺伐果斷和最冷酷無情的人下單拋售,Deep Seek肯定做對了什麽事 - 對英偉達構成了直接的威脅,英偉達的高端圖形處理單元 (GPU) 已成為全球 AI 訓練的支柱,售價高達4萬美元。雖然英偉達聲稱其GPU對於先進的 AI 流程仍將是必不可少的,但DeepSeek的出現挑戰了這樣的說法。
網上有許多報道,DeepSeek的技術是“蒸餾”或者說是偷竊自ChatGPT。說老實話,“蒸餾”是什麽意思,完全不懂。“蒸餾”和偷竊有什麽區別,我也說不清楚。老話說“捉賊見贓,捉奸見雙”,憑空討論DeepSeek有沒有偷竊ChatGPT的技術,那隻能是浪費時間,隻有閑的無聊的人才會糾結於此。從特朗普總統最近愛說的“常識”來看,如果說一項花費許多年時間,投資幾千億美元的技術,能夠讓人隔著太平洋輕易偷竊或者複製,這似乎也太小瞧科技元老美國人了吧。對此美國AI初創公司Perplexity首席執行官亞拉文·斯裏尼瓦斯(Aravind Srinivas)在接受 CNBC 采訪時表示:“因為 DeepSeek 必須想辦法繞過種種限製,最終實際上打造出了效率更高的東西。他們提出了許多聰明的解決方案。通常的認知是中國人擅長複製。但現實是,DeepSeek 3 中的一些細節非常出色,我甚至不會驚訝 Meta 會借鑒其中的一些內容,並將其應用到 Llama 模型中。這並不是說他們在複製,而是他們在創新。”相信行內專家的評論更貼近實情。
再說今天全世界在美國麵前俯首稱臣之時,有誰會計較當初美國從歐洲剽竊了多少技術;現在上達權貴富豪下至販夫走卒,當人們手捧一杯純清透亮香氣撲鼻的英國紅茶,享受其中的時候,又有誰會想到英國人鬼鬼祟祟從中國偷竊製茶技術的艱辛過程,NO ONE CARE! 現實世界講究的是你能夠提供什麽,我又能夠從中得到什麽。
總的來說,美國專家們對DeepSeek的功能基本認同,但是對其聲稱隻花了600萬美元來開發這個模型普遍存疑。Scale AI的亞曆山大·王稱DeepSeek擁有5萬塊英偉達H100高端芯片,盡管他們不能公開承認;馬斯克多次發表意見,認為DeepSeek 如此低的訓練成本是不可能的。我們普通老百姓很難對這樣專業性極強的問題做出論斷,但是從“常識”出發還是可以看出其中的端倪。雖然說杭州的研發成本肯定會比矽穀要低得多,但600萬美元在悉尼隻是買一套好房子的錢,想憑此訓練出一個世界一流的人工智能模型出來,這顯然是不可能的,這個牛吹的太大了。自從宋襄公信守諾言被打得大敗之後,隻有為了達到目的不擇手段的人才能在中國立足,謊報數據更是小事一樁。誰也不知道DeepSeek到底用了幾塊英偉達芯片,不過在美國嚴密封禁之下,DeepSeek又是如何拿到英偉達的高端芯片,這也許是一個永遠不會曝光的秘密。
相對於ChatGPT的閉源,DeepSeek的開源也引起了廣泛的關注,Meta首席AI科學家Yann Lecun表示,DeepSeek-R1麵世與其說意味著中國公司在AI領域正在超越美國公司,不如說意味著開源大模型正在超越閉源。“DeepSeek會從開放研究和開源中獲利,可能會類似Meta的PyTorch和Llama。他們提出新想法,並在別人的工作基礎上實現。因為他們的工作是公開和開源的,每個人都能從中獲利,這就是開放研究和開源的力量。” 因為曆史的經驗證明,一個好的開源模型會吸引全世界的AI工作者在這個基礎上開發,這個模型的擁有者可以借此掌控全球AI開發者的心智和生態係統,使國家能夠擁有更少的資源來獨立發展強大的AI能力,這種發展無疑可以改變技術領域的國際關係和競爭平衡。亞拉文·斯裏尼瓦斯認為“如果整個美國AI生態係統都依賴於中國的開源模型,那將是非常危險的......人們曾質疑是否應該信任紮克伯格,但現在的問題是,我們是否應該信任中國?”這應該就是美國人開始擔心國家安全的原因。
DeepSeek的問世,無疑攪了美國人的一朝春夢,人工智能的壟斷可能就此被打破,遊戲規則也很可能就此被改寫。當然到目前為止,這一切僅僅是可能而已,中國人對此有著清醒的認識。DeepSeek創辦人梁文鋒在1月20日下午成為中國總理李強的座上賓,參加了中國國務院總理座談會。梁文鋒在會上說:“盡管中國企業正努力追趕,但美方限製先進芯片出口中國仍是瓶頸。”同時清華大學計算機係副教授劉知遠指出,“AGI新技術還在加速演進,未來發展路徑尚不明確。我們仍在追趕階段,已經不是望塵莫及,但也隻能說是望其項背”,“在別人已經探索出來的路上跟隨快跑是相對容易的,接下來我們要麵對一團未來迷霧。”
OpenAI的首席執行官薩姆·奧爾特曼(Samuel Harris Altman)去年訪問印度時,曾傲慢地宣稱“在訓練基礎模型方麵與我們競爭完全沒有希望”、“不應該嚐試(競爭)”、“你能做的也就嚐試而已”,把軟件能力比中國還要厲害,本應該率先搞出AI模型的印度人嚇唬的心灰意冷。雖然現在中國人依然處於追趕階段,但是DeepSeek的發布,已經成功激起了印度人的攀比之心,印度通信以及電子和信息技術部長阿什維尼·瓦伊什瑙表示自己會親自領軍來建立本地化AI模型;英國議會也開始討論建立自己的AI模型。事實上,DeepSeek的AI模型打破了全世界對財大氣粗美國巨頭的迷信,AI模型從此變得不再高不可攀,相信從今以後會有更多的國家加入研發人工智能的行列,美國贏家通吃的局麵開始動搖,全世界的AI用戶都將從中受益匪淺,也許這才是DeepSeek對人類最大的價值所在。