最近2周，DeepSeek無疑成了各類媒體的熱門話題。懂一些IT的、完全不懂的、粉紅、公知 …… 人人都要來說上幾句。有個老朋友僅僅在DeepSeek和ChatGPT上分別問了3個問題，立刻斷言SeepSeek是一堆垃圾，似乎大洋彼岸為此震驚的美國人都是傻瓜。大部分人總是懶得開動自己的大腦，而是屁股決定腦袋，根據自己既有的立場，來詮釋任何看見的現象和事物，無疑這樣的態度對我們真正認識世界沒有幫助。

對於DeepSeek這類專業性非常強的話題，我們這些普通人首先應該知道自己能力的邊界在哪裏，不要試圖對自己不懂的東西大放厥詞，那結果隻能是貽笑大方。比如DeepSeek的工作原理，她的結構、運作過程、各類參數等等，就是專家給說上一天，估計我們也領會不了些許皮毛。但是這並不妨礙我們從媒體、市場、政府和各位科技大佬的反應中，窺探出人工智能領域一些真正有價值的真相。

DeepSeek是幻方量化旗下的AI公司，創立於2023年，創始人梁文峰在量化投資和高性能計算領域有深厚背景。當年5月發布了首款模型人工智能DeepSeek V1。當時《財經十一人》報道稱，國內擁有超過1萬枚GPU的企業不超過5家，而DeepSeek就是其中之一。2024年5月，DeepSeek再次借助大模型價格戰一躍成名。當時，DeepSeek發布了DeepSeek V2開源模型，並在行業內率先降價，將推理成本降到每百萬token僅1塊錢，約等於GPT-4 Turbo的七十分之一。隨後，字節、騰訊、百度、阿裏等大廠紛紛降價跟進。中國大模型價格戰由此揭幕。

在長達一年多的時間裏，西方媒體沒有人對DeepSeek有絲毫興趣，我們自然沒有看到任何相關報道。隻到今年1月22日，微軟CEO薩提亞·納德拉（Satya Nadella ）在達沃斯論壇的一檔訪談節目中表示，中國的DeepSeek發展非常迅速，在推理時間上表現非常出色，計算效率極高，給他深刻印象。納德拉的發言一石激起千層浪，頓時在世界媒體引得一片嘩然，DeepSeek-R1 就此躋身大模型競技榜前三，以開源、便宜 20 倍的“身價”與 ChatGPT-4o（2024.11.20）並列。今日 DeepSeek 應用已登頂蘋果中國地區和美國地區應用商店免費 App 下載排行榜，在美區下載榜上超越了 ChatGPT。

難道隻有微軟慧眼識珠，看出來DeepSeek的不凡之處？美國科技七巨頭哪個不是從市場的屍山血海中打拚出來的，它們肯定都會連夜加班測試Deep Seek的虛實，據IT之家的報道，Facebook 母公司 Meta 成立了四個專門研究小組來研究 DeepSeek 的工作原理，並基於此來改進旗下大模型 Llama。再看看特朗普稱讚DeepSeek取得突破是一件好事，因為不必花費大量金錢來發展大模型；美國政府正式對Deep Seek展開國家安全調查等一係列動作。應該可以確定DeepSeek是有著真材實料的人工智能，來自美國的數據表明它在和OpenAI的正麵較量中表現不相上下。

為什麽一個百多人的中國民企，居然在全世界掀起如此軒然大波。因為今天的人工智能90%是由美國公司開發和采用的，美國的科技七巨頭Alphabet (GOOGL; GOOG)、亞馬遜(AMZN)、蘋果(AAPL)、Meta Platforms (META)、微軟(MSFT)、NVIDIA (NVDA)和Tesla(TSLA)，幾乎壟斷了人工智慧、雲端運算、線上遊戲以及軟硬體技術的全球市場，而它們的總市值高達11.5兆美元。現在一個名不見經傳的小公司居然要擠進來和他們平起平坐，這如何不讓人吃驚。

去年底在一場家庭聚會上，一個在澳洲知名大公司IT部門工作的朋友告訴我，3年前美國亞馬遜建議這家公司將整個IT部門外包給他們，簽訂雲服務合同，將所有業務遷移至雲端。對於這樣可以節省大量人力開銷的建議，公司權衡利弊後給予采納，然後將自家的IT部門裁掉了90%。公司高層沒有想到的是，當去年亞馬遜再來續簽下一個3年合同時，價錢上漲了300%。這時的公司已經不可能在短期內重建自己的IT隊伍，徹頭徹尾成了一隻待宰的羔羊，這就是資本和壟斷的無情力量。這也是為什麽美國經濟按照購買力平價計算約占全球GDP的20%不到，但是美國股市占比卻高達65%，其中科技七巨頭占據美國股市的25%。拿華爾街日報的話來說，它們可是全世界“會下最大金蛋的鵝”，它們的股票價格中包含著人們對其越來越高的盈利能力的期望。

美國人花了無數時間和上萬億美元構造了史無前例的科技高地，正準備像收刮澳洲公司那樣吃遍天下。誰知道天有不測之風雲，DeepSeek的出現，無疑讓美國人感到一股涼風刺骨。股市寵兒英偉達的股價在今年第一個月從近150下跌到120美元，能夠讓美國華爾街的這幫全世界最精明計算，最殺伐果斷和最冷酷無情的人下單拋售，Deep Seek肯定做對了什麽事 - 對英偉達構成了直接的威脅，英偉達的高端圖形處理單元 (GPU) 已成為全球 AI 訓練的支柱，售價高達4萬美元。雖然英偉達聲稱其GPU對於先進的 AI 流程仍將是必不可少的，但DeepSeek的出現挑戰了這樣的說法。

網上有許多報道，DeepSeek的技術是“蒸餾”或者說是偷竊自ChatGPT。說老實話，“蒸餾”是什麽意思，完全不懂。“蒸餾”和偷竊有什麽區別，我也說不清楚。老話說“捉賊見贓，捉奸見雙”，憑空討論DeepSeek有沒有偷竊ChatGPT的技術，那隻能是浪費時間，隻有閑的無聊的人才會糾結於此。從特朗普總統最近愛說的“常識”來看，如果說一項花費許多年時間，投資幾千億美元的技術，能夠讓人隔著太平洋輕易偷竊或者複製，這似乎也太小瞧科技元老美國人了吧。對此美國AI初創公司Perplexity首席執行官亞拉文·斯裏尼瓦斯（Aravind Srinivas）在接受 CNBC 采訪時表示：“因為 DeepSeek 必須想辦法繞過種種限製，最終實際上打造出了效率更高的東西。他們提出了許多聰明的解決方案。通常的認知是中國人擅長複製。但現實是，DeepSeek 3 中的一些細節非常出色，我甚至不會驚訝 Meta 會借鑒其中的一些內容，並將其應用到 Llama 模型中。這並不是說他們在複製，而是他們在創新。”相信行內專家的評論更貼近實情。

再說今天全世界在美國麵前俯首稱臣之時，有誰會計較當初美國從歐洲剽竊了多少技術；現在上達權貴富豪下至販夫走卒，當人們手捧一杯純清透亮香氣撲鼻的英國紅茶，享受其中的時候，又有誰會想到英國人鬼鬼祟祟從中國偷竊製茶技術的艱辛過程，NO ONE CARE! 現實世界講究的是你能夠提供什麽，我又能夠從中得到什麽。

總的來說，美國專家們對DeepSeek的功能基本認同，但是對其聲稱隻花了600萬美元來開發這個模型普遍存疑。Scale AI的亞曆山大·王稱DeepSeek擁有5萬塊英偉達H100高端芯片，盡管他們不能公開承認；馬斯克多次發表意見，認為DeepSeek 如此低的訓練成本是不可能的。我們普通老百姓很難對這樣專業性極強的問題做出論斷，但是從“常識”出發還是可以看出其中的端倪。雖然說杭州的研發成本肯定會比矽穀要低得多，但600萬美元在悉尼隻是買一套好房子的錢，想憑此訓練出一個世界一流的人工智能模型出來，這顯然是不可能的，這個牛吹的太大了。自從宋襄公信守諾言被打得大敗之後，隻有為了達到目的不擇手段的人才能在中國立足，謊報數據更是小事一樁。誰也不知道DeepSeek到底用了幾塊英偉達芯片，不過在美國嚴密封禁之下，DeepSeek又是如何拿到英偉達的高端芯片，這也許是一個永遠不會曝光的秘密。

相對於ChatGPT的閉源，DeepSeek的開源也引起了廣泛的關注，Meta首席AI科學家Yann Lecun表示，DeepSeek-R1麵世與其說意味著中國公司在AI領域正在超越美國公司，不如說意味著開源大模型正在超越閉源。“DeepSeek會從開放研究和開源中獲利，可能會類似Meta的PyTorch和Llama。他們提出新想法，並在別人的工作基礎上實現。因為他們的工作是公開和開源的，每個人都能從中獲利，這就是開放研究和開源的力量。” 因為曆史的經驗證明，一個好的開源模型會吸引全世界的AI工作者在這個基礎上開發，這個模型的擁有者可以借此掌控全球AI開發者的心智和生態係統，使國家能夠擁有更少的資源來獨立發展強大的AI能力，這種發展無疑可以改變技術領域的國際關係和競爭平衡。亞拉文·斯裏尼瓦斯認為“如果整個美國AI生態係統都依賴於中國的開源模型，那將是非常危險的......人們曾質疑是否應該信任紮克伯格，但現在的問題是，我們是否應該信任中國？”這應該就是美國人開始擔心國家安全的原因。

DeepSeek的問世，無疑攪了美國人的一朝春夢，人工智能的壟斷可能就此被打破，遊戲規則也很可能就此被改寫。當然到目前為止，這一切僅僅是可能而已，中國人對此有著清醒的認識。DeepSeek創辦人梁文鋒在1月20日下午成為中國總理李強的座上賓，參加了中國國務院總理座談會。梁文鋒在會上說：“盡管中國企業正努力追趕，但美方限製先進芯片出口中國仍是瓶頸。”同時清華大學計算機係副教授劉知遠指出，“AGI新技術還在加速演進，未來發展路徑尚不明確。我們仍在追趕階段，已經不是望塵莫及，但也隻能說是望其項背”，“在別人已經探索出來的路上跟隨快跑是相對容易的，接下來我們要麵對一團未來迷霧。”

OpenAI的首席執行官薩姆·奧爾特曼（Samuel Harris Altman）去年訪問印度時，曾傲慢地宣稱“在訓練基礎模型方麵與我們競爭完全沒有希望”、“不應該嚐試（競爭）”、“你能做的也就嚐試而已”，把軟件能力比中國還要厲害，本應該率先搞出AI模型的印度人嚇唬的心灰意冷。雖然現在中國人依然處於追趕階段，但是DeepSeek的發布，已經成功激起了印度人的攀比之心，印度通信以及電子和信息技術部長阿什維尼·瓦伊什瑙表示自己會親自領軍來建立本地化AI模型；英國議會也開始討論建立自己的AI模型。事實上，DeepSeek的AI模型打破了全世界對財大氣粗美國巨頭的迷信，AI模型從此變得不再高不可攀，相信從今以後會有更多的國家加入研發人工智能的行列，美國贏家通吃的局麵開始動搖，全世界的AI用戶都將從中受益匪淺，也許這才是DeepSeek對人類最大的價值所在。

切換到網頁版

南半球名博

周末聊聊DeepSeek

南半球 (2025-02-01 13:19:37) 評論 (7)

周末聊聊DeepSeek

今日熱點

一周熱點

南半球名博

周末聊聊DeepSeek

周末聊聊DeepSeek

今日熱點

一周熱點

南半球 名博

周末聊聊DeepSeek

南半球名博