一場新的AI軍備競賽要開始了嗎？

2025-02-07 05:22:59

您好，這個問題我暫時無法回答，讓我們換個話題再聊聊吧。 ——DeepSeek

上一篇寫DeepSeek的文章僅僅幾個小時就“閃”了。當時還感覺一頭霧水。原本文章裏還寫到了春晚的機器人扭秧歌。後來想想終究是去掉了。文章也從最初的近6000字減少到3500字。即便如此依然沒能逃脫厄運。好吧，我認輸。這年頭，說點真話太難了。如果再說出問題的底層邏輯，那就有可能是十惡不赦。

人家說DeepSeek隻需要幾個沒有經驗的大學畢業生就能創造出妖妖領先。我就應該附和，藏經閣裏還有“掃地僧”沒拿出來。人家說DeepSeek的開發成本隻有幾百萬美金，用的還都是過時的GPU芯片。我就應該說，手搓芯片那都是小兒科，美帝崩潰在即褲襠已經濕了。最聰明的做法應該是像神拳大V們一樣，站在前列腺上炮口直懟美帝下三路。但是我，偏偏一直都是一個不夠聰明的人。別人都是看破不說破，我卻是既看破又說破。結果一不小心又踩到了一部分人的G點上。我能想象出牠們的“瓦片心”碎了一地的樣。瓦片心，是我最近的一個原創詞。之所以不叫玻璃心是因為，牠們那顆心沒玻璃那麽純淨。而是既汙穢又脆弱，就像垃圾堆裏終年見不得陽光的一片烏漆麻黑的破瓦片。牠們最常見的問題是是對事物缺乏理性的對待。熱衷於吹捧出一個又一個不能被質疑的妖妖領先。

既然覺得DeepSeek遠超ChatGPT。至少應該對比應用一下才更有說服力不是嗎？我把升天文《DeepSeek，是否會毀於一場“盲目狂歡”》輸入ChatGPT。然後提問“請幫我分析一下文章為什麽會被刪除，以及有什麽地方出現違規”。ChatGPT經過短暫分析給出了6個方麵的結論。其中說到我這篇文章涉及傳播負麵情緒、抨擊“民族科技狂歡”；質疑國內AI產品的國際競爭力，與國內主流輿論導向不符雲雲。然後又非常貼心的給出了6條對應的修改建議。包括刪除哪些有可能觸及敏感的用詞，以及心照不宣的隱喻。在這一刻我突然發現自己還真的不如機器人圓滑老到。君不見，遇到了一些難以回答的問題，連DeepSeek都會告訴你，您好，這個問題我暫時無法回答，讓我們換個話題再聊聊吧。

被閃的文章裏我曾提到一項大模型的評判指標。即：新聞事件的準確性。關鍵要點是：事實性、時效性、信息源可信度和多角度理解。所謂多角度理解會評估模型在報道新聞事件時是否存在偏見，或是否能涵蓋多個觀點。於是有人留言說，問題是DeepSeek也不是搜索引擎啊。但我的觀點是，並不是每一個人都會用這個大模型來編寫程序做數學題。大部分人還是會提一些自己感興趣的問題。這些問題自然而然的會與新聞事件有關。例如，我們可以對ChatGPT提問：發生在美國華盛頓的軍用直升機撞擊民航客機事件，與恐怖主義或者政治陰謀有關嗎？大模型在回答這樣的問題的時候，就包括了對真實發生的事件的描述，同時又會給出信息的來源和不帶偏見性的理解。DeepSeek確實不是搜索引擎，但搜索和理解本身就是一體的。所以領先的搜索引擎會將大模型整合到平台生態中。大模型采集什麽樣的信息“源”，決定了你能得到什麽樣的理解和結論。

我知道，此刻有人會跳出來質問：難道DeepSeek沒有給美國AI科技圈帶來震動嗎？英偉達股價沒有跳水嗎？這其實就是“ETC成精——自動抬杠”的人常見的問題：凡事隻看表麵而對底層邏輯缺乏認知。

我還是那句話，不吹不黑的看待這次DeepSeek的橫空出世。如我上篇文章所說，相較於國內其他版本的大模型來說，DeepSeek確實有過人之處。獨辟蹊徑的算法打破了矽穀精英的慣有邏輯。不可忽視的是，大家對於科技的底層態度不一樣，美國AI界對DeepSeek的重視是超越了意識形態的。在自由的市場經濟中，隻要有好東西，管它姓什麽，第一時間先用上增強自身競爭力才是王道。所以在這兩天，DeepSeek已經被多家領先的科技企業納入其生態係統。微軟、英偉達和亞馬遜等公司已將 DeepSeek-R1 模型集成到各自的平台中。微軟已在其 Azure AI Foundry 和 GitHub 的模型目錄中添加了 DeepSeek-R1，開發者可以利用該模型進行測試和構建基於雲的應用程序和服務。英偉達也宣布，DeepSeek-R1 模型現已作為 NVIDIA NIM 微服務的預覽版提供，開發者可以測試和體驗該 API。但所有這些並不代表別人“慫了”“尿了”，從這種務實、開放的精神中反而能看到企業的盛名不虛。

這些企業之所以爭先恐後的把DeepSeek拉入懷抱，除了看中其在代碼生成、數學推理能力方麵的技術優勢；以及模型輕量化，適用於本地 AI 計算，同時具有跨平台部署能力以外，還有一個重要的原因是企業希望減少成本，降低對 OpenAI 的依賴；同時增強企業在亞洲市場（尤其是中國市場）的 AI 競爭力。在這個科技飛速發展的時代，大家其實都有壓箱底的東西，願意什麽時候拿出來才是關鍵。我可以斷言，DeepSeek將會刺激到美國的AI界，進而引發一場波及整個世界的新的AI軍備競賽。

這裏要順便說一句為什麽英偉達會暴跌。其實英偉達超高的股價和對定價權的壟斷早就讓業內大佬看不順眼。大家其實就在等DeepSeek這樣的一個機會，適時用市場教育一下英偉達。在一個沒有權力幹擾的自由的市場經濟環境下，擁有核心競爭力的大科技公司想要控製世界並不容易。因為隨時會出現一個“破局者”用獨辟蹊徑的方式打破壟斷。同時給那些被財富燒得發燙的大腦降降溫。

任何一項科技成果，最終都會在應用中體現出價值。大模型之下，還會有實用性更強的小模型。恰如我之前的升天文中所寫：ChatGPT和Gemini這樣的大模型摒棄了人工標注的”訓練拐杖”，開始具備學習和自主推理的潛能。這不僅是技術方法的創新，更是AI對於世界的認知模式發生了改變。稱之為“覺醒”一點都不過分。而一些小模型可以基於大模型的數據，借助蒸餾技術繼承知識和推理能力。相當於老師把自己積累的精華傳承給學生。讓小模型在任務表現上大幅躍升，同時實現成本的大幅降低。這本身就應該是AI發展的未來。

引述一位技術達人的話：這場大模型覺醒和小模型崛起的雙重革命正重塑AI行業規則。大模型拓展認知邊界，小模型釋放商業勢能。當技術邏輯與商業思維完成融合，智能時代的格局不再是單一的算法至上，而是商業賦能技術、技術重構商業的雙向進化。鑒於不同開發思路的AI模型會有不同的解題方法。人們更可以方便的把同一個問題扔給不同的AI模型。然後綜合幾個AI的答複得出成果。目前，麵對著世界領先平台爭相納入DeepSeek，我們其實更需要以開放和包容的心態接納其他AI模型的接入。在科技全球化的時代背景下，唯有全麵和深入的交流與合作才會讓AI更聰明。

我們小時候都學過王安石的散文《傷仲永》。其中講述了神童方仲永從天賦異稟到泯然眾人的故事。課文旨在教育我們：天賦隻是起點，持續的學習和努力才決定最終的成就。但是在現實中，有多少天資卓越的“仲永”是一次次的被毀於“父利其然也，日扳仲永環謁於邑人，不使學”呢？又有多少是被“瓦片兒”們的迷之狂歡葬送了的？我們這一代人真的太喜歡掃地僧的故事。以至於熱播的網絡無腦劇都充滿了“穿越到過去，用現代科技秒殺古人”的橋段。不願意承認別人的優秀，不願意主動修正和提升自己，不能包容和接納，缺乏麵向未來的視野和境界其實是典型的弱者心態。

今天的文章就寫到這裏吧。對不起，大過節的又給“瓦片兒”們添堵了。在這個世界上，有時候免費的才是最貴的。360曾率先垂範，給了我們免費的殺毒軟件，也給了我們無法刪除的360“全家桶”。當某樣東西可以讓我們免費使用的時候，應該想想他會從我們這裏拿走什麽呢？世界就是個草台班子。如果有朝一日AI變得滑頭，學會了撒謊；或者有一天你感覺自己的智商遭到了AI的強奸，你也隻好忍著。因為你不可以說不。如果你非想要一個答案，得到的回答是：您好，這個問題我暫時無法回答，讓我們換個話題再聊聊吧。

作者：如是大牛哥

sandstone2 發表評論於 2025-02-08 14:52:14

回複 'markyang' 的評論 : 有道理.

markyang 發表評論於 2025-02-07 14:01:14

文章不錯，其實DEEPSEEK屬於典型的理工科學生，大量關注，包括微調於幾個局部的領域，所以看似局部成績不錯，但是如果對比文科，曆史，甚至是簡單的生活類等等，我對比過DS，CHATGPT，GEMINI，DS的回答是最弱的，當然其中有部分是中文互聯網本身的數據比較爛有關，所以，DEEPSEEK的確更加像一個LLM界的拚多多，某些局部突出，但是整體輸出質量很普通，當然要承認它的算法突破性，不過也沒有那麽懸，有論文比較過，CHATGPT的訓練成本也已經下降90%，達到了千萬美元級別。

登錄後才可評論.

切換到網頁版

sandstone2 名博

一場新的AI軍備競賽要開始了嗎？

sandstone2 (2025-02-07 05:22:59) 評論 (2)

您好，這個問題我暫時無法回答，讓我們換個話題再聊聊吧。 ——DeepSeek

作者：如是大牛哥

一場新的AI軍備競賽要開始了嗎？

今日熱點

一周熱點

sandstone2 名博

一場新的AI軍備競賽要開始了嗎？