DeepSeek，是否會毀於一場“愚蠢的狂歡”？

太陽下麵就沒有啥新鮮事

原本想趁著假期好好休息一下的。人總是會被各種繁瑣事務塞得滿滿當當。對中國人來說尤為如此。春節假期可以讓人有一段時間放空自己。然後再以空杯的心態重新麵對新的一年。但今天這個話題實在忍不住要講一講。

我從小就知道，年，是有味道的。

當左鄰右舍紛紛傳來DuangDuang的剁餡聲，年就到了。那時候的年，味道很重。是油鍋裏滋啦滋啦的熱油的味道；是胡同裏誰家小孩剛放完鞭炮以後的硫磺味兒；是大眾浴池裏熱烘烘濕乎乎的水氣味兒；還有雜貨店裏醬油醋帶魚肥肉混合在一起的味道。長大了一些，年味兒就變成了鋪天蓋地的煙花，新提的車子內飾的皮革味兒；寺廟的香煙繚繞；還有飯館裏的觥籌交錯和廟會上的烤串味道。今年的北京，看電視春晚的人少了，串門兒的人少了，街上的人少了，開門的飯館少了，發拜年紅包的人也少了。有些時候，空氣中充斥著一種不真實的味道或者索性沒有味道也算是味道。

今年另一個巨大的變化就是，人們開始紛紛用AI工具編寫個性化的拜年信息。追本溯源，發信息拜年不過是二十幾年的曆史。隨著手機的普及，讓短信拜年成為一時之尚。智能手機和微信又催生出微信拜年和拜年紅包。每到這個時候，會有一部分人挖空心思編寫最能代表自己心意的文字。但大部分人更喜歡“拿來主義”。用別人的內容“蒸餾”一下變成自己的，然後一鍵群發。總之都是在表達心意，也談不上是孰對孰錯。如果說短信拜年的時代，人們還有興趣仔細閱讀一下文字，咂摸一下文字裏的滋味；微信拜年則變得越來越敷衍了事。反正都是一些見慣了的老詞翻過來掉過去的排列組合。就像超市裏每到春節必然循環播放的那種應景歌曲。你不喜歡它，但就是想不出辦法擺脫它。

2024，應該算是國人開始普遍接受AI的元年。但大多數人對於AI的使用還是基於詢問一些簡單的問題。好一點的，可以幫忙撰寫文案或者工作計劃。項目公司投標的標書都普遍比以往的厚度增加了1/3。這也要拜AI所賜。得益於AI的推廣應用，今年春節又有了新的應用場景。我身邊的很多朋友開始用AI編寫個性化拜年信息。隻要在AI中輸入你想要的風格以及表達的內容，短短十幾秒鍾就可以得到一篇“佳作”。無論是唐詩還是宋詞皆可信手拈來。然後就可以欣欣然的將其作為自己的祝福發送給親朋好友。很多人沒有想到的是，AI大模型的民間爆發竟會得益於春節的拜年信息。

說到今年春節最受關注的AI大模型，非橫空出世的DeepSeek莫屬。DeepSeek於1月27日突然爆紅。當天，其AI智能助手應用在中國和美國的蘋果應用商店免費榜單中同時登頂，超越了ChatGPT，成為下載量最高的免費應用。這一現象直接引發了美國科技股的劇烈波動，英偉達等主要科技公司的股價大幅下跌。聞此佳訊，簡中互聯網上可謂彩旗招展鑼鼓喧天一片喜氣洋洋。刹那間，DeepSeek被捧為了改變國運的神器，AI技術進步一杆大旗。又一次，中國贏麻了，美帝被嚇尿了。連中專生盧大師都搶在除夕發文稱“DeepSeek痛擊美國東林黨”。嗯，好吧，還記得當初“天才少女”橫空出世的時候，這廝曾撰寫長文稱“中國有14億人，普通人中不乏有很多天才，隻是有些被埋沒了，而薑萍剛好是那個被發掘的天才”。但真實結果曝光後，這廝就默默的把文章刪了。反正牠培養的韭菜也沒啥記性。

不吹不黑的說，DeepSeek確實給美國AI科技圈帶來了不小的震動。英偉達股價在1月27日下跌了約17%，市值蒸發約5890億美元，創下美國股市曆史上單日市值損失的紀錄。但科技圈僅僅兩天時間就從驚呼轉為一片質疑。有研究團隊指出，DeepSeek是在ChatGPT的數據基礎上“蒸餾”出來的。換句話說就是，ChatGPT接受的是普遍的大模型訓練。蒸餾就是從訓練結果中提煉出精華數據，幫助訓練出成本更低的小模型。這一說法得到了很多業內人士的驗證。甚至被DeepSeek親口承認。不過我相信這個小小的bug很快就會被DeepSeek的技術團隊修正。

DeepSeek，到底是真的革了AI時代的命，還是另一個“天才少女薑萍”？我知道在這個時候說這種話無疑是極大的政治不正確。或許會有人質問，你算老幾？你懂什麽叫大語言模型麽？是啊！我確實談不上懂AI，但是我懂“他們”啊！我懂那些搞“快科技”的人是怎麽圈錢的啊！美帝不懂這世上還有“刷榜”這種事，可我懂啊！DeepSeek公布了很多可以壓ChatGPT一頭的測試數據。但這些數據和研發成本費用都是開發團隊自己發布的。相信在接下來的幾天，其他專業團隊也會測試這些“跑分”的真實性以及後台數據庫的來源。越來越多的證據可以證明DeepSeek的研發成本是否符合邏輯。畢竟，大模型的開發除了需要昂貴的硬件成本，還需要源源不斷的信息投喂。信息這塊的成本到底如何，DeepSeek語焉不詳。還是那句話，太陽下麵就沒有啥新鮮事！

我用了兩天時間對比感受了一下DeepSeek和ChatGPT的區別。同時也和AI領域的朋友進行了一定深度的交流。可以說，相較於國內其他版本的大模型來說，DeepSeek確實有過人之處。即便是對上國外其他一些大模型也有很多亮眼的地方。首先從技術上講，DeepSeek采用更高效的推理架構，同時通過蒸餾競爭對手的數據，使得計算成本更低，推理速度更快。這就帶來了開發和使用成本的大幅下降。減少了GPU和算力工程師的使用，自然打破了矽穀精英的慣有邏輯。這才導致了英偉達的股價暴跌。當然，低成本優勢的另一個重要原因就是信息的來源。畢竟中國是一個信息大國。而且對於信息的掌握又非常集中。此外，DeepSeek在數學推理、邏輯分析和代碼生成方麵也表現突出。在語言理解方麵，DeepSeek提供多語言支持，但中文優化明顯比ChatGPT更好。從市場推廣的角度講，DeepSeek更是具有ChatGPT無法比擬的優勢。這麽說吧，你能見到ChatGPT隔空操控數以萬計的自媒體賬號“扶清滅洋”麽。

當然，DeepSeek的劣勢也是不容忽略的。在大模型的測試成績中，有一項重要指標是新聞事件的準確性。關鍵要點是：事實性、時效性、信息源可信度和多角度理解。所謂多角度理解會評估模型在報道新聞事件時是否存在偏見，或是否能涵蓋多個觀點。根據新聞可靠性評級機構NewsGuard於2025年1月29日發布的報告，DeepSeek的聊天機器人在處理新聞和信息時的準確率僅為17%，在所評估的11款人工智能聊天機器人中排名第十。落後於OpenAI的ChatGPT和穀歌的Gemini等西方競爭對手。報告指出，DeepSeek的聊天機器人在30%的情況下重複了錯誤信息，而在53%的情況下提供了模糊或無用的回答，總體錯誤率達83%。除此以外，基於數據蒸餾訓練出來的小模型，往往很難超越上一代的“老師”模型。更何況，這位老師還在不斷發展和進步。

其實我並不認為DeepSeek坦然承認自己蒸餾了ChatGPT數據是一件很丟人的事情。當然，這麽做是否合規合法又是另外一碼事。ChatGPT和Gemini這樣的大模型摒棄了人工標注的”訓練拐杖”，開始具備學習和自主推理的潛能。這不僅是技術方法的創新，更是AI對於世界的認知模式發生了改變。稱之為“覺醒”一點都不過分。而一些小模型可以基於大模型的數據，借助蒸餾技術繼承知識和推理能力。相當於老師把自己積累的精華傳承給學生。讓小模型在任務表現上大幅躍升，同時實現成本的大幅降低。這本身就應該是AI大模型發展的未來。我看到一位技術達人如是說：這場大模型覺醒和小模型崛起的雙重革命正重塑AI行業規則。大模型拓展認知邊界，小模型釋放商業勢能。當技術邏輯與商業思維完成融合，智能時代的格局不再是單一的算法至上，而是商業賦能技術、技術重構商業的雙向進化。

從我個人的角度講，當然希望能看到中國人創造出具有競爭力的商業大模型。但是尚需明確一點，大模型終究是一個工具。既然是工具，就要明確工具是為誰服務的；是否允許提出質疑；是否能帶給人獨立思考而不是強化某種偏見。當然還有非常重要的一點是要說真話。如果一個大模型連準確描述新聞事件都做不到，這樣的大模型就算編程能力再強，終究也是個殘障。某度當年號稱可以替代穀歌。但如今穀歌已經成為世界頂尖的人工智能公司。某度還在靠售賣不清不楚的醫療廣告賺錢。

AI在這個時代，已經無可爭議的成為“國家競爭力”的代名詞。但是，無數自媒體用盲目自嗨和網絡狂歡的方式為DeepSeek“慶生”，真的有好處嗎？真的有用處嗎？科技不是關上門搞出來的。在當今這個時代，科技的每一分進步都離不開國際合作。隻有小腦發育不完全、大腦完全不發育的盧粉之流，才會相信“天才少女”的神話。如果“天才少女”這種故事在國內講講也就罷了。但急於把DeepSeek捧上神壇，會帶來什麽呢？再寬泛一點說，對於那些需要與國際同行保持交流的技術研發人員來說，他們獲得更新鮮的技術資訊的門檻是提高了還是降低了呢？DeepSeek能否融入國際AI的生態圈，被更多的人接受和使用呢？拜托，少點腦殘似的狂歡，少一點枷鎖鐐銬，給真正想幹事的人留條活路好不好！

今天的文章就寫到這裏吧。說實話，我是一邊歎氣一邊寫完這篇文章的。DeepSeek的研發團隊是值得尊敬和肯定的。但要說的是，科技，來不得半點虛假，也容不得“畝產十萬斤”式的迷之狂歡！不想讓DeepSeek變成DeepSick，隻有學會規則，路才能走得更遠。

作者：如是大牛哥

DeepSeek，是否會毀於一場“愚蠢的狂歡”？

今日熱點

一周熱點