DeepSeek,是否會毀於一場“愚蠢的狂歡”?

太陽下麵就沒有啥新鮮事

原本想趁著假期好好休息一下的。人總是會被各種繁瑣事務塞得滿滿當當。對中國人來說尤為如此。春節假期可以讓人有一段時間放空自己。然後再以空杯的心態重新麵對新的一年。但今天這個話題實在忍不住要講一講。

我從小就知道,年,是有味道的。

當左鄰右舍紛紛傳來DuangDuang的剁餡聲,年就到了。那時候的年,味道很重。是油鍋裏滋啦滋啦的熱油的味道;是胡同裏誰家小孩剛放完鞭炮以後的硫磺味兒;是大眾浴池裏熱烘烘濕乎乎的水氣味兒;還有雜貨店裏醬油醋帶魚肥肉混合在一起的味道。長大了一些,年味兒就變成了鋪天蓋地的煙花,新提的車子內飾的皮革味兒;寺廟的香煙繚繞;還有飯館裏的觥籌交錯和廟會上的烤串味道。今年的北京,看電視春晚的人少了,串門兒的人少了,街上的人少了,開門的飯館少了,發拜年紅包的人也少了。有些時候,空氣中充斥著一種不真實的味道或者索性沒有味道也算是味道。

今年另一個巨大的變化就是,人們開始紛紛用AI工具編寫個性化的拜年信息。追本溯源,發信息拜年不過是二十幾年的曆史。隨著手機的普及,讓短信拜年成為一時之尚。智能手機和微信又催生出微信拜年和拜年紅包。每到這個時候,會有一部分人挖空心思編寫最能代表自己心意的文字。但大部分人更喜歡“拿來主義”。用別人的內容“蒸餾”一下變成自己的,然後一鍵群發。總之都是在表達心意,也談不上是孰對孰錯。如果說短信拜年的時代,人們還有興趣仔細閱讀一下文字,咂摸一下文字裏的滋味;微信拜年則變得越來越敷衍了事。反正都是一些見慣了的老詞翻過來掉過去的排列組合。就像超市裏每到春節必然循環播放的那種應景歌曲。你不喜歡它,但就是想不出辦法擺脫它。

2024,應該算是國人開始普遍接受AI的元年。但大多數人對於AI的使用還是基於詢問一些簡單的問題。好一點的,可以幫忙撰寫文案或者工作計劃。項目公司投標的標書都普遍比以往的厚度增加了1/3。這也要拜AI所賜。得益於AI的推廣應用,今年春節又有了新的應用場景。我身邊的很多朋友開始用AI編寫個性化拜年信息。隻要在AI中輸入你想要的風格以及表達的內容,短短十幾秒鍾就可以得到一篇“佳作”。無論是唐詩還是宋詞皆可信手拈來。然後就可以欣欣然的將其作為自己的祝福發送給親朋好友。很多人沒有想到的是,AI大模型的民間爆發竟會得益於春節的拜年信息。

說到今年春節最受關注的AI大模型,非橫空出世的DeepSeek莫屬。DeepSeek於1月27日突然爆紅。當天,其AI智能助手應用在中國和美國的蘋果應用商店免費榜單中同時登頂,超越了ChatGPT,成為下載量最高的免費應用。這一現象直接引發了美國科技股的劇烈波動,英偉達等主要科技公司的股價大幅下跌。聞此佳訊,簡中互聯網上可謂彩旗招展鑼鼓喧天一片喜氣洋洋。刹那間,DeepSeek被捧為了改變國運的神器,AI技術進步一杆大旗。又一次,中國贏麻了,美帝被嚇尿了。連中專生盧大師都搶在除夕發文稱“DeepSeek痛擊美國東林黨”。嗯,好吧,還記得當初“天才少女”橫空出世的時候,這廝曾撰寫長文稱“中國有14億人,普通人中不乏有很多天才,隻是有些被埋沒了,而薑萍剛好是那個被發掘的天才”。但真實結果曝光後,這廝就默默的把文章刪了。反正牠培養的韭菜也沒啥記性。

不吹不黑的說,DeepSeek確實給美國AI科技圈帶來了不小的震動。英偉達股價在1月27日下跌了約17%,市值蒸發約5890億美元,創下美國股市曆史上單日市值損失的紀錄。但科技圈僅僅兩天時間就從驚呼轉為一片質疑。有研究團隊指出,DeepSeek是在ChatGPT的數據基礎上“蒸餾”出來的。換句話說就是,ChatGPT接受的是普遍的大模型訓練。蒸餾就是從訓練結果中提煉出精華數據,幫助訓練出成本更低的小模型。這一說法得到了很多業內人士的驗證。甚至被DeepSeek親口承認。不過我相信這個小小的bug很快就會被DeepSeek的技術團隊修正。

DeepSeek,到底是真的革了AI時代的命,還是另一個“天才少女薑萍”?我知道在這個時候說這種話無疑是極大的政治不正確。或許會有人質問,你算老幾?你懂什麽叫大語言模型麽?是啊!我確實談不上懂AI,但是我懂“他們”啊!我懂那些搞“快科技”的人是怎麽圈錢的啊!美帝不懂這世上還有“刷榜”這種事,可我懂啊!DeepSeek公布了很多可以壓ChatGPT一頭的測試數據。但這些數據和研發成本費用都是開發團隊自己發布的。相信在接下來的幾天,其他專業團隊也會測試這些“跑分”的真實性以及後台數據庫的來源。越來越多的證據可以證明DeepSeek的研發成本是否符合邏輯。畢竟,大模型的開發除了需要昂貴的硬件成本,還需要源源不斷的信息投喂。信息這塊的成本到底如何,DeepSeek語焉不詳。還是那句話,太陽下麵就沒有啥新鮮事!

我用了兩天時間對比感受了一下DeepSeek和ChatGPT的區別。同時也和AI領域的朋友進行了一定深度的交流。可以說,相較於國內其他版本的大模型來說,DeepSeek確實有過人之處。即便是對上國外其他一些大模型也有很多亮眼的地方。首先從技術上講,DeepSeek采用更高效的推理架構,同時通過蒸餾競爭對手的數據,使得計算成本更低,推理速度更快。這就帶來了開發和使用成本的大幅下降。減少了GPU和算力工程師的使用,自然打破了矽穀精英的慣有邏輯。這才導致了英偉達的股價暴跌。當然,低成本優勢的另一個重要原因就是信息的來源。畢竟中國是一個信息大國。而且對於信息的掌握又非常集中。此外,DeepSeek在數學推理、邏輯分析和代碼生成方麵也表現突出。在語言理解方麵,DeepSeek提供多語言支持,但中文優化明顯比ChatGPT更好。從市場推廣的角度講,DeepSeek更是具有ChatGPT無法比擬的優勢。這麽說吧,你能見到ChatGPT隔空操控數以萬計的自媒體賬號“扶清滅洋”麽。

當然,DeepSeek的劣勢也是不容忽略的。在大模型的測試成績中,有一項重要指標是新聞事件的準確性。關鍵要點是:事實性、時效性、信息源可信度和多角度理解。所謂多角度理解會評估模型在報道新聞事件時是否存在偏見,或是否能涵蓋多個觀點。根據新聞可靠性評級機構NewsGuard於2025年1月29日發布的報告,DeepSeek的聊天機器人在處理新聞和信息時的準確率僅為17%,在所評估的11款人工智能聊天機器人中排名第十。落後於OpenAI的ChatGPT和穀歌的Gemini等西方競爭對手。報告指出,DeepSeek的聊天機器人在30%的情況下重複了錯誤信息,而在53%的情況下提供了模糊或無用的回答,總體錯誤率達83%。除此以外,基於數據蒸餾訓練出來的小模型,往往很難超越上一代的“老師”模型。更何況,這位老師還在不斷發展和進步。

其實我並不認為DeepSeek坦然承認自己蒸餾了ChatGPT數據是一件很丟人的事情。當然,這麽做是否合規合法又是另外一碼事。ChatGPT和Gemini這樣的大模型摒棄了人工標注的”訓練拐杖”,開始具備學習和自主推理的潛能。這不僅是技術方法的創新,更是AI對於世界的認知模式發生了改變。稱之為“覺醒”一點都不過分。而一些小模型可以基於大模型的數據,借助蒸餾技術繼承知識和推理能力。相當於老師把自己積累的精華傳承給學生。讓小模型在任務表現上大幅躍升,同時實現成本的大幅降低。這本身就應該是AI大模型發展的未來。我看到一位技術達人如是說:這場大模型覺醒和小模型崛起的雙重革命正重塑AI行業規則。大模型拓展認知邊界,小模型釋放商業勢能。當技術邏輯與商業思維完成融合,智能時代的格局不再是單一的算法至上,而是商業賦能技術、技術重構商業的雙向進化。

從我個人的角度講,當然希望能看到中國人創造出具有競爭力的商業大模型。但是尚需明確一點,大模型終究是一個工具。既然是工具,就要明確工具是為誰服務的;是否允許提出質疑;是否能帶給人獨立思考而不是強化某種偏見。當然還有非常重要的一點是要說真話。如果一個大模型連準確描述新聞事件都做不到,這樣的大模型就算編程能力再強,終究也是個殘障。某度當年號稱可以替代穀歌。但如今穀歌已經成為世界頂尖的人工智能公司。某度還在靠售賣不清不楚的醫療廣告賺錢。

AI在這個時代,已經無可爭議的成為“國家競爭力”的代名詞。但是,無數自媒體用盲目自嗨和網絡狂歡的方式為DeepSeek“慶生”,真的有好處嗎?真的有用處嗎?科技不是關上門搞出來的。在當今這個時代,科技的每一分進步都離不開國際合作。隻有小腦發育不完全、大腦完全不發育的盧粉之流,才會相信“天才少女”的神話。如果“天才少女”這種故事在國內講講也就罷了。但急於把DeepSeek捧上神壇,會帶來什麽呢?再寬泛一點說,對於那些需要與國際同行保持交流的技術研發人員來說,他們獲得更新鮮的技術資訊的門檻是提高了還是降低了呢?DeepSeek能否融入國際AI的生態圈,被更多的人接受和使用呢?拜托,少點腦殘似的狂歡,少一點枷鎖鐐銬,給真正想幹事的人留條活路好不好!

今天的文章就寫到這裏吧。說實話,我是一邊歎氣一邊寫完這篇文章的。DeepSeek的研發團隊是值得尊敬和肯定的。但要說的是,科技,來不得半點虛假,也容不得“畝產十萬斤”式的迷之狂歡!不想讓DeepSeek變成DeepSick,隻有學會規則,路才能走得更遠。

作者: 如是大牛哥

加州laoren 發表評論於
完全讚同作者的觀點,好文!
喜德牧 發表評論於
好!! 再同意不過。
京華人 發表評論於
讚!好文章!
登錄後才可評論.