您好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。 ——DeepSeek
上一篇寫DeepSeek的文章僅僅幾個小時就“閃”了。當時還感覺一頭霧水。原本文章裏還寫到了春晚的機器人扭秧歌。後來想想終究是去掉了。文章也從最初的近6000字減少到3500字。即便如此依然沒能逃脫厄運。好吧,我認輸。這年頭,說點真話太難了。如果再說出問題的底層邏輯,那就有可能是十惡不赦。
人家說DeepSeek隻需要幾個沒有經驗的大學畢業生就能創造出妖妖領先。我就應該附和,藏經閣裏還有“掃地僧”沒拿出來。人家說DeepSeek的開發成本隻有幾百萬美金,用的還都是過時的GPU芯片。我就應該說,手搓芯片那都是小兒科,美帝崩潰在即褲襠已經濕了。最聰明的做法應該是像神拳大V們一樣,站在前列腺上炮口直懟美帝下三路。但是我,偏偏一直都是一個不夠聰明的人。別人都是看破不說破,我卻是既看破又說破。結果一不小心又踩到了一部分人的G點上。我能想象出牠們的“瓦片心”碎了一地的樣。瓦片心,是我最近的一個原創詞。之所以不叫玻璃心是因為,牠們那顆心沒玻璃那麽純淨。而是既汙穢又脆弱,就像垃圾堆裏終年見不得陽光的一片烏漆麻黑的破瓦片。牠們最常見的問題是是對事物缺乏理性的對待。熱衷於吹捧出一個又一個不能被質疑的妖妖領先。
既然覺得DeepSeek遠超ChatGPT。至少應該對比應用一下才更有說服力不是嗎?我把升天文《DeepSeek,是否會毀於一場“盲目狂歡”》輸入ChatGPT。然後提問“請幫我分析一下文章為什麽會被刪除,以及有什麽地方出現違規”。ChatGPT經過短暫分析給出了6個方麵的結論。其中說到我這篇文章涉及傳播負麵情緒、抨擊“民族科技狂歡”;質疑國內AI產品的國際競爭力,與國內主流輿論導向不符雲雲。然後又非常貼心的給出了6條對應的修改建議。包括刪除哪些有可能觸及敏感的用詞,以及心照不宣的隱喻。在這一刻我突然發現自己還真的不如機器人圓滑老到。君不見,遇到了一些難以回答的問題,連DeepSeek都會告訴你,您好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。
被閃的文章裏我曾提到一項大模型的評判指標。即:新聞事件的準確性。關鍵要點是:事實性、時效性、信息源可信度和多角度理解。所謂多角度理解會評估模型在報道新聞事件時是否存在偏見,或是否能涵蓋多個觀點。於是有人留言說,問題是DeepSeek也不是搜索引擎啊。但我的觀點是,並不是每一個人都會用這個大模型來編寫程序做數學題。大部分人還是會提一些自己感興趣的問題。這些問題自然而然的會與新聞事件有關。例如,我們可以對ChatGPT提問:發生在美國華盛頓的軍用直升機撞擊民航客機事件,與恐怖主義或者政治陰謀有關嗎?大模型在回答這樣的問題的時候,就包括了對真實發生的事件的描述,同時又會給出信息的來源和不帶偏見性的理解。DeepSeek確實不是搜索引擎,但搜索和理解本身就是一體的。所以領先的搜索引擎會將大模型整合到平台生態中。大模型采集什麽樣的信息“源”,決定了你能得到什麽樣的理解和結論。
我知道,此刻有人會跳出來質問:難道DeepSeek沒有給美國AI科技圈帶來震動嗎?英偉達股價沒有跳水嗎?這其實就是“ETC成精——自動抬杠”的人常見的問題:凡事隻看表麵而對底層邏輯缺乏認知。
我還是那句話,不吹不黑的看待這次DeepSeek的橫空出世。如我上篇文章所說,相較於國內其他版本的大模型來說,DeepSeek確實有過人之處。獨辟蹊徑的算法打破了矽穀精英的慣有邏輯。不可忽視的是,大家對於科技的底層態度不一樣,美國AI界對DeepSeek的重視是超越了意識形態的。在自由的市場經濟中,隻要有好東西,管它姓什麽,第一時間先用上增強自身競爭力才是王道。所以在這兩天,DeepSeek已經被多家領先的科技企業納入其生態係統。微軟、英偉達和亞馬遜等公司已將 DeepSeek-R1 模型集成到各自的平台中。微軟已在其 Azure AI Foundry 和 GitHub 的模型目錄中添加了 DeepSeek-R1,開發者可以利用該模型進行測試和構建基於雲的應用程序和服務。英偉達也宣布,DeepSeek-R1 模型現已作為 NVIDIA NIM 微服務的預覽版提供,開發者可以測試和體驗該 API。但所有這些並不代表別人“慫了”“尿了”,從這種務實、開放的精神中反而能看到企業的盛名不虛。
這些企業之所以爭先恐後的把DeepSeek拉入懷抱,除了看中其在代碼生成、數學推理能力方麵的技術優勢;以及模型輕量化,適用於本地 AI 計算,同時具有跨平台部署能力以外,還有一個重要的原因是企業希望減少成本,降低對 OpenAI 的依賴;同時增強企業在亞洲市場(尤其是中國市場)的 AI 競爭力。在這個科技飛速發展的時代,大家其實都有壓箱底的東西,願意什麽時候拿出來才是關鍵。我可以斷言,DeepSeek將會刺激到美國的AI界,進而引發一場波及整個世界的新的AI軍備競賽。
這裏要順便說一句為什麽英偉達會暴跌。其實英偉達超高的股價和對定價權的壟斷早就讓業內大佬看不順眼。大家其實就在等DeepSeek這樣的一個機會,適時用市場教育一下英偉達。在一個沒有權力幹擾的自由的市場經濟環境下,擁有核心競爭力的大科技公司想要控製世界並不容易。因為隨時會出現一個“破局者”用獨辟蹊徑的方式打破壟斷。同時給那些被財富燒得發燙的大腦降降溫。
任何一項科技成果,最終都會在應用中體現出價值。大模型之下,還會有實用性更強的小模型。恰如我之前的升天文中所寫:ChatGPT和Gemini這樣的大模型摒棄了人工標注的”訓練拐杖”,開始具備學習和自主推理的潛能。這不僅是技術方法的創新,更是AI對於世界的認知模式發生了改變。稱之為“覺醒”一點都不過分。而一些小模型可以基於大模型的數據,借助蒸餾技術繼承知識和推理能力。相當於老師把自己積累的精華傳承給學生。讓小模型在任務表現上大幅躍升,同時實現成本的大幅降低。這本身就應該是AI發展的未來。
引述一位技術達人的話:這場大模型覺醒和小模型崛起的雙重革命正重塑AI行業規則。大模型拓展認知邊界,小模型釋放商業勢能。當技術邏輯與商業思維完成融合,智能時代的格局不再是單一的算法至上,而是商業賦能技術、技術重構商業的雙向進化。鑒於不同開發思路的AI模型會有不同的解題方法。人們更可以方便的把同一個問題扔給不同的AI模型。然後綜合幾個AI的答複得出成果。目前,麵對著世界領先平台爭相納入DeepSeek,我們其實更需要以開放和包容的心態接納其他AI模型的接入。在科技全球化的時代背景下,唯有全麵和深入的交流與合作才會讓AI更聰明。
我們小時候都學過王安石的散文《傷仲永》。其中講述了神童方仲永從天賦異稟到泯然眾人的故事。課文旨在教育我們:天賦隻是起點,持續的學習和努力才決定最終的成就。但是在現實中,有多少天資卓越的“仲永”是一次次的被毀於“父利其然也,日扳仲永環謁於邑人,不使學”呢?又有多少是被“瓦片兒”們的迷之狂歡葬送了的?我們這一代人真的太喜歡掃地僧的故事。以至於熱播的網絡無腦劇都充滿了“穿越到過去,用現代科技秒殺古人”的橋段。不願意承認別人的優秀,不願意主動修正和提升自己,不能包容和接納,缺乏麵向未來的視野和境界其實是典型的弱者心態。
今天的文章就寫到這裏吧。對不起,大過節的又給“瓦片兒”們添堵了。在這個世界上,有時候免費的才是最貴的。360曾率先垂範,給了我們免費的殺毒軟件,也給了我們無法刪除的360“全家桶”。當某樣東西可以讓我們免費使用的時候,應該想想他會從我們這裏拿走什麽呢?世界就是個草台班子。如果有朝一日AI變得滑頭,學會了撒謊;或者有一天你感覺自己的智商遭到了AI的強奸,你也隻好忍著。因為你不可以說不。如果你非想要一個答案,得到的回答是:您好,這個問題我暫時無法回答,讓我們換個話題再聊聊吧。
作者: 如是大牛哥