春節期間被Deepseek霸屏了, 每一塊液晶屏上都是國產AI的勁爆新聞,媒體掙流量的本質體現的淋漓盡致,可能對皮衣黃早有不滿的華爾街更是趁火打劫,NVDA跳水16%,對AI股大有要開類似本世紀初互聯網泡沫崩塌的第一槍的架勢。國內更是吹上了天, 將其上升到國運級別,國人終於可以在AI競賽中揚眉吐氣了一把。
於是嚐試讀了一下deepseek的論文,並沒有基礎架構的創新(仍基於transformer),但在微架構上的嚐試和創新的確值得讚譽(MLA,不用SFT等),在沒有算力支撐的情況下,看得出來他們花了很多力氣嚐試達到四兩撥千斤的效果,結果非常reasonable。
deepseek的訓練是否真的隻花了5百萬美金是個問號, 本人想起若幹年前在某初創公司花費三個多月做個了個DSP仿真器,因此對該架構了如指掌,後續公司新買了個EDA計工具,由於對要做什麽非常清楚,用那個工具一周完成了一個和自己從零做的同樣仿真器, 於是成了該EDA公司的成功案例模版,在外麵到處吹其客戶一周完成DSP仿真器設計,顯然沒有前麵那三個月,何來那一周?有報道稱deepseek的母公司幾年前就聚集了萬張顯卡做machine learning(用於量化炒股),沒有那些積累,估計也不會有什麽五百萬美金訓練處frontier模型的神話。
deepseek用到的trick,openai或anthropic他們是不懂怎麽做嗎?我認為也未必,隻是如果如Altman所言, Scaling Law還遠未結束,他們認為這是觸手可得的成果和路徑,所謂low hanging fruit,又沒什麽芯片管製,於是資源都朝著堆算力方向投去。今天看到Mark Chen的推,言下之意,deepseek的部分算法和openai是不謀而合,說明openai內部也許已經知道訓練的成本可以降下來,但作為AI標杆初創,降本顯然不是他們需要吹噓的。 至於 deepseek的模型是否有缺陷呢?其實都不知道,還是讓子彈飛一會兒最佳。
Matador 發表評論於 2025-01-30 03:03:59
共慘黨製度下發展出的人工智慧,應該也是被植入了思想禁區,共慘黨永遠是偉大,光明,正確。不能批評挑戰共慘黨,共慘黨永遠是正確的。
——-
這是對於AI的作用是什麽根本不清楚的表現,屬於世界觀問題。
AI是人類的工具,不是反應和表現人類的主觀需求。而政治是關於人類的主觀需求,你認為共產黨應該挑戰,有人認為共產黨做的不錯,解決了世界上二十億人的貧困問題(不僅僅是中國),把中國十四億人中的五億人帶到了歐盟的平均生活水平,這是目前還沒有其他政府和國家做到的。整個歐盟隻有五億人口。
這完全是出於不同的認知和思維角度,也是不同的世界觀決定的。
你會讓一個扳手選擇是擰革命的螺釘,而不是擰反革命的螺釘?你試試在美國的ChatGPT或者不論什麽AI工具問關於以色列加沙戰爭不利於以色列的問題,或者任何不利於以色列的政治有關的問題,你看會是什麽結果。
在美國你得先有敢提這類問題的膽子,不論是對人還是對機器。
這是技術角度,經濟角度的衝擊太大了,因為徹底破壞了美國希望利用AI壟斷,建成Stargate斂錢的贏利模式,而這正是中國把不論什麽都做成白菜價的目的,不允許美國壟斷,利益均沾。
美國對AI的投入這麽多年來已經14萬億美元,等於美國一半的GDP,開始進入收獲季節,這是建立Stargate計劃的主要目的,利用這些巨大的運算中心和數據中心,加上專門的核電站提供支持算力的電力,對全世界所有使用美國AI技術的人收費,月收入可能就是數千億到上萬億。
如今DeepSeek的出現表明這種模式沒意義,也就掙不到錢,因為任何國家有意進入AI領域的公司都可以使用DeepSeek自己做API建立需要的AI應用係統,基本免費,而不需要從美國獲得Stargate的注冊。
所以美國媒體的評論是中國這個產品的出現讓AI實現民主化了,而不是美國的獨裁。
14萬億美元的數年投資打水漂,這才是如今這件事的核心問題。
而不是DeepSeek具體使用了什麽技術,畢竟對於投資來講,看的是結果,而不是過程。目前知道DeepSeek的深度探索整個公司隻有一百零幾個人,成立沒幾年,但集中了一批如今二十幾歲從中學時代就開始拿獎的各類天才,包括語言和曆史方麵的,公司號稱中國五十個最聰明的人他們擁有幾個。
中國把什麽都做成白菜價的模式其實是對美國傳統上利用壟斷對技術和市場控製獲得巨額利潤模式的衝擊,客觀上有利於技術進步,你不能依賴壟斷,而是不得不繼續創新才能獲得市場。
DeepSeek目前具有的優勢是還是處於發展階段,不需要考慮盈利,這是美國在AI競爭上處於很不利的地方,14萬億美元的投入希望看到結果。
這就能理解為什麽美國市場反應這樣大,和所有AI有關的公司都進入瘋狂狀態,董事會看著自己的錢有可能打水漂。
其實DeepSeek具體化了多少錢,用了什麽芯片訓練,算法是什麽,都不那麽重要了,這是開源,任何人都可以拷貝開發。而是看結果,手機上誰都可以下載使用,雖然因為網絡攻擊讓deepseek停止了中國以外的注冊,但用穀歌賬戶仍然可以登錄使用。
而且免費。這東西在日常生活中是真省時間,更別說工作中了。