2018 (209)
2019 (405)
2025 (14)
中國橫空出世的AI模型DeepSeek震撼矽穀,也讓Meta陷入恐慌。
中國AI新創企業DeepSeek(深度求索)近2個月接連推出新模型DeepSeek-V3與DeepSick-R1,令其APP在蘋果App Store的下載排行榜中衝上第一名,將ChatGPT遠拋在後。這款低成本高性能的AI模型表現與OpenAI的ChatGPT-4等全球頂尖AI語言模型不相上下,令整個矽穀為之震撼,更讓美國科技巨頭Meta的生成式AI部門陷入危機。
一位自稱是Meta員工的網友,日前在美國匿名職場論壇TeamBlind上發文,表示DeepSeek橫空出世後,技術水準就直接超越了Meta旗下的Llama 4,讓Meta全公司上下陷入恐慌。更令Meta難堪的是,這家中國企業隻用了550萬美元(約新台幣1.8億元)來訓練DeepSeek,成本隻有Meta的十一分之一。
這名員工坦言,DeepSeek以超低成本完成大規模模型訓練,顛覆了行業對高昂成本的傳統認知,因為「單隻Meta生成式AI部門裏的主管薪資就已超過了DeepSeek訓練AI的成本,而且我們這裏有幾十位領著高薪的主管,我根本無法想像他們該如何向公司證明部門目前高額成本的合理性。」
外媒The Information指出,OpenAI、Meta和其他頂尖AI公司的工程師正瘋狂地研究DeepSeek模型,試圖解讀其技術秘密,複製其成功模式,但暫時還不得其解。Meta更為此籌組了4個「戰情室」,2個聚焦研究如何降低訓練和運作DeepSeek的成本,另2個則負責厘清DeepSeek使用了哪些數據來訓練其模型,及基於DeepSeek模型歸納出的特質,重新建構Meta的模型。
中國公司深度求索(DeepSeek)1月20日發佈最新的DeepSeek-R1模型後,因其開發成本低、性能直追OpenAI等公司的產品,備受矽穀關注。主導Meta AI研究的首席科學家、圖靈獎得主楊立昆(Yann LeCun)認為,DeepSeek帶來的最大啟示是開源模型正在超越專有模型。
楊立昆在Threads上的一則貼文中表示,一些人看到DeepSeek表現會想到“中國AI正在超越美國”,他認為這種解讀錯誤,正確解讀是“開源模型正在超越專有模型”。
DeepSeek-R1屬開源模型(open source),開放程式碼,Meta的Llama也是。
楊立昆指,DeepSeek受益於開放研究(Open Research)和開源,例如是PyTorch、Meta的Llama,“他們提出新想法,在其他人的工作基礎上加以實現。由於他們的工作成果已發表並開源,因此每個人都可以從中受益,這就是開放研究和開源的力量。”
OpenAI最初成立時是一家開源AI公司,其使命是創造造福全人類的技術,之後轉向閉源,特斯拉(Tesla)創辦人馬斯克(Elon Musk)2024年2月底入稟控告OpenAI及其行政總裁奧爾特曼(Sam Altman),馬斯克方麵在訴訟書講述OpenAI公司成立協議標明會尋求開放程式碼,不滿其如今未有公開技術。