DeepSeek橫空出世,Meta慌:訓練成本"比高層薪水低"
文章來源: ettoday 於
- 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
▲中國橫空出世的AI模型DeepSeek震撼矽穀,也讓Meta陷入恐慌。
中國AI新創企業DeepSeek(深度求索)近2個月接連推出新模型DeepSeek-V3與DeepSick-R1,令其APP在蘋果App
Store的下載排行榜中衝上第一名,將ChatGPT遠拋在後。這款低成本高性能的AI模型表現與OpenAI的ChatGPT-4等全球頂尖AI語言模型不相上下,令整個矽穀為之震撼,更讓美國科技巨頭Meta的生成式AI部門陷入危機。
一位自稱是Meta員工的網友,日前在美國匿名職場論壇TeamBlind上發文,表示DeepSeek橫空出世後,技術水準就直接超越了Meta旗下的Llama
4,讓Meta全公司上下陷入恐慌。更令Meta難堪的是,這家中國企業隻用了550萬美元(約新台幣1.8億元)來訓練DeepSeek,成本隻有Meta的十一分之一。
這名員工坦言,DeepSeek以超低成本完成大規模模型訓練,顛覆了行業對高昂成本的傳統認知,因為「單隻Meta生成式AI部門裏的主管薪資就已超過了DeepSeek訓練AI的成本,而且我們這裏有幾十位領著高薪的主管,我根本無法想像他們該如何向公司證明部門目前高額成本的合理性。」
外媒The
Information指出,OpenAI、Meta和其他頂尖AI公司的工程師正瘋狂地研究DeepSeek模型,試圖解讀其技術秘密,複製其成功模式,但暫時還不得其解。Meta更為此籌組了4個「戰情室」,2個聚焦研究如何降低訓練和運作DeepSeek的成本,另2個則負責厘清DeepSeek使用了哪些數據來訓練其模型,及基於DeepSeek模型歸納出的特質,重新建構Meta的模型。