Technical trading

Technical analysis is a way to trade stocks. There are different ways to trade. You get your way that match your personality.

首頁文章列表博文目錄

個人資料

dongpo1

給我悄悄話

博客訪問：

zt:DeepSeek橫空出世,Meta慌:訓練成本\'比高層薪水低\'

(2025-01-27 10:00:05) 下一個

中國橫空出世的AI模型DeepSeek震撼矽穀，也讓Meta陷入恐慌。

中國AI新創企業DeepSeek（深度求索）近2個月接連推出新模型DeepSeek-V3與DeepSick-R1，令其APP在蘋果App Store的下載排行榜中衝上第一名，將ChatGPT遠拋在後。這款低成本高性能的AI模型表現與OpenAI的ChatGPT-4等全球頂尖AI語言模型不相上下，令整個矽穀為之震撼，更讓美國科技巨頭Meta的生成式AI部門陷入危機。

一位自稱是Meta員工的網友，日前在美國匿名職場論壇TeamBlind上發文，表示DeepSeek橫空出世後，技術水準就直接超越了Meta旗下的Llama 4，讓Meta全公司上下陷入恐慌。更令Meta難堪的是，這家中國企業隻用了550萬美元（約新台幣1.8億元）來訓練DeepSeek，成本隻有Meta的十一分之一。

這名員工坦言，DeepSeek以超低成本完成大規模模型訓練，顛覆了行業對高昂成本的傳統認知，因為「單隻Meta生成式AI部門裏的主管薪資就已超過了DeepSeek訓練AI的成本，而且我們這裏有幾十位領著高薪的主管，我根本無法想像他們該如何向公司證明部門目前高額成本的合理性。」

外媒The Information指出，OpenAI、Meta和其他頂尖AI公司的工程師正瘋狂地研究DeepSeek模型，試圖解讀其技術秘密，複製其成功模式，但暫時還不得其解。Meta更為此籌組了4個「戰情室」，2個聚焦研究如何降低訓練和運作DeepSeek的成本，另2個則負責厘清DeepSeek使用了哪些數據來訓練其模型，及基於DeepSeek模型歸納出的特質，重新建構Meta的模型。

Meta楊立昆談DeepSeek：不是中國AI超越美國而是…

中國公司深度求索（DeepSeek）1月20日發佈最新的DeepSeek-R1模型後，因其開發成本低、性能直追OpenAI等公司的產品，備受矽穀關注。主導Meta AI研究的首席科學家、圖靈獎得主楊立昆（Yann LeCun）認為，DeepSeek帶來的最大啟示是開源模型正在超越專有模型。

楊立昆在Threads上的一則貼文中表示，一些人看到DeepSeek表現會想到“中國AI正在超越美國”，他認為這種解讀錯誤，正確解讀是“開源模型正在超越專有模型”。

DeepSeek-R1屬開源模型（open source），開放程式碼，Meta的Llama也是。

楊立昆指，DeepSeek受益於開放研究（Open Research）和開源，例如是PyTorch、Meta的Llama，“他們提出新想法，在其他人的工作基礎上加以實現。由於他們的工作成果已發表並開源，因此每個人都可以從中受益，這就是開放研究和開源的力量。”

OpenAI最初成立時是一家開源AI公司，其使命是創造造福全人類的技術，之後轉向閉源，特斯拉（Tesla）創辦人馬斯克（Elon Musk）2024年2月底入稟控告OpenAI及其行政總裁奧爾特曼（Sam Altman），馬斯克方麵在訴訟書講述OpenAI公司成立協議標明會尋求開放程式碼，不滿其如今未有公開技術。

[ 打印 ]

[ 加入書簽 ]

閱讀 ( ) ┆ 評論

評論

目前還沒有任何評論

登錄後才可評論.

Technical trading

zt:DeepSeek橫空出世,Meta慌:訓練成本\'比高層薪水低\'

Meta楊立昆談DeepSeek：不是中國AI超越美國 而是…

Meta楊立昆談DeepSeek：不是中國AI超越美國而是…