簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 李飛飛花20元26分鍾造出新模型 媲美DeepSeek

李飛飛花20元26分鍾造出新模型 媲美DeepSeek

文章來源: 星島日報 於 2025-02-11 16:17:46 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數


美籍華裔科學家李飛飛,僅用20美元和26分鍾,便創出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中國低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鍾,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  僅用16塊H100 GPU訓練

綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿裏巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鍾,訓練出新模型。

美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei

李飛飛是史丹福大學首位紅杉講席教授。Stanford University

  表現媲美OpenAI o1及DeepSeek R1

報道指,李飛飛團隊在研究中提出了「預算控製」策略,透過加入「wait指令」等方式,強製延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。

根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道,複旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。

由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也隻包含了訓練時的GPU算力費用。

  • 功效卓著,回頭客眾多!美國專利【骨精華】消除關節痛//骨質疏鬆;【心血通+益腦靈】強心護腦。
查看評論(26)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

"最優秀的中國人才正在離開":特朗普如何改變了美國高校
中國女留學生誣告英警性侵:性愛錄音揭其主動
特朗普在自家社媒發布改圖,手持美國國旗"登上"格陵蘭島
12歲女孩遭關廁所17天虐死案 繼母今被執行死刑
詐騙園區放人了!大批中國豬仔使館外排隊回家




24小時討論排行

全球中產生活,都在大退潮?
中國對台開戰若失手將引爆四重反噬 中國夢變惡夢
美財長籲各界:不要恐慌美歐貿易戰 冷靜 深呼吸…
高市早苗解散國會:賭上首相大位 再提“台灣有事”
“99年租期”川普新方案拿下格陵蘭 擬本周達沃斯提出
中式“特朗普”樂翻美互聯網:中國總能提供更好產品
發AI插旗圖公開私訊 川普矢言奪格陵蘭絕不回頭
川普“和平理事會” 這些國家證實受邀 中國也收到…
"香港自治已死":美參議員要求撤銷香港駐美經貿辦外交特權
"核彈級報複"歐盟反脅迫工具是什麽?亞馬遜和微軟恐遭殃
特朗普:不給我諾貝爾和平獎,就別怪我不和平了
重返白宮第一年,特朗普交出怎樣的成績單?
第二家庭再添丁 萬斯烏莎將迎第四個孩子 是個男孩
馬英九建議鄭麗文:如訪陸別穿高跟鞋 快練毛筆
特朗普曝光馬克龍短信:我不懂你在格陵蘭做什麽
川普遭“高級黑”!反MAGA爆款小紅帽 美國人買瘋了
文學城新聞
切換到網頁版

李飛飛花20元26分鍾造出新模型 媲美DeepSeek

星島日報 2025-02-11 16:17:46


美籍華裔科學家李飛飛,僅用20美元和26分鍾,便創出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中國低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鍾,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  僅用16塊H100 GPU訓練

綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿裏巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鍾,訓練出新模型。

美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei

李飛飛是史丹福大學首位紅杉講席教授。Stanford University

  表現媲美OpenAI o1及DeepSeek R1

報道指,李飛飛團隊在研究中提出了「預算控製」策略,透過加入「wait指令」等方式,強製延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。

根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道,複旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。

由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也隻包含了訓練時的GPU算力費用。