簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 李飛飛花20元26分鍾造出新模型 媲美DeepSeek

李飛飛花20元26分鍾造出新模型 媲美DeepSeek

文章來源: 星島日報 於 2025-02-11 16:17:46 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數


美籍華裔科學家李飛飛,僅用20美元和26分鍾,便創出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中國低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鍾,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  僅用16塊H100 GPU訓練

綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿裏巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鍾,訓練出新模型。

美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei

李飛飛是史丹福大學首位紅杉講席教授。Stanford University

  表現媲美OpenAI o1及DeepSeek R1

報道指,李飛飛團隊在研究中提出了「預算控製」策略,透過加入「wait指令」等方式,強製延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。

根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道,複旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。

由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也隻包含了訓練時的GPU算力費用。

  • 北美最大中英文保健網“母親節特大酬賓”!美國專利[骨精華][心血通][益腦靈]健骨強心護腦,用過的都說好!
查看評論(26)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

從奧斯卡到戛納 華裔女導演趙婷再站上世界影壇核心
大炸鍋!伊朗導彈狂轟商船 川普:擊沉7艘武裝快艇
驚!舊金山移民法庭將永久關閉 曾創下超90%通過率
油價隻是前菜 第二波通脹正悄悄席卷美國
俄士兵殺戰友剁腿吃掉 軍方急下軍令:嚴禁吃人




24小時討論排行

數百中國小學生赴海參崴慶祝勝利,是在傷疤上跳舞?
賴清德回程如何避開中國封鎖 繞地球一圈?
不結婚 不生孩子 都是受了境外敵對勢力的蠱惑?
中國“道教高官”娶妻擁妾生活豪奢 香豔女弟子曝光
蓬佩奧喊話川普:伊朗沒有“溫和派”領袖
終戰露曙光!伊朗提3階段方案 川普:望帶來正麵結果
中國主導無人機領域 美媒:華府想追趕麵臨“2難題”
當美國航班迎“矽基乘客” 宇樹機械人慘遭“拔管"
紐時揭北京表麵勸和暗給導彈!美情報揪中企偷運
ICE懇求:不要釋放在舊金山殺死醫生的非法移民
習近平重建軍隊高層 被打壓的“邊緣”軍官全麵上位
景區男性NPC“擦邊服務”爆火,當景區開始卷軟色情
香港後國安法時代:當大學不再是"保護傘"
五角大樓爆24高層遭撤職 戰爭部長處境陷孤立
青島保險圈爆出詐騙大案:泰康銷冠被警方帶走
中國五一驚傳“獻忠”!溫州至少5人被車撞死
文學城新聞
切換到網頁版

李飛飛花20元26分鍾造出新模型 媲美DeepSeek

星島日報 2025-02-11 16:17:46


美籍華裔科學家李飛飛,僅用20美元和26分鍾,便創出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中國低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鍾,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  僅用16塊H100 GPU訓練

綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿裏巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鍾,訓練出新模型。

美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei

李飛飛是史丹福大學首位紅杉講席教授。Stanford University

  表現媲美OpenAI o1及DeepSeek R1

報道指,李飛飛團隊在研究中提出了「預算控製」策略,透過加入「wait指令」等方式,強製延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。

根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道,複旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。

由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也隻包含了訓練時的GPU算力費用。