簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 李飛飛花20元26分鍾造出新模型 媲美DeepSeek

李飛飛花20元26分鍾造出新模型 媲美DeepSeek

文章來源: 星島日報 於 2025-02-11 16:17:46 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數


美籍華裔科學家李飛飛,僅用20美元和26分鍾,便創出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中國低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鍾,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  僅用16塊H100 GPU訓練

綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿裏巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鍾,訓練出新模型。

美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei

李飛飛是史丹福大學首位紅杉講席教授。Stanford University

  表現媲美OpenAI o1及DeepSeek R1

報道指,李飛飛團隊在研究中提出了「預算控製」策略,透過加入「wait指令」等方式,強製延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。

根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道,複旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。

由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也隻包含了訓練時的GPU算力費用。

  • 海外省錢快報,掌櫃推薦,實現買買買自由!
查看評論(44)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

“我今天被開除了”,小哥在地鐵“發泄式演講”的三分鍾
500萬青少年中招,這病已成第三大健康威脅
高溫,熱射病死人,一個拒用衛生巾的女孩
“天堂島”總統來中國尋根,在族譜裏看到自己名字
“你是聽不懂人話嗎?”人工智能客服逼瘋消費者




24小時討論排行

針對台積電美國廠的集體訴訟升級,原告增加至30多人
中國看不下去了! 胡塞接連擊沉2貨輪 耿爽點名停手
馬克龍宣布法英擬擴組5萬人軍隊 或部署烏前線作戰
胡錫進:大國悲歌,俄羅斯遭新一輪“眾叛親離”
萬字對話王成錄:替代安卓,隻是鴻蒙價值的不到5%
華人接管矽穀!Grok4發布會上馬斯克旁邊華人是誰?
王毅會見魯比奧:希望美方客觀、理性、務實
“天堂島”總統來中國尋根,在族譜裏看到自己名字
俄羅斯國防部可能放棄修複海軍目前唯一的航母
FBI、CIA前局長被調查 特朗普:他們必須“付出代價”
Meta從蘋果重金挖角華人AI大牛,薪酬超庫克
WHO呼籲開征“健康稅” 煙酒、含糖飲料一次調漲50%
湘潭大學投毒案二審開庭:現場過道坐滿人
昆侖石刻真假之謎:當地有牧民稱40年前就曾看見
白宮發川普超人照讚正義化身 迷因爆紅網友評價兩極
歐洲熱死人了,但還是開不起空調
文學城新聞
切換到網頁版

李飛飛花20元26分鍾造出新模型 媲美DeepSeek

星島日報 2025-02-11 16:17:46


美籍華裔科學家李飛飛,僅用20美元和26分鍾,便創出新的AI模型,效能媲美Deepseek、OpenAI。路透社

中國低成本高效的AI模型DeepSeek,推出後震撼科技界後,有AI教母之稱的美籍華裔科學家李飛飛,率領其團隊僅花了20美元及26分鍾,便創造出一個「s1」的AI推理模型,表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

  僅用16塊H100 GPU訓練

綜合外媒報道,李飛飛是史丹福大學首位紅杉講席教授,美國國家工程院院士。她與史丹福大學和華盛頓大學的研究團隊,在一個月內便研發出s1模型,因像DeepSeek一樣並非從零開始。s1是以阿裏巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座,在16塊輝達(NVIDIA)H100 GPU上監督微調26分鍾,訓練出新模型。

美籍華裔科學家李飛飛有「AI教母」之稱。@drfeifei

李飛飛是史丹福大學首位紅杉講席教授。Stanford University

  表現媲美OpenAI o1及DeepSeek R1

報道指,李飛飛團隊在研究中提出了「預算控製」策略,透過加入「wait指令」等方式,強製延長模型推理過程、思考時間,以此促使模型自我檢查並修正錯誤的推理步驟,提升推理品質。

根據李飛飛等人的研究論文《s1:Simple test- time scaling》,該模型在數學和編碼能力測試中的表現,可媲美OpenAI的o1,以及DeepSeek的R1等尖端推理模型,在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道,複旦大學計算機學院副教授鄭驍慶受訪時表示:「像DeepSeek或類似的公司,在尋找有效的整合解決方案時,需要進行大量的前期研究與消融實驗。」這意味著前期是需要大量「燒錢」的。

由於s1是基於現成模型進行監督微調,而微調一個模型和從零開始訓練一個模型的成本是無法相提並論的。其次50美元是否包含了其他數據、設備和消融實驗等費用,如DeepSeek-V3不到600萬美元的訓練成本,其實也隻包含了訓練時的GPU算力費用。