簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 生活百態 » 這家美國創企“燒出”最強開源大模型 能力號稱接近GPT-4

這家美國創企“燒出”最強開源大模型 能力號稱接近GPT-4

文章來源: 騰訊科技 於 2024-03-28 18:58:57 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數


騰訊科技訊 3月28日消息,據國外媒體報道,美國人工智能初創公司Databricks日前發布了開源大語言模型DBRX。該公司聲稱,在語言理解、編程和數學方麵,DBRX的測試得分吊打GPT-3.5、Mixtral、Meta的Llama 2-70B以及埃隆·馬斯克(Elon Musk)旗下xAI的Grok-1等開源模型。作為混合專家模型,DBRX的輸出Token速度高Llama 2一籌。

圖注:Databricks員工慶祝開源大語言模型DBRX大獲成功

本周一早晨,數據科學與人工智能公司Databricks的大約十多位工程師和高管聚集在公司會議室,通過Zoom視頻會議等待他們開發的人工智能語言模型的測試結果。該團隊花費了數月時間和大約1000萬美元訓練在設計上與OpenAI的ChatGPT相似的大語言模型DBRX。但在最終的測試結果出來之前,他們也不清楚自己開發的大模型究竟有多麽強大。

“我們超越了所有的開源大模型,”Databricks首席神經網絡架構師、開發DBRX的團隊負責人喬納森·弗蘭克爾(Jonathan Frankle)最終告訴該團隊。消息一經公布,會場上立即響起雷鳴般的掌聲和歡呼聲。弗蘭克爾通常會喝無因咖啡,但是在通宵達旦的撰寫完測試結果報告之後,他也抿了幾口冰拿鐵。

Databricks計劃在開源許可下發布DBRX,意味著允許其他人在其工作基礎上開發大語言模型。弗蘭克爾分享的數據顯示,在衡量人工智能模型回答常規知識問題、閱讀理解、解決令人煩惱的邏輯難題和生成高質量代碼的十幾個基準中,DBRX均優於其他所有可用的開源模型。

DBRX的性能吊打目前最受歡迎的兩款開源人工智能模型--Llama 2和Mistral的Mixtral。當DBRX的得分呈現在會議室的屏幕上時,Databricks首席執行官阿裏·古德西(Ali Ghodsi)先是高呼“酷斃了!”,然後又突然發問:“等等,我們打敗了馬斯克的產品嗎?”弗蘭克爾對此答複稱,DBRX的表現性能確實超越了馬斯克旗下的xAI最近宣布開源的Grok AI模型。他還補充說:“如果馬斯克對此結果發表一條刻薄的貼子,我會認為這就是成功。”

令Databricks感到驚訝的是,DBRX在若幹項基準測試中的得分非常接近閉源大模型GPT-4,後者被業界廣泛認為是目前機器智能的巔峰。“我們為開源大語言模型設定了新標準,”弗蘭克爾笑著說。

Databricks通過開源DBRX,為當前生成式人工智能熱潮的開放運動注入了新動力,同時也向行業內頂尖公司的保密做法發起了挑戰。盡管OpenAI和穀歌不願公布GPT-4和Gemini等大語言模型的代碼,但 Meta等競爭對手選擇了開源模式,認為隻有更多研究人員、企業家、初創公司和老牌企業都掌握了相應的技術,才能進行更好地推陳出新。

Databricks表示,它還想要公開其開源模型的創建過程,相比之下Llama 2的開發者Meta還沒有公布創建該模型的一些關鍵細節。

Databricks計劃發布一篇博客文章,詳細介紹創建該模型所涉及的工作。屆時,外界不僅能夠了解到構建領先人工智能模型的複雜性和挑戰性,而且也能明白開發人工智能模型的成本會大幅減少的原因。

  • 海外省錢快報,掌櫃推薦,實現買買買自由!
查看評論(1)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2025 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

假期第3天:第一批贏家,已出現
威廉王子罕見詳述家庭生活:凱特患癌對仨娃有影響
梅拉尼婭發布AI版的自己,“走向未來”,卻引發爭議
螺絲釘裏,長出羽毛:一個工廠車間的藝術之路
哈裏與國王見麵秘密內容泄露 威廉繼位將集中清算




24小時討論排行

王誌安:隻要能解封,“讓我喊台灣獨立萬歲都可以”
美陸軍特種作戰司令部司令 四星上將辭職信曝光
普丁警告川普政府!若援烏"戰斧飛彈"俄美關係全麵升級
清華登頂多項全球計算機科學榜 “衝擊美國主導地位”
川普授權!向芝加哥部署300國民兵,解決"失控犯罪"
“China Travel”火爆背後,3500萬外國遊客的難題
特朗普想上1美元紀念幣 美國教授:過不了法律這關
知名網紅在攀岩時失足墜崖,直播間觀眾目睹墜亡瞬間
中國國家安全部要求公民警惕“溫柔陷阱”從天而降
政府關門危機持續,加州州長呼籲民主黨堅定立場
川普:以色列同意撤軍線,哈瑪斯確認後停火將立即生效
特朗普前丈母娘過99歲生日,伊萬卡和弟弟為她祝壽
聯邦法官暫時阻止特朗普在波特蘭市部署國民警衛隊
馬斯克等億萬富豪稱,大學畢業生有望去太空上班
全球最大的實體書城剛開業,國慶期間麵臨"毒氣"爭議
馬斯克曬特斯拉人形機器人練功夫 招式精準應對
文學城新聞
切換到網頁版

這家美國創企“燒出”最強開源大模型 能力號稱接近GPT-4

騰訊科技 2024-03-28 18:58:57


騰訊科技訊 3月28日消息,據國外媒體報道,美國人工智能初創公司Databricks日前發布了開源大語言模型DBRX。該公司聲稱,在語言理解、編程和數學方麵,DBRX的測試得分吊打GPT-3.5、Mixtral、Meta的Llama 2-70B以及埃隆·馬斯克(Elon Musk)旗下xAI的Grok-1等開源模型。作為混合專家模型,DBRX的輸出Token速度高Llama 2一籌。

圖注:Databricks員工慶祝開源大語言模型DBRX大獲成功

本周一早晨,數據科學與人工智能公司Databricks的大約十多位工程師和高管聚集在公司會議室,通過Zoom視頻會議等待他們開發的人工智能語言模型的測試結果。該團隊花費了數月時間和大約1000萬美元訓練在設計上與OpenAI的ChatGPT相似的大語言模型DBRX。但在最終的測試結果出來之前,他們也不清楚自己開發的大模型究竟有多麽強大。

“我們超越了所有的開源大模型,”Databricks首席神經網絡架構師、開發DBRX的團隊負責人喬納森·弗蘭克爾(Jonathan Frankle)最終告訴該團隊。消息一經公布,會場上立即響起雷鳴般的掌聲和歡呼聲。弗蘭克爾通常會喝無因咖啡,但是在通宵達旦的撰寫完測試結果報告之後,他也抿了幾口冰拿鐵。

Databricks計劃在開源許可下發布DBRX,意味著允許其他人在其工作基礎上開發大語言模型。弗蘭克爾分享的數據顯示,在衡量人工智能模型回答常規知識問題、閱讀理解、解決令人煩惱的邏輯難題和生成高質量代碼的十幾個基準中,DBRX均優於其他所有可用的開源模型。

DBRX的性能吊打目前最受歡迎的兩款開源人工智能模型--Llama 2和Mistral的Mixtral。當DBRX的得分呈現在會議室的屏幕上時,Databricks首席執行官阿裏·古德西(Ali Ghodsi)先是高呼“酷斃了!”,然後又突然發問:“等等,我們打敗了馬斯克的產品嗎?”弗蘭克爾對此答複稱,DBRX的表現性能確實超越了馬斯克旗下的xAI最近宣布開源的Grok AI模型。他還補充說:“如果馬斯克對此結果發表一條刻薄的貼子,我會認為這就是成功。”

令Databricks感到驚訝的是,DBRX在若幹項基準測試中的得分非常接近閉源大模型GPT-4,後者被業界廣泛認為是目前機器智能的巔峰。“我們為開源大語言模型設定了新標準,”弗蘭克爾笑著說。

Databricks通過開源DBRX,為當前生成式人工智能熱潮的開放運動注入了新動力,同時也向行業內頂尖公司的保密做法發起了挑戰。盡管OpenAI和穀歌不願公布GPT-4和Gemini等大語言模型的代碼,但 Meta等競爭對手選擇了開源模式,認為隻有更多研究人員、企業家、初創公司和老牌企業都掌握了相應的技術,才能進行更好地推陳出新。

Databricks表示,它還想要公開其開源模型的創建過程,相比之下Llama 2的開發者Meta還沒有公布創建該模型的一些關鍵細節。

Databricks計劃發布一篇博客文章,詳細介紹創建該模型所涉及的工作。屆時,外界不僅能夠了解到構建領先人工智能模型的複雜性和挑戰性,而且也能明白開發人工智能模型的成本會大幅減少的原因。