這家美國創企“燒出”最強開源大模型 能力號稱接近GPT-4

文章來源: - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
(被閱讀 次)

騰訊科技訊 3月28日消息,據國外媒體報道,美國人工智能初創公司Databricks日前發布了開源大語言模型DBRX。該公司聲稱,在語言理解、編程和數學方麵,DBRX的測試得分吊打GPT-3.5、Mixtral、Meta的Llama 2-70B以及埃隆·馬斯克(Elon Musk)旗下xAI的Grok-1等開源模型。作為混合專家模型,DBRX的輸出Token速度高Llama 2一籌。

圖注:Databricks員工慶祝開源大語言模型DBRX大獲成功

本周一早晨,數據科學與人工智能公司Databricks的大約十多位工程師和高管聚集在公司會議室,通過Zoom視頻會議等待他們開發的人工智能語言模型的測試結果。該團隊花費了數月時間和大約1000萬美元訓練在設計上與OpenAI的ChatGPT相似的大語言模型DBRX。但在最終的測試結果出來之前,他們也不清楚自己開發的大模型究竟有多麽強大。

“我們超越了所有的開源大模型,”Databricks首席神經網絡架構師、開發DBRX的團隊負責人喬納森·弗蘭克爾(Jonathan Frankle)最終告訴該團隊。消息一經公布,會場上立即響起雷鳴般的掌聲和歡呼聲。弗蘭克爾通常會喝無因咖啡,但是在通宵達旦的撰寫完測試結果報告之後,他也抿了幾口冰拿鐵。

Databricks計劃在開源許可下發布DBRX,意味著允許其他人在其工作基礎上開發大語言模型。弗蘭克爾分享的數據顯示,在衡量人工智能模型回答常規知識問題、閱讀理解、解決令人煩惱的邏輯難題和生成高質量代碼的十幾個基準中,DBRX均優於其他所有可用的開源模型。

DBRX的性能吊打目前最受歡迎的兩款開源人工智能模型--Llama 2和Mistral的Mixtral。當DBRX的得分呈現在會議室的屏幕上時,Databricks首席執行官阿裏·古德西(Ali Ghodsi)先是高呼“酷斃了!”,然後又突然發問:“等等,我們打敗了馬斯克的產品嗎?”弗蘭克爾對此答複稱,DBRX的表現性能確實超越了馬斯克旗下的xAI最近宣布開源的Grok AI模型。他還補充說:“如果馬斯克對此結果發表一條刻薄的貼子,我會認為這就是成功。”

令Databricks感到驚訝的是,DBRX在若幹項基準測試中的得分非常接近閉源大模型GPT-4,後者被業界廣泛認為是目前機器智能的巔峰。“我們為開源大語言模型設定了新標準,”弗蘭克爾笑著說。

Databricks通過開源DBRX,為當前生成式人工智能熱潮的開放運動注入了新動力,同時也向行業內頂尖公司的保密做法發起了挑戰。盡管OpenAI和穀歌不願公布GPT-4和Gemini等大語言模型的代碼,但 Meta等競爭對手選擇了開源模式,認為隻有更多研究人員、企業家、初創公司和老牌企業都掌握了相應的技術,才能進行更好地推陳出新。

Databricks表示,它還想要公開其開源模型的創建過程,相比之下Llama 2的開發者Meta還沒有公布創建該模型的一些關鍵細節。

Databricks計劃發布一篇博客文章,詳細介紹創建該模型所涉及的工作。屆時,外界不僅能夠了解到構建領先人工智能模型的複雜性和挑戰性,而且也能明白開發人工智能模型的成本會大幅減少的原因。