騰訊科技訊 3月28日消息，據國外媒體報道，美國人工智能初創公司Databricks日前發布了開源大語言模型DBRX。該公司聲稱，在語言理解、編程和數學方麵，DBRX的測試得分吊打GPT-3.5、Mixtral、Meta的Llama 2-70B以及埃隆·馬斯克（Elon Musk）旗下xAI的Grok-1等開源模型。作為混合專家模型，DBRX的輸出Token速度高Llama 2一籌。

圖注：Databricks員工慶祝開源大語言模型DBRX大獲成功

本周一早晨，數據科學與人工智能公司Databricks的大約十多位工程師和高管聚集在公司會議室，通過Zoom視頻會議等待他們開發的人工智能語言模型的測試結果。該團隊花費了數月時間和大約1000萬美元訓練在設計上與OpenAI的ChatGPT相似的大語言模型DBRX。但在最終的測試結果出來之前，他們也不清楚自己開發的大模型究竟有多麽強大。

“我們超越了所有的開源大模型，”Databricks首席神經網絡架構師、開發DBRX的團隊負責人喬納森·弗蘭克爾（Jonathan Frankle）最終告訴該團隊。消息一經公布，會場上立即響起雷鳴般的掌聲和歡呼聲。弗蘭克爾通常會喝無因咖啡，但是在通宵達旦的撰寫完測試結果報告之後，他也抿了幾口冰拿鐵。

Databricks計劃在開源許可下發布DBRX，意味著允許其他人在其工作基礎上開發大語言模型。弗蘭克爾分享的數據顯示，在衡量人工智能模型回答常規知識問題、閱讀理解、解決令人煩惱的邏輯難題和生成高質量代碼的十幾個基準中，DBRX均優於其他所有可用的開源模型。

DBRX的性能吊打目前最受歡迎的兩款開源人工智能模型--Llama 2和Mistral的Mixtral。當DBRX的得分呈現在會議室的屏幕上時，Databricks首席執行官阿裏·古德西（Ali Ghodsi）先是高呼“酷斃了！”，然後又突然發問：“等等，我們打敗了馬斯克的產品嗎？”弗蘭克爾對此答複稱，DBRX的表現性能確實超越了馬斯克旗下的xAI最近宣布開源的Grok AI模型。他還補充說：“如果馬斯克對此結果發表一條刻薄的貼子，我會認為這就是成功。”

令Databricks感到驚訝的是，DBRX在若幹項基準測試中的得分非常接近閉源大模型GPT-4，後者被業界廣泛認為是目前機器智能的巔峰。“我們為開源大語言模型設定了新標準，”弗蘭克爾笑著說。

Databricks通過開源DBRX，為當前生成式人工智能熱潮的開放運動注入了新動力，同時也向行業內頂尖公司的保密做法發起了挑戰。盡管OpenAI和穀歌不願公布GPT-4和Gemini等大語言模型的代碼，但 Meta等競爭對手選擇了開源模式，認為隻有更多研究人員、企業家、初創公司和老牌企業都掌握了相應的技術，才能進行更好地推陳出新。

Databricks表示，它還想要公開其開源模型的創建過程，相比之下Llama 2的開發者Meta還沒有公布創建該模型的一些關鍵細節。

Databricks計劃發布一篇博客文章，詳細介紹創建該模型所涉及的工作。屆時，外界不僅能夠了解到構建領先人工智能模型的複雜性和挑戰性，而且也能明白開發人工智能模型的成本會大幅減少的原因。