騰訊科技訊
3月28日消息,據國外媒體報道,美國人工智能初創公司Databricks日前發布了開源大語言模型DBRX。該公司聲稱,在語言理解、編程和數學方麵,DBRX的測試得分吊打GPT-3.5、Mixtral、Meta的Llama
2-70B以及埃隆·馬斯克(Elon
Musk)旗下xAI的Grok-1等開源模型。作為混合專家模型,DBRX的輸出Token速度高Llama 2一籌。
圖注:Databricks員工慶祝開源大語言模型DBRX大獲成功
本周一早晨,數據科學與人工智能公司Databricks的大約十多位工程師和高管聚集在公司會議室,通過Zoom視頻會議等待他們開發的人工智能語言模型的測試結果。該團隊花費了數月時間和大約1000萬美元訓練在設計上與OpenAI的ChatGPT相似的大語言模型DBRX。但在最終的測試結果出來之前,他們也不清楚自己開發的大模型究竟有多麽強大。
“我們超越了所有的開源大模型,”Databricks首席神經網絡架構師、開發DBRX的團隊負責人喬納森·弗蘭克爾(Jonathan
Frankle)最終告訴該團隊。消息一經公布,會場上立即響起雷鳴般的掌聲和歡呼聲。弗蘭克爾通常會喝無因咖啡,但是在通宵達旦的撰寫完測試結果報告之後,他也抿了幾口冰拿鐵。
Databricks計劃在開源許可下發布DBRX,意味著允許其他人在其工作基礎上開發大語言模型。弗蘭克爾分享的數據顯示,在衡量人工智能模型回答常規知識問題、閱讀理解、解決令人煩惱的邏輯難題和生成高質量代碼的十幾個基準中,DBRX均優於其他所有可用的開源模型。
DBRX的性能吊打目前最受歡迎的兩款開源人工智能模型--Llama
2和Mistral的Mixtral。當DBRX的得分呈現在會議室的屏幕上時,Databricks首席執行官阿裏·古德西(Ali
Ghodsi)先是高呼“酷斃了!”,然後又突然發問:“等等,我們打敗了馬斯克的產品嗎?”弗蘭克爾對此答複稱,DBRX的表現性能確實超越了馬斯克旗下的xAI最近宣布開源的Grok
AI模型。他還補充說:“如果馬斯克對此結果發表一條刻薄的貼子,我會認為這就是成功。”
令Databricks感到驚訝的是,DBRX在若幹項基準測試中的得分非常接近閉源大模型GPT-4,後者被業界廣泛認為是目前機器智能的巔峰。“我們為開源大語言模型設定了新標準,”弗蘭克爾笑著說。
Databricks通過開源DBRX,為當前生成式人工智能熱潮的開放運動注入了新動力,同時也向行業內頂尖公司的保密做法發起了挑戰。盡管OpenAI和穀歌不願公布GPT-4和Gemini等大語言模型的代碼,但
Meta等競爭對手選擇了開源模式,認為隻有更多研究人員、企業家、初創公司和老牌企業都掌握了相應的技術,才能進行更好地推陳出新。
Databricks表示,它還想要公開其開源模型的創建過程,相比之下Llama
2的開發者Meta還沒有公布創建該模型的一些關鍵細節。
Databricks計劃發布一篇博客文章,詳細介紹創建該模型所涉及的工作。屆時,外界不僅能夠了解到構建領先人工智能模型的複雜性和挑戰性,而且也能明白開發人工智能模型的成本會大幅減少的原因。
-->
`,
"script":[]
}
, "gg_rightside": {
"html":`
`,
"script":[{"exec":`(function(w,q){w[q]=w[q]||[];w[q].push(["_mgc.load"])})(window,"_mgq");`}]
}
, "gg_duturandom": {
"html":`
`,
"script":[]
}
, "gg_square": {
"html":`
`,
"script":[]
}
, "gg_topbanner": {
"html":`
`,
"script":[]
}
, "gg_middlesquare": {
"html":`
`,
"script":[]
}
, "gg_dutu": {
"html":`
`,
"script":[]
}
, "gg_botline": {
"html":``,
"script":[]
}
, "gg_dututop": {
"html":`
`,
"script":[]
}
, "gg_shipintop": {
"html":`
`,
"script":[]
}
, "gg_inContent": {
"html":`
`,
"script":[{"exec":`(function(w,q){w[q]=w[q]||[];w[q].push(["_mgc.load"])})(window,"_mgq");`}]
}
, "gg_shipinrandom": {
"html":``,
"script":[]
}
, "gg_sideSticky": {
"html":`
`,
"script":[]
}
, "gg_bottombanner": {
"html":`
`,
"script":[{"exec":`(function(w,q){w[q]=w[q]||[];w[q].push(["_mgc.load"])})(window,"_mgq");`}]
}
, "gg_marquee": {
"html":`
`,
"script":[]
}
}
const adEnv={
"gg_header": {
"html":``,
"script":[{"exec":`(function(){/*
Copyright The Closure Library Authors.
SPDX-License-Identifier: Apache-2.0
*/
'use strict';var g=function(a){var b=0;return function(){return b
=b||null!=a.a&&0!=a.a.offsetHeight&&0!=a.a.offsetWidth||(fa(a),D(a),l.setTimeout(function(){return E(a,b-1)},50))},fa=function(a){var b=a.c;var c="undefined"!=typeof Symbol&&Symbol.iterator&&b[Symbol.iterator];b=c?c.call(b):{next:g(b)};for(c=b.next();!c.done;c=b.next())(c=c.value)&&c.parentNode&&c.parentNode.removeChild(c);a.c=[];(b=a.a)&&b.parentNode&&b.parentNode.removeChild(b);a.a=null};var ia=function(a,b,c,d,e){var f=ha(c),k=function(n){n.appendChild(f);l.setTimeout(function(){f?(0!==f.offsetHeight&&0!==f.offsetWidth?b():a(),f.parentNode&&f.parentNode.removeChild(f)):a()},d)},h=function(n){document.body?k(document.body):0e;e++){var f=c.concat(d[e].split(""));K[e]=f;for(var k=0;k>2;n=(n&
3)<<4|t>>4;t=(t&15)<<2|h>>6;h&=63;f||(h=64,e||(t=64));c.push(b[k],b[n],b[t]||"",b[h]||"")}return c.join("")};try{return JSON.stringify(this.a&&this.a,S)}finally{Uint8Array.prototype.toJSON=a}}:function(){return JSON.stringify(this.a&&this.a,S)};var S=function(a,b){return"number"!==typeof b||!isNaN(b)&&Infinity!==b&&-Infinity!==b?b:String(b)};M.prototype.toString=function(){return this.a.toString()};var T=function(a){O(this,a)};u(T,M);var U=function(a){O(this,a)};u(U,M);var ja=function(a,b){this.c=new B(a);var c=R(b,T,5);c=new y(w,Q(c,4)||"");this.b=new ea(a,c,Q(b,4));this.a=b},ka=function(a,b,c,d){b=new T(b?JSON.parse(b):null);b=new y(w,Q(b,4)||"");C(a.c,b,3,!1,c,function(){ia(function(){F(a.b);d(!1)},function(){d(!0)},Q(a.a,2),Q(a.a,3),Q(a.a,1))})};var la=function(a,b){V(a,"internal_api_load_with_sb",function(c,d,e){ka(b,c,d,e)});V(a,"internal_api_sb",function(){F(b.b)})},V=function(a,b,c){a=l.btoa(a+b);v(a,c)},W=function(a,b,c){for(var d=[],e=2;ec?0:c}else c=-1;0!=c&&(W(a.b,"internal_api_sb"),Z(a,Q(a.a,6)))},function(c){Z(a,c?Q(a.a,4):Q(a.a,5))})},Z=function(a,b){a.c||(a.c=!0,a=new l.XMLHttpRequest,a.open("GET",b,!0),a.send())};(function(a,b){l[a]=function(c){for(var d=[],e=0;e2){dom.hide();}}$("#showallcomment").show();$("#showlesscomment").hide();};',
],
"src":[
{"src":"//count.wenxuecity.com/service/count/script/do.php?type=news&id=242206&n=0&out=jsval"},
{"src": "/news/js/view.js"},
{"src":"/members/js/md5.js"}
]
}
}