618 的風,還是吹到了大模型這裏。。。
最近這段時間,大模型廠商們是分不刷了,參數不比了,甚至連長文本也懶得卷了。一個個的都掉轉車頭,打起了價格戰。
什麽 “ 連降 99% ” , “ 注冊就送 ” , “ 限時免費 ” 等等。。。各種 618
專屬名詞,都掛在了各個大模型廠商的主頁。
在這裏,先跟不太懂的差友科普下,不少大模型廠商們,都會把 API
接口開放出來,賺個其他企業或者開發者們調用的錢,其中,它們賣的,就是token 數,像咱跟模型對話的時候,消耗的就是 token
。
最先打響token 價格戰的,其實是個大模型創業公司——幻方,它率先把每百萬 token的價格達到了一兩塊錢的級別。
打個比方,把 token 換算成漢字,原來一塊錢咱隻能買得起兩萬來字的短篇,現在同樣的價格,能把整套《 三體
》打包下來,還綽綽有餘。
很快,智譜 AI 也拿起了刀,對著自家大模型 GLM-3 Turbo 唰唰來了好幾下。
原來 5 塊錢 100 萬個 token ,直接打兩折,隻要 1 塊。本來新用戶注冊送的 500 萬個 token
數,也連著翻了五個跟頭,提升到了 2500 萬。
有趣的是,智譜還直接貼著阿裏和百度兩個大廠的臉開大,做了個價格對比圖。。。
這還沒完,緊接著,上周字節在火山引擎原力大會上,把價格戰又推進了一步。
它給出的折扣比幻方和智譜還要大,他們家的豆包大模型, 8 毛錢就能買到 100 萬個 token 。
而且同樣拉來了阿裏和百度來做對比,就差指著它們的鼻子說 “ 輪到你們了 ” 。
到這時,大廠之間的大模型價格戰,算是正式拉開了序幕。。。
被拉著鞭屍了好幾次的阿裏和百度,終於也坐不住了,就在昨天,前後腳官宣了 “ 大降價 ” 的消息。
世超瞅了眼阿裏的降價名單,一出手就是連降九個模型,從開源的到商業化的大模型,通通都打骨折。
同樣級別的模型,同樣的 token 數,比上麵提到的那些都還要便宜。像是 GPT-4 級別的 Qwen-Long
,五毛錢就能買下 100 萬個 token 。
百度這邊呢,雖然沒啥降價的模型,但也先直接宣布了有兩個基礎的模型能免費調用。
而就在世超寫稿子的時候,騰訊也甩出了自家的大模型 618 降價方案,打折力度五折起。
估計照這架勢,各位企業和開發者們離 token 自由都不遠了。。。
當然,咱也別擔心大模型廠商是不是賠錢,或者倒貼錢搞價格戰。火山引擎總裁譚待在降價的時候,就直接亮明了底牌,說是不虧錢。
而能打得起這場價格戰,在世超看來,很大一部分原因是,大模型廠商們有這個本錢和實力。
這次宣布降價的,基本上都是手裏實打實握著算力資源的企業,不是雲廠商,就是手裏有大把大把的顯卡。
字節有火山引擎雲服務平台,阿裏有阿裏雲,就連初創企業幻方 DeepSeek ,他們也有自己的 AI 智能超算集群,裏麵有1
萬來張英偉達的 A100。
另外這幾年,大模型廠商們也都攢下來了一波技術紅利,訓練和推理的成本也都降下去不少。像是 GPT-4o
都已經慢慢開始向咱白嫖用戶開放, API 的價格對比 GPT-4 Turbo 也是幾乎腰斬。
零一萬物的李開複也預測過,未來大模型的推理算力,每年降個十倍是沒啥問題的。
還有,在最最底層的算力調度上,各個雲廠商們這兩年的長進也不小。
還拿阿裏雲來說,它搭了個非常強大的AI
算力調度係統,在訓練的時候,係統知道怎麽調度算力才最有效率,和之前相比,能節省一半的算力資源。
今年年初,大夥應該就已經感受過一次它的衝擊,當時阿裏雲帶頭挑起了雲服務價格戰,全線產品直降 20%
,有的直接降價一半,惹得騰訊雲、京東雲等等都出來卷價格了。
甚至阿裏雲和騰訊雲還跑去直播間帶貨,去賣雲服務器和雲存儲產品。
除了技術成本確實降下來之外,世超還覺得,大模型廠商們搞出這個價格戰,可能恰恰是為了賺更多的錢、搶占更多的市場。
也就是說,大模型降價可能就是疊醋,得花大價錢的餃子還在後頭。
這麽說吧,雖然大家嘴裏吆喝的,都是大模型降價、 token 降價,但實際打骨折價的,就隻有模型推理用的 token 。
就拿差評編輯部來說,要想用大模型煉個專屬自己的寫稿 AI ,肯定不能隻買推理的 token
,還得用咱們的文章數據把模型再煉一煉,等訓練好之後還得再把新 AI 部署到生產環境中。
後麵的這兩道程序,要花的錢和推理就不在一個量級。。。就拿阿裏的 qwen-turbo 模型來說,百萬個 token
用來推理,隻要 2 塊錢,而要是訓練,就得 30 塊,部署的話,還得分包月和小時費。
而且,這次大模型價格戰打得最狠的,都是阿裏雲、百度雲、騰訊雲等等各種帶 “雲” 的廠商。
世超有理由懷疑,這次大模型價格戰,其實隻是雲服務價格戰的延伸,它們最終的目的,還是想把大夥引到自家的雲服務生態上。
總的來看,價格戰最終卷到大模型領域,大夥們的看法也都是五花八門的,有人覺得,白菜價的大模型會降低門檻,助力企業們加速創新。
也有不少人覺得,要是控製不好降價的力度,最後也可能一地雞毛,沒贏家。
但無論怎麽說,照這價格戰的發展態勢,似乎就隻有大廠們才能玩得起了。
至於最後它們到底會怎麽收場,咱隻能走著瞧了。。。
-->
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_rightside": {
"html":`
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_duturandom": {
"html":`
`,
"script":[]
}
, "gg_square": {
"html":`
`,
"script":[]
}
, "gg_topbanner": {
"html":`
`,
"script":[]
}
, "gg_middlesquare": {
"html":`
`,
"script":[]
}
, "gg_dutu": {
"html":`
`,
"script":[]
}
, "gg_botline": {
"html":``,
"script":[]
}
, "gg_dututop": {
"html":`
`,
"script":[]
}
, "gg_shipintop": {
"html":`
`,
"script":[]
}
, "gg_inContent": {
"html":`
`,
"script":[]
}
, "gg_shipinrandom": {
"html":``,
"script":[]
}
, "gg_sideSticky": {
"html":`
`,
"script":[]
}
, "gg_bottombanner": {
"html":`
`,
"script":[{"type":"text/javascript","src":"//widgets.outbrain.com/outbrain.js","async":"async"}]
}
, "gg_marquee": {
"html":`
`,
"script":[]
}
}
const adEnv={
"gg_header": {
"html":``,
"script":[{"type":"text/javascript","exec":` var googletag = googletag || {}; googletag.cmd = googletag.cmd || []; var pbjs = pbjs || {}; pbjs.que = pbjs.que || []; `},{"type":"text/javascript","src":"https://adncdnend.azureedge.net/adn-hb/adn.wnx2.js","async":""},{"type":"text/javascript","src":"https://adncdnend.azureedge.net/adn-video/WenxuecityPlayer.js","async":"async"}]
}
}
const wxcEnv = {
"base":{
"exe":[],
"src":[
{"src": "/news/js/recommendednews.js","defer":"true"},
{"src":"/js/wxcFunc.js","defer":"true"}
]
},
"func":{
"exe":[
//展示評論
'function showMoreComments(){let n = 4;for(let i=0;i
2){dom.hide();}}$("#showallcomment").show();$("#showlesscomment").hide();};hideComments();',
],
"src":[
//圖片,搜索,QR code
{"src": "/news/js/view.js?v=05132024"},
//計數器
{"src":"//count.wenxuecity.com/service/count/script/do.php?type=news&id=125580784&n=0&out=jsval","defer":"true"},
]
}
}
function wxcCode(){
wxcEnv.base.exe.forEach(x=>{
let tag = buildAdcode(x);
document.head.append(tag);
})
wxcEnv.base.src.forEach(src => {
let tag = buildSrc(src)
document.head.append(tag);
});
wxcEnv.func.exe.forEach(x=>{
let tag = buildAdcode(x);
document.body.append(tag);
})
wxcEnv.func.src.forEach(src => {
let tag = buildSrc(src)
document.body.append(tag);
});
}
function adcode(){
let adkey = Object.keys(ads);
adkey.forEach(x=>{
let code = ads[x].html;
let div = document.getElementById(x);
if(div)div.innerHTML = code;
ads[x].script.forEach(s=>{
if(Object.keys(s).indexOf('src')===-1){
let tag = buildAdcode(s.exec);
document.body.append(tag);
}else{
let tag = buildSrc(s);
document.body.append(tag);
}
})
})
}
function baseCode(){
let baseKeys = Object.keys(adEnv);
baseKeys.forEach(x=>{
adEnv[x].script.forEach(s=>{
if(Object.keys(s).indexOf('src')===-1){
let tag = buildAdcode(s.exec);
document.head.append(tag);
}else{
let tag = buildSrc(s);
document.head.append(tag);
}
})
})
}
function buildAdcode(script){
let tag = document.createElement('script');
tag.innerHTML = script;
return tag;
}
function buildSrc(obj){
let keys = Object.keys(obj);
let tag = document.createElement("script");
keys.forEach(key=>{
tag.setAttribute(key, obj[key]);
})
return tag ;
}