簡體 | 繁體
loading...
新聞頻道
  • 首頁
  • 新聞
  • 讀圖
  • 財經
  • 教育
  • 家居
  • 健康
  • 美食
  • 時尚
  • 旅遊
  • 影視
  • 博客
  • 群吧
  • 論壇
  • 電台
  • 焦點新聞
  • 圖片新聞
  • 視頻新聞
  • 生活百態
  • 娛樂新聞
您的位置: 文學城 » 新聞 » 焦點新聞 » 造出最大芯片的公司 拿下今年全球最大IPO 首日漲70%

造出最大芯片的公司 拿下今年全球最大IPO 首日漲70%

文章來源: 騰訊科技 於 2026-05-14 18:40:48 - 新聞取自各大新聞媒體,新聞內容並不代表本網立場!
被閱讀次數
 

過去幾年,AI 芯片行業有一個很有意思的現象,很多公司最初講的故事,和後來真正活下來的原因,並不完全一致。

Cerebras,就是一個典型案例。

5月14日,Cerebras以每股185美元定價,募資約55.5億美元,對應市值398.17億美元。成為2026年迄今全球規模最大的IPO。上市首日暴漲近70%。

他講的故事是:一顆刷新世界紀錄的大芯片、一份超過200億美元的OpenAI 合同、一個超過兩億美金的GAAP淨利潤。

但如果把 Cerebras 的故事拆分成兩層:一層是技術與產品的真實位置,一層是IPO招股書裏寫在白紙黑字上的另一麵,這個故事可能會給資本市場留下更多的未完待續。

一、一顆“Wafer-Scale 晶圓級”芯片

Cerebras 的核心產品叫Wafer-Scale Engine(WSE),它沒有像 Nvidia、AMD、Google TPU那樣把一顆Die切下來封裝成芯片,而是把一整片12吋晶圓做成一顆芯片。

這在工程實現上挑戰很大。

普通芯片受限於光刻機的Reticle大小(每次曝光最大版圖麵積約 858mm²),切出來的die麵積是有限的,不能比Reticle更大。Reticle 之間有一條專門用來切割的線叫Scribe line,上麵默認沒有有效電路。Cerebras 與 TSMC 一起做了Cross-reticle stitching,讓金屬連線可以跨過 Scribe line,把多個Reticle大小的版圖拚成一整片Wafer-Scale晶圓級的計算係統。單顆 WSE-3 上有約 90 萬顆核心和44GB片上SRAM。

業內一直對Cerebras的Wafer-Scale存在著質疑,在硬件上主要圍繞工程實現和良率展開的。

WSE涉及的版圖設計、片上互聯、缺陷繞行、PVT 一致性、散熱、供電、封裝,每一項都是工程上的硬骨頭。客觀地說,Cerebras把這些骨頭啃下來了,這本身就是一項很強的工程成果,確實是實現了工程意義上的突破。

在良率上,Cerebras 對外宣稱做到了 100%。可如果仔細研究其S1文件和公開的信息和資料,它實際上隻是改變了良率本身的計算方式。

換句話說,他重新定義了芯片良率。

傳統芯片的良率算的是一顆die是否如預期完整可用,隻要落上一個致命缺陷,整顆芯片就會被報廢或降級出售。Cerebras把良率的定義換了一種計算方式:整片晶圓能否通過冗餘核心和片上網絡繞過缺陷,最終湊出一個邏輯上完整的計算係統。根據S-1文件的描述:這是從 memory 行業借來的思路,DRAM/SRAM實際上就是靠冗餘Row/column 把良率做到接近100%,Cerebras 也把這套做法搬到邏輯芯片上。

這倒不能說他完全是在偷換良率的概念,真要實現如此大麵積上的係統可用性也很不容易。靠著片內互連和結構上的取巧,Cerebras實現了某種工程上的突破和產品層麵的平衡。但說到底,它和傳統 GPU 良率口徑不在同一個度量衡裏,並不能直接橫向比較。

從Cerebras的視角來看,除了WSE, 還有一個顯著特點,也是其多次強調的創新突破之處,那就是片內帶寬極高。根據其公開說法,片上 NoC 帶寬達到Pbps量級。

但如果仔細研究就會發現,隻要數據需要離開晶圓,還是要麵對其他 AI芯片麵臨的問題,片(卡)間帶寬的瓶頸同樣會出現,片內和片間互連的量級差大約在 100 倍以上。

我們分析,正是這種“內快外慢”的結構決定了WSE的“轉向”故事。

二、訓練夢碎,推理找到了新機會

Cerebras 最早瞄準的是訓練。站在今天回看,這件事沒做成。

訓練市場有三個繞不過去的約束。硬件:大模型訓練拚的不是單芯片算力,是外部內存與外部互連,權重、梯度、optimizer state、activation 都要在大規模係統裏高效搬運,而WSE恰恰在片外 I/O 互連上是短板。

軟件:Nvidia 的真正壁壘在 GPU+CUDA+NCCL+NVLink+NVSwitch+HBM+服務器+雲廠商部署+開發者生態共同搭出的整套係統,這種壁壘不是單點技術領先就能撼動。訓練場景的客戶基本上主要為全球大模型的頭部玩家了,他們當下最大的戰略任務是“留在牌桌上、爭最快迭代”,沒有人會用如此巨大的機會成本去賭一顆非Nvidia的訓練芯片。

Cerebras當年為訓練配了SwarmX和MemoryX,這其實一定程度上是借用了AMD的既有成果,掛在 WSE外麵解決內存與擴展。但實際部署中這套配套基本沒被認真用起來,根源還是那句話,WSE 的技術亮點在片內,AI 係統的真實瓶頸在係統,在模型如此規模化的今天,片間與片外的瓶頸,直接限製了係統的效能,進一步限製了應用場景。

它還押過一個更大的賭注:非結構化權重稀疏,理論上 8:1 任意稀疏可以拿到接近 8 倍的有效算力,在產品定義與設計上,要在AI計算的泛化意義上來實現,那是非常難的。但在實際上,大模型最後沒走這條路,業界主流是 MoE、低精度量化(FP8/FP4/MXFP)、attention 優化。Cerebras 在硬件上嚐試去做一個很難的特性,但這個特性沒有成為模型演進的主路線。

這也再次證明,AI芯片產品經理要對AI模型有很深刻的理解和預判能力,不然的話,產品定義和設計,就會麵臨極高的風險。

三、推理成為“新金礦”

推理和訓練的係統約束完全不同,推理和場景有關,其計算模式可以解耦。Cerebras 把推理任務做成一條流水線:把整個大模型按層切成幾段,分別放到一片或多片 WSE 上;推理時數據像在工廠傳送帶上一樣,從第一片 WSE 流到下一片,每片隻負責自己那一段計算。

這套辦法之所以能在 WSE 上跑通,關鍵在於一個細節,串接片與片之間需要傳輸的,隻是這一步算出來的中間結果(activation),數據量相對較小;而真正吃內存的部分(模型權重、用戶對話過程中累積的 KV cache)則被鎖在每一片 WSE內部,不需要反複跨片搬運。

這恰好繞開了 WSE 最大的短板,片外 I/O 不夠快(隻是相對於片間來說,和其他 AI芯片其實也在同一個數量級上)。對追求高 token 吞吐的推理場景,這條路線的工程意義是真實的:Cerebras Inference在公開 benchmark上跑出了比主流GPU方案快約15倍的token速度。

但正如之前分析Groq的文章中所述,推理的強泛化能力幾乎就難度極高了。

模型大小、結構、KV cache 需求差異極大,再加上 SRAM 容量、片外 I/O 這些底層約束,WSE 隻能在“特定模型 + 特定適配”的場景下打出最強表現。它的最優市場策略,就應該是找到最通用的模型、量最大的HyperScaler客戶,針對其計算係統進行軟硬件的適配與優化,這也就意味著,從經濟意義上來看,它必須挑客戶。

到這裏,技術故事講完了。一顆工程上有真本事的大芯片,從訓練市場退了出來,在推理市場找到了一條高吞吐路徑,但這條路徑必須靠少數大客戶和深度適配才能走通。

在當今西方世界上,OpenAI和Anthropic是頂級模型大平台。

因此,接下來在S-1文件中,我們就看到了這個技術故事的另外一麵。

四、$200 億訂單的另一麵:股權換訂單

2026 年 1 月,Cerebras 公開宣布與 OpenAI 的多年合同,金額“超過 200 億美元”,部署 750MW 高速 AI 推理算力,雙方共同設計未來模型與硬件。這是 Cerebras IPO路演中很重的一句話。

在S-1文件中,這句話卻成為了一組互相咬合的合同條款,需要拚起來才能看到全貌。

第一筆:$10 億“工作資本貸款”。MRA(Master Relationship Agreement)簽署後,OpenAI 借給 Cerebras $10 億 secured promissory note,年利率 6%,到期日不晚於 2032/12。但這筆錢的賬戶由 OpenAI 控製,Cerebras 不能自由支配;如果MRA因為非 OpenAI 重大違約的原因終止,OpenAI 可以一鍵凍結這筆錢並要求立即全額償還。還款方式特別,Cerebras 可以用現金還,也可以用算力、硬件或其他服務抵銷貸款本金和利息。

第二筆:33,445,026 股 OpenAI Warrant。同一份MRA簽訂之時,Cerebras向OpenAI發行了一份認股權證:標的33,445,026股Class N普通股,行權價$0.00001 / 股,幾乎等於白送。S-1 披露的授予日公允價值是$82.02 / 股,對應總價值約 $27.4 億。Vesting 分三檔:第一檔 4,459,337 股,觸發條件是 $10 億貸款到賬,已於 2026 年 1 月歸屬;第二檔 5,574,171 股,觸發條件是 Cerebras 上市後市值首次突破$400 億、或 OpenAI 完成特定付款裏程碑;第三檔 23,411,518 股,按交付節奏分批歸屬,且完整歸屬的前提是 OpenAI 行使全部1.25GW Additional Capacity 選項、累計采購量達到2GW。

第三筆:Co-design義務 + 排他條款。MRA還包含一定排他性安排,限製Cerebras向OpenAI的部分特定競爭對手提供某些產品和服務。這意味著,Cerebras在獲得OpenAI大單的同時,也在一定程度上讓渡了部分潛在客戶空間。

把這三件事放在一起看,OpenAI與Cerebras之間走的是一個完整的資金閉環:

OpenAI借出$10億, Cerebras 用這筆錢采購Wafer、擴產能、租數據中心;然後Cerebras 把建成的算力賣回給 OpenAI;OpenAI不需要付現金,用應付貨款抵銷貸款本金。限期一年走完,OpenAI的現金沒真正出去,Cerebras的現金也沒真正留下,剩下的隻有 OpenAI 拿到750MW 算力使用權 + 33,445,026 股 Cerebras N普通股的認股權證(OpenAI 同時簽了 Registration Rights Agreement,行權後可要求Cerebras把股票登記上市流通)。

這是一筆以“算力期權 + 股權認購權”打包的交易,被會計準則切成三張表,但商業實質是同一筆生意。

作者聲明:該圖片由AI生成

S-1 在Note 4給出了會計處理依據:客戶Warrant 按授予日公允價值,作為合同交易價格的扣減項(contra-revenue),隨商品/服務交付按比例衝減收入。截至 2025/12/31,Cerebras 資產負債表上記入 $152.4M的 Customer Warrant Asset——但這部分幾乎全部對應G42那筆 1,857,516 股Warrant(同樣是阿聯酋係客戶,是不是似曾相識?可以參考上一篇有關Nvidia收購Groq的文章),並且OpenAI Warrant 在 2025 年財報裏沒有任何影響。

也就是說,Cerebras 2025 年報告口徑裏的所有收入與毛利率,都還沒有扣過 OpenAI 這筆賬。

按S-1在 Note 13的probable判斷:第一檔(已 vest)+ 第二檔(probable)+ 第三檔之 Committed 750MW的部分(probable),合計約 1900 萬股,對應公允價值約$15.4 億,這部分將從 2026 年 Q1 起按 OpenAI 收入比例陸續衝減 Cerebras 的報告口徑收入。

Cerebras自己在 MD&A 裏寫:“When we begin to recognize contra-revenue amounts from the warrants in the first quarter of 2026, we expect quarterly revenue growth rates will decline from recent trends.”(當我們從 2026 年第一季度開始確認Warrant 對應的衝減收入時,預計季度收入增長率將較此前趨勢放緩。)

全部OpenAI Warrant按授予日公允價值約27.4億美元計算,其中約15.4億美元對應已歸屬及被公司判斷為probable的部分,將自2026年一季度起隨OpenAI收入確認節奏衝減收入;剩餘約12億美元則主要取決於OpenAI是否行使額外容量選擇權及後續交付進度。

這在其披露的另一個大客戶Amazon的合作上也有類似的操作。

AWS與Cerebras在 2026 年3月簽訂的 binding term sheet 也包含一份 2,696,678 股、行權價 $100 的 warrant,按 7 年時間+采購量vest。但 OpenAI Warrant 在數量級、行權價折扣、與合同金額的比例上都更激進,它已經不再是客戶激勵,而是把客戶做成了準股東。

這種模式也並不是Cerebras這種將要上市公司所獨有。

今年2月24日,AMD與Meta達成了一項為期五年、總規模超千億美元的戰略合作,根據協議,Meta將在未來五年內部署6GW算力規模的AMD GPU集群。作為對價,AMD向Meta授予最多1.6億股、約占總股本10%的業績型認股權證,行權價僅為每股0.01美元的象征性水平。

同樣的認股權證,同樣的味道。

五、39%毛利率背後的會計幻覺

把視線從合同移到財務報表,S-1文件中披露的2025年關鍵數據:

作者聲明:該圖片由AI生成

GAAP 淨利潤 +$237.8M,這看上去Cerebras已經實現盈利。但仔細研究S-1文件給出的完整解釋會發現,其中包含了一筆一次性 +$363.3M的一次性會計重估。剔除這筆會計重估和股權激勵,Non-GAAP 淨虧損$75.7M,同比擴大約 $54M。2024 年 +$452M的經營現金流主要靠客戶預付款(G42、MBZUAI 提前付款 $640M),2025 年因為預付款消化反轉成了-$10M。

$237.8M的盈利,其實是一個會計幻覺,實際上Cerebras仍在加速虧損。

再看毛利率,從2024年的42.3%降到2025年的39.0%,其在MD&A裏提到雲業務占比上升,與數據中心成本相關的項目也稀釋了毛利,與此同時,未來還將出現客戶認股權證衝減收入。換句話說,這39%的毛利率,毛的有點毛骨悚然:上市後,OpenAI 和AWS的認股權證所帶來的的影響一旦從 2026 年 Q1 開始確認,毛利率算起來就更低了。

更需要被研究的是客戶結構。

正如前麵技術分析中所述,所謂在推理領域找到的機會,是要先決條件的!

作者聲明:該圖片由AI生成

S-1中附注的Note 5裏明確寫到:G42和MBZUAI在ASC 850下被認定為相互的關聯方。也就是說,Cerebras在2024和2025兩年裏,幾乎全部收入都來自一組在會計上可以視為“同一客戶陣營”的阿布紮比實體。應收賬款來看集中度更誇張——2024 年末G42占91%的應收賬款,2025 年末MBZUAI占 77.9%。

從整個客戶組合來看:2025年86%的收入來自一個相互關聯的阿聯酋客戶組合,剩餘約 14% 是其他長尾客戶,OpenAI在2025年財報裏還沒有真正開始確認收入。Cerebras 當下的產品需求被鎖在一個非常窄的客戶麵裏,而向前看,IPO 之後的收入故事高度依賴 OpenAI——而 OpenAI 這個故事,又必須用Warrant 當作配套條件才成立。

這就是一家在上市前投資份額被瘋搶的明星AI芯片公司的真實技術、產品、客戶、營收和利潤狀況!

六、留給資本市場的五個問號

Wafer-Scale Engine算是過去十年最有辨識度的AI芯片項目,後期重新定位的“超高速推理”作為產品定位也跑出了市場——OpenAI 的 Codex-Spark 模型在 2026 年 2 月已經跑在了Cerebras上對外服務。在Nvidia鎖死訓練側、推理側仍存在多種架構機會的當下,在全球資本市場為AI產業瘋狂砸錢的當下,Cerebras選擇此時上市,也是煞費苦心。

但如果在二級市場真金地白銀投票,還是要在這些故事之外,仔細研究幾個非常具體的問題。

問號一:剔除股權對價後的真實毛利率是多少? 2025年的39%是沒有扣 OpenAI Warrant 一分錢。Probable 部分約 $15.4 億即將從 2026 年 Q1 起按比例衝減收入;如果 IPO 後股價進一步抬升,未來新增 vesting tranche 的公允價值會更高、對收入的拖累會更深。

問號二:$200 億 OpenAI 訂單到底鎖定了多少?MRA 同時把“OpenAI 單方按 SLA 砍單的權利、Working Capital Loan 抽貸的權利、Additional Capacity 是否行使的選擇權”全部交給了 OpenAI。Cerebras 履約不達標,訂單可被部分或全部終止;Additional Capacity 不行使,Warrant 第三檔 B 那 14,632,199 股作廢、合同金額也大幅縮水。這份合同的下限,遠低於“$200 億”這個數字給人的直覺。

問號三:客戶結構能不能從“主權 AI 項目承包商”切換為“AI推理基礎設施公司”?2024–2025 兩年 86%–85% 的收入來自互為關聯方的 G42 + MBZUAI 組合,收入集中度太高。這種集中度在傳統工業品業務裏可以被解釋為"早期單點突破",但對一家標榜為世界頂級AI芯片公司來說,它意味著估值錨是不穩定的。OpenAI 的引入能否在2026–2027年真正稀釋這種集中度,要看後續的實際收入分布——而不是合同金額和市場敘事。

問號四:WSE-4 能不能補齊架構層麵的短板?當前 WSE-3 有三個工程缺口:缺乏 FP8 / MXFP / FP4 等低精度浮點支持、片外和片間互連的帶寬極度不帶等遠不夠支撐大模型 KV Cache、以及其核心粒度太小給編譯器和數據映射帶來高複雜度。Cerebras 自己也承認推理經濟性高度依賴片上 SRAM。如果 WSE-4 不完成數量級別的改善,超高速推理的故事就不那麽完備。產品層麵客觀地說,在芯片硬件既定的情況下,軟件無法進行數量級別地優化係統能力,毛利率的改善必須靠硬件架構層麵實打實地獲取!

問號五:這套“認股權證(Warrant)換訂單”的模式,二級市場願不願意買單?Meta 接受過 AMD 的Warrant,AWS也拿了Cerebras的Warrant,OpenAI 拿了Cerebras 更激進的Warrant,國內已上市和正在IPO的幾家AI芯片公司也在用各自版本的客戶股權激勵換訂單。

這個模式正在變成AI芯片公司上市的必備模式。

這種模式它能不能每次都跑成功,且一直可以跑下去,我們需要拭目以待。這次Cerebras的IPO,會是這個模式在國際資本二級市場上進行的壓力測試。

`
  • 父親節送什麽?很多北美華人都在買這3款暢銷保健品:美國專利【骨精華】【心血通】【益腦靈】,優惠大促中!
`
查看評論(8)
  • 文學城簡介
  • 廣告服務
  • 聯係我們
  • 招聘信息
  • 注冊筆名
  • 申請版主
  • 收藏文學城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小時熱點排行

八九學運領袖徐光刑滿出獄,身形消瘦健康受關注
法國網球星丟分失控 球場上當眾脫褲驚呆全場
雪亮工程:中國大數據和AI技術如何讓外國人無處遁形
北京國宴引爆陰謀論 女服務員“胸形不正”被熱議
湖北一村62人先後患癌症和白血病,疑村裏工廠汙染






24小時討論排行

普京與“中國男孩”重逢 “您風采依舊 我變發福大叔”
川普抱怨白宮“空間不夠用,沒地方接待習主席”
一專家:農民就應交公糧,天經地義,重新征收農業稅?
馬西敗選:川普再清算異己 共和黨全麵“川普化”
魯比奧喊話古巴人民:困境源於領袖腐敗 美願捐1億
Meta今血洗大裁員近8000人!員工淩晨4點收通知
上海日料店隨機砍人細節:59歲男涉案 當地日人嚇爆
普京第25次訪華:與習會麵討論"最重要敏感的問題"
中國電影由殺夫女犯自傳式出演惹爭議 上映無期
川普簽署行政令:要求銀行審查客戶的移民身份
特朗普前腳離開,普京後腳抵京:訪問背後外交密碼
普京也進中南海喝茶 川普普京誰待遇更高?北京真正訊號
川普鐵票群苦撐 伊朗戰爭前後“3大重擊”辛酸滿腹
習近平設宴迎普京:茶敘 烤鴨 金華火腿 聽"天鵝湖"
烏克蘭的恐怖日常:一個男孩戰勝俄無人機的求生故事
農村老人幹不動了,屯裏的地誰來種?
文學城新聞
切換到網頁版

造出最大芯片的公司 拿下今年全球最大IPO 首日漲70%

騰訊科技 2026-05-14 18:40:48
 

過去幾年,AI 芯片行業有一個很有意思的現象,很多公司最初講的故事,和後來真正活下來的原因,並不完全一致。

Cerebras,就是一個典型案例。

5月14日,Cerebras以每股185美元定價,募資約55.5億美元,對應市值398.17億美元。成為2026年迄今全球規模最大的IPO。上市首日暴漲近70%。

他講的故事是:一顆刷新世界紀錄的大芯片、一份超過200億美元的OpenAI 合同、一個超過兩億美金的GAAP淨利潤。

但如果把 Cerebras 的故事拆分成兩層:一層是技術與產品的真實位置,一層是IPO招股書裏寫在白紙黑字上的另一麵,這個故事可能會給資本市場留下更多的未完待續。

一、一顆“Wafer-Scale 晶圓級”芯片

Cerebras 的核心產品叫Wafer-Scale Engine(WSE),它沒有像 Nvidia、AMD、Google TPU那樣把一顆Die切下來封裝成芯片,而是把一整片12吋晶圓做成一顆芯片。

這在工程實現上挑戰很大。

普通芯片受限於光刻機的Reticle大小(每次曝光最大版圖麵積約 858mm²),切出來的die麵積是有限的,不能比Reticle更大。Reticle 之間有一條專門用來切割的線叫Scribe line,上麵默認沒有有效電路。Cerebras 與 TSMC 一起做了Cross-reticle stitching,讓金屬連線可以跨過 Scribe line,把多個Reticle大小的版圖拚成一整片Wafer-Scale晶圓級的計算係統。單顆 WSE-3 上有約 90 萬顆核心和44GB片上SRAM。

業內一直對Cerebras的Wafer-Scale存在著質疑,在硬件上主要圍繞工程實現和良率展開的。

WSE涉及的版圖設計、片上互聯、缺陷繞行、PVT 一致性、散熱、供電、封裝,每一項都是工程上的硬骨頭。客觀地說,Cerebras把這些骨頭啃下來了,這本身就是一項很強的工程成果,確實是實現了工程意義上的突破。

在良率上,Cerebras 對外宣稱做到了 100%。可如果仔細研究其S1文件和公開的信息和資料,它實際上隻是改變了良率本身的計算方式。

換句話說,他重新定義了芯片良率。

傳統芯片的良率算的是一顆die是否如預期完整可用,隻要落上一個致命缺陷,整顆芯片就會被報廢或降級出售。Cerebras把良率的定義換了一種計算方式:整片晶圓能否通過冗餘核心和片上網絡繞過缺陷,最終湊出一個邏輯上完整的計算係統。根據S-1文件的描述:這是從 memory 行業借來的思路,DRAM/SRAM實際上就是靠冗餘Row/column 把良率做到接近100%,Cerebras 也把這套做法搬到邏輯芯片上。

這倒不能說他完全是在偷換良率的概念,真要實現如此大麵積上的係統可用性也很不容易。靠著片內互連和結構上的取巧,Cerebras實現了某種工程上的突破和產品層麵的平衡。但說到底,它和傳統 GPU 良率口徑不在同一個度量衡裏,並不能直接橫向比較。

從Cerebras的視角來看,除了WSE, 還有一個顯著特點,也是其多次強調的創新突破之處,那就是片內帶寬極高。根據其公開說法,片上 NoC 帶寬達到Pbps量級。

但如果仔細研究就會發現,隻要數據需要離開晶圓,還是要麵對其他 AI芯片麵臨的問題,片(卡)間帶寬的瓶頸同樣會出現,片內和片間互連的量級差大約在 100 倍以上。

我們分析,正是這種“內快外慢”的結構決定了WSE的“轉向”故事。

二、訓練夢碎,推理找到了新機會

Cerebras 最早瞄準的是訓練。站在今天回看,這件事沒做成。

訓練市場有三個繞不過去的約束。硬件:大模型訓練拚的不是單芯片算力,是外部內存與外部互連,權重、梯度、optimizer state、activation 都要在大規模係統裏高效搬運,而WSE恰恰在片外 I/O 互連上是短板。

軟件:Nvidia 的真正壁壘在 GPU+CUDA+NCCL+NVLink+NVSwitch+HBM+服務器+雲廠商部署+開發者生態共同搭出的整套係統,這種壁壘不是單點技術領先就能撼動。訓練場景的客戶基本上主要為全球大模型的頭部玩家了,他們當下最大的戰略任務是“留在牌桌上、爭最快迭代”,沒有人會用如此巨大的機會成本去賭一顆非Nvidia的訓練芯片。

Cerebras當年為訓練配了SwarmX和MemoryX,這其實一定程度上是借用了AMD的既有成果,掛在 WSE外麵解決內存與擴展。但實際部署中這套配套基本沒被認真用起來,根源還是那句話,WSE 的技術亮點在片內,AI 係統的真實瓶頸在係統,在模型如此規模化的今天,片間與片外的瓶頸,直接限製了係統的效能,進一步限製了應用場景。

它還押過一個更大的賭注:非結構化權重稀疏,理論上 8:1 任意稀疏可以拿到接近 8 倍的有效算力,在產品定義與設計上,要在AI計算的泛化意義上來實現,那是非常難的。但在實際上,大模型最後沒走這條路,業界主流是 MoE、低精度量化(FP8/FP4/MXFP)、attention 優化。Cerebras 在硬件上嚐試去做一個很難的特性,但這個特性沒有成為模型演進的主路線。

這也再次證明,AI芯片產品經理要對AI模型有很深刻的理解和預判能力,不然的話,產品定義和設計,就會麵臨極高的風險。

三、推理成為“新金礦”

推理和訓練的係統約束完全不同,推理和場景有關,其計算模式可以解耦。Cerebras 把推理任務做成一條流水線:把整個大模型按層切成幾段,分別放到一片或多片 WSE 上;推理時數據像在工廠傳送帶上一樣,從第一片 WSE 流到下一片,每片隻負責自己那一段計算。

這套辦法之所以能在 WSE 上跑通,關鍵在於一個細節,串接片與片之間需要傳輸的,隻是這一步算出來的中間結果(activation),數據量相對較小;而真正吃內存的部分(模型權重、用戶對話過程中累積的 KV cache)則被鎖在每一片 WSE內部,不需要反複跨片搬運。

這恰好繞開了 WSE 最大的短板,片外 I/O 不夠快(隻是相對於片間來說,和其他 AI芯片其實也在同一個數量級上)。對追求高 token 吞吐的推理場景,這條路線的工程意義是真實的:Cerebras Inference在公開 benchmark上跑出了比主流GPU方案快約15倍的token速度。

但正如之前分析Groq的文章中所述,推理的強泛化能力幾乎就難度極高了。

模型大小、結構、KV cache 需求差異極大,再加上 SRAM 容量、片外 I/O 這些底層約束,WSE 隻能在“特定模型 + 特定適配”的場景下打出最強表現。它的最優市場策略,就應該是找到最通用的模型、量最大的HyperScaler客戶,針對其計算係統進行軟硬件的適配與優化,這也就意味著,從經濟意義上來看,它必須挑客戶。

到這裏,技術故事講完了。一顆工程上有真本事的大芯片,從訓練市場退了出來,在推理市場找到了一條高吞吐路徑,但這條路徑必須靠少數大客戶和深度適配才能走通。

在當今西方世界上,OpenAI和Anthropic是頂級模型大平台。

因此,接下來在S-1文件中,我們就看到了這個技術故事的另外一麵。

四、$200 億訂單的另一麵:股權換訂單

2026 年 1 月,Cerebras 公開宣布與 OpenAI 的多年合同,金額“超過 200 億美元”,部署 750MW 高速 AI 推理算力,雙方共同設計未來模型與硬件。這是 Cerebras IPO路演中很重的一句話。

在S-1文件中,這句話卻成為了一組互相咬合的合同條款,需要拚起來才能看到全貌。

第一筆:$10 億“工作資本貸款”。MRA(Master Relationship Agreement)簽署後,OpenAI 借給 Cerebras $10 億 secured promissory note,年利率 6%,到期日不晚於 2032/12。但這筆錢的賬戶由 OpenAI 控製,Cerebras 不能自由支配;如果MRA因為非 OpenAI 重大違約的原因終止,OpenAI 可以一鍵凍結這筆錢並要求立即全額償還。還款方式特別,Cerebras 可以用現金還,也可以用算力、硬件或其他服務抵銷貸款本金和利息。

第二筆:33,445,026 股 OpenAI Warrant。同一份MRA簽訂之時,Cerebras向OpenAI發行了一份認股權證:標的33,445,026股Class N普通股,行權價$0.00001 / 股,幾乎等於白送。S-1 披露的授予日公允價值是$82.02 / 股,對應總價值約 $27.4 億。Vesting 分三檔:第一檔 4,459,337 股,觸發條件是 $10 億貸款到賬,已於 2026 年 1 月歸屬;第二檔 5,574,171 股,觸發條件是 Cerebras 上市後市值首次突破$400 億、或 OpenAI 完成特定付款裏程碑;第三檔 23,411,518 股,按交付節奏分批歸屬,且完整歸屬的前提是 OpenAI 行使全部1.25GW Additional Capacity 選項、累計采購量達到2GW。

第三筆:Co-design義務 + 排他條款。MRA還包含一定排他性安排,限製Cerebras向OpenAI的部分特定競爭對手提供某些產品和服務。這意味著,Cerebras在獲得OpenAI大單的同時,也在一定程度上讓渡了部分潛在客戶空間。

把這三件事放在一起看,OpenAI與Cerebras之間走的是一個完整的資金閉環:

OpenAI借出$10億, Cerebras 用這筆錢采購Wafer、擴產能、租數據中心;然後Cerebras 把建成的算力賣回給 OpenAI;OpenAI不需要付現金,用應付貨款抵銷貸款本金。限期一年走完,OpenAI的現金沒真正出去,Cerebras的現金也沒真正留下,剩下的隻有 OpenAI 拿到750MW 算力使用權 + 33,445,026 股 Cerebras N普通股的認股權證(OpenAI 同時簽了 Registration Rights Agreement,行權後可要求Cerebras把股票登記上市流通)。

這是一筆以“算力期權 + 股權認購權”打包的交易,被會計準則切成三張表,但商業實質是同一筆生意。

作者聲明:該圖片由AI生成

S-1 在Note 4給出了會計處理依據:客戶Warrant 按授予日公允價值,作為合同交易價格的扣減項(contra-revenue),隨商品/服務交付按比例衝減收入。截至 2025/12/31,Cerebras 資產負債表上記入 $152.4M的 Customer Warrant Asset——但這部分幾乎全部對應G42那筆 1,857,516 股Warrant(同樣是阿聯酋係客戶,是不是似曾相識?可以參考上一篇有關Nvidia收購Groq的文章),並且OpenAI Warrant 在 2025 年財報裏沒有任何影響。

也就是說,Cerebras 2025 年報告口徑裏的所有收入與毛利率,都還沒有扣過 OpenAI 這筆賬。

按S-1在 Note 13的probable判斷:第一檔(已 vest)+ 第二檔(probable)+ 第三檔之 Committed 750MW的部分(probable),合計約 1900 萬股,對應公允價值約$15.4 億,這部分將從 2026 年 Q1 起按 OpenAI 收入比例陸續衝減 Cerebras 的報告口徑收入。

Cerebras自己在 MD&A 裏寫:“When we begin to recognize contra-revenue amounts from the warrants in the first quarter of 2026, we expect quarterly revenue growth rates will decline from recent trends.”(當我們從 2026 年第一季度開始確認Warrant 對應的衝減收入時,預計季度收入增長率將較此前趨勢放緩。)

全部OpenAI Warrant按授予日公允價值約27.4億美元計算,其中約15.4億美元對應已歸屬及被公司判斷為probable的部分,將自2026年一季度起隨OpenAI收入確認節奏衝減收入;剩餘約12億美元則主要取決於OpenAI是否行使額外容量選擇權及後續交付進度。

這在其披露的另一個大客戶Amazon的合作上也有類似的操作。

AWS與Cerebras在 2026 年3月簽訂的 binding term sheet 也包含一份 2,696,678 股、行權價 $100 的 warrant,按 7 年時間+采購量vest。但 OpenAI Warrant 在數量級、行權價折扣、與合同金額的比例上都更激進,它已經不再是客戶激勵,而是把客戶做成了準股東。

這種模式也並不是Cerebras這種將要上市公司所獨有。

今年2月24日,AMD與Meta達成了一項為期五年、總規模超千億美元的戰略合作,根據協議,Meta將在未來五年內部署6GW算力規模的AMD GPU集群。作為對價,AMD向Meta授予最多1.6億股、約占總股本10%的業績型認股權證,行權價僅為每股0.01美元的象征性水平。

同樣的認股權證,同樣的味道。

五、39%毛利率背後的會計幻覺

把視線從合同移到財務報表,S-1文件中披露的2025年關鍵數據:

作者聲明:該圖片由AI生成

GAAP 淨利潤 +$237.8M,這看上去Cerebras已經實現盈利。但仔細研究S-1文件給出的完整解釋會發現,其中包含了一筆一次性 +$363.3M的一次性會計重估。剔除這筆會計重估和股權激勵,Non-GAAP 淨虧損$75.7M,同比擴大約 $54M。2024 年 +$452M的經營現金流主要靠客戶預付款(G42、MBZUAI 提前付款 $640M),2025 年因為預付款消化反轉成了-$10M。

$237.8M的盈利,其實是一個會計幻覺,實際上Cerebras仍在加速虧損。

再看毛利率,從2024年的42.3%降到2025年的39.0%,其在MD&A裏提到雲業務占比上升,與數據中心成本相關的項目也稀釋了毛利,與此同時,未來還將出現客戶認股權證衝減收入。換句話說,這39%的毛利率,毛的有點毛骨悚然:上市後,OpenAI 和AWS的認股權證所帶來的的影響一旦從 2026 年 Q1 開始確認,毛利率算起來就更低了。

更需要被研究的是客戶結構。

正如前麵技術分析中所述,所謂在推理領域找到的機會,是要先決條件的!

作者聲明:該圖片由AI生成

S-1中附注的Note 5裏明確寫到:G42和MBZUAI在ASC 850下被認定為相互的關聯方。也就是說,Cerebras在2024和2025兩年裏,幾乎全部收入都來自一組在會計上可以視為“同一客戶陣營”的阿布紮比實體。應收賬款來看集中度更誇張——2024 年末G42占91%的應收賬款,2025 年末MBZUAI占 77.9%。

從整個客戶組合來看:2025年86%的收入來自一個相互關聯的阿聯酋客戶組合,剩餘約 14% 是其他長尾客戶,OpenAI在2025年財報裏還沒有真正開始確認收入。Cerebras 當下的產品需求被鎖在一個非常窄的客戶麵裏,而向前看,IPO 之後的收入故事高度依賴 OpenAI——而 OpenAI 這個故事,又必須用Warrant 當作配套條件才成立。

這就是一家在上市前投資份額被瘋搶的明星AI芯片公司的真實技術、產品、客戶、營收和利潤狀況!

六、留給資本市場的五個問號

Wafer-Scale Engine算是過去十年最有辨識度的AI芯片項目,後期重新定位的“超高速推理”作為產品定位也跑出了市場——OpenAI 的 Codex-Spark 模型在 2026 年 2 月已經跑在了Cerebras上對外服務。在Nvidia鎖死訓練側、推理側仍存在多種架構機會的當下,在全球資本市場為AI產業瘋狂砸錢的當下,Cerebras選擇此時上市,也是煞費苦心。

但如果在二級市場真金地白銀投票,還是要在這些故事之外,仔細研究幾個非常具體的問題。

問號一:剔除股權對價後的真實毛利率是多少? 2025年的39%是沒有扣 OpenAI Warrant 一分錢。Probable 部分約 $15.4 億即將從 2026 年 Q1 起按比例衝減收入;如果 IPO 後股價進一步抬升,未來新增 vesting tranche 的公允價值會更高、對收入的拖累會更深。

問號二:$200 億 OpenAI 訂單到底鎖定了多少?MRA 同時把“OpenAI 單方按 SLA 砍單的權利、Working Capital Loan 抽貸的權利、Additional Capacity 是否行使的選擇權”全部交給了 OpenAI。Cerebras 履約不達標,訂單可被部分或全部終止;Additional Capacity 不行使,Warrant 第三檔 B 那 14,632,199 股作廢、合同金額也大幅縮水。這份合同的下限,遠低於“$200 億”這個數字給人的直覺。

問號三:客戶結構能不能從“主權 AI 項目承包商”切換為“AI推理基礎設施公司”?2024–2025 兩年 86%–85% 的收入來自互為關聯方的 G42 + MBZUAI 組合,收入集中度太高。這種集中度在傳統工業品業務裏可以被解釋為"早期單點突破",但對一家標榜為世界頂級AI芯片公司來說,它意味著估值錨是不穩定的。OpenAI 的引入能否在2026–2027年真正稀釋這種集中度,要看後續的實際收入分布——而不是合同金額和市場敘事。

問號四:WSE-4 能不能補齊架構層麵的短板?當前 WSE-3 有三個工程缺口:缺乏 FP8 / MXFP / FP4 等低精度浮點支持、片外和片間互連的帶寬極度不帶等遠不夠支撐大模型 KV Cache、以及其核心粒度太小給編譯器和數據映射帶來高複雜度。Cerebras 自己也承認推理經濟性高度依賴片上 SRAM。如果 WSE-4 不完成數量級別的改善,超高速推理的故事就不那麽完備。產品層麵客觀地說,在芯片硬件既定的情況下,軟件無法進行數量級別地優化係統能力,毛利率的改善必須靠硬件架構層麵實打實地獲取!

問號五:這套“認股權證(Warrant)換訂單”的模式,二級市場願不願意買單?Meta 接受過 AMD 的Warrant,AWS也拿了Cerebras的Warrant,OpenAI 拿了Cerebras 更激進的Warrant,國內已上市和正在IPO的幾家AI芯片公司也在用各自版本的客戶股權激勵換訂單。

這個模式正在變成AI芯片公司上市的必備模式。

這種模式它能不能每次都跑成功,且一直可以跑下去,我們需要拭目以待。這次Cerebras的IPO,會是這個模式在國際資本二級市場上進行的壓力測試。