造出最大芯片的公司 拿下今年全球最大IPO 首日漲70%
騰訊科技
2026-05-14 18:40:48
過去幾年,AI 芯片行業有一個很有意思的現象,很多公司最初講的故事,和後來真正活下來的原因,並不完全一致。
Cerebras,就是一個典型案例。
5月14日,Cerebras以每股185美元定價,募資約55.5億美元,對應市值398.17億美元。成為2026年迄今全球規模最大的IPO。上市首日暴漲近70%。
他講的故事是:一顆刷新世界紀錄的大芯片、一份超過200億美元的OpenAI 合同、一個超過兩億美金的GAAP淨利潤。
但如果把 Cerebras
的故事拆分成兩層:一層是技術與產品的真實位置,一層是IPO招股書裏寫在白紙黑字上的另一麵,這個故事可能會給資本市場留下更多的未完待續。
一、一顆“Wafer-Scale 晶圓級”芯片
Cerebras 的核心產品叫Wafer-Scale Engine(WSE),它沒有像 Nvidia、AMD、Google
TPU那樣把一顆Die切下來封裝成芯片,而是把一整片12吋晶圓做成一顆芯片。
這在工程實現上挑戰很大。
普通芯片受限於光刻機的Reticle大小(每次曝光最大版圖麵積約
858mm²),切出來的die麵積是有限的,不能比Reticle更大。Reticle 之間有一條專門用來切割的線叫Scribe
line,上麵默認沒有有效電路。Cerebras 與 TSMC 一起做了Cross-reticle
stitching,讓金屬連線可以跨過 Scribe
line,把多個Reticle大小的版圖拚成一整片Wafer-Scale晶圓級的計算係統。單顆 WSE-3 上有約 90
萬顆核心和44GB片上SRAM。
業內一直對Cerebras的Wafer-Scale存在著質疑,在硬件上主要圍繞工程實現和良率展開的。
WSE涉及的版圖設計、片上互聯、缺陷繞行、PVT
一致性、散熱、供電、封裝,每一項都是工程上的硬骨頭。客觀地說,Cerebras把這些骨頭啃下來了,這本身就是一項很強的工程成果,確實是實現了工程意義上的突破。
在良率上,Cerebras 對外宣稱做到了
100%。可如果仔細研究其S1文件和公開的信息和資料,它實際上隻是改變了良率本身的計算方式。
換句話說,他重新定義了芯片良率。
傳統芯片的良率算的是一顆die是否如預期完整可用,隻要落上一個致命缺陷,整顆芯片就會被報廢或降級出售。Cerebras把良率的定義換了一種計算方式:整片晶圓能否通過冗餘核心和片上網絡繞過缺陷,最終湊出一個邏輯上完整的計算係統。根據S-1文件的描述:這是從
memory 行業借來的思路,DRAM/SRAM實際上就是靠冗餘Row/column 把良率做到接近100%,Cerebras
也把這套做法搬到邏輯芯片上。
這倒不能說他完全是在偷換良率的概念,真要實現如此大麵積上的係統可用性也很不容易。靠著片內互連和結構上的取巧,Cerebras實現了某種工程上的突破和產品層麵的平衡。但說到底,它和傳統
GPU 良率口徑不在同一個度量衡裏,並不能直接橫向比較。
從Cerebras的視角來看,除了WSE,
還有一個顯著特點,也是其多次強調的創新突破之處,那就是片內帶寬極高。根據其公開說法,片上 NoC 帶寬達到Pbps量級。
但如果仔細研究就會發現,隻要數據需要離開晶圓,還是要麵對其他
AI芯片麵臨的問題,片(卡)間帶寬的瓶頸同樣會出現,片內和片間互連的量級差大約在 100 倍以上。
我們分析,正是這種“內快外慢”的結構決定了WSE的“轉向”故事。
二、訓練夢碎,推理找到了新機會
Cerebras 最早瞄準的是訓練。站在今天回看,這件事沒做成。
訓練市場有三個繞不過去的約束。硬件:大模型訓練拚的不是單芯片算力,是外部內存與外部互連,權重、梯度、optimizer
state、activation 都要在大規模係統裏高效搬運,而WSE恰恰在片外 I/O 互連上是短板。
軟件:Nvidia 的真正壁壘在
GPU+CUDA+NCCL+NVLink+NVSwitch+HBM+服務器+雲廠商部署+開發者生態共同搭出的整套係統,這種壁壘不是單點技術領先就能撼動。訓練場景的客戶基本上主要為全球大模型的頭部玩家了,他們當下最大的戰略任務是“留在牌桌上、爭最快迭代”,沒有人會用如此巨大的機會成本去賭一顆非Nvidia的訓練芯片。
Cerebras當年為訓練配了SwarmX和MemoryX,這其實一定程度上是借用了AMD的既有成果,掛在
WSE外麵解決內存與擴展。但實際部署中這套配套基本沒被認真用起來,根源還是那句話,WSE 的技術亮點在片內,AI
係統的真實瓶頸在係統,在模型如此規模化的今天,片間與片外的瓶頸,直接限製了係統的效能,進一步限製了應用場景。
它還押過一個更大的賭注:非結構化權重稀疏,理論上 8:1 任意稀疏可以拿到接近 8
倍的有效算力,在產品定義與設計上,要在AI計算的泛化意義上來實現,那是非常難的。但在實際上,大模型最後沒走這條路,業界主流是
MoE、低精度量化(FP8/FP4/MXFP)、attention 優化。Cerebras
在硬件上嚐試去做一個很難的特性,但這個特性沒有成為模型演進的主路線。
這也再次證明,AI芯片產品經理要對AI模型有很深刻的理解和預判能力,不然的話,產品定義和設計,就會麵臨極高的風險。
三、推理成為“新金礦”
推理和訓練的係統約束完全不同,推理和場景有關,其計算模式可以解耦。Cerebras
把推理任務做成一條流水線:把整個大模型按層切成幾段,分別放到一片或多片 WSE 上;推理時數據像在工廠傳送帶上一樣,從第一片 WSE
流到下一片,每片隻負責自己那一段計算。
這套辦法之所以能在 WSE
上跑通,關鍵在於一個細節,串接片與片之間需要傳輸的,隻是這一步算出來的中間結果(activation),數據量相對較小;而真正吃內存的部分(模型權重、用戶對話過程中累積的
KV cache)則被鎖在每一片 WSE內部,不需要反複跨片搬運。
這恰好繞開了 WSE 最大的短板,片外 I/O 不夠快(隻是相對於片間來說,和其他 AI芯片其實也在同一個數量級上)。對追求高
token 吞吐的推理場景,這條路線的工程意義是真實的:Cerebras Inference在公開
benchmark上跑出了比主流GPU方案快約15倍的token速度。
但正如之前分析Groq的文章中所述,推理的強泛化能力幾乎就難度極高了。
模型大小、結構、KV cache 需求差異極大,再加上 SRAM 容量、片外 I/O 這些底層約束,WSE
隻能在“特定模型 +
特定適配”的場景下打出最強表現。它的最優市場策略,就應該是找到最通用的模型、量最大的HyperScaler客戶,針對其計算係統進行軟硬件的適配與優化,這也就意味著,從經濟意義上來看,它必須挑客戶。
到這裏,技術故事講完了。一顆工程上有真本事的大芯片,從訓練市場退了出來,在推理市場找到了一條高吞吐路徑,但這條路徑必須靠少數大客戶和深度適配才能走通。
在當今西方世界上,OpenAI和Anthropic是頂級模型大平台。
因此,接下來在S-1文件中,我們就看到了這個技術故事的另外一麵。
四、$200 億訂單的另一麵:股權換訂單
2026 年 1 月,Cerebras 公開宣布與 OpenAI 的多年合同,金額“超過 200 億美元”,部署 750MW
高速 AI 推理算力,雙方共同設計未來模型與硬件。這是 Cerebras IPO路演中很重的一句話。
在S-1文件中,這句話卻成為了一組互相咬合的合同條款,需要拚起來才能看到全貌。
第一筆:$10 億“工作資本貸款”。MRA(Master Relationship Agreement)簽署後,OpenAI
借給 Cerebras $10 億 secured promissory note,年利率 6%,到期日不晚於
2032/12。但這筆錢的賬戶由 OpenAI 控製,Cerebras 不能自由支配;如果MRA因為非 OpenAI
重大違約的原因終止,OpenAI 可以一鍵凍結這筆錢並要求立即全額償還。還款方式特別,Cerebras
可以用現金還,也可以用算力、硬件或其他服務抵銷貸款本金和利息。
第二筆:33,445,026 股 OpenAI
Warrant。同一份MRA簽訂之時,Cerebras向OpenAI發行了一份認股權證:標的33,445,026股Class
N普通股,行權價$0.00001 / 股,幾乎等於白送。S-1 披露的授予日公允價值是$82.02 / 股,對應總價值約 $27.4
億。Vesting 分三檔:第一檔 4,459,337 股,觸發條件是 $10 億貸款到賬,已於 2026 年 1 月歸屬;第二檔
5,574,171 股,觸發條件是 Cerebras 上市後市值首次突破$400 億、或 OpenAI 完成特定付款裏程碑;第三檔
23,411,518 股,按交付節奏分批歸屬,且完整歸屬的前提是 OpenAI 行使全部1.25GW Additional
Capacity 選項、累計采購量達到2GW。
第三筆:Co-design義務 +
排他條款。MRA還包含一定排他性安排,限製Cerebras向OpenAI的部分特定競爭對手提供某些產品和服務。這意味著,Cerebras在獲得OpenAI大單的同時,也在一定程度上讓渡了部分潛在客戶空間。
把這三件事放在一起看,OpenAI與Cerebras之間走的是一個完整的資金閉環:
OpenAI借出$10億, Cerebras 用這筆錢采購Wafer、擴產能、租數據中心;然後Cerebras
把建成的算力賣回給
OpenAI;OpenAI不需要付現金,用應付貨款抵銷貸款本金。限期一年走完,OpenAI的現金沒真正出去,Cerebras的現金也沒真正留下,剩下的隻有
OpenAI 拿到750MW 算力使用權 + 33,445,026 股 Cerebras N普通股的認股權證(OpenAI 同時簽了
Registration Rights Agreement,行權後可要求Cerebras把股票登記上市流通)。
這是一筆以“算力期權 + 股權認購權”打包的交易,被會計準則切成三張表,但商業實質是同一筆生意。
作者聲明:該圖片由AI生成
S-1 在Note 4給出了會計處理依據:客戶Warrant
按授予日公允價值,作為合同交易價格的扣減項(contra-revenue),隨商品/服務交付按比例衝減收入。截至
2025/12/31,Cerebras 資產負債表上記入 $152.4M的 Customer Warrant
Asset——但這部分幾乎全部對應G42那筆 1,857,516
股Warrant(同樣是阿聯酋係客戶,是不是似曾相識?可以參考上一篇有關Nvidia收購Groq的文章),並且OpenAI
Warrant 在 2025 年財報裏沒有任何影響。
也就是說,Cerebras 2025 年報告口徑裏的所有收入與毛利率,都還沒有扣過 OpenAI 這筆賬。
按S-1在 Note 13的probable判斷:第一檔(已 vest)+ 第二檔(probable)+ 第三檔之
Committed 750MW的部分(probable),合計約 1900 萬股,對應公允價值約$15.4 億,這部分將從 2026
年 Q1 起按 OpenAI 收入比例陸續衝減 Cerebras 的報告口徑收入。
Cerebras自己在 MD&A 裏寫:“When we begin to recognize
contra-revenue amounts from the warrants in the first quarter of
2026, we expect quarterly revenue growth rates will decline from
recent trends.”(當我們從 2026 年第一季度開始確認Warrant
對應的衝減收入時,預計季度收入增長率將較此前趨勢放緩。)
全部OpenAI
Warrant按授予日公允價值約27.4億美元計算,其中約15.4億美元對應已歸屬及被公司判斷為probable的部分,將自2026年一季度起隨OpenAI收入確認節奏衝減收入;剩餘約12億美元則主要取決於OpenAI是否行使額外容量選擇權及後續交付進度。
這在其披露的另一個大客戶Amazon的合作上也有類似的操作。
AWS與Cerebras在 2026 年3月簽訂的 binding term sheet 也包含一份 2,696,678
股、行權價 $100 的 warrant,按 7 年時間+采購量vest。但 OpenAI Warrant
在數量級、行權價折扣、與合同金額的比例上都更激進,它已經不再是客戶激勵,而是把客戶做成了準股東。
這種模式也並不是Cerebras這種將要上市公司所獨有。
今年2月24日,AMD與Meta達成了一項為期五年、總規模超千億美元的戰略合作,根據協議,Meta將在未來五年內部署6GW算力規模的AMD
GPU集群。作為對價,AMD向Meta授予最多1.6億股、約占總股本10%的業績型認股權證,行權價僅為每股0.01美元的象征性水平。
同樣的認股權證,同樣的味道。
五、39%毛利率背後的會計幻覺
把視線從合同移到財務報表,S-1文件中披露的2025年關鍵數據:
作者聲明:該圖片由AI生成
GAAP 淨利潤
+$237.8M,這看上去Cerebras已經實現盈利。但仔細研究S-1文件給出的完整解釋會發現,其中包含了一筆一次性
+$363.3M的一次性會計重估。剔除這筆會計重估和股權激勵,Non-GAAP 淨虧損$75.7M,同比擴大約 $54M。2024 年
+$452M的經營現金流主要靠客戶預付款(G42、MBZUAI 提前付款 $640M),2025
年因為預付款消化反轉成了-$10M。
$237.8M的盈利,其實是一個會計幻覺,實際上Cerebras仍在加速虧損。
再看毛利率,從2024年的42.3%降到2025年的39.0%,其在MD&A裏提到雲業務占比上升,與數據中心成本相關的項目也稀釋了毛利,與此同時,未來還將出現客戶認股權證衝減收入。換句話說,這39%的毛利率,毛的有點毛骨悚然:上市後,OpenAI
和AWS的認股權證所帶來的的影響一旦從 2026 年 Q1 開始確認,毛利率算起來就更低了。
更需要被研究的是客戶結構。
正如前麵技術分析中所述,所謂在推理領域找到的機會,是要先決條件的!
作者聲明:該圖片由AI生成
S-1中附注的Note 5裏明確寫到:G42和MBZUAI在ASC
850下被認定為相互的關聯方。也就是說,Cerebras在2024和2025兩年裏,幾乎全部收入都來自一組在會計上可以視為“同一客戶陣營”的阿布紮比實體。應收賬款來看集中度更誇張——2024
年末G42占91%的應收賬款,2025 年末MBZUAI占 77.9%。
從整個客戶組合來看:2025年86%的收入來自一個相互關聯的阿聯酋客戶組合,剩餘約 14%
是其他長尾客戶,OpenAI在2025年財報裏還沒有真正開始確認收入。Cerebras
當下的產品需求被鎖在一個非常窄的客戶麵裏,而向前看,IPO 之後的收入故事高度依賴 OpenAI——而 OpenAI
這個故事,又必須用Warrant 當作配套條件才成立。
這就是一家在上市前投資份額被瘋搶的明星AI芯片公司的真實技術、產品、客戶、營收和利潤狀況!
六、留給資本市場的五個問號
Wafer-Scale
Engine算是過去十年最有辨識度的AI芯片項目,後期重新定位的“超高速推理”作為產品定位也跑出了市場——OpenAI 的
Codex-Spark 模型在 2026 年 2
月已經跑在了Cerebras上對外服務。在Nvidia鎖死訓練側、推理側仍存在多種架構機會的當下,在全球資本市場為AI產業瘋狂砸錢的當下,Cerebras選擇此時上市,也是煞費苦心。
但如果在二級市場真金地白銀投票,還是要在這些故事之外,仔細研究幾個非常具體的問題。
問號一:剔除股權對價後的真實毛利率是多少? 2025年的39%是沒有扣 OpenAI Warrant 一分錢。Probable
部分約 $15.4 億即將從 2026 年 Q1 起按比例衝減收入;如果 IPO 後股價進一步抬升,未來新增 vesting
tranche 的公允價值會更高、對收入的拖累會更深。
問號二:$200 億 OpenAI 訂單到底鎖定了多少?MRA 同時把“OpenAI 單方按 SLA 砍單的權利、Working
Capital Loan 抽貸的權利、Additional Capacity 是否行使的選擇權”全部交給了
OpenAI。Cerebras 履約不達標,訂單可被部分或全部終止;Additional Capacity 不行使,Warrant
第三檔 B 那 14,632,199 股作廢、合同金額也大幅縮水。這份合同的下限,遠低於“$200
億”這個數字給人的直覺。
問號三:客戶結構能不能從“主權 AI 項目承包商”切換為“AI推理基礎設施公司”?2024–2025 兩年 86%–85%
的收入來自互為關聯方的 G42 + MBZUAI
組合,收入集中度太高。這種集中度在傳統工業品業務裏可以被解釋為"早期單點突破",但對一家標榜為世界頂級AI芯片公司來說,它意味著估值錨是不穩定的。OpenAI
的引入能否在2026–2027年真正稀釋這種集中度,要看後續的實際收入分布——而不是合同金額和市場敘事。
問號四:WSE-4 能不能補齊架構層麵的短板?當前 WSE-3 有三個工程缺口:缺乏 FP8 / MXFP / FP4
等低精度浮點支持、片外和片間互連的帶寬極度不帶等遠不夠支撐大模型 KV
Cache、以及其核心粒度太小給編譯器和數據映射帶來高複雜度。Cerebras 自己也承認推理經濟性高度依賴片上 SRAM。如果
WSE-4
不完成數量級別的改善,超高速推理的故事就不那麽完備。產品層麵客觀地說,在芯片硬件既定的情況下,軟件無法進行數量級別地優化係統能力,毛利率的改善必須靠硬件架構層麵實打實地獲取!
問號五:這套“認股權證(Warrant)換訂單”的模式,二級市場願不願意買單?Meta 接受過 AMD
的Warrant,AWS也拿了Cerebras的Warrant,OpenAI 拿了Cerebras
更激進的Warrant,國內已上市和正在IPO的幾家AI芯片公司也在用各自版本的客戶股權激勵換訂單。
這個模式正在變成AI芯片公司上市的必備模式。
這種模式它能不能每次都跑成功,且一直可以跑下去,我們需要拭目以待。這次Cerebras的IPO,會是這個模式在國際資本二級市場上進行的壓力測試。