過去幾年，AI 芯片行業有一個很有意思的現象，很多公司最初講的故事，和後來真正活下來的原因，並不完全一致。

Cerebras，就是一個典型案例。

5月14日，Cerebras以每股185美元定價，募資約55.5億美元，對應市值398.17億美元。成為2026年迄今全球規模最大的IPO。上市首日暴漲近70%。

他講的故事是：一顆刷新世界紀錄的大芯片、一份超過200億美元的OpenAI 合同、一個超過兩億美金的GAAP淨利潤。

但如果把 Cerebras 的故事拆分成兩層：一層是技術與產品的真實位置，一層是IPO招股書裏寫在白紙黑字上的另一麵，這個故事可能會給資本市場留下更多的未完待續。

一、一顆“Wafer-Scale 晶圓級”芯片

Cerebras 的核心產品叫Wafer-Scale Engine（WSE），它沒有像 Nvidia、AMD、Google TPU那樣把一顆Die切下來封裝成芯片，而是把一整片12吋晶圓做成一顆芯片。

這在工程實現上挑戰很大。

普通芯片受限於光刻機的Reticle大小（每次曝光最大版圖麵積約 858mm²），切出來的die麵積是有限的，不能比Reticle更大。Reticle 之間有一條專門用來切割的線叫Scribe line，上麵默認沒有有效電路。Cerebras 與 TSMC 一起做了Cross-reticle stitching，讓金屬連線可以跨過 Scribe line，把多個Reticle大小的版圖拚成一整片Wafer-Scale晶圓級的計算係統。單顆 WSE-3 上有約 90 萬顆核心和44GB片上SRAM。

業內一直對Cerebras的Wafer-Scale存在著質疑，在硬件上主要圍繞工程實現和良率展開的。

WSE涉及的版圖設計、片上互聯、缺陷繞行、PVT 一致性、散熱、供電、封裝，每一項都是工程上的硬骨頭。客觀地說，Cerebras把這些骨頭啃下來了，這本身就是一項很強的工程成果，確實是實現了工程意義上的突破。

在良率上，Cerebras 對外宣稱做到了 100%。可如果仔細研究其S1文件和公開的信息和資料，它實際上隻是改變了良率本身的計算方式。

換句話說，他重新定義了芯片良率。

傳統芯片的良率算的是一顆die是否如預期完整可用，隻要落上一個致命缺陷，整顆芯片就會被報廢或降級出售。Cerebras把良率的定義換了一種計算方式：整片晶圓能否通過冗餘核心和片上網絡繞過缺陷，最終湊出一個邏輯上完整的計算係統。根據S-1文件的描述：這是從 memory 行業借來的思路，DRAM/SRAM實際上就是靠冗餘Row/column 把良率做到接近100%，Cerebras 也把這套做法搬到邏輯芯片上。

這倒不能說他完全是在偷換良率的概念，真要實現如此大麵積上的係統可用性也很不容易。靠著片內互連和結構上的取巧，Cerebras實現了某種工程上的突破和產品層麵的平衡。但說到底，它和傳統 GPU 良率口徑不在同一個度量衡裏，並不能直接橫向比較。

從Cerebras的視角來看，除了WSE，還有一個顯著特點，也是其多次強調的創新突破之處，那就是片內帶寬極高。根據其公開說法，片上 NoC 帶寬達到Pbps量級。

但如果仔細研究就會發現，隻要數據需要離開晶圓，還是要麵對其他 AI芯片麵臨的問題，片（卡）間帶寬的瓶頸同樣會出現，片內和片間互連的量級差大約在 100 倍以上。

我們分析，正是這種“內快外慢”的結構決定了WSE的“轉向”故事。

二、訓練夢碎，推理找到了新機會

Cerebras 最早瞄準的是訓練。站在今天回看，這件事沒做成。

訓練市場有三個繞不過去的約束。硬件：大模型訓練拚的不是單芯片算力，是外部內存與外部互連，權重、梯度、optimizer state、activation 都要在大規模係統裏高效搬運，而WSE恰恰在片外 I/O 互連上是短板。

軟件：Nvidia 的真正壁壘在 GPU+CUDA+NCCL+NVLink+NVSwitch+HBM+服務器+雲廠商部署+開發者生態共同搭出的整套係統，這種壁壘不是單點技術領先就能撼動。訓練場景的客戶基本上主要為全球大模型的頭部玩家了，他們當下最大的戰略任務是“留在牌桌上、爭最快迭代”，沒有人會用如此巨大的機會成本去賭一顆非Nvidia的訓練芯片。

Cerebras當年為訓練配了SwarmX和MemoryX，這其實一定程度上是借用了AMD的既有成果，掛在 WSE外麵解決內存與擴展。但實際部署中這套配套基本沒被認真用起來，根源還是那句話，WSE 的技術亮點在片內，AI 係統的真實瓶頸在係統，在模型如此規模化的今天，片間與片外的瓶頸，直接限製了係統的效能，進一步限製了應用場景。

它還押過一個更大的賭注：非結構化權重稀疏，理論上 8:1 任意稀疏可以拿到接近 8 倍的有效算力，在產品定義與設計上，要在AI計算的泛化意義上來實現，那是非常難的。但在實際上，大模型最後沒走這條路，業界主流是 MoE、低精度量化（FP8/FP4/MXFP）、attention 優化。Cerebras 在硬件上嚐試去做一個很難的特性，但這個特性沒有成為模型演進的主路線。

這也再次證明，AI芯片產品經理要對AI模型有很深刻的理解和預判能力，不然的話，產品定義和設計，就會麵臨極高的風險。

三、推理成為“新金礦”

推理和訓練的係統約束完全不同，推理和場景有關，其計算模式可以解耦。Cerebras 把推理任務做成一條流水線：把整個大模型按層切成幾段，分別放到一片或多片 WSE 上；推理時數據像在工廠傳送帶上一樣，從第一片 WSE 流到下一片，每片隻負責自己那一段計算。

這套辦法之所以能在 WSE 上跑通，關鍵在於一個細節，串接片與片之間需要傳輸的，隻是這一步算出來的中間結果（activation），數據量相對較小；而真正吃內存的部分（模型權重、用戶對話過程中累積的 KV cache）則被鎖在每一片 WSE內部，不需要反複跨片搬運。

這恰好繞開了 WSE 最大的短板，片外 I/O 不夠快（隻是相對於片間來說，和其他 AI芯片其實也在同一個數量級上）。對追求高 token 吞吐的推理場景，這條路線的工程意義是真實的：Cerebras Inference在公開 benchmark上跑出了比主流GPU方案快約15倍的token速度。

但正如之前分析Groq的文章中所述，推理的強泛化能力幾乎就難度極高了。

模型大小、結構、KV cache 需求差異極大，再加上 SRAM 容量、片外 I/O 這些底層約束，WSE 隻能在“特定模型 + 特定適配”的場景下打出最強表現。它的最優市場策略，就應該是找到最通用的模型、量最大的HyperScaler客戶，針對其計算係統進行軟硬件的適配與優化，這也就意味著，從經濟意義上來看，它必須挑客戶。

到這裏，技術故事講完了。一顆工程上有真本事的大芯片，從訓練市場退了出來，在推理市場找到了一條高吞吐路徑，但這條路徑必須靠少數大客戶和深度適配才能走通。

在當今西方世界上，OpenAI和Anthropic是頂級模型大平台。

因此，接下來在S-1文件中，我們就看到了這個技術故事的另外一麵。

四、$200 億訂單的另一麵：股權換訂單

2026 年 1 月，Cerebras 公開宣布與 OpenAI 的多年合同，金額“超過 200 億美元”，部署 750MW 高速 AI 推理算力，雙方共同設計未來模型與硬件。這是 Cerebras IPO路演中很重的一句話。

在S-1文件中，這句話卻成為了一組互相咬合的合同條款，需要拚起來才能看到全貌。

第一筆：$10 億“工作資本貸款”。MRA（Master Relationship Agreement）簽署後，OpenAI 借給 Cerebras $10 億 secured promissory note，年利率 6%，到期日不晚於 2032/12。但這筆錢的賬戶由 OpenAI 控製，Cerebras 不能自由支配；如果MRA因為非 OpenAI 重大違約的原因終止，OpenAI 可以一鍵凍結這筆錢並要求立即全額償還。還款方式特別，Cerebras 可以用現金還，也可以用算力、硬件或其他服務抵銷貸款本金和利息。

第二筆：33,445,026 股 OpenAI Warrant。同一份MRA簽訂之時，Cerebras向OpenAI發行了一份認股權證：標的33,445,026股Class N普通股，行權價$0.00001 / 股，幾乎等於白送。S-1 披露的授予日公允價值是$82.02 / 股，對應總價值約 $27.4 億。Vesting 分三檔：第一檔 4,459,337 股，觸發條件是 $10 億貸款到賬，已於 2026 年 1 月歸屬；第二檔 5,574,171 股，觸發條件是 Cerebras 上市後市值首次突破$400 億、或 OpenAI 完成特定付款裏程碑；第三檔 23,411,518 股，按交付節奏分批歸屬，且完整歸屬的前提是 OpenAI 行使全部1.25GW Additional Capacity 選項、累計采購量達到2GW。

第三筆：Co-design義務 + 排他條款。MRA還包含一定排他性安排，限製Cerebras向OpenAI的部分特定競爭對手提供某些產品和服務。這意味著，Cerebras在獲得OpenAI大單的同時，也在一定程度上讓渡了部分潛在客戶空間。

把這三件事放在一起看，OpenAI與Cerebras之間走的是一個完整的資金閉環：

OpenAI借出$10億， Cerebras 用這筆錢采購Wafer、擴產能、租數據中心；然後Cerebras 把建成的算力賣回給 OpenAI；OpenAI不需要付現金，用應付貨款抵銷貸款本金。限期一年走完，OpenAI的現金沒真正出去，Cerebras的現金也沒真正留下，剩下的隻有 OpenAI 拿到750MW 算力使用權 + 33,445,026 股 Cerebras N普通股的認股權證（OpenAI 同時簽了 Registration Rights Agreement，行權後可要求Cerebras把股票登記上市流通）。

這是一筆以“算力期權 + 股權認購權”打包的交易，被會計準則切成三張表，但商業實質是同一筆生意。

作者聲明：該圖片由AI生成

S-1 在Note 4給出了會計處理依據：客戶Warrant 按授予日公允價值，作為合同交易價格的扣減項（contra-revenue），隨商品/服務交付按比例衝減收入。截至 2025/12/31，Cerebras 資產負債表上記入 $152.4M的 Customer Warrant Asset——但這部分幾乎全部對應G42那筆 1,857,516 股Warrant（同樣是阿聯酋係客戶，是不是似曾相識？可以參考上一篇有關Nvidia收購Groq的文章），並且OpenAI Warrant 在 2025 年財報裏沒有任何影響。

也就是說，Cerebras 2025 年報告口徑裏的所有收入與毛利率，都還沒有扣過 OpenAI 這筆賬。

按S-1在 Note 13的probable判斷：第一檔（已 vest）+ 第二檔（probable）+ 第三檔之 Committed 750MW的部分（probable），合計約 1900 萬股，對應公允價值約$15.4 億，這部分將從 2026 年 Q1 起按 OpenAI 收入比例陸續衝減 Cerebras 的報告口徑收入。

Cerebras自己在 MD&A 裏寫：“When we begin to recognize contra-revenue amounts from the warrants in the first quarter of 2026, we expect quarterly revenue growth rates will decline from recent trends.”（當我們從 2026 年第一季度開始確認Warrant 對應的衝減收入時，預計季度收入增長率將較此前趨勢放緩。）

全部OpenAI Warrant按授予日公允價值約27.4億美元計算，其中約15.4億美元對應已歸屬及被公司判斷為probable的部分，將自2026年一季度起隨OpenAI收入確認節奏衝減收入；剩餘約12億美元則主要取決於OpenAI是否行使額外容量選擇權及後續交付進度。

這在其披露的另一個大客戶Amazon的合作上也有類似的操作。

AWS與Cerebras在 2026 年3月簽訂的 binding term sheet 也包含一份 2,696,678 股、行權價 $100 的 warrant，按 7 年時間+采購量vest。但 OpenAI Warrant 在數量級、行權價折扣、與合同金額的比例上都更激進，它已經不再是客戶激勵，而是把客戶做成了準股東。

這種模式也並不是Cerebras這種將要上市公司所獨有。

今年2月24日，AMD與Meta達成了一項為期五年、總規模超千億美元的戰略合作，根據協議，Meta將在未來五年內部署6GW算力規模的AMD GPU集群。作為對價，AMD向Meta授予最多1.6億股、約占總股本10%的業績型認股權證，行權價僅為每股0.01美元的象征性水平。

同樣的認股權證，同樣的味道。

五、39%毛利率背後的會計幻覺

把視線從合同移到財務報表，S-1文件中披露的2025年關鍵數據：

作者聲明：該圖片由AI生成

GAAP 淨利潤 +$237.8M，這看上去Cerebras已經實現盈利。但仔細研究S-1文件給出的完整解釋會發現，其中包含了一筆一次性 +$363.3M的一次性會計重估。剔除這筆會計重估和股權激勵，Non-GAAP 淨虧損$75.7M，同比擴大約 $54M。2024 年 +$452M的經營現金流主要靠客戶預付款（G42、MBZUAI 提前付款 $640M），2025 年因為預付款消化反轉成了-$10M。

$237.8M的盈利，其實是一個會計幻覺，實際上Cerebras仍在加速虧損。

再看毛利率，從2024年的42.3%降到2025年的39.0%，其在MD&A裏提到雲業務占比上升，與數據中心成本相關的項目也稀釋了毛利，與此同時，未來還將出現客戶認股權證衝減收入。換句話說，這39%的毛利率，毛的有點毛骨悚然：上市後，OpenAI 和AWS的認股權證所帶來的的影響一旦從 2026 年 Q1 開始確認，毛利率算起來就更低了。

更需要被研究的是客戶結構。

正如前麵技術分析中所述，所謂在推理領域找到的機會，是要先決條件的！

作者聲明：該圖片由AI生成

S-1中附注的Note 5裏明確寫到：G42和MBZUAI在ASC 850下被認定為相互的關聯方。也就是說，Cerebras在2024和2025兩年裏，幾乎全部收入都來自一組在會計上可以視為“同一客戶陣營”的阿布紮比實體。應收賬款來看集中度更誇張——2024 年末G42占91%的應收賬款，2025 年末MBZUAI占 77.9%。

從整個客戶組合來看：2025年86%的收入來自一個相互關聯的阿聯酋客戶組合，剩餘約 14% 是其他長尾客戶，OpenAI在2025年財報裏還沒有真正開始確認收入。Cerebras 當下的產品需求被鎖在一個非常窄的客戶麵裏，而向前看，IPO 之後的收入故事高度依賴 OpenAI——而 OpenAI 這個故事，又必須用Warrant 當作配套條件才成立。

這就是一家在上市前投資份額被瘋搶的明星AI芯片公司的真實技術、產品、客戶、營收和利潤狀況！

六、留給資本市場的五個問號

Wafer-Scale Engine算是過去十年最有辨識度的AI芯片項目，後期重新定位的“超高速推理”作為產品定位也跑出了市場——OpenAI 的 Codex-Spark 模型在 2026 年 2 月已經跑在了Cerebras上對外服務。在Nvidia鎖死訓練側、推理側仍存在多種架構機會的當下，在全球資本市場為AI產業瘋狂砸錢的當下，Cerebras選擇此時上市，也是煞費苦心。

但如果在二級市場真金地白銀投票，還是要在這些故事之外，仔細研究幾個非常具體的問題。

問號一：剔除股權對價後的真實毛利率是多少？ 2025年的39%是沒有扣 OpenAI Warrant 一分錢。Probable 部分約 $15.4 億即將從 2026 年 Q1 起按比例衝減收入；如果 IPO 後股價進一步抬升，未來新增 vesting tranche 的公允價值會更高、對收入的拖累會更深。

問號二：$200 億 OpenAI 訂單到底鎖定了多少？MRA 同時把“OpenAI 單方按 SLA 砍單的權利、Working Capital Loan 抽貸的權利、Additional Capacity 是否行使的選擇權”全部交給了 OpenAI。Cerebras 履約不達標，訂單可被部分或全部終止；Additional Capacity 不行使，Warrant 第三檔 B 那 14,632,199 股作廢、合同金額也大幅縮水。這份合同的下限，遠低於“$200 億”這個數字給人的直覺。

問號三：客戶結構能不能從“主權 AI 項目承包商”切換為“AI推理基礎設施公司”？2024–2025 兩年 86%–85% 的收入來自互為關聯方的 G42 + MBZUAI 組合，收入集中度太高。這種集中度在傳統工業品業務裏可以被解釋為"早期單點突破"，但對一家標榜為世界頂級AI芯片公司來說，它意味著估值錨是不穩定的。OpenAI 的引入能否在2026–2027年真正稀釋這種集中度，要看後續的實際收入分布——而不是合同金額和市場敘事。

問號四：WSE-4 能不能補齊架構層麵的短板？當前 WSE-3 有三個工程缺口：缺乏 FP8 / MXFP / FP4 等低精度浮點支持、片外和片間互連的帶寬極度不帶等遠不夠支撐大模型 KV Cache、以及其核心粒度太小給編譯器和數據映射帶來高複雜度。Cerebras 自己也承認推理經濟性高度依賴片上 SRAM。如果 WSE-4 不完成數量級別的改善，超高速推理的故事就不那麽完備。產品層麵客觀地說，在芯片硬件既定的情況下，軟件無法進行數量級別地優化係統能力，毛利率的改善必須靠硬件架構層麵實打實地獲取！

問號五：這套“認股權證（Warrant）換訂單”的模式，二級市場願不願意買單？Meta 接受過 AMD 的Warrant，AWS也拿了Cerebras的Warrant，OpenAI 拿了Cerebras 更激進的Warrant，國內已上市和正在IPO的幾家AI芯片公司也在用各自版本的客戶股權激勵換訂單。

這個模式正在變成AI芯片公司上市的必備模式。

這種模式它能不能每次都跑成功，且一直可以跑下去，我們需要拭目以待。這次Cerebras的IPO，會是這個模式在國際資本二級市場上進行的壓力測試。