隨著生成式人工智能和大模型訓練的爆發式增長,大型雲服務商開始嚐試自研和委托定製芯片來降低成本、提高能效並控製供應鏈。這些**定製 ASIC(應用專用集成電路)**針對推理、推薦係統和特定的 AI 工作負載進行了優化,能夠在功耗和延遲方麵顯著優於通用 GPU。它們並不是要完全取代 GPU,而是為了在某些應用中提供更具成本效益的解決方案,並減少對英偉達等供應商的依賴。下麵分析幾家重要的定製芯片供應商及雲計算平台的財務狀況和競爭優勢。
財務表現:2024 財年 Broadcom 營收 516 億美元,同比增長 44%,其中半導體業務 301 億美元,AI 相關收入達到 122 億美元,較上年增長 220 %investors.broadcom.com。2025 財年第一季度(截至 2025 年 2 月 2 日),總收入 149.16 億美元,同比增長 25%;GAAP 淨利潤 55.03 億美元;調整後 EBITDA 100.83 億美元,占收入的 68 %investors.broadcom.com。第一季度 AI 半導體收入 41 億美元,同比增長 77 %investors.broadcom.com。
護城河與戰略:Broadcom 利用多年積累的 ASIC 設計 IP 和信號處理技術,為 Google、AWS、Meta 等雲廠商開發定製訓練加速器和高性能網絡芯片。例如,2024 財年公司在 AI 領域取得 122 億美元收入,CEO Hock Tan 預測到 2027 年 AI 芯片需求的服務市場規模可達 600 億至 900 億美元reuters.com。Broadcom 擁有 70 %的自定義加速器市場份額,並與台積電等製造夥伴緊密合作,形成技術和供貨雙重優勢。
增長前景與挑戰:公司預計 2025 財年第二季度 AI 半導體收入將達到 44 億美元investors.broadcom.com。但由於過度依賴少數雲客戶,毛利率和訂單周期易受資本支出波動影響;同時,英偉達、AMD 也在提供更靈活的 GPU 解決方案,可能壓縮定製 ASIC 的擴展空間。
財務表現:2025 財年 Marvell 總收入 57.67 億美元,但 GAAP 淨虧損 8.85 億美元,主要因收購相關攤銷費用;非 GAAP 淨利潤 13.77 億美元prnewswire.com。第四季度收入 18.17 億美元,同比增長 27%,GAAP 毛利率 50.5%,非 GAAP 毛利率 60.1%prnewswire.com。數據中心業務在本季度收入同比增長 78 %prnewswire.com。
定製化優勢:Marvell 的專長在於高速以太網交換芯片、光學 DSP、PCIe 轉接器等互連產品,並提供定製 AI 加速器。2024 年 12 月,公司與 AWS 簽訂 5 年多世代合作協議,為 AWS 提供定製 AI 產品、光模塊、PCIe 轉發器、數據中心互連模塊和以太網交換芯片storagenewsletter.com。通過與 AWS 合作進行雲端 EDA,Marvell 可利用 AWS 的彈性算力加速其芯片設計storagenewsletter.com。
增長前景與挑戰:CEO Matt Murphy 表示定製 AI 芯片計劃已進入量產階段,並獲得多項新設計訂單prnewswire.com。公司預計 2026 財年第一季度收入同比增長超過 60 %prnewswire.com。然而其規模和研發投入遠低於 Broadcom,且仍然依賴外部製造,未來需繼續擴大客戶基礎以提升盈利性。
財務表現:2025 年第一季度,Amazon 總銷售額 1557 億美元,同比增長 9%;AWS 部門銷售額 293 億美元,同比增長 17%;AWS 的營業收入 115 億美元,高於去年同期的 94 億美元sec.gov。公司整體淨收入 171 億美元sec.gov。
自研芯片與生態:AWS 推出了 Inferentia、Trainium 和 2024 年 12 月發布的 Trainium2 芯片。根據報道,Trainium2 提供比當前 GPU 實例30–40 % 更高的性價比datacenterknowledge.com。每個 Trn2 EC2 實例由 16 顆芯片組成,峰值算力 20.8 PF;Trn2 UltraServer 將 64 顆芯片組合,峰值算力達到 83.2 PFdatacenterknowledge.com。AWS 與人工智能公司 Anthropic 合作打造 “Project Rainier” 集群,部署數十萬顆 Trainium2 芯片,提供前代係統 5 倍的算力datacenterknowledge.com。Trainium3(3 nm)計劃 2025 年末發布,性能將提升 4 倍且能效提升 40 %datacenterknowledge.com。
競爭定位:通過自研芯片,AWS 能為客戶提供比 Nvidia GPU 更低成本、能耗更優的訓練與推理選項datacenterknowledge.com。但 AWS 仍同時采購 Nvidia H100/H200 和 AMD MI300X GPUnews.microsoft.com。自研芯片目前主要服務於內部和特定客戶如 Anthropic,其生態與 CUDA 相比仍在早期發展。
財務表現:Alphabet 2025 年第一季度總收入 902.34 億美元,同比增長 12%;Google Cloud 收入 122.6 億美元,同比增長 28 %,推動雲業務運營利潤從 9 億美元增至 21.77 億美元sec.govsec.gov。公司整體淨利潤 345.4 億美元,運營利潤率由 32 % 提升至 34 %sec.gov。
自研 TPU 的協作與挑戰:Google 自 2017 年起推出 Tensor Processing Unit(TPU),用於訓練和推理。多代 TPU 均由 Broadcom 提供設計和芯片工程支持。2023 年 9 月,媒體報道稱 Google 可能尋求新供應商以降低成本,但 Google 發言人表示與 Broadcom 的合作“不變”reuters.com。近期也有消息稱 Google 正與 MediaTek 合作設計低成本的推理芯片,但尚未證實。總體來看,Google 依賴 Broadcom 提供定製 ASIC,同時仍采購 Nvidia GPU 滿足高端訓練需求。
戰略與發展:Meta 正測試首款內部 AI 訓練芯片,旨在減少對 Nvidia GPU 的依賴。報道稱,這款芯片是專用訓練加速器,可降低 AI 基礎設施成本,公司計劃先用於推薦係統,再擴展到生成式 AIreuters.com。Meta 正與台積電合作生產芯片,並計劃 2026 年起廣泛使用reuters.com。2025 年 Meta 預計總支出 1140–1190 億美元,其中資本開支最高 650 億美元 用於 AI 基礎設施reuters.com。這顯示公司對內部芯片的長期投資,但因技術路線不確定,仍需大量采購 Nvidia GPU,短期內對供應鏈影響有限。
戰略與產品:微軟在 2023 年底發布了兩款定製芯片:Azure Maia AI 加速器(麵向大模型訓練和推理)和 Azure Cobalt CPU(基於 Arm,麵向通用工作負載)。這兩款芯片計劃在 2025 年初部署到微軟數據中心,用於支持 Copilot、Azure OpenAI Service 等服務news.microsoft.com。微軟強調通過自研芯片和定製服務器、冷卻係統實現“從矽到服務”的垂直整合,優化能效和性能news.microsoft.comnews.microsoft.com。
與合作夥伴的關係:微軟同時在 Azure 上提供 Nvidia H100/H200 GPU、AMD MI300X 加速器等產品線news.microsoft.com。OpenAI 參與了 Maia 芯片的設計測試,微軟表示通過與 OpenAI 協同可以優化模型訓練並降低成本news.microsoft.com。這種雙軌策略確保客戶擁有不同價格和性能組合的選擇。
市場份額與差異:定製 ASIC 主要針對固定的推理或推薦任務,其能效和成本優勢明顯,但通用性不如 GPU。根據分析,GPU 仍然控製 2025 年約 90 %的訓練市場,而 ASIC 在推理市場占比約 20 %,並持續擴大gilderreport.com。這說明定製芯片是對英偉達 GPU 的補充,而非完全替代。
軟件生態:Nvidia 的 CUDA 平台和 cuDNN 庫是其護城河;AMD 提供 ROCm 和 open-source 軟件生態。定製芯片通常需要雲廠商自行維護編譯器和框架,如 AWS Neuron、Google XLA/TPU 軟件棧,這提高了遷移成本並限製了普遍采用。
供應鏈合作:雖然 AWS、Google、Meta 和 Microsoft 都在自研芯片,但仍依賴 Broadcom、Marvell 等第三方進行 ASIC 設計和網絡互連,同時依賴台積電等先進製造節點。Meta 與台積電合作生產芯片reuters.com,Google 的 TPU 由 Broadcom 設計製造reuters.com。這使定製芯片生態與傳統半導體供應鏈緊密相連。
定製 AI 芯片正在成為雲巨頭優化成本和性能的關鍵戰略。Broadcom 通過為 Google、AWS、Meta 等客戶提供定製 ASIC 和網絡芯片,已成為最大的外部供應商;2024 財年 AI 收入 122 億美元,公司的長期目標是抓住 2027 年 600–900 億美元的市場機會reuters.com。Marvell 的規模較小但在光通信和互連方麵具有差異化優勢,和 AWS 簽訂了五年合作協議storagenewsletter.com。
雲廠商方麵,AWS 推出 Trainium 係列芯片,通過更高的性價比吸引客戶,同時保持對 Nvidia 和 AMD GPU 的采購;Google 通過 TPU 等內部設計滿足訓練和推理需求,並繼續與 Broadcom深度合作reuters.com;Meta 計劃 2026 年前後啟用自研訓練芯片以降低成本reuters.com;微軟發布 Maia 加速器並與 OpenAI 合作優化硬件news.microsoft.com。
綜合來看,定製 ASIC 有望在 AI 推理與垂直應用中迅速增長,但由於軟件生態和通用性限製,短期內不太可能撼動 Nvidia 在訓練領域的領先地位。投資者應關注 Broadcom 等上遊供應商在定製 ASIC 領域的擴張機會,同時注意雲廠商在自研芯片和 GPU 雙軌策略中的資本支出和盈利平衡。