桃花源裏人家的院子

讀書不求甚解,喝茶不問綠紅。種花種果又種菜,管它春夏秋冬。
個人資料
文章分類
正文

ZT 被低估的先進封裝巨頭

(2026-04-06 15:30:10) 下一個

過去談到英特爾,大家可能常說他們在製造方麵落後,但其實在先進方麵,英特爾在過去幾年已經取得了不錯的成績。

我們將時間撥回到2025年9月,當時英偉達CEO黃仁勳做了一件看似毫無道理的事向英特爾承諾投資50億美元。在分析人士看來,這筆錢不是用於晶圓製造,也不是用於工藝技術,而是用於封裝。

全球市值最高的半導體公司,其GPU幾乎為全球所有人工智能數據中心提供動力,審視了英特爾(一家股價接近十年低點、代工部門每季度虧損數十億美元、晨星評級為無護城河的公司),並決定開出一張足以收購4%至5%股權的支票。後續,黃仁勳曾告訴媒體,英特爾擁有Foveros的多技術封裝能力,這在這裏確實至關重要。

人們的第一反應自然是困惑。英特爾?那家在製程節點上落後了十年的公司?那家連首席財務官自己都承認其代工廠客戶的承諾訂單量微不足道的公司?

圖片

幾十年來,半導體行業衡量進步的唯一標準就是晶體管密度。更小的製程意味著更快、更便宜、更高效的芯片。企業的成敗取決於其縮小製程的能力。英特爾在這場競賽中領先了40年,但在2015年前後遭遇重挫,台積電趁機奪得了霸主地位。

但就在大家關注製程節點競賽的時候,發生了這樣的事:芯片變得如此複雜,以至於沒有哪個單一的製程節點能夠完美地滿足現代處理器的所有功能。CPU核心需要最快的晶體管來保證原始時鍾頻率;GPU陣列需要高密度和高能效來應對並行工作負載;而I/O控製器、內存接口、安全引擎呢?它們幾乎無法從尖端晶體管中獲得任何提升,而且即便如此,它們的製造成本仍然高得驚人。在3nm製程下,設計一顆芯片的成本就超過5億美元。

想象一下蓋房子。你可以用結構鋼來搭建整個房子的框架,包括壁櫥和花園小屋。或者,你也可以隻在關鍵部位(承重牆)使用鋼材,其他地方則使用木材。效果一樣,成本卻低得多。這個比喻與基於芯片的設計非常契合:隻將最先進(也最昂貴)的工藝節點用於那些真正需要的組件,而其他所有組件則使用更便宜、更成熟的工藝節點來製造。

因此,問題不在於誰擁有最好的晶體管,而在於誰能最好地將來自多個來源的異質矽集成到一個可用的單一產品中。

芯片是如何不再扁平的

在深入了解英特爾的具體技術之前,你需要掌握三個概念。理解它們隻需要大約九十秒,但它們將為你理解後續所有內容奠定基礎。

概念一:芯粒

芯粒(chiplet)顧名思義,就是一個功能單一的小型芯片,設計用於與其他封裝內的小型芯片連接。它不像傳統的單芯片設計那樣使用一塊巨大的矽芯片來處理所有功能,而是將設計拆分成多個功能模塊,例如 CPU 模塊、GPU 模塊、I/O 模塊和內存控製器模塊。每個模塊都可以采用最適合其功能的工藝節點進行製造,然後組裝在一起。

方案二:2.5D和3D封裝

芯粒之間需要相互通信。在 2.5D 封裝中,芯粒並排排列在共享基板上,通過微型橋接器橫向連接。英特爾稱其版本為EMIB。可以把它想象成建造相鄰的房屋,並用有頂走廊連接起來。在 3D 封裝中,芯粒垂直堆疊,彼此麵對麵。英特爾稱之為 Foveros。這就像在樓上建造公寓樓層,樓層之間有電梯井連接。連接更短、更密集、速度更快,但由於散熱空間減少,工程難度也更大。

概念3:混合鍵合

過去連接堆疊芯片的方法是使用稱為微凸點的微小焊球。想象一下,將一塊樂高積木的底部浸入焊錫中,然後將其壓到另一塊積木上。這種方法雖然可行,但在小尺寸下使用焊錫會造成混亂。混合鍵合技術則完全摒棄了焊錫。它將兩個芯片上的銅焊盤直接接觸,並通過表麵化學反應和熱退火工藝進行鍵合。銅原子擴散穿過界麵,形成一條連續的金屬路徑。

英特爾的Foveros Direct技術實現了9微米間距(每平方毫米約12,000個連接),每比特功耗低於0.05皮焦耳。芯片內通信的功耗約為每比特0.1皮焦耳。混合鍵合技術已經突破了一個臨界點,使得芯片間連接在實際應用中與單個芯片內部連接一樣高效。

這將徹底改變芯片設計的計算方式。

七年五代更新

自 2018 年以來,英特爾的 Foveros 技術經曆了五代發展演變。每一代都解決了前代技術的特定局限性,最終實現了互連密度提高 30 倍,能源效率提高 3 倍。

圖片

最初的 Foveros (2020 年,Lakefield 公司)是概念驗證:50 微米焊料微凸點,每平方毫米約 400 個凸點,每比特功耗 0.15 皮焦耳。它將一個 10 納米計算芯片麵朝下鍵合到一個 22 層 I/O 芯片上。雖然功能正常,但這種通過芯片供電的方式會產生幹擾,限製了間距的進一步縮小。

Foveros Omni (2023 年,Meteor Lake 架構)通過全向互連 (ODI) 技術解決了這個問題,該技術通過圍繞基片的銅柱來供電。可以將其理解為增加了外部防火通道,使內部樓梯間僅供行人通行。這種解耦設計使得混合使用來自不同代工廠的芯片成為可能。芯片間距縮小至 36 微米,並正朝著 25 微米邁進。

Foveros Direct (預計2026年上半年在Clearwater Forest工廠生產)實現了代際飛躍:采用銅對銅混合鍵合技術,間距為9微米,互連密度超過12,000個/平方毫米,功耗低於0.05皮焦/比特。第二代產品目標是在2027-2028年左右實現3微米間距(約111,000個/平方毫米)。英特爾聲稱,其流體自對準貼裝技術可將吞吐量提升10倍。

兩種成本優化變體完善了產品組合:Foveros-R (更便宜的 RDL 中介層)和Foveros-B (RDL 加上局部矽橋),兩者的目標都是在 2027 年左右投產。

圖片

Panther Lake

四個工藝、兩個工廠,一個封裝

理論固然美好,但產品上市才是關鍵。英特爾酷睿Ultra係列3的Panther Lake處理器將於2025年底開始出貨,並於2026年1月全麵上市。它將來自兩家代工廠四個不同製程節點的芯片集成到單個封裝中。

圖片

為什麽要將GPU的生產分散到兩家代工廠?因為經濟因素迫使我們這樣做。台積電的N3E芯片在處理更大規模的並行工作負載時,能夠提供更高的密度和效率。據報道,Intel在大尺寸芯片的成本上不具備競爭力,但這種小型GPU芯片可以作為英特爾代工廠GPU製造經驗的學習平台。最終結果是:Panther Lake超過70%的芯片麵積由英特爾自主研發,這與Lunar Lake和Arrow Lake的情況截然不同。

這就是混合架構理念的現實化體現。每個功能都使用最佳節點,無論其開發者是誰。

圖片

讓單芯片結構過時的數學

假設每平方毫米芯片的缺陷率為0.1%,那麽100平方毫米的芯片良率約為90.5%。而400平方毫米的芯片良率僅為67%左右。在5納米工藝下,對於800平方毫米的單芯片SoC而言,缺陷成本占總製造成本的50%以上。

圖片

Clearwater Forest 將這種邏輯發揮到了極致:12 個小型Intel 18A芯片(每個芯片 24 個核心)混合粘合到 3 個基礎芯片上,外加 2 個 I/O 芯片。總共 17 個芯粒,每個芯粒在組裝前都可以單獨測試。

圖片

I/O模塊在不同產品代際間可以沿用。Clearwater Forest沿用了Xeon的I/O模塊。Panther Lake在同一平台上提供了不同的GPU配置。AMD通過MI300A和MI300X展示了這一點:在同一封裝平台上,用GPU芯片替換了CPU芯片。

位於新墨西哥州裏奧蘭喬的英特爾Fab 9工廠是美國唯一一家能夠大規模生產3D先進封裝芯片的高產能工廠。目前,在台積電亞利桑那州工廠製造的芯片必須運往台灣進行封裝。英特爾副總裁馬克加德納證實,英特爾已將采用台積電CoWoS技術的產品直接移植到我們的Foveros技術上,完全沒有進行任何設計更改。

良率、成本、速度、供應鏈韌性,每一項都有利於分散化。它們共同構築了一道結構性護城河。

當 47個tiles匯聚成一個封裝

圖片

Foveros負責垂直堆疊,EMIB負責橫向連接。單插槽即可實現超過5TB/s的內存帶寬和petaFLOPS級的AI性能。

圖片

三位競爭者,各有優勢。

圖片

台積電在產能方麵占據主導地位。CoWoS芯片預計在2025年底達到每分鍾8萬片的產能,目標是在2026年底達到每分鍾13萬片。英偉達占據了約60%的份額。SoIC混合鍵合技術自2022年開始出貨。產能領先優勢為3-4年。

AMD 使用了台積電的產品組合,但也承擔了單一供應商的風險。V -Cache 的密度是 2D 芯片的 200 倍。MI300 是一款擁有 1530 億個晶體管的加速器。但 AMD 完全依賴於單一供應商。

三星在部署方麵落後。尚未推出商用3D混合鍵合邏輯芯片。目標是在2026年實現4微米以下的製程。代工廠市場份額僅為5.9%,而台積電則高達35.3%。

圖片

封裝作為代工廠的入口。

圖片

供需關係十分嚴峻。台積電的CoWoS項目已排滿至2026年。台積電亞利桑那工廠生產的芯片必須運往台灣進行封裝。英特爾則提供了另一種選擇:位於美國新墨西哥州Fab 9工廠的先進封裝技術(投資超過35億美元)。UCIe標準(由英特爾發起,擁有100多家支持者,UCIe 3.0的傳輸速率為64 GT/s)使芯片互連不再依賴於代工廠,從而真正實現了封裝即服務。

市場規模:目前為 460 億美元,到 2030 年將達到 800 億美元。

圖片

封裝已經從後台的附屬品變成了戰略武器。資本支出說明了一切。

接下來的規劃

Diamond Rapids 的目標是在 2026 年中後期推出:最多 192 個 Panther Cove P 核心,支持 PCIe 6.0、CXL 3,TDP 為 500-650W。直接競爭對手是 AMD EPYC Venice(Zen 6,台積電 2nm)。

據報道, Nova Lake (2026 年下半年)的計算單元已在台積電 N2 芯片上完成流片。即使 18A 芯片日趨成熟,英特爾仍將繼續采用混合代工廠模式。

2025 年 12 月的概念演示展示了一種尺寸超過光刻膠尺寸 12 倍的設計:Intel 14A 上有 16 個計算單元,18A-PT 上有 8 個基礎單元,24 個 HBM5 堆疊,麵積接近 10,296 平方毫米。封裝,而不是光刻技術,決定了係統層麵的可能性。

圖片

總結

過去十年,市場對英特爾的評價一直局限於單一視角:製程技術的執行力。而就這一指標而言,英特爾的表現並不盡如人意。10nm工藝的延誤、7nm工藝的挫折、以及失去蘋果公司,都印證了這一點。

但這種說法假設製造優勢僅僅取決於晶體管密度。事實並非如此。至少現在不是了。2026 年的關鍵問題是:誰能從任何來源獲取矽,以近乎零性能損失的方式將其堆疊成三維結構,並在單個封裝中交付一個可用的係統?

英特爾是地球上唯一一家能夠同時做到這一切的公司。

台積電生產最好的晶體管,並在混合鍵合工藝量產方麵領先,但它並不設計芯片。AMD設計的芯片非常出色,但完全依賴單一供應商。三星有發展晶圓代工的雄心,但目前還沒有商用的3D混合鍵合邏輯產品。英偉達設計了世界上最重要的AI加速器,但在製造和封裝方麵都必須依賴其他供應商。

英特爾設計芯片,自主生產,擁有最廣泛的封裝產品組合,為外部代工廠封裝芯片,並運營著美國唯一的高產能3D封裝工廠。這種良性循環已經開始運轉:內部產品驗證了封裝技術的成熟度,成熟的產品吸引了外部客戶,每個客戶都分攤了研發成本,更優的經濟效益為下一代產品的研發提供了資金。

秉持學術誠信,就必須以鋼鐵般的意誌力來應對反對意見。以下就是一位聰明的對手會提出的論點。

台積電的產能領先優勢是實實在在的。三到四年的混合鍵合產品出貨經驗意味著其良率學習能力、客戶信任度和供應鏈成熟度,而這些都是英特爾尚未獲得的。等到英特爾實現量產時,台積電可能已經領先兩代產品了。

英特爾的執行記錄令人質疑。Clearwater Forest 項目從2025年推遲到2026年上半年。英特爾晶圓代工業務每季度虧損數十億美元。首席財務官承認外部業務量微不足道。晨星公司給予英特爾無護城河評級。

良率複利是一把雙刃劍。單獨來看,小塊tile的優勢在數學上可能並不明顯,尤其是在組裝損失率較高的情況下。

圖片

對英特爾而言,他們無需在封裝方麵超越台積電,隻需達到足夠好、供應充足且位於合適的國家即可。CoWoS 的瓶頸是結構性的,而非暫時的。而且,美國封裝所麵臨的地緣政治壓力正在加劇,而非減弱。

我們認為,有三件事值得關注:

圖片

謬誤一:Clearwater Forest 的良率報告。如果英特爾在 2026 年下半年之前無法在 17 芯片架構上實現經濟可行的良率,那麽封裝護城河理論將受到實質性削弱。密切關注出貨量、平均售價趨勢以及 Diamond Rapids 的進度信號。

謬誤二:外部客戶數量。英偉達的交易要到2027年底才能交付。如果英特爾在2026年底前無法宣布至少兩項價值數十億美元的額外封裝協議,那麽這個論點進展太慢。CoWoS的限製窗口並非永久性的。

謬誤三:台積電在亞利桑那州的封裝。如果台積電將先進封裝技術引入亞利桑那州,英特爾的地域優勢將大幅縮小。密切關注台積電的資本支出披露。

客觀的結論是:英特爾打造了一款真正獨一無二的產品。Foveros Direct 近乎芯片級的性能、Panther Lake 久經考驗的混合晶圓代工架構、英偉達的認證以及美國本土製造,都是實實在在的優勢。

但資產並不等同於優勢。優勢需要多年而非幾個季度的持續執行才能獲得。英特爾擁有所需的工具,也擁有源源不斷的客戶,市場也迫切需要它的產品。然而,它尚未展現出那種將戰略地位轉化為競爭護城河的、枯燥乏味卻又無比卓越的運營能力。

封裝已經準備就緒。問題是英特爾是否也準備好了。

*免責聲明:本文由作者原創。文章內容係作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點讚同或支持,如果有任何異議,歡迎聯係半導體行業觀察。

免責聲明:本內容來自騰訊平台創作者,不代表騰訊新聞或騰訊網的觀點和立場。
[ 打印 ]
評論
目前還沒有任何評論
登錄後才可評論.