桃花源裏人家

桃花源裏人家

ZT 存儲板塊調整,是錯殺還是邏輯坍塌?

桃花源裏人家 (2026-03-28 19:08:21) 評論 (0)

這周穀歌的一個新技術發布,直接把存儲板塊砸懵了。以美光科技為例,直接來了個五連陰,A股相關標的也同樣出現調整。

圖片

TurboQuant,這個號稱能把長文本KV Cache存儲需求砍6倍、推理速度提8倍的壓縮方案,發布後存儲股就集體跳水,不少人喊著“AI存儲需求要沒了”。

但你仔細想想,這事兒是不是有點眼熟?2023年GQA技術出來的時候,也有人說KV Cache需求要砍半,存儲要涼;2024年PagedAttention出來的時候,同樣的論調又來一遍。

結果呢?過去這兩年,全球大模型的token消耗量,直接漲了10倍都不止,存儲的需求,反而越漲越猛。

01 TurboQuant的真相:壓縮未必是利空



很多人一聽,6倍壓縮,那存儲需求不就少了6倍?這不是要了存儲廠的命嗎?

要是這麽想,你就把這個技術的邏輯搞反了。

簡單說,KV Cache,就是大模型推理的時候,要把之前的對話內容存起來,不然它就忘了你之前說過啥,這個東西,占了推理階段大部分的存儲需求。而TurboQuant做的壓縮,就是為了解決AI推理的核心瓶頸——內存牆。

現在大模型的上下文,已經從過去的4K,漲到了128K,甚至百萬級、千萬級,並發的推理請求也越來越多,要是不做壓縮,就算把所有的HBM都堆上去,也不夠用,而且,數據搬運的成本,遠高於計算成本,會把推理的速度拖得很慢。

所以,壓縮是為了讓長上下文、高並發的推理能跑得起來,不是為了少用點存儲。

而且,這根本不是什麽新東西,產業早就開始迭代了。

2023年的GQA,把KV Cache壓縮了4-8倍;2024年的量化、PagedAttention,又壓縮了2-4倍,每一次都有人說存儲需求要沒了,結果呢?

每一次壓縮之後,大家就敢放開手腳,做更長的上下文,做更多的並發,原來用不起的長文本推理,現在能用了,新的需求,反而把壓縮省出來的空間給填滿了,甚至還不夠。

這就是經濟學裏的傑文斯效應,最典型的就是視頻壓縮:當年H.264、H.265出來,把單位視頻的存儲需求砍了一大半,結果大家反而開始做4K、8K的高清視頻,甚至現在的10分鍾長視頻,體積輕鬆10GB+,最後整個視頻存儲的總需求,反而漲了幾十倍。

TurboQuant也是一樣的道理。6倍的壓縮,看起來很大,但你看看現在的需求增長:2026年2月,全球大模型的token消耗量,是去年同期的10倍,到2028年,全球的數據量,要漲到394ZB,是2020年的5倍多。這點壓縮,在指數級的需求增長麵前,根本就是杯水車薪。

更重要的是,壓縮帶來的成本下降,會釋放出更多的新需求。

原來,長上下文推理太貴了,很多企業用不起,現在成本降了,他們就敢用了,雲廠商也敢放開上下文的限製,放開並發的限製,最後,總存儲的需求,反而會被進一步放大。

說白了,TurboQuant,是供給端的優化,不是需求端的消失。它是在HBM供給不足的背景下,為了緩解內存牆做的優化。

短期來看,HBM的供需缺口依然存在,甚至因為新需求的釋放,這個缺口,會越來越大。

02 長周期的景氣,撞上了地緣的黑天鵝



其實,在這次TurboQuant的波動之前,存儲行業,早就已經進入了超級景氣周期,供需的緊平衡,已經到了極致。

需求端,AI的爆發,已經把存儲的需求,拉到了前所未有的高度。

過去,存儲的需求,靠PC、靠手機,現在,AI服務器、多模態應用,成了新的引擎。

字節的Seedance2.0,做10分鍾的視頻,消耗的token,是文本的幾十倍,英偉達的新架構,直接把NAND的需求,從TB級,拉到了PB級,單機櫃的容量,直接漲了5倍。

圖片

全球的互聯網巨頭,都在瘋狂加碼算力基建,2026年,八大CSP的資本開支,要漲25%,到5000億美元,這些錢,大部分都砸在了AI的基礎設施上,存儲,就是其中最核心的剛需。

而供給端,海外的三大存儲巨頭,三星、SK海力士、美光,早就把產能卡得死死的。

經曆了上一輪周期的虧損,他們現在擴產,都謹慎得很,而且,所有的新增產能,都往HBM、DDR5這些高利潤的高端產品上堆,低端的DRAM、NAND的產能,反而在收縮。

更要命的是,高端HBM的產能,根本擴不出來。

建一個潔淨室,就要8-12個月,良率爬坡還要更久。

現在,三大原廠的庫存,已經到了曆史最低的3-5周,也就是說,他們手裏的貨,賣完之後,下一批的貨,還沒生產出來,供給已經剛性到了極致。

這種供需的緊平衡,已經讓存儲的價格,漲了好幾個月了。

美光的最新財報,就是最好的證明:FY26Q2,它的營收直接幹到了238.6億美元,同比漲了196%,淨利潤140.21億,同比漲了686%,經營毛利率直接幹到了69%,這就是超級周期的威力。

圖片

而就在這個時候,霍爾木茲的衝突,直接給這個已經緊繃到極致的供需,又添了一把火。

你要知道,全球的存儲產能,大部分都在韓國,三星、SK海力士,這兩家,占了全球DRAM產能的70%,而韓國,70%的石油進口,都要靠中東,幾乎全靠霍爾木茲海峽運進來。

更要命的是,那些存儲生產必須的稀有氣體,比如氦氣,韓國64.7%都靠卡塔爾,而卡塔爾的氦氣,已經停產了,砍了全球30%的供給;還有氖氣,全球大部分的氖氣,都來自伊朗,現在這些東西都成了供應鏈的不定時炸彈。

這就是現在存儲行業的現狀:長邏輯,是AI帶來的超級需求周期,供給剛性,價格持續上漲;短邏輯,是霍爾木茲的地緣衝突,直接戳中了海外存儲產能的命門,把本來就緊張的供給,搞得更緊張了。

03 誰能接住這波全球供給缺口?



很多人會問,那這個時候,國產存儲的機會,到底在哪?哪些細分,最值得我們關注?

其實很簡單,就抓兩個核心:第一,找那些海外供給最容易受地緣幹擾的環節,第二,找那些已經做好了技術突破、產能就緒的國產龍頭,隻有他們,才能接住這波突然爆發的缺口。

首先,就是高端的HBM和DRAM相關的環節。

你想想,三星、SK海力士的產能已經被英偉達提前鎖完了,要是他們的產能,因為能源、原料的問題,出了問題,那這個缺口,誰來補?

首先當然是上遊的國產存儲芯片晶圓廠,現在它們的產能正在快速擴張,良率也已經上來了,而且它們也在發力HBM的研發,要是海外的供給出了問題,客戶可能會主動加快國產的驗證。

還有就是中遊的存儲模組環節。

比如江波龍佰維存儲這些企業,他們本來就有成熟的客戶渠道,如果海外晶圓供給出了問題,價格漲了,他們就能依托國內的晶圓產能,給客戶提供更穩定、更便宜的存儲產品。

過去,大家都覺得海外的供應鏈穩得很,所以不願意冒風險換國產的,但是,地緣衝突,直接給所有人敲了警鍾:原來海外的供應鏈也會斷?原來把所有的產能都押在海外,風險這麽大?

而且,油價的上漲,讓海外企業的成本飆升,國內企業的性價比優勢,就更明顯了。

總而言之,存儲的長邏輯,是AI帶來的超級需求周期、是國產替代的十年長跑;短催化,是這次的地緣衝突,把整個進程,給加速了。

不過,考慮到板塊此前整體漲幅已經較大,可能已充分反映市場樂觀預期,後續投資需警惕多重風險:

AI發展不及預期風險:當前AI拉動存儲需求持續提升,若大模型技術進展不及預期,不排除AI Capex下修的風險,從而影響需求。

存儲價格下行風險:由於存儲價格暴漲,流通渠道存在部分炒作囤貨現象,若投機炒作過度影響下遊需求,存在價格下跌的風險。

研發進展不及預期風險:存儲企業需要持續進行產品升級和創新,若戰略選擇失誤,或造成研發失敗風險。

04 結語



回望全球存儲產業的曆史,每一次地緣衝突,都會加速供應鏈的重構;每一次技術革命,都會催生全新的存儲需求。

而當下,我們正站在AI革命和供應鏈重構的交匯點上,存儲,正是這兩大浪潮共同指向的核心賽道。

當然,任何賽道的投資都不可能一帆風順。存儲行業依然麵臨著海外貿易政策變化、行業競爭加劇、技術迭代不及預期等風險,這也要求我們必須持續跟蹤行業變化,去偽存真,找到真正具備核心競爭力的企業。