女大的發熱問題在1個月前就傳開了。最大客戶微軟為此把很多BLACKWELL NVL72 ORDER 取消了。
GB200-NVL72 接口合格率很低,加上MOS 電源芯片發熱導致合格率比較低。這2個關鍵部件據說都隻有單一供貨源。。以前做產品任何關鍵部件/Subsystem至少2個供貨商 get Qualified,隻有一個供貨商是不可以進入MASS PRODUCTION的。可見女大內部產品開發工程設計,質量控製,風險控製有問題, 。不知道女大的設計原則是幾個SIGMA的。看樣子為了趕進度很多該做的ENGINEERING VERIFICATION/Reliability Design沒做好,SIGMA不高吧。
絕大部分客戶訂的是NVL72大機櫃,據說現在出問題的就是這個配套。。DELAY是基本確定的。女大也許可以發貨GB200 NVL36的,可是別人都要GB200 NVL72的。。
女大BLACKWELL問題不是簡單的女大問題,希望它能盡快解決發熱問題,並吸取教訓,在RUBIN 時避免出現這樣的情況。