ICC訊 在GTC大會(huì)的傳聞被證實(shí)后,英偉達(dá)正式發(fā)布了面向InfiniBand和以太網(wǎng)的共封裝光學(xué)(CPO)交換機(jī),分別命名為Quantum-X Photonics和Spectrum-X Photonics。其中,InfiniBand CPO將于2025年下半年上市,以太網(wǎng)CPO則計(jì)劃于2026年下半年推出。需要注意的是,CPO將作為可選方案——英偉達(dá)將繼續(xù)提供支持可插拔模塊的交換機(jī)系統(tǒng)。
盡管CPO技術(shù)此前普及緩慢,但英偉達(dá)仍決定邁出這一步。首要原因是節(jié)能。黃仁勛在主題演講中強(qiáng)調(diào),CPO可將每1.6T端口的功耗從30W(可插拔光模塊)降至9W,降幅達(dá)70%。
英偉達(dá)的CPO基于新型微環(huán)調(diào)制器(MRM),進(jìn)一步提升了能效。博通的CPO技術(shù)通過移除DSP實(shí)現(xiàn)了50%的功耗降低,但其基于馬赫-曾德爾調(diào)制器(MZM)——這是光模塊中的標(biāo)準(zhǔn)組件。
該技術(shù)的核心組件包括由臺(tái)積電(TSMC)制造的電子和光子集成電路,并以3D堆疊方式組裝。臺(tái)積電的緊湊型通用光子引擎(COUPE)技術(shù)包含用于表面耦合光纖陣列的微透鏡。在Quantum-X光子平臺(tái)中,光學(xué)引擎通過中介層與交換機(jī)ASIC連接。英偉達(dá)未透露各組件的具體作用,但其CPO合作伙伴包括波若威、Coherent、Corning、Fabrinet、富士康、Lumentum、扇港、SPIL、住友、天孚和臺(tái)積電。
光模塊廠商可暫時(shí)松一口氣——至少未來幾年如此。英偉達(dá)的首款CPO設(shè)計(jì)是InfiniBand交換機(jī),而該協(xié)議在公司的AI戰(zhàn)略中已退居次席,以太網(wǎng)成為主導(dǎo)。事實(shí)上,Quantum-X Photonics甚至未出現(xiàn)在英偉達(dá)的路線圖中。此外,英偉達(dá)已推出支持1.6T光模塊的Quantum-X800系統(tǒng),因此首批CPO部署可能用于內(nèi)部集群。Quantum-X Photonics將作為技術(shù)驗(yàn)證的重要一步,但對(duì)光模塊需求的影響有限。
黃仁勛稱Spectrum-X為“巨大成功”,因其將以太網(wǎng)提升至InfiniBand水平。他表示,Spectrum-X將在Rubin時(shí)代連接“數(shù)十萬個(gè)”GPU。盡管未公布具體差異,但Spectrum-X采用了與Quantum-X不同的設(shè)計(jì),可能代表第二代技術(shù)。
英偉達(dá)的加入為CPO技術(shù)注入新動(dòng)力。自2021年起,博通一直是CPO的主要推動(dòng)者。到2027年,兩家公司預(yù)計(jì)將量產(chǎn)200G/通道的CPO交換機(jī),推動(dòng)生態(tài)系統(tǒng)成熟。
Scale-out網(wǎng)絡(luò)是CPO技術(shù)的低風(fēng)險(xiǎn)切入點(diǎn),但Scale-up光互連更為關(guān)鍵。專家混合模型(MoE)的快速響應(yīng)需依賴跨GPU的專家并行計(jì)算。黃仁勛解釋了吞吐量與響應(yīng)時(shí)間的平衡,并舉例說明最佳方案需64個(gè)GPU并行處理單個(gè)專家任務(wù)。Blackwell架構(gòu)的NVL72機(jī)架通過NVLink在無源銅背板上構(gòu)建72-GPU集群。英偉達(dá)計(jì)劃在2026年下半年的Vera Rubin NVL144中采用類似設(shè)計(jì),無源電纜數(shù)量或翻倍。
英偉達(dá)未透露Rubin Ultra NVL576的細(xì)節(jié),但其Kyber機(jī)架布局對(duì)NVLink互連提出新要求。盡管144個(gè)GPU可封裝于單一機(jī)架(最大傳輸距離約2米),但路線圖未提及Feynman的NVLink規(guī)模——業(yè)界認(rèn)為其將擴(kuò)展至多機(jī)架,屆時(shí)需引入光學(xué)技術(shù)。
英偉達(dá)于2022年GTC大會(huì)首次公布光纖NVLink計(jì)劃,并內(nèi)部構(gòu)建了至少一個(gè)集群。但因重定時(shí)光模塊的高功耗,該技術(shù)未能推廣。移除DSP是進(jìn)步,但仍需持續(xù)改進(jìn)。這解釋了英偉達(dá)為何冒險(xiǎn)采用MRM等新技術(shù)??紤]到提升網(wǎng)絡(luò)的重要性,該公司可能正在研發(fā)多種光學(xué)技術(shù)。
NVLink CPO計(jì)劃于2028年推出,為英偉達(dá)留出兩代時(shí)間驗(yàn)證擴(kuò)展網(wǎng)絡(luò)技術(shù)。此舉將降低GPU轉(zhuǎn)向CPO的風(fēng)險(xiǎn)——這只是時(shí)間問題。這只是一個(gè)時(shí)間問題,而非是否會(huì)發(fā)生的問題。
研究報(bào)告全文可登錄LightCounting訂閱頁面查看:https://www.lightcounting.com/login