英特爾光計算互聯(lián)芯粒(Chiplet)有望推動AI基礎設施變革性高速率數(shù)據(jù)處理
ICC訊 英特爾(Intel)高速數(shù)據(jù)傳輸應用集成光子技術取得了具有革命性意義的里程碑式突破。在OFC 2024上,英特爾集成光子解決方案(IPS)集團推出了業(yè)界最先進且第一個與英特爾CPU共同封裝并傳輸實時數(shù)據(jù)的全集成光學計算互連(OCI)芯片。英特爾OCI芯片通過在數(shù)據(jù)中心和高性能計算(HPC)應用的人工智能基礎設施中實現(xiàn)共封裝(CPO)的光學輸入/輸出(I/O),在高帶寬互連方面實現(xiàn)了巨大飛躍。
集成光子解決方案集團產品管理與戰(zhàn)略高級總監(jiān)Thomas Liljeberg表示:“服務器持續(xù)增長的數(shù)據(jù)流量正在考驗當今數(shù)據(jù)中心基礎設施的能力,當前的解決方案正迅速接近電氣I/O性能的實際極限。然而,英特爾的開創(chuàng)性成果使客戶能夠將共封裝(CPO)硅光子互連解決方案無縫集成到下一代計算系統(tǒng)中。OCI Chiplet提高了帶寬,降低了功耗并增加了傳輸距離,使機器學習工作負載加速,有望徹底改變高性能人工智能基礎設施?!?
第一款OCI芯片旨在支持在100米光纖單方向32Gbps速率的64通道傳輸,有望將滿足人工智能基礎設施對更高帶寬、更低功耗和更長傳輸距離的需求。它支持CPU/GPU集群連接和新型計算架構的未來可擴展性,包括相干內存擴展和資源分解。
基于人工智能的應用場景在全球范圍內的廣泛部署,大型語言模型(LLM)和生成式人工智能的最新發(fā)展正在加速這一趨勢。更大、更高效的機器學習(ML)模型將在解決人工智能加速工作負載的新需求方面發(fā)揮關鍵作用。未來AI計算平臺的擴展需求正在推動I/O帶寬的指數(shù)級增長和更長的覆蓋范圍,以支持更大的處理單元(CPU/GPU/IPU)集群和具有更高效資源利用的架構,例如xPU分解和內存池。
電氣I/O(即銅纜連接)提供高帶寬密度和低功耗,但僅支持1米甚至更短的傳輸距離。數(shù)據(jù)中心和早期人工智能集群中使用的可插拔光模塊可以在成本和功率水平上增加覆蓋范圍,但這在人工智能工作負載的擴展要求下是不可持續(xù)的。協(xié)封裝的xPU光I/O解決方案可以支持更高的帶寬,提高功率效率,低延遲和更長的覆蓋范圍-這正是AI/ML基礎設施擴展所需要的。
例如,用CPU和GPU中的光學I/O取代電氣I/O來傳輸數(shù)據(jù),就像從使用容量和范圍有限的馬車來分發(fā)貨物,到使用可以在更遠的距離上運送大量貨物的汽車和卡車。其升級性能和能源成本是光學I/O解決方案(如英特爾的OCI芯片)為人工智能擴展所創(chuàng)造的價值。
英特爾公司集成光子學解決方案(IPS)組展示了業(yè)界首個與英特爾CPU共封裝并運行實時數(shù)據(jù)的全集成光計算互連(OCI)芯片。可在新興的AI基礎設施中為數(shù)據(jù)中心和高性能計算應用提供共封裝光輸入/輸出。(資料來源:英特爾公司)
全集成OCI芯片利用英特爾經過現(xiàn)場驗證的硅光子技術,將硅光子集成電路(PIC)與電子IC集成在一起,其中包括片上激光器和光放大器。OFC上展示的OCI芯片與英特爾CPU共封裝,但也可以與下一代CPU、GPU、IPU和其他片上系統(tǒng)(SOC)集成。
首款OCI芯片實現(xiàn)支持4Tbps的雙向數(shù)據(jù)傳輸,與外部組件互連express (PCIe) Gen5兼容。現(xiàn)場光學鏈路演示展示了兩個CPU平臺之間通過單模光纖(SMF)跳線的Tx端和Rx端連接。CPU生成并測量了光學誤碼率(BER),演示展示了在單根光纖上200GHz間隔的8個波長的Tx頻譜,以及32 Gbps的Tx眼圖,證明了優(yōu)秀的信號質量。
目前的芯片支持64*32Gbps通道,每個方向傳輸100米(盡管由于飛行時間延遲,實際應用可能限制在幾十米),利用8對光纖,每對光纖傳輸8個密集波分復用(DWDM)波長。這種共封裝解決方案也非常節(jié)能,與可插拔的光收發(fā)模塊相比,每比特的功耗僅為5pJ。這種超高效率對于數(shù)據(jù)中心和高性能計算環(huán)境至關重要,可以幫助解決人工智能不可持續(xù)的電力需求。
新聞來源:訊石光通訊網