前言
11月19日第十一屆網(wǎng)絡(luò)平臺部技術(shù)峰會在深圳圓滿落幕。本次峰會圍繞硬件研發(fā)、硬件加速、網(wǎng)絡(luò)產(chǎn)品、網(wǎng)絡(luò)運營四大領(lǐng)域,深度全面地展示了網(wǎng)絡(luò)平臺部不斷精進的研發(fā)能力及探索成果。下面讓我們共同回顧本次峰會中由硬件研發(fā)專家——孫敏博士呈現(xiàn)的《光模塊:從自采到自研》的精彩內(nèi)容。
光模塊及應(yīng)用
光模塊首次站在技術(shù)大會的舞臺,回顧了光模塊產(chǎn)品從商用到自采,再到自研的發(fā)展歷程。著眼未來,我們從“芯”出發(fā),把握關(guān)鍵技術(shù)路徑,同時探索新型開發(fā)模式。
光模塊麻雀雖小,五臟俱全,可以說是一套完整的小系統(tǒng)。電信號輸入,經(jīng)過dsp等芯片解析,然后進入驅(qū)動芯片,再去帶動光芯片進行調(diào)制,調(diào)制出來的光再進入到光無源系統(tǒng)進行耦合,最后耦合光進入光纖系統(tǒng)傳輸。
光模塊不是數(shù)據(jù)中心專屬的,而是電信網(wǎng)絡(luò),特別是長距離傳送網(wǎng)絡(luò)最早開始使用的。但是隨著數(shù)據(jù)中心的發(fā)展,包括設(shè)備的帶寬的提升,光模塊開始進入到數(shù)據(jù)中心應(yīng)用中。由于數(shù)據(jù)中心的發(fā)展速度遠超傳統(tǒng)電信行業(yè),所以數(shù)據(jù)中心對光模塊的需求增長也遠超傳統(tǒng)電信行業(yè)。
從商用到自采
對騰訊而言,早期的40G網(wǎng)絡(luò)實際上是一個封閉的系統(tǒng),比如說我們買的實際上是傳統(tǒng)設(shè)備廠商的整個網(wǎng)絡(luò)系統(tǒng),包括軟件,交換設(shè)備和光模塊等。商用系統(tǒng)成本高,出了問題不便于運維,這是商用轉(zhuǎn)自采的一個重要原因。
結(jié)合25G服務(wù)器的上線應(yīng)用,25G/100G模塊開啟自采之路,挑戰(zhàn)是必然的,第一個挑戰(zhàn)其實就是設(shè)備之間的適配,光模塊單體測試雖然沒有問題,但是在自采灰度階段,我們遇到了很多設(shè)備兼容性的問題,我們發(fā)現(xiàn)不同廠商的模塊在不同設(shè)備上每個端口的表現(xiàn)不一樣,在不同設(shè)備上的表現(xiàn)也不一樣,而且為了保證大家都可以傳得通,必須得做一個完善的適配方案,形成一套復(fù)雜的測試系統(tǒng),很多時候甚至要一對一針對端口參數(shù)進行優(yōu)化。
但是如果能把自采模塊管理的很精細(xì),將會是一個非常有收益的事情。記得在15年到17年之間,我們現(xiàn)網(wǎng)出現(xiàn)大量的40G光模塊的故障替換,究其原因,其實是系統(tǒng)集成廠商的光模塊都是外購的,對光模塊了解較淺,并且對光模塊的質(zhì)量問題如何攔截也基本依靠模塊廠商。如果結(jié)合自己的實際應(yīng)用場景,把端到端的模塊技術(shù)方案進行管理,端到端的流程進行管控和優(yōu)化,同時把系統(tǒng)的質(zhì)量管理方案做到位的話,完全可以避免上面出現(xiàn)的這些問題。通過2到3年對自采光模塊的不斷優(yōu)化和管控,我們發(fā)現(xiàn)不只是成本逐年有收益,而且質(zhì)量問題得到系統(tǒng)改善,現(xiàn)網(wǎng)故障率不斷下降。
從自采到定制
自采光模塊的另一個優(yōu)勢是能夠滿足我們自己網(wǎng)絡(luò)的多樣化發(fā)展帶來的多樣化定制需求,比如業(yè)務(wù)部門提到10km分光監(jiān)控場景的需求,需要10km的模塊進行互連,因為現(xiàn)成收發(fā)一體模塊價格高昂,在需求推動下,我們借助現(xiàn)有的模塊平臺去做一些微小的改進,實現(xiàn)低成本方案。另一個例子是DCI提到了2km的分光的需求,整個項目很有收益,但是技術(shù)方案上很有挑戰(zhàn),需要結(jié)合我們的現(xiàn)網(wǎng)環(huán)境,對現(xiàn)有的模塊進行的深度的設(shè)計優(yōu)化,包括規(guī)格、模塊光學(xué)部分及芯片層面的一系列升級優(yōu)化。
從定制到自研
隨著100G服務(wù)器的批量上線,200G網(wǎng)絡(luò)進入量產(chǎn)應(yīng)用,自研光模塊產(chǎn)品的誕生也契合了整個網(wǎng)絡(luò)從100G升級迭代到200G。光模塊行業(yè)一個很大特點,就是整個產(chǎn)業(yè)鏈類似于一個“陀螺式”或者“橄欖球形”,中間大,兩頭小,整個行業(yè)號稱可以做光模塊的公司不下于200家,但是處于產(chǎn)業(yè)鏈最上游的各類芯片廠家可能只有不超過10家,特別像DSP這樣技術(shù)門檻較高的芯片更是不超過5家,而最下游的應(yīng)用方或者終端用戶的數(shù)量也遠少于光模塊廠商數(shù)量,呈現(xiàn)出來產(chǎn)業(yè)結(jié)構(gòu)混亂,同時也引申出來一些問題,需求不明確,不具體,芯片價值不清晰。自研光模塊的第一個目標(biāo)就是要打破這個生態(tài),即我們與芯片廠商直接討論規(guī)格需求和成本(用量)需求,從而去實現(xiàn)真正的端到端的成本的競爭力。模式上,我們稱之為多方JDM模式,就是我們直接向芯片廠商發(fā)出規(guī)格需求,以及一些定制化功能,芯片廠商根據(jù)我們的需求進行優(yōu)化或者重新開發(fā),同時模塊廠商結(jié)合芯片的設(shè)計,與騰訊聯(lián)合設(shè)計模塊方案,最后由模塊廠商負(fù)責(zé)生產(chǎn)制造。
進入自研階段,我們要考慮的最重要的問題就是方案的設(shè)計和選擇如何實現(xiàn)最大價值?!肮狻备半姟睆膫鬏攲傩陨嫌兄举|(zhì)的差異,光有它自己的一些特殊屬性,比如不同溫度下的光功率特性,不同電流下的帶寬特性,還有不同條件下的波長特性。在光模塊開發(fā)過程中,往往會遇到,當(dāng)想去用一些非常有潛力的電芯片方案的時候,你會發(fā)現(xiàn)它不太懂光芯片特性,或者考慮不是那么周全,這種問題如果流入到現(xiàn)網(wǎng),就會發(fā)生類似100G網(wǎng)絡(luò)時代經(jīng)常遇到的“鏈路抖動”。如果普通開發(fā)模式,為了滿足交付,難以繼續(xù)開發(fā),但在自研模式下,我們就可以結(jié)合系統(tǒng)規(guī)格持續(xù)去推動方案的不斷優(yōu)化,把電芯片做到更加懂光,從而發(fā)揮出更大的技術(shù)優(yōu)勢。
光模塊大家常常理解為標(biāo)準(zhǔn)品,因為定義好了外殼形態(tài),輸入輸出接口規(guī)格,但內(nèi)部的光學(xué)封裝是一個特殊的東西,封裝方式五花八門,每一個廠商的設(shè)計都不一樣,涉及到的制造設(shè)備也是定制化的,如果我們要快速設(shè)計及制造一個自研模塊,我們就要面臨平臺選擇的問題。自研光模塊模式下,充分利用已經(jīng)成熟的100G模塊的封裝平臺,同時針對性的做一些升級改造,是滿足質(zhì)量穩(wěn)定性,開發(fā)效率以及低成本等訴求的最好解決方案。
對下一階段的探索
我們的網(wǎng)絡(luò)基本上是2到3年迭代一次,從交換芯片的路標(biāo)來看,全面112G網(wǎng)絡(luò)將在2023年來臨。近期大家已經(jīng)在討論下一代基于112Gbpsl的網(wǎng)絡(luò)開發(fā)的事情,包括網(wǎng)卡和交換設(shè)備。
在模塊層面,前面2年我們也陸陸續(xù)續(xù)做了一些技術(shù)摸底,從100G到400G&800G,模塊功耗肯定會持續(xù)提升,同時,BER就是我們說的誤碼率,也會面臨指數(shù)級的劣化。這些需要加大在芯片層面的設(shè)計和優(yōu)化工作,甚至包括參與芯片的設(shè)計。光學(xué)封裝方面也會面臨一系列的挑戰(zhàn),需要探尋各種新的提高光學(xué)集成度的方案,在傳輸方案上,我們也需要持續(xù)挖掘以滿足騰訊的網(wǎng)絡(luò)場景需求。
信號傳輸距離是互聯(lián)硬件的一個基本屬性,也是我們每次探討未來技術(shù)方案和發(fā)展趨勢的時候,必須要討論的關(guān)鍵約束條件。隨著基礎(chǔ)速率的不斷提升,我們的數(shù)據(jù)中心機房或者IDC在物理距離上基本不太會有大變化。因此,在做連接兩臺設(shè)備之間的模塊或者技術(shù)方案的選擇的時候,需要隨著傳輸技術(shù)的迭代而發(fā)生迭代的。“距離”的演進上有三個界面,從短距離接入側(cè)來看,是“光”進“銅”退,從IDC機房內(nèi)部連接來看,是單模替代多模,從DCI連接來看,是相干技術(shù)的不斷下沉。以上這些方面,我們也陸續(xù)做了一些提前布局,包括在112Gbpsl網(wǎng)卡接入這一塊,我們正在布局基于112Gbpsl TAC技術(shù)以及相應(yīng)的芯片合作開發(fā)。IDC機房內(nèi)部的連接方面, MM SR模塊可能無法滿足我們數(shù)據(jù)中心機房 (Building Range)內(nèi)部的連接,特別是跨房間的連接,這里,我們也在探索單模替代多模的方案,特別是在單模全集成芯片方案上也做了一些聯(lián)合開發(fā)的嘗試。IMDD和coherent的選擇和替代,我們預(yù)計可能會在1.6T或者單波400G這一代到來,所以未來我們會在Coherent-lite這個領(lǐng)域,特別是oDSP算法上做一些工作。
從“芯”出發(fā)
400G+上我們還會探索一些新的模式,其實有一些我們已經(jīng)在布局,包括建立芯片實驗室及芯片級系統(tǒng)驗證平臺,以及牽引一些行業(yè)的標(biāo)準(zhǔn)等。
光模塊跟傳統(tǒng)電氣器件/設(shè)備的一個關(guān)鍵的區(qū)別,就是它不僅要有“電”的特性,還要有“光”的特性,所以它必須同時面對微電子的摩爾定律和光電子的摩爾定律。隨著光進銅退的趨勢,全球都在不斷整合核心的光電資源,以傳統(tǒng)電芯片領(lǐng)域的巨頭為首的廠商,他們也在往光電子這個領(lǐng)域不斷的去擴張,為未來的光電融合趨勢做準(zhǔn)備。同樣,我們也需要做些什么,去迎接一個又一個挑戰(zhàn)。112Gbpsl可能是一個很長的過程,基于112G Serdes的400G+系統(tǒng),正是我們需要在當(dāng)下布局, 展望未來的最好契機!