用戶名: 密碼: 驗(yàn)證碼:

騰訊全自研200G/400G網(wǎng)絡(luò)的創(chuàng)新與實(shí)踐

摘要:騰訊網(wǎng)絡(luò)平臺(tái)部通過(guò)對(duì)自研交換機(jī)平臺(tái)(TONS)以及開(kāi)放光平臺(tái)(TOOP)的產(chǎn)品升級(jí),構(gòu)建了全面自研的100G服務(wù)器接入、200G匯聚、400G數(shù)據(jù)中心互聯(lián)的網(wǎng)絡(luò)體系。

  騰訊云業(yè)務(wù)的高速發(fā)展不但推動(dòng)了云上層架構(gòu)的創(chuàng)新,也對(duì)基礎(chǔ)網(wǎng)絡(luò)提出了更高的要求。一方面,池化讓云資源的獲取突破了服務(wù)器的邊界,大量的數(shù)據(jù)流往返于服務(wù)器間,加大了網(wǎng)內(nèi)的數(shù)據(jù)傳輸量。另一方面,隨著存儲(chǔ)介質(zhì)、計(jì)算部件的性能提升,使得網(wǎng)絡(luò)性能陡然成為新的瓶頸。在此趨勢(shì)下,云基礎(chǔ)網(wǎng)絡(luò)向大規(guī)模、高帶寬、低延遲的方向演進(jìn)的訴求更加迫切。如今,騰訊網(wǎng)絡(luò)平臺(tái)部通過(guò)對(duì)自研交換機(jī)平臺(tái)(TONS)以及開(kāi)放光平臺(tái)(TOOP)的產(chǎn)品升級(jí),構(gòu)建了全面自研的100G服務(wù)器接入、200G匯聚、400G數(shù)據(jù)中心互聯(lián)的網(wǎng)絡(luò)體系。

  如果把當(dāng)前的網(wǎng)絡(luò)速率迭代比作交通路網(wǎng)升級(jí),那么TONS與TOOP不光從硬件上拓寬了道路,更從軟件上解決了復(fù)雜的交通管理難題。

  其中,TONS針對(duì)DCN海量交付以及高速率接入需求,在交換機(jī)硬件上具備部件級(jí)成本透明、樂(lè)高式模塊化設(shè)計(jì)、高精度狀態(tài)采集以及極簡(jiǎn)無(wú)背板框架等特點(diǎn),打造了高可控、高質(zhì)量、低成本的交換機(jī)產(chǎn)品平臺(tái)。在軟件上通過(guò)基于開(kāi)源SONiC深度自研的TCSOS,不光提供了自動(dòng)化、智能化的可運(yùn)營(yíng)能力,更結(jié)合可編程芯片在高性能的基礎(chǔ)上,實(shí)現(xiàn)高靈活性。

  而TOOP針對(duì)DCI互聯(lián)場(chǎng)景的特點(diǎn),也從軟硬件層面對(duì)波分系統(tǒng)進(jìn)行了顛覆性創(chuàng)新。首先對(duì)波分系統(tǒng)做減法,極大的降低了系統(tǒng)復(fù)雜度,通過(guò)三個(gè)層面的解耦(光電解耦,波道解耦,相干器件解耦),實(shí)現(xiàn)了系統(tǒng)交付成本的大幅降低。TOOP硬件產(chǎn)品在DCI盒式產(chǎn)品中首次引入了可切換分段增益光放技術(shù)與Flex-grid技術(shù),實(shí)現(xiàn)了極簡(jiǎn)運(yùn)營(yíng)的能力 。在軟件上,實(shí)現(xiàn)1秒級(jí)全量PM telemetry上傳,結(jié)合控制器軟件高速迭代,全面打造高度自動(dòng)化的光網(wǎng)絡(luò)系統(tǒng)。

  騰訊自研交換機(jī)平臺(tái)——TONS

  1.高可控&低成本的硬件設(shè)計(jì)

  TCS8400與 TCS9400的硬件發(fā)布,宣告了其作為騰訊下一代數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的主要載體,提供了100G服務(wù)器接入能力以及200G/400G的匯聚能力,同時(shí)兼顧端到端的最優(yōu)成本、持續(xù)供應(yīng)、可靠性以及可運(yùn)維能力,旨在構(gòu)建高敏捷、最優(yōu)性能、低成本、自服務(wù)的閉環(huán)硬件生態(tài)。集中體現(xiàn)在:

TCS8400 & TCS9400前視圖

      自主可控的樂(lè)高式部件設(shè)計(jì)

  新一代交換機(jī)硬件平臺(tái)由騰訊自主設(shè)計(jì),擁有自主產(chǎn)權(quán),可以方便地在ODM廠轉(zhuǎn)產(chǎn),使得各廠商提供的產(chǎn)品做到了硬件歸一,網(wǎng)絡(luò)操作系統(tǒng)即插即用。騰訊自研交換機(jī)采用了樂(lè)高式的部件化設(shè)計(jì),將整機(jī)電路解耦成不同的模塊與部件。其中CPU扣/底板、BMC扣板、MAC主板等模塊來(lái)自于騰訊自研硬件通用平臺(tái),通過(guò)繼承這些成熟應(yīng)用,降低了設(shè)計(jì)、生產(chǎn)難度及風(fēng)險(xiǎn)。部件選型時(shí)更多考慮騰訊數(shù)據(jù)中心良好的溫濕度環(huán)境,選用了最優(yōu)性價(jià)比部件,如PSU選用的CRPS電源等。最終讓海量供應(yīng)有保障的同時(shí),達(dá)到成本最優(yōu)。

TCS9400部件拆解圖

       極簡(jiǎn)無(wú)背板去PHY設(shè)計(jì)

  傳統(tǒng)交換機(jī)方案多借助PHY芯片來(lái)提升SI的裕量,但是PHY芯片的引入在增加整機(jī)成本的同時(shí)、也加大了功耗以及端口link-up時(shí)間,最終拉低了設(shè)備MTBF。TCS9400的產(chǎn)品形態(tài)為128*200G/64*400G端口,其中速率可配置。在設(shè)計(jì)時(shí)利用多維空間盡量縮短了走線距離,在無(wú)PHY的情況下滿足了SI要求, 將MTBF提升30%,單Gbit功耗降低10%,做到了硬件架構(gòu)極簡(jiǎn),成本最低。

  TCS9400整機(jī)4RU高度,由于無(wú)PHY方案因?yàn)镾erDes較多,要在同一平面使用多個(gè)跨板連接器,存在一定的容差風(fēng)險(xiǎn)。通過(guò)對(duì)比不同連接器3D圖形間隙,結(jié)合其他連接器的容差參數(shù)計(jì)算方法,在結(jié)構(gòu)件設(shè)計(jì)、定位設(shè)計(jì)、裝配方案設(shè)計(jì)上做了針對(duì)性的論證和改進(jìn)。同時(shí)對(duì)連接器測(cè)試指標(biāo),環(huán)溫壓力,測(cè)試周期等進(jìn)行修訂并導(dǎo)入。經(jīng)過(guò)試驗(yàn)板實(shí)際測(cè)試驗(yàn)證,改進(jìn)方案可以提高容差能力,排除容差風(fēng)險(xiǎn)。

ASIC芯片I/O封裝內(nèi)走線長(zhǎng)度對(duì)損耗的影響

  TCS9400的SI是當(dāng)下高速設(shè)計(jì)領(lǐng)域的頂級(jí)挑戰(zhàn),兼有512路56Gbps PAM4信號(hào)、700A大電流,最高密度BGA等業(yè)內(nèi)難題,因此SI的設(shè)計(jì)和仿真毫無(wú)疑問(wèn)是解決問(wèn)題的重中之重。SI設(shè)計(jì)不但考慮了Chip Ball to IO Connector Pin-Channel的設(shè)計(jì)優(yōu)化,還考慮到了芯片內(nèi)不同Die走線長(zhǎng)度的影響。把系統(tǒng)裕量損耗升至25%,足以應(yīng)對(duì)任何不利因素。

串?dāng)_優(yōu)化仿真及實(shí)測(cè)眼圖

  在串?dāng)_優(yōu)化設(shè)計(jì)中,針對(duì)跨板連接器這一最大串?dāng)_源,通過(guò)TX/RX隔離避免了系統(tǒng)近端串?dāng)_,全部串?dāng)_源最優(yōu)化,將Fanout Via Crosstalk控制在-57db下。所有端口的一致性測(cè)試結(jié)果對(duì)比IEEE規(guī)范眼高均有60%以上的裕量。

  高精度數(shù)據(jù)采集

  隨著交換機(jī)接口帶寬的快速增加,傳統(tǒng)上基于交換機(jī)CPU的流量采集,BFD保護(hù)等技術(shù),面臨著精度低、成本高的問(wèn)題。為此我們?cè)诮粨Q機(jī)內(nèi)部引入了FPGA,通過(guò)軟硬協(xié)同的方式提高業(yè)務(wù)信息以及網(wǎng)元健康情況的采集精度,為業(yè)務(wù)的高性能訴求提供給了高可用保障。

  FPGA通過(guò)兩個(gè)10GE接口與交換芯片連接,構(gòu)建高帶寬和低時(shí)延的報(bào)文接收和發(fā)送通道,實(shí)現(xiàn)大吞吐的流量采樣、流量注入等功能。FPGA和交換芯片通過(guò)CPU PCIe RC橋可以進(jìn)行PCIe End to End通信,能夠在CPU無(wú)感的情況下直接與交換芯片交互,實(shí)時(shí)獲取到芯片內(nèi)部狀態(tài),同時(shí)降低了輪詢數(shù)據(jù)對(duì)CPU性能的消耗。

高精度數(shù)據(jù)采集FPGA

  彈性設(shè)計(jì)、敏捷安裝

  TCS9400的128個(gè)業(yè)務(wù)口對(duì)稱均勻分布,可靈活實(shí)現(xiàn)200G/400G端口組合,方便布線和網(wǎng)絡(luò)架構(gòu)設(shè)計(jì),除PSU接口外,其余端口均在前面板,運(yùn)維操作更便捷。側(cè)面抬手采用航空級(jí)壓鑄鋁材料,造型符合人體工程設(shè)計(jì),更方便安裝使用。前面板增加兩個(gè)拉手,拆卸時(shí)可以通過(guò)拉手將設(shè)備從機(jī)架中拉出,實(shí)現(xiàn)快速替換維修。同時(shí),線上設(shè)備可以無(wú)感知CPLD邏輯進(jìn)行熱升級(jí)。

通過(guò)更換端口封裝支持不同速率

  為了匹配TCS9400交換機(jī)的快速安裝,我們開(kāi)發(fā)了光纖理線架。理線架位于交換機(jī)上方,光纖沿垂直方向出線到上方理線架,內(nèi)部設(shè)計(jì)了導(dǎo)線槽和繞柱,保證光纖布線滿足最小折彎半徑。光纖從理線器左右兩邊出線到機(jī)柜布線槽,通過(guò)理線器實(shí)現(xiàn)了隱藏式布線,有效保護(hù)光纖的同時(shí),減少了人為對(duì)光纖的誤動(dòng)作。

  2.智能化&高性能的軟件設(shè)計(jì)

  騰訊交換機(jī)硬件平臺(tái)搭載了基于開(kāi)源SONiC深度自研的操作系統(tǒng)。與騰訊網(wǎng)絡(luò)建模系統(tǒng)相輔相成,構(gòu)建了智能化的運(yùn)維體系。在200G/400G網(wǎng)絡(luò)時(shí)代,TCS OS持續(xù)改進(jìn),貼合海量規(guī)模運(yùn)維以及高性能的需求,讓網(wǎng)絡(luò)擁有了更高的升級(jí)效率以及更強(qiáng)的可編程能力。集中體現(xiàn)在:

  數(shù)據(jù)模型驅(qū)動(dòng)的全自動(dòng)化運(yùn)營(yíng)能力

  Tencent YANG Model通過(guò)將網(wǎng)絡(luò)特性抽象成結(jié)構(gòu)化數(shù)據(jù),為上層應(yīng)用提供了靈活的可編程能力,加速應(yīng)用產(chǎn)能的同時(shí),也解放了上層的設(shè)計(jì)思想。TONS天然支持Tencent YANG Model,通過(guò)JSON(Tencent YANG)到JSON(Sonic YANG)的映射,將翻譯層下沉至OS側(cè),快速支持配置與狀態(tài)模型的更新,解決了建模系統(tǒng)中“翻譯難”的問(wèn)題。同時(shí)用gRPC框架替代傳統(tǒng)CLI下發(fā)通道,提高配置下發(fā)與提取性能。

  在該框架下,針對(duì)TONS的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)以及建設(shè)運(yùn)營(yíng)正式邁向全自動(dòng)化。相關(guān)應(yīng)用主要有:

  1) 快速故障自愈:利用TCSOS軟件快速迭代的優(yōu)勢(shì),從網(wǎng)元級(jí),鏈路級(jí),操作系統(tǒng)以及芯片級(jí)四個(gè)維度填充了當(dāng)前的監(jiān)控盲區(qū)。并結(jié)合gRPC毫秒級(jí)下發(fā)能力,實(shí)現(xiàn)快速故障自愈。

  2) 配置自動(dòng)審計(jì):通過(guò)每日的數(shù)據(jù)拉取以及對(duì)比,清晰的感知配置在現(xiàn)網(wǎng)的變化以及與架構(gòu)標(biāo)準(zhǔn)的偏差。

  3) 基于可編程的配置修改自動(dòng)化:當(dāng)網(wǎng)絡(luò)架構(gòu)的標(biāo)準(zhǔn)配置用YANG模型來(lái)設(shè)計(jì)時(shí),可以利用層次化可復(fù)用的代碼化思想來(lái)加速設(shè)計(jì)效率,當(dāng)配置需要變更時(shí),結(jié)合配置審計(jì),將與配置標(biāo)準(zhǔn)的偏差自動(dòng)推送到變更平臺(tái)實(shí)施,整個(gè)流程與軟件發(fā)布異曲同工。

  4) 基于網(wǎng)絡(luò)應(yīng)用商店的軟件升級(jí)自動(dòng)化:在快速迭代的云數(shù)據(jù)中心,對(duì)數(shù)以萬(wàn)計(jì)的網(wǎng)絡(luò)設(shè)備進(jìn)行頻繁的軟件升級(jí),長(zhǎng)久以來(lái)給運(yùn)營(yíng)帶來(lái)了巨大挑戰(zhàn),我們將軟件功能的發(fā)布與更新提升至以周為單位,同時(shí)避免對(duì)網(wǎng)絡(luò)的可靠性和安全性帶來(lái)影響。

  相對(duì)于OS版本,應(yīng)用的更新顯得更為頻繁,為了便于對(duì)線上設(shè)備的應(yīng)用進(jìn)行管理和升級(jí),騰訊自研交換機(jī)引入了"網(wǎng)絡(luò)應(yīng)用商店",提升運(yùn)營(yíng)部署效率。

  其過(guò)程為:

  應(yīng)用開(kāi)發(fā)完之后,通過(guò)版本發(fā)布系統(tǒng)自動(dòng)推送到版本倉(cāng)庫(kù),并自動(dòng)創(chuàng)建下載任務(wù)。

  應(yīng)用商店收到下載任務(wù)之后,根據(jù)任務(wù)信息批量通告現(xiàn)網(wǎng)設(shè)備進(jìn)行應(yīng)用下載。

  可以看到引入應(yīng)用商店之后,一旦版本發(fā)布,便自動(dòng)更新到關(guān)聯(lián)設(shè)備上。運(yùn)營(yíng)人員部署應(yīng)用時(shí)無(wú)需進(jìn)行版本下載,只需下發(fā)升級(jí)指令即可,這樣節(jié)省掉最耗時(shí)的下載步驟。整個(gè)部署過(guò)程和手機(jī)應(yīng)用下載流程很類似,應(yīng)用自動(dòng)更新至最新版本,然后由用戶來(lái)決定是否更新,并根據(jù)授權(quán)級(jí)別判斷是否安裝。

網(wǎng)絡(luò)應(yīng)用商店

  面向高性能網(wǎng)絡(luò)的數(shù)據(jù)面可編程能力

  進(jìn)入到200G/400G網(wǎng)絡(luò)時(shí)代,上層業(yè)務(wù)與控制軟件對(duì)底層網(wǎng)絡(luò)的特殊需求日益增多,如高帶寬、低時(shí)延、大象流處理、小包線速、高精度流控等。DPDK相對(duì)優(yōu)秀,可以達(dá)到很高的包轉(zhuǎn)發(fā)速率,但需通過(guò)多服務(wù)器、多核負(fù)載均衡實(shí)現(xiàn),傳統(tǒng)網(wǎng)絡(luò)設(shè)備雖然可以提供高性能網(wǎng)絡(luò)傳輸,但其轉(zhuǎn)發(fā)邏輯被固化,難以實(shí)現(xiàn)靈活的網(wǎng)絡(luò)轉(zhuǎn)發(fā)控制。

  搭載新一代Trident 4可編程交換芯片的自研交換機(jī)TCS-PS,向上兼容多種業(yè)務(wù)組件及控制器,向下屏蔽底層可編程硬件差異(可編程交換芯片、FPGA等),不僅支持交換機(jī)的基礎(chǔ)網(wǎng)絡(luò)功能,還可以定制特殊數(shù)據(jù)面轉(zhuǎn)發(fā)邏輯,性能與靈活性完美結(jié)合,可以優(yōu)雅適配更多的業(yè)務(wù)場(chǎng)景。例如,在骨干網(wǎng)及專線接入點(diǎn)部署TCS-PS,實(shí)現(xiàn)基于租戶及五元組的精細(xì)化流量調(diào)度及限速能力,快速解決流量熱點(diǎn),有效提高網(wǎng)絡(luò)利用率;利用TCS-PS對(duì)云網(wǎng)關(guān)場(chǎng)景服務(wù)器集群進(jìn)行流量卸載加速,解決大象流處理、小包線速、前置交換機(jī)HASH不均等軟轉(zhuǎn)發(fā)性能問(wèn)題;通過(guò)TCS-PS在安全防護(hù)及流量分析場(chǎng)景細(xì)分業(yè)務(wù)的差異化應(yīng)用,大幅減少其后端分析服務(wù)器集群的帶寬及計(jì)算壓力,成倍降低安全防護(hù)與流量分析的成本。

  02 騰訊開(kāi)放光平臺(tái)——TOOP

  為了匹配TONS在數(shù)據(jù)中心園區(qū)提供的200G/400G能力,用于數(shù)據(jù)中心間互聯(lián)的開(kāi)放光網(wǎng)絡(luò)平臺(tái)(TOOP)也進(jìn)行了2.0版本升級(jí)迭代。升級(jí)后光層OPC與電層TPC各自分別支持了柔性光網(wǎng)絡(luò)能力與基于可插拔方案的單波400G產(chǎn)品。其中,在L0層OPC-4光層產(chǎn)品首次在DCI層面引入了Flex-grid功能,賦予OPC-4光層產(chǎn)品支持向未來(lái)的平滑演進(jìn)能力,即無(wú)論是當(dāng)前的400G還是未來(lái)的單載波800G/1600G,OPC-4均無(wú)需更換硬件可直接支持任意速率波長(zhǎng)接入能力;而在L1層,TPC-4電層產(chǎn)品通過(guò)深化解耦思路,將開(kāi)放解耦進(jìn)一步下探至相干器件層面,即T2X4C8電層板卡支持多廠商DCO混合部署,打破壟斷增加核心成本器件的競(jìng)爭(zhēng)力,進(jìn)一步降低了DCI帶寬飛速增長(zhǎng)的成本壓力。

波長(zhǎng)通道劣化快速辨識(shí)

  TOOP旨在通過(guò)技術(shù)創(chuàng)新來(lái)降低CapEx與OpEx。我們?cè)谠O(shè)計(jì)400G做了一些微創(chuàng)新。

  電芯片層面加了性能預(yù)判機(jī)制

  相干系統(tǒng)通過(guò)強(qiáng)大的FEC(前向糾錯(cuò)編碼)技術(shù)實(shí)現(xiàn)對(duì)傳送的bit進(jìn)行錯(cuò)誤修正,F(xiàn)EC編碼算法就像微信的語(yǔ)音轉(zhuǎn)換文字功能,其具備一定的口音糾錯(cuò)能力。進(jìn)行語(yǔ)音文字轉(zhuǎn)換時(shí),算法會(huì)根據(jù)語(yǔ)意來(lái)判斷是否修正口音帶來(lái)的干擾。當(dāng)你的口音很重或者引入過(guò)多方言時(shí),超過(guò)算法的容忍上限時(shí)其轉(zhuǎn)換也會(huì)出錯(cuò)。如同我們可以用轉(zhuǎn)換正確率來(lái)評(píng)估普通話標(biāo)準(zhǔn)與否一樣,我們可以根據(jù)Pre-fec前向糾錯(cuò)誤碼率來(lái)評(píng)估系統(tǒng)的性能情況。TOOP通過(guò)CFP2-DCO的Pin37 管腳來(lái)上報(bào)pre-fec前向糾錯(cuò)編碼超限的事件,實(shí)現(xiàn)了對(duì)性能劣化事件的提前關(guān)注。當(dāng)DCO檢測(cè)到Pre-fec越過(guò)設(shè)定門(mén)限,即拉高Pin37管腳,為業(yè)務(wù)的無(wú)損切換提供可能性。

  業(yè)內(nèi)首創(chuàng)的DSP收斂計(jì)時(shí)上報(bào),實(shí)現(xiàn)業(yè)務(wù)受損時(shí)間監(jiān)控


  保護(hù)路徑切換的業(yè)務(wù)受損時(shí)間精準(zhǔn)計(jì)時(shí)

  引入了DCO模塊收斂計(jì)時(shí)功能,如上圖所示,TOOP系統(tǒng)可以記錄光路倒換過(guò)程的持續(xù)時(shí)間,包括光保護(hù)(OP)板卡的光開(kāi)關(guān)切換時(shí)間與DCO模塊的業(yè)務(wù)中斷時(shí)間。我們定義了DCO模塊的業(yè)務(wù)中斷計(jì)時(shí)功能,定義0x910e(高位)與0x910f(低位)寄存器內(nèi)儲(chǔ)存了DSP收斂時(shí)間,其十進(jìn)制值即收斂時(shí)間,單位us,上圖中的測(cè)試結(jié)果為4971us=4.971ms,這樣的數(shù)據(jù)協(xié)助我們?cè)\斷系統(tǒng)的性能問(wèn)題。例如,當(dāng)某次保護(hù)切換事件發(fā)生時(shí),OP開(kāi)關(guān)切換時(shí)間較短,而DSP的收斂時(shí)間較久,則說(shuō)明線路性能余量不足,在光信號(hào)劣化至光開(kāi)關(guān)切換門(mén)限值之前DSP已經(jīng)產(chǎn)生了誤碼。

  DSP收斂時(shí)間這個(gè)功能讓我們第一次在ms級(jí)尺度上對(duì)一個(gè)瞬態(tài)進(jìn)行描述,目的是減少上層業(yè)務(wù)的感知,進(jìn)一步優(yōu)化四纖三路由系統(tǒng),讓我們打造更加可靠且穩(wěn)定的底層系統(tǒng)。

  DSP 色散掃描范圍自動(dòng)配置

  當(dāng)前400G場(chǎng)景下,因光纜中斷而引起的倒換事件對(duì)業(yè)務(wù)的影響時(shí)間由原先的100ms級(jí)別(業(yè)務(wù)層面丟失時(shí)間),降低到了10ms級(jí)別(業(yè)務(wù)層面丟失時(shí)間),從而降低光纜中斷引起的業(yè)務(wù)損失。

  在線路開(kāi)通時(shí),OPC-4的OTDR會(huì)探測(cè)線路實(shí)際距離(主備用路由收發(fā)雙芯分別探測(cè)),通過(guò)距離配置DSP的色散掃描范圍,由默認(rèn)的-20000~2000ps,配置成符合主備用光纜距離的實(shí)際值,例如-5000 ~ 2000ps,得益于DSP的算法優(yōu)化與色散掃描范圍的自動(dòng)配置,通過(guò)減少DSP的resync的色散搜索時(shí)間,進(jìn)一步提升保護(hù)倒換的速度,進(jìn)而減少業(yè)務(wù)受損時(shí)間。

保護(hù)路徑切換導(dǎo)致的業(yè)務(wù)受損時(shí)間大幅縮短

  根據(jù)實(shí)際測(cè)試及過(guò),儀表顯示波分系統(tǒng)在保護(hù)倒換過(guò)程中的切換時(shí)間最長(zhǎng)為8ms,最短為3.8ms,上圖左側(cè)部分顯示通過(guò)交換機(jī)加載流量端到端測(cè)試結(jié)果,TOOP 400G系統(tǒng)在倒換過(guò)程中速度更快,減少了業(yè)務(wù)受損時(shí)間,為線上服務(wù)的可靠性提供了有效保障。

  DCO自動(dòng)測(cè)量端到端RTT時(shí)延功能

  通過(guò)下插探測(cè)信號(hào)序列,實(shí)現(xiàn)DCO寄存器讀取線路RTT時(shí)延,從而對(duì)開(kāi)通系統(tǒng)的線路性能指標(biāo)進(jìn)行準(zhǔn)確預(yù)估,此功能為自動(dòng)重路由功能提供了數(shù)據(jù)基礎(chǔ)。

  DCO內(nèi)全量PM數(shù)據(jù)秒級(jí)telemetry提取

  定義超過(guò)85項(xiàng)的PM數(shù)據(jù)通過(guò)telemetry進(jìn)行秒級(jí)采集,是業(yè)內(nèi)第一次將ASIC中的信息進(jìn)行如此全面的采集,傳統(tǒng)的MSA模塊也沒(méi)有做到如此精細(xì)化程度。進(jìn)而通過(guò)數(shù)據(jù)分析提供DCO硬件故障預(yù)測(cè)與線路狀態(tài)預(yù)測(cè)功能,T2X4C8單板具備硬件反饋機(jī)制,該機(jī)制使子框內(nèi)OP-6單板支持通過(guò)DCO的BER觸發(fā)OCH1+1保護(hù)倒換。

  海量的PM數(shù)據(jù)是我們未來(lái)重點(diǎn)挖掘的數(shù)據(jù)寶藏,這將賦予我們一些偵測(cè)線路信息的能力。

  OOP向柔性網(wǎng)絡(luò)演進(jìn),F(xiàn)lex-grid 為我們打造未來(lái)平臺(tái)


所見(jiàn)即所得的可視化精準(zhǔn)運(yùn)維

  TOOP首次在DCI平臺(tái)引入靈活柵格技術(shù)(flex-grid),實(shí)現(xiàn)了柔性光網(wǎng)絡(luò)的能力。在面對(duì)400G以及400G+場(chǎng)景的平滑演進(jìn)提供了基礎(chǔ)。TOOP選擇了“簡(jiǎn)單”作為其設(shè)計(jì)語(yǔ)言。通過(guò)友好的施工管理設(shè)計(jì),利用MUX-PAENL對(duì)64個(gè)通道進(jìn)行散出,背面與前部走線設(shè)計(jì)減少布線復(fù)雜度。控制層面通過(guò)拓?fù)涔芾斫M件實(shí)現(xiàn)簡(jiǎn)明扼要的指示,避免維護(hù)時(shí)的復(fù)雜度。

  CMUX-64單板與MUX-PANEL采用了專利設(shè)計(jì),實(shí)現(xiàn)了低損耗的OMSP與Flex-grid應(yīng)用。在點(diǎn)到點(diǎn)OMSP場(chǎng)景時(shí)無(wú)需額外增加OP單板即可實(shí)現(xiàn),在采用OCH1+1場(chǎng)景或無(wú)需光層保護(hù)場(chǎng)景時(shí)也不會(huì)額外增加插損。整體功率計(jì)算符合鏈路落波與合波需求,滿足400G及400G+場(chǎng)景的需求,該系統(tǒng)可以平滑向未來(lái)演進(jìn),進(jìn)而降低光層的重復(fù)投資與提升頻譜利用率。

高品質(zhì)Flex-Grid讓光層基礎(chǔ)設(shè)施更穩(wěn)定更長(zhǎng)壽

  CMUX-64所采用的WSS器件具備優(yōu)秀濾波特性,讓我們減少了對(duì)DCO模塊內(nèi)置TOF的需求,進(jìn)一步降低DCO模塊的成本。同時(shí)Flex-grid賦予我們無(wú)需標(biāo)準(zhǔn)化FEC,兩端IDC的不同DSP廠商的DCO可以自適應(yīng)匹配,無(wú)需繁瑣的現(xiàn)場(chǎng)操作。這里劃重點(diǎn),TOOP產(chǎn)品的設(shè)計(jì)語(yǔ)言是“簡(jiǎn)”,我們希望現(xiàn)場(chǎng)處理問(wèn)題的方式就是安裝與替換,縮短系統(tǒng)開(kāi)通與故障處理的時(shí)間,提升業(yè)務(wù)的可用率。電層設(shè)備與合波器之間的頻率分配,互聯(lián)關(guān)系等問(wèn)題可以做到無(wú)圖紙化施工,我們引入了自適應(yīng)功能來(lái)實(shí)現(xiàn)匹配波長(zhǎng)功能。同時(shí)CMUX-64可以針對(duì)不同模塊的發(fā)射功率差異與不同波特率的問(wèn)題,包括正在測(cè)試中的基于PCS-16QAM的69Gbaud CFP2-DCO的高性能 400G所需81.5GHz頻譜間隔應(yīng)用,采用Flex-grid可以很好的解決。

  結(jié)語(yǔ)

  路寬難平,快馬難馴?;厥?A href="http://3xchallenge.com/site/CN/Search.aspx?page=1&keywords=%e8%85%be%e8%ae%af&column_id=ALL&station=%E5%85%A8%E9%83%A8" target="_blank">騰訊在200G/400G網(wǎng)絡(luò)中的創(chuàng)新與實(shí)踐之路,我們不僅僅是為了貼合業(yè)務(wù)算力要求而做了速率提升,更是通過(guò)構(gòu)建端到端全面自研的底層基礎(chǔ)設(shè)施,并搭載智能化的網(wǎng)絡(luò)系統(tǒng),借助自主可控創(chuàng)造了高速率,也馴服了高速率,最終為云業(yè)務(wù)提供高帶寬、低延時(shí)、更靈活的云網(wǎng)絡(luò)服務(wù)。相信在該體系的奠基下,后續(xù)騰訊網(wǎng)絡(luò)會(huì)持續(xù)穩(wěn)步邁向400G/800G網(wǎng)絡(luò)時(shí)代。

內(nèi)容來(lái)自:鵝廠網(wǎng)事
本文地址:http://3xchallenge.com//Site/CN/News/2021/05/28/20210528074026550684.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字: 騰訊 TOOP
文章標(biāo)題:騰訊全自研200G/400G網(wǎng)絡(luò)的創(chuàng)新與實(shí)踐
【加入收藏夾】  【推薦給好友】 
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right