本文轉(zhuǎn)載微信公眾號(hào)“鵝廠往事”,原創(chuàng)作者:李方超
ICC訊 TOOP(Tencent open optical platform),近日TOOP硬件家族又添新的成員,TPC-4開放電層產(chǎn)品!其實(shí)它是基于原有OPC-4平臺(tái)子框進(jìn)行開發(fā)的,通過設(shè)計(jì)一款電層板卡T2X4C8來實(shí)現(xiàn)傳送功能,其特點(diǎn)是采用基于400G CFP2-DCO線路側(cè)方案,實(shí)現(xiàn)相干器件分離設(shè)計(jì)。每塊T2X4C8單板可以支持兩個(gè)400G線路口,8個(gè)100GE客戶側(cè)端口。在2U的機(jī)架空間內(nèi)可以容納4塊業(yè)務(wù)板卡,600W+的功耗能提供3.2Tbit/s的互聯(lián)業(yè)務(wù)容量。每個(gè)線路口使用64 GBaud 16QAM調(diào)制,在單個(gè)波長(zhǎng)上傳輸400Gbps的數(shù)據(jù),并且可以在75GHz波道間隔上調(diào)諧至64個(gè)波長(zhǎng)通道,從而在單根光纖上實(shí)現(xiàn)高達(dá)25.6Tbps的總傳輸容量。
對(duì)于多跨段系統(tǒng)或大損耗跨段,可以采用200G QPSK調(diào)制方式來提升傳送性能實(shí)現(xiàn)復(fù)雜跨段場(chǎng)景的應(yīng)用 。凡支持Tencent CFP2-DCO MSA的DCO模塊均可在T2X4C8上應(yīng)用,即電層核心器件也是開放解耦的!至此我們的TOOP算是實(shí)現(xiàn)了波分系統(tǒng)的全部功能模塊,同時(shí)徹底的將原有波分系統(tǒng)的封閉實(shí)現(xiàn)了全面的開放。
TOC(騰訊光網(wǎng)絡(luò)控制器)+ OPC-4(開放光層產(chǎn)品)+ TPC-4(開放電層產(chǎn)品)將為騰訊今后數(shù)據(jù)中心互聯(lián)提供強(qiáng)有力的基礎(chǔ)能力支持。但這一切也僅僅是開始,后面還有很長(zhǎng)的路要走,TOOP到底做了個(gè)什么事?為什么要做TOOP?為什么要徹底開放?今天我們就來聊聊,TOOP以及它的未來。
TOOP誕生的背景
大家看到,隨著數(shù)據(jù)中心業(yè)務(wù)的爆發(fā)式增長(zhǎng),數(shù)據(jù)中心互聯(lián)需求已經(jīng)在過去的若干年里給光傳輸設(shè)備帶來顯著而不同以往的特點(diǎn)。不同于傳統(tǒng)電信級(jí)光通信設(shè)備,數(shù)據(jù)中心互聯(lián)設(shè)備有高帶寬,接口開放,簡(jiǎn)化運(yùn)維,快速部署,網(wǎng)絡(luò)應(yīng)用模式固定等特點(diǎn)。傳統(tǒng)的波分設(shè)備,各商用設(shè)備差別較大,在產(chǎn)品應(yīng)用設(shè)計(jì)上沒有統(tǒng)一標(biāo)準(zhǔn)。就像MAC OS和Windows的差異一樣,每一個(gè)廠商有自己的一套邏輯。這樣的差異化導(dǎo)致使用者要付出額外的學(xué)習(xí)成本。每多一個(gè)廠商,需要重新的培訓(xùn)。這就導(dǎo)致傳統(tǒng)波分系統(tǒng)在多廠商、規(guī)?;渴饡r(shí)對(duì)運(yùn)營(yíng)成本帶來了很大的挑戰(zhàn)。
同時(shí),我們注意到在數(shù)據(jù)中心互聯(lián)場(chǎng)景應(yīng)用中,如上圖所示,波分系統(tǒng)在數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)中位于最底層,提供節(jié)點(diǎn)間的互聯(lián)。單個(gè)網(wǎng)絡(luò)平面內(nèi),IP設(shè)備可以是多供應(yīng)商來源混合部署,即不同節(jié)點(diǎn)的IP設(shè)備可以是來自于不同供應(yīng)商。波分設(shè)備通常每個(gè)平面采用單一供應(yīng)商進(jìn)行組網(wǎng),波分系統(tǒng)長(zhǎng)期以來處于一個(gè)相對(duì)封閉的系統(tǒng)。一個(gè)平面全部為單一來源時(shí),當(dāng)發(fā)生供應(yīng)商風(fēng)險(xiǎn)時(shí),運(yùn)營(yíng)團(tuán)隊(duì)將面臨十分棘手的狀態(tài)。TOOP也正是基于這樣的原因而誕生,為降低數(shù)據(jù)中心互聯(lián)這一類用戶的運(yùn)營(yíng)復(fù)雜度與提高系統(tǒng)健壯性的痛點(diǎn)而生。
那TOOP給我們帶來了什么?
波分系統(tǒng)是由光層、電層設(shè)備組成,到底他們的區(qū)別是什么呢?從功能上區(qū)分,光層設(shè)備是提供不同波長(zhǎng)的光信號(hào)的合并與分離、光信號(hào)的監(jiān)控與管理,以及光信號(hào)的放大的作用。簡(jiǎn)單的來理解就好比是高速公路,光層設(shè)備合分波器件就相當(dāng)于高速公路入口與出口的收費(fèi)站,將不同車道的車匯聚進(jìn)入高速公路,同時(shí)收費(fèi)站也提供從高速公路駛離的出口。高速公路沿途的電子眼、道路指示牌就類似光層設(shè)備提供的監(jiān)控與管理功能,保證每一輛車都按照規(guī)定速度行駛,各司其咎。沿途的加油站就相當(dāng)于光層設(shè)備的光放大器,提供光信號(hào)的供功率補(bǔ)償。而波分系統(tǒng)電層設(shè)備功能就很專一了,就是負(fù)責(zé)將客戶側(cè)信號(hào)(交換機(jī)/路由器的100GE/400GE端口)通過一系列的信號(hào)處理算法調(diào)制成可以在光纖中傳送的光信號(hào),例如TOOP的自研電層產(chǎn)品,T2X4C8單板可以提供2路400G 16QAM信號(hào),即可將8個(gè)100GE的交換機(jī)端口數(shù)據(jù)封裝到2個(gè)400G的波分線路側(cè)端口中用于傳送。電層設(shè)備呢就好比跑在高速公路上的貨車,一輛輛車傳輸著來自交換機(jī)的數(shù)據(jù)包。
TOOP可以解決什么呢?傳統(tǒng)的波分系統(tǒng)就好比,波分廠商自己修建了自己的高速公路,且這條高速公路只能跑自己廠的貨車,其他廠商的貨車即使能駛?cè)耄矡o法被監(jiān)控和管理系統(tǒng)所識(shí)別,導(dǎo)致維護(hù)這條高速公路交通的工作變得十分麻煩,如果車輛發(fā)生召回事件或者批次問題時(shí),面臨很大的系統(tǒng)穩(wěn)定隱患。TOOP呢改變了這個(gè)游戲規(guī)則,我們自己修建了可以支持任意貨車的高速公路(OPC-4),并且通過對(duì)每輛貨車簡(jiǎn)單的加裝標(biāo)準(zhǔn)化監(jiān)控協(xié)議(Tencent Yang module)實(shí)現(xiàn)了多廠商車輛在我們的道路上安全有序的行駛,在TOC(騰訊光網(wǎng)絡(luò)控制器)的指揮下讓指揮調(diào)度人員(NOC運(yùn)營(yíng)人員)可以快速、安全的無差異化的監(jiān)控不同廠商的貨車并將貨物送抵目的地。這就是TOOP第一階段所解決的問題,無論下面硬件是來自“方塊、圓圈、三角、菱形”,都可以無差異化的在統(tǒng)一的TOOP控制器下管理,“軟硬解耦,大道至簡(jiǎn)!”即,傳輸系統(tǒng)在TOOP框架下是一個(gè)開放的場(chǎng)景,光層與電層完全分離,需求量與成本最高的電層產(chǎn)品在TOC(控制器)的協(xié)助下通過打破封閉從而將單一來源的風(fēng)險(xiǎn)解除。同時(shí)TOC配合Tencent Yang的管控模型,將差異化在控制器與設(shè)備北向?qū)用嫱耆帘?,極大的減少了我們對(duì)不同供應(yīng)商產(chǎn)品的學(xué)習(xí)成本。
光電解耦喊了很多年了,為什么還要搞TOOP,搞自研波分硬件?
隨著14年~18年移動(dòng)互聯(lián)網(wǎng)的全面發(fā)展,數(shù)據(jù)中心互聯(lián)帶寬急劇增長(zhǎng),隨之而來的網(wǎng)絡(luò)規(guī)模也成倍增長(zhǎng)。因?yàn)槌鲇诔杀九c供應(yīng)鏈安全角度,我們引入了多供應(yīng)商的策略,但隨之而來的管控與運(yùn)營(yíng)成本問題愈發(fā)凸顯。同時(shí)波分系統(tǒng)的封閉性,也導(dǎo)致老系統(tǒng)擴(kuò)容成本居高不下;這些因素導(dǎo)致我們需要更好的解決方案來應(yīng)對(duì)如此爆發(fā)式的增長(zhǎng),在傳統(tǒng)方案局限性凸顯的情況下,我們走上了TOOP的道路。
18年的時(shí)候我們啟動(dòng)了TOOP,也定下了一個(gè)愿景,“讓價(jià)值回歸其根本,讓技術(shù)回歸其應(yīng)有的位置。”我們的目標(biāo)是打造一款好用的光網(wǎng)絡(luò)產(chǎn)品,我們對(duì)此還是很有信心的。因?yàn)闆]有人比我們更了解我們的需求,我們是在打造更符合我們需求的軟硬件產(chǎn)品。包括在成本上幫助我們節(jié)約CapEx和OpEx即資產(chǎn)采購(gòu)成本和運(yùn)營(yíng)成本。我們開始給波分設(shè)備作減法,因?yàn)樗珡?fù)雜。我們從幾個(gè)角度來對(duì)TOOP硬件產(chǎn)品進(jìn)行設(shè)計(jì):
● 刪減不必要功能,例如TPC設(shè)計(jì)時(shí),我們不做overhead開銷處理,降低復(fù)雜度,僅通過MDIO對(duì)DCO寄存器對(duì)應(yīng)PM數(shù)據(jù)進(jìn)行抓取,包括LLDP、PM等全量數(shù)據(jù)進(jìn)行抓取;
● 增加人性化設(shè)計(jì),增加LCD、Button等提示與反饋按鍵,實(shí)現(xiàn)現(xiàn)場(chǎng)操作時(shí)可以與NOC相互確認(rèn),避免誤操作;
● 增加精細(xì)化運(yùn)營(yíng)功能,通過gRPC反饋回臂,實(shí)現(xiàn)1秒telemetry推送,OPC與TPC每秒上報(bào)各采集點(diǎn)的性能數(shù)據(jù),這些數(shù)據(jù)將協(xié)助我們做告警事件分析;
● 提升快速交付能力,通過高器件集成度設(shè)計(jì),減少板卡類型與架內(nèi)尾纖的數(shù)量,提升交付效率。同時(shí)產(chǎn)品含包裝小于23kg重量符合單人搬運(yùn)限制規(guī)定,連接器與安裝套件精心設(shè)計(jì)減少部署環(huán)節(jié)的時(shí)間成本;
TOOP采用集中化控制的思路,TOC為國(guó)王角色,OPC與TPC為臣民的角色。硬件設(shè)計(jì)就如同傳感器一樣,采集數(shù)據(jù)回傳給控制器,由控制器進(jìn)行決策。這樣減少硬件OS內(nèi)開發(fā)工作量,降低bug與系統(tǒng)的復(fù)雜度。
安全方面我們?cè)O(shè)計(jì)選用了符合電器規(guī)范的帶屏蔽蓋的LC法蘭,當(dāng)光纖拔出時(shí)端口會(huì)立即自動(dòng)閉合,實(shí)現(xiàn)Class 1M的激光安全規(guī)范。同時(shí)所有功率會(huì)超過Class 1M限定的端口均支持APR功能(自動(dòng)功率衰減),對(duì)于OA單板的系統(tǒng)口我們也設(shè)計(jì)了反向ARP功能防止意外發(fā)生。
當(dāng)然這些描述起來是很容易,但做起來是十分復(fù)雜和困難的,器件的選擇、功能的取舍都是難點(diǎn),在這過程中也體現(xiàn)了光器件行業(yè)的痛。以單波速率400G的電層產(chǎn)品來說,oDSP的開發(fā),IC-TROSA的開發(fā)國(guó)內(nèi)少有人做,在深入到ADC/DAC的IP基本上還是來自于北美。說到國(guó)產(chǎn)化程度最高的光層器件,高維度WSS也還沒有成功攻克,甚至一個(gè)LC法蘭也是有專利保護(hù)。這些問題在與商用系統(tǒng)廠商溝通中或多或少的影響我們定制化需求,這也是我們做自己的硬件的原因。我們理解商用系統(tǒng)廠商面對(duì)眾口難調(diào)的難處,導(dǎo)致目前的產(chǎn)品面對(duì)IDC應(yīng)用的需求還有一些優(yōu)化的空間。當(dāng)然TOOP也歡迎各商用系統(tǒng)商一起加入進(jìn)來,希望可以一起推動(dòng)產(chǎn)業(yè)的發(fā)展。
TOOP用互聯(lián)網(wǎng)思維方式設(shè)計(jì)通信產(chǎn)品
OPC-4是TOOP產(chǎn)品的第一個(gè)硬件產(chǎn)品,這個(gè)是一個(gè)通用的光層平臺(tái)產(chǎn)品。我們?cè)谠O(shè)計(jì)這款產(chǎn)品時(shí)選用了很多創(chuàng)新產(chǎn)品與一些高品質(zhì)器件,就像我們的愿景一樣,讓價(jià)值回歸其根本,讓技術(shù)回歸其應(yīng)有的位置。其主要特性如下:
● 體積小巧,便于部署,可以安裝在19英寸、600mm深的機(jī)柜內(nèi),同時(shí)散熱與安裝方式適合數(shù)據(jù)中心場(chǎng)景等多種不同場(chǎng)景應(yīng)用
● 高集成度設(shè)計(jì),單個(gè)子框?qū)崿F(xiàn)OMSP的部署
● 端口標(biāo)識(shí)具備防錯(cuò)插/拔設(shè)計(jì),減少誤操作造成的業(yè)務(wù)損失
● PANEL設(shè)計(jì)有狀態(tài)顯示LCD屏幕,顯示當(dāng)前告警狀態(tài),屏幕依據(jù)告警級(jí)別進(jìn)行對(duì)應(yīng)顏色顯示,同時(shí)常態(tài)顯示本機(jī)管理IP地址,用于定位子框使用
● 設(shè)計(jì)有反饋按鍵,按鍵操作會(huì)觸發(fā)Notifaction至NOC,TOC上會(huì)顯示該設(shè)備被操作,配合PANEL的LCD屏幕,每次現(xiàn)場(chǎng)對(duì)設(shè)備進(jìn)行操作時(shí)可以通過反饋確認(rèn),并根據(jù)屏幕顯示開始/停止內(nèi)容進(jìn)行操作,減少誤操作的可能。同時(shí)按鍵支持查看重要線路狀態(tài)信息,包括OPS工作路由,A/B路接收功率等
● OPC 系統(tǒng)邏輯設(shè)計(jì)有維護(hù)狀態(tài)模式,便于現(xiàn)場(chǎng)人員確認(rèn)并識(shí)別子框信息與狀態(tài),即子框、子卡、電源、風(fēng)扇單元具備提示指示燈,NOC人員可以通過預(yù)設(shè)提示狀態(tài)指引現(xiàn)場(chǎng)人員進(jìn)行對(duì)應(yīng)部件的識(shí)別確認(rèn)操作
● 無源背板設(shè)計(jì),減少子框故障的可能,設(shè)備主控單元CU支持1+1熱備,CU選用多核高性能處理器,單板與器件內(nèi)置flight recorder功能,實(shí)現(xiàn)硬件原生支持故障異常可溯源,器件壽命到期前警告
● 電源單元支持1+1熱備,支持多種電源規(guī)格,AC 100~230v / HDC 230v,DC -48V電源系統(tǒng)
● 支持50GHz間隔96波系統(tǒng) / 75Ghz間隔64波系統(tǒng) / 以及Flex Grid(50GHz +/- 6.25GHz)的系統(tǒng)
● 高性能 OCM 支持500ms內(nèi)完成 C 波段掃描,OTDR 支持 36dB 跨段的探測(cè)能力
● 高性能 EDFA 覆蓋多場(chǎng)景跨段需要,寬增益調(diào)節(jié)范圍7~32dB可調(diào)節(jié),其中15~30dB為平坦增益范圍 (NF<6.5板卡SIG ?àLINE)
● 1s 級(jí)別的 Telemetry 能力,全部 PM 采集點(diǎn)支持 1s 級(jí)別的數(shù)據(jù)推送(包括OCM、各節(jié)點(diǎn)端口PD、溫度、風(fēng)扇轉(zhuǎn)速、增益、平坦度、激光器溫度、偏置電壓電流等全部可讀取節(jié)點(diǎn))
● 1GE的OSC交互帶寬,靈活的管理網(wǎng)接入方案及DCN方案,支持OSPF協(xié)議
● 支持基于Netconf協(xié)議的管控方案,以及Tacacs+的認(rèn)證機(jī)制
● 原生支持 Tencent Yang model
● 支持電層板卡混插實(shí)現(xiàn)TPC-4功能
化繁為簡(jiǎn),減少誤操作的可能
OPC-4的一些功能源于現(xiàn)場(chǎng)運(yùn)營(yíng)的痛點(diǎn),我們?cè)谠O(shè)計(jì)時(shí)犧牲前面板寬度增加了一個(gè)PANEL子卡。
PANEL板卡上有LCD屏幕與Button按鍵。PANEL會(huì)顯示當(dāng)前運(yùn)行告警,按照告警級(jí)別匹配對(duì)應(yīng)顏色。Button作為交互信息按鍵,提供網(wǎng)絡(luò)運(yùn)營(yíng)中心NOC與現(xiàn)場(chǎng)維護(hù)人員的確認(rèn)/反確認(rèn)的能力。出于安全考慮IDC可能沒有做手機(jī)信號(hào)覆蓋,亦或噪音很大的情況下難以通過電話說清信息。通過button,現(xiàn)場(chǎng)運(yùn)營(yíng)人員點(diǎn)按Button后,NOC會(huì)在TOC上收到事件提示,顯示該設(shè)備被人觸碰,從而確認(rèn)所維護(hù)的設(shè)備是否正確。NOC也可以下發(fā)簡(jiǎn)單命令信息如“GO,STOP,NEXT STEP,OK”等信息,通知現(xiàn)場(chǎng)人員可以進(jìn)行操作或者停止,來避免產(chǎn)生誤操作的可能。
真能有人找錯(cuò)機(jī)框?會(huì)有人拔錯(cuò)板卡嗎?不幸的是,這個(gè)答案是肯定的。其實(shí)我也有過類似的疑問,經(jīng)歷過這么巧合的故障后發(fā)現(xiàn),人是運(yùn)營(yíng)環(huán)節(jié)中的一個(gè)不可靠因素。其實(shí)就如同法航447空難一樣,人在緊張的情況下是不可靠因素,特別是面對(duì)復(fù)雜的設(shè)備很容易發(fā)生誤操作?,F(xiàn)在大多采用雙平面組網(wǎng)方案,平面A故障時(shí),如果誤操作了平面B帶來的損失將是極大的。如何通過系統(tǒng)有效規(guī)避誤操作是OPC-4設(shè)計(jì)時(shí)重點(diǎn)考慮的一個(gè)因素。
除了PANEL之外,對(duì)于OPC-4上的端口,通過絲印設(shè)計(jì)進(jìn)行提示,OPC與TPC產(chǎn)品的絲印遵循色標(biāo)含義。連接外線光纖的端口為紅色絲印;本子框內(nèi)互聯(lián)的端口為藍(lán)色絲印;不同子框間互聯(lián)的端口為綠色絲印。同時(shí)默認(rèn)配發(fā)的是單管雙芯跳纖,成倍數(shù)的減少光纖布防的數(shù)量,精簡(jiǎn)現(xiàn)場(chǎng)操作。相比傳統(tǒng)設(shè)備安裝調(diào)測(cè)可能需要數(shù)天,我們?cè)?jīng)計(jì)時(shí)對(duì)比,開通1.6T帶寬業(yè)務(wù),從庫(kù)房拆箱開始計(jì)時(shí),1個(gè)人耗時(shí)2個(gè)半小時(shí)完成單個(gè)站點(diǎn)的調(diào)試與業(yè)務(wù)開通,極大的縮短了業(yè)務(wù)交付的時(shí)間。
將復(fù)雜留給設(shè)備內(nèi)部,精簡(jiǎn)留給用產(chǎn)品的人
波分設(shè)備長(zhǎng)久以來是需要專業(yè)人員運(yùn)維的,即使波分系統(tǒng)一直是通過UI界面的網(wǎng)管進(jìn)行操作,但不同廠商的網(wǎng)管也有著各樣的設(shè)計(jì)。從架構(gòu)方案設(shè)計(jì)、現(xiàn)場(chǎng)工程交付、后期故障運(yùn)營(yíng)維護(hù),人性化缺失在各個(gè)環(huán)節(jié)。總結(jié)其原因,還是單一系統(tǒng)承載了太多需求,同時(shí)滿足各家需求時(shí)往往產(chǎn)品會(huì)非常繁冗。因此需要專業(yè)團(tuán)隊(duì)來維護(hù)這樣一個(gè)封閉的,復(fù)雜的系統(tǒng)。我們能否化繁為簡(jiǎn)?答案也是肯定的,通過內(nèi)繁外簡(jiǎn)的思路,將傳統(tǒng)設(shè)備眾多功能的板卡集成在一塊板卡中實(shí)現(xiàn)。精簡(jiǎn)信號(hào)流關(guān)系,減少架內(nèi)連纖數(shù)量,我們可以看到,傳統(tǒng)設(shè)備一個(gè)光方向可能需要36根光纖,而OPC-4 將這些復(fù)雜的功能小型化集成在單一板卡內(nèi)時(shí),一個(gè)標(biāo)準(zhǔn)OMSP應(yīng)用也僅僅需要5根雙芯纖實(shí)現(xiàn)。節(jié)省下來的是復(fù)雜度,在進(jìn)行故障排查時(shí)會(huì)減少難度,對(duì)于工程建設(shè)也會(huì)縮減工作量。
OPC系統(tǒng)是如何做到這一點(diǎn)的呢?
以線路放大器單板ILA-SWG為例,一塊單板相當(dāng)于傳統(tǒng)設(shè)備5塊業(yè)務(wù)單板的功能。OPC-4的OA-SWG單板內(nèi)置2塊高性能OCM、OTDR、OSC、VOA、無緣濾波器、雙向的PA單元。每一個(gè)器件在傳統(tǒng)設(shè)備中都是單獨(dú)以板卡形態(tài)存在。以BA/PA為例,我們選用了高功率Switchable gain EDFA,輸出功率高達(dá)23dBm,增益范圍支持7~32dB可調(diào)節(jié),其中平坦增益段支持15~30dB可調(diào)(NF < 6.5),這個(gè)噪聲系數(shù)是EDFA單板的噪聲系數(shù),相當(dāng)于傳統(tǒng)設(shè)備的一個(gè)光方向的噪聲系數(shù)。
采用可切換分段增益EDFA的好處是,一塊板卡實(shí)現(xiàn)適應(yīng)眾多跨段,傳統(tǒng)的光層產(chǎn)品,以華為OSN系列為例,光放種類高達(dá)十余種,即使是較為常用的也有OAU101~OAU107之多。每次進(jìn)行架構(gòu)設(shè)計(jì)時(shí)需要根據(jù)光纜工勘結(jié)果進(jìn)行配置,不同跨段損耗,配置不同增益范圍、輸出功率的OA,對(duì)應(yīng)備件也應(yīng)配置相應(yīng)的OA,因此對(duì)于系統(tǒng)設(shè)計(jì)復(fù)雜度,維護(hù)便利性均帶來了很大的挑戰(zhàn)。傳統(tǒng)波分系統(tǒng)的各功能均采用獨(dú)立單板設(shè)計(jì),單板之間通過架內(nèi)尾纖進(jìn)行連接,維護(hù)人員需要根據(jù)圖紙進(jìn)行操作,端口設(shè)計(jì)密集操作難度大。OPC-4的單光放設(shè)計(jì)規(guī)避了這些問題,高集成度,一塊單板解決眾多應(yīng)用場(chǎng)景,精簡(jiǎn)設(shè)備連纖,端口采用色標(biāo)標(biāo)記,邏輯清晰方便開站應(yīng)用。采用新器件、新技術(shù)來解開操作的繁瑣的難題。器件與設(shè)計(jì)繁冗但操作簡(jiǎn)便,是OPC-4的一個(gè)特點(diǎn),我們相信隨著網(wǎng)絡(luò)規(guī)模增長(zhǎng)降低運(yùn)營(yíng)成本將會(huì)更劃算。
對(duì)于OPS光保護(hù)單板我們也做了全新的設(shè)計(jì),并融入了重量級(jí)功能——倒換精準(zhǔn)計(jì)時(shí)。我們?cè)贠PS單板的每個(gè)端口均增加了PD,這個(gè)也賦予我們一個(gè)能力,OPS在發(fā)生了主備路由切換時(shí),OPS單板可以精確的計(jì)算出切換的時(shí)間,即光切換瞬間丟失信號(hào)多次時(shí)間,并通過切換時(shí)間上報(bào)給TOC騰訊光網(wǎng)絡(luò)控制器。結(jié)合TPC的同樣的保護(hù)倒換瞬態(tài)業(yè)務(wù)丟失計(jì)時(shí)功能,我們可以精確的知道,一個(gè)保護(hù)倒換在光層上丟失了多少ms,在電層上丟失了多少ms。并借此可以定位故障,比如當(dāng)OPS顯示0.7ms完成切換,而電層設(shè)備的DSP記錄到resync時(shí)間達(dá)到了1-2秒,那我們有理由相信,可能OTU單板的入光功率接近靈敏度了,或者線路OSNR余量不足,需要進(jìn)行線路或者系統(tǒng)優(yōu)化。這樣我們可以精準(zhǔn)的記錄系統(tǒng)的每一個(gè)細(xì)節(jié)變動(dòng),這是精細(xì)化運(yùn)營(yíng)的基本要素。每一次網(wǎng)絡(luò)抖動(dòng)我們都希望知道真實(shí)的發(fā)生了什么,波分層、underlay層網(wǎng)絡(luò)、overlay層網(wǎng)絡(luò),每一層上面業(yè)務(wù)損失了多少時(shí)間。為什么損失我們希望調(diào)查明白,這樣當(dāng)發(fā)生故障時(shí),我們知道整個(gè)系統(tǒng)的SLA是否可以保證,分配給波分系統(tǒng)的50ms是否可以守住,這個(gè)從硬件層面我們做了這些工作來理解切換的那一瞬間到底發(fā)生了什么。
其實(shí)類似的細(xì)節(jié)設(shè)計(jì)還有很多,我們重新定義了光網(wǎng)絡(luò)硬件設(shè)備的PM信息。OA、ILA、OPS、WSS、T2X4C8電層單板,包括即將發(fā)布的CMUX-64(支持Flex-grid的合分波板卡)均支持全量PM數(shù)據(jù)的1秒級(jí)別的Telemetry。
TOOP硬件層面原生支持1秒及telemetry的性能采集是什么意思?傳統(tǒng)波分設(shè)備僅有15分鐘及24小時(shí)性能記錄,這樣的數(shù)據(jù)經(jīng)常的給我們帶來故障判斷的困擾。從故障分析、硬件故障預(yù)判方面1秒級(jí)的telemetry讓TOOP系統(tǒng)大有可為。這個(gè)賦能讓我們頭一次徹底的在微觀層面,在秒級(jí)尺度上進(jìn)行了故障描述。以前我們常遇到光纜抖動(dòng)一下,瞬間業(yè)務(wù)有丟包,但是尋找故障并無法得知具體原因,因?yàn)镻M數(shù)據(jù)無法給到更精確的信息,這些故障統(tǒng)一的歸類給光纜抖動(dòng)因素。但是現(xiàn)在,我們可以在光域、電域內(nèi)進(jìn)行更微觀尺度的檢查,精準(zhǔn)定位到底是光纜真的發(fā)生了瞬間的抖動(dòng)還是激光器存在異常。
所謂大道至簡(jiǎn),衍化至繁。當(dāng)前TOOP的成功部署,其實(shí)僅僅是個(gè)開始,我們用了2年時(shí)間,日以繼夜的設(shè)計(jì)、開發(fā)、測(cè)試實(shí)現(xiàn)了這個(gè)系統(tǒng)由0至1的遷躍,而這也為TOC(騰訊光網(wǎng)絡(luò)控制器)帶來了無盡的想象,我們做到了對(duì)光網(wǎng)絡(luò)的數(shù)字化轉(zhuǎn)變。TOC這里我們有太多的創(chuàng)新與設(shè)計(jì),待后續(xù)單獨(dú)呈現(xiàn)這部分內(nèi)容?;诜答伝乇鬯鶐淼暮A縋M數(shù)據(jù),我們現(xiàn)在每周可以抓取到數(shù)百G的運(yùn)行數(shù)據(jù),這些數(shù)據(jù)都是基于我們類似傳感器一樣的各個(gè)器件所反饋回來的性能數(shù)據(jù)。我們希望能夠通過機(jī)器學(xué)習(xí)的方式將這些數(shù)據(jù)利用起來,我們有燃料,我們需要火箭來燃燒他們,與我們尋找未知的高度。有相關(guān)愿景的小伙伴們可以聯(lián)系我們哦,歡迎加入我們一起改變世界!
(例如,下圖中的每一個(gè)細(xì)點(diǎn)都是那一秒的PMD數(shù)據(jù)。讓我們?cè)囅胍幌?,光纜收到應(yīng)力作用PMD會(huì)發(fā)生變化,原理是光纜因施工或其他因素產(chǎn)生應(yīng)力變化,從而產(chǎn)生雙折射。進(jìn)而有沒有可能我們從DSP的數(shù)據(jù)中采集到這個(gè)變化,基于這個(gè)數(shù)值,我們是否可以推斷出現(xiàn)場(chǎng)有施工?或者兩條光纜是否統(tǒng)一時(shí)刻產(chǎn)生了類似的問題,是否是同路由?當(dāng)然從更精確的角度來看,我們也在推動(dòng)DSP供應(yīng)商上報(bào)SOP等信息,震動(dòng)是否可以帶來更具有價(jià)值的數(shù)據(jù)?)
電層核心器件解耦,TOOP徹底擁抱開放
在19年OFC上,我們看到業(yè)內(nèi)在7nm芯片DSP(數(shù)字信號(hào)處理芯片)上推出了兩款產(chǎn)品,即低功耗版本和高性能版本。其中低功耗版本應(yīng)用于DCO模塊,主要是為400G-ZR產(chǎn)品設(shè)計(jì),應(yīng)對(duì)80km的傳送距離的需求。但是如大家所知,國(guó)內(nèi)的環(huán)境與海外有很大的不同,海外的城市規(guī)模較小,數(shù)據(jù)中心相距較近,光纜損耗相對(duì)較小,因此400G-ZR的應(yīng)用十分適合。而國(guó)內(nèi)城市相對(duì)大很多,輕輕松松的在城市內(nèi)光纜距離超過100km,同時(shí)光纜損耗較大以及光層保護(hù)的加入使得400G-ZR性能不足以滿足場(chǎng)景需求。我們發(fā)現(xiàn)這款低功耗的DSP如果采用高性能的FEC(前向糾錯(cuò)編碼)配合模塊內(nèi)置SOA或EDFA實(shí)現(xiàn)高功率輸出時(shí),其性能相比傳統(tǒng)的波分設(shè)備并沒有相差太多,可以輕松的應(yīng)對(duì)城域網(wǎng)的應(yīng)用環(huán)境,而成本相比400G-ZR并未增加太多,同時(shí)考慮到100GE的應(yīng)用還有大量需求,因此TPC-4平臺(tái)的第一塊業(yè)務(wù)板卡T2X4C8的設(shè)計(jì)概念就浮現(xiàn)出來。基于這個(gè)背景,我們又結(jié)合了此前我們已經(jīng)自研的光層設(shè)備OPC-4產(chǎn)品,采用相同的平臺(tái)子框去支持這塊T2X4C8板卡,減少重復(fù)研發(fā)的成本,并加速研發(fā)速度。
不同的光學(xué)前端ITTRA+DSP的組合讓我們有了更多的選擇余地,我們可以更好的挑選相應(yīng)的組合,也可以更好的把握不同器件的特點(diǎn),比如硅光的低功耗,磷化銦高帶寬性能。從最底層進(jìn)行波分系統(tǒng)的設(shè)計(jì)從而實(shí)現(xiàn)對(duì)需求的準(zhǔn)確把控,這也是TOOP所帶來的價(jià)值。相比傳統(tǒng)的5x7英寸相干模塊來說,DCO的方案成本具有一定優(yōu)勢(shì)(相同速率情況下),兩者的發(fā)貨量有著非常大的差距。雖然5x7模塊的性能更好,短距離應(yīng)用可以提供更大單波速率,但是在光纜距離較長(zhǎng),應(yīng)用OMSP保護(hù)的場(chǎng)景下400G DCO可以充分發(fā)揮其價(jià)值。我們輸出了Tencent CFP2-DCO MSA,繼而實(shí)現(xiàn)單一OTU板卡支持多廠商相干模塊的能力,在避免供應(yīng)商危機(jī)、批次故障方面具備了相當(dāng)靈活的可能性。硬件解耦后最大的收益是控制器開發(fā)工作降低,以前每一款新的板卡引入,均需要對(duì)其進(jìn)行適配、軟件測(cè)試、硬件系統(tǒng)測(cè)試等一系列工作。通過在板卡層面屏蔽硬件差異性,標(biāo)準(zhǔn)的MSA保證電器性能與管理接口可控,極大的釋放了控制器研發(fā)的需求量。對(duì)于運(yùn)營(yíng)也十分便捷,統(tǒng)一軟、硬件架構(gòu),像管理客戶側(cè)光模塊一樣簡(jiǎn)單。這就是擁抱開放所帶來的好處,也是TOOP的愿景“讓價(jià)值回歸其根本,讓技術(shù)回歸其應(yīng)有的位置。”,讓我們通過技術(shù)方案的創(chuàng)新來降低成本,而不是通過使用廉價(jià)器件,正所謂工欲善其事必先利其器,好的設(shè)計(jì)與品質(zhì)器件選擇將幫助我們降低故障發(fā)生的可能。
TOOP的未來
軟硬解耦,大道至簡(jiǎn)之后,便是衍化至繁。這里的繁是繁華的意思,功能多而不雜,產(chǎn)品優(yōu)而簡(jiǎn)潔是我們TOOP設(shè)計(jì)的目標(biāo)。TOOP硬件產(chǎn)品有2個(gè)事情近期將實(shí)現(xiàn),一個(gè)是對(duì)于Flex-grid的支持,一個(gè)是20維方向調(diào)度能力的支持。以前對(duì)波分業(yè)務(wù)開通調(diào)整,需要現(xiàn)場(chǎng)配合,擴(kuò)容和故障替換的效率也因此而受到影響,能否做到真的Zero-Touch,資源池儲(chǔ)備后按需投產(chǎn),通過技術(shù)換來一種從容感。
另一方面,開放解耦后我們面臨一個(gè)問題,即OTU是否需要互聯(lián)互通,即FEC的統(tǒng)一。我們知道OIF等一些組織在推動(dòng)FEC的標(biāo)準(zhǔn)化,但我們認(rèn)為,F(xiàn)EC和其他一些算法的差異性也恰恰是波分系統(tǒng)的精髓,趨同有時(shí)未必是一件好事。同時(shí)巨頭的壟斷可能讓市場(chǎng)喪失創(chuàng)新性,標(biāo)準(zhǔn)成立前和成立后對(duì)不同玩家會(huì)帶來不同的影響。因此騰訊不會(huì)強(qiáng)迫各廠商去支持相同的FEC,可由此而來的端到端設(shè)備同供應(yīng)商的問題我們通過TOOP產(chǎn)品解決。即Colorless實(shí)現(xiàn)現(xiàn)場(chǎng)電層設(shè)備無規(guī)則任意連接,電層設(shè)備安裝后,可以隨意的在CMUX-64單板對(duì)應(yīng)的端口上進(jìn)行連接,無需考慮波長(zhǎng)的因素,連接好后系統(tǒng)會(huì)自動(dòng)的對(duì)齊兩端波分設(shè)備,實(shí)現(xiàn)即使沒有相同F(xiàn)EC,系統(tǒng)也可以自動(dòng)的無需人員干預(yù)的實(shí)現(xiàn)端到端業(yè)務(wù)的創(chuàng)建。
對(duì)于更遠(yuǎn)的未來,多維度大容量CDC、L-band、800G,我們會(huì)根據(jù)需求進(jìn)行開發(fā),TOC會(huì)給予整個(gè)網(wǎng)絡(luò)更靈活與更智能的變化,我們相信光網(wǎng)絡(luò)的未來會(huì)朝向智慧互聯(lián)發(fā)展,期待著大家一起來討論,共同推動(dòng)產(chǎn)業(yè)的發(fā)展。