近年來,人工智能、虛擬/增強(qiáng)現(xiàn)實(shí)、物聯(lián)網(wǎng)等新興技術(shù)的涌現(xiàn)都離不開云計(jì)算的支持。云計(jì)算是數(shù)百萬臺(tái)分布在全球各地?cái)?shù)據(jù)中心的服務(wù)器通過網(wǎng)絡(luò)連接在一起組成的大型分布式計(jì)算平臺(tái)。今天,數(shù)據(jù)中心不再是一座孤立的機(jī)房,而是一個(gè)建筑群。一個(gè)數(shù)據(jù)中心可以包含很多個(gè)分支數(shù)據(jù)中心,它們所處的位置不同,卻可以通過網(wǎng)絡(luò)互聯(lián)起來,共同完成相應(yīng)的業(yè)務(wù)部署。
而實(shí)現(xiàn)這些數(shù)據(jù)中心間互通的紐帶就是——數(shù)據(jù)中心間互聯(lián)技術(shù)(注,下文簡(jiǎn)稱DCI)
根據(jù)Cisco發(fā)布的云指數(shù)報(bào)告,過去五年,數(shù)據(jù)中心間的互聯(lián)帶寬保持了近33%的年增長(zhǎng)率,互聯(lián)帶寬達(dá)到了~100Tb/s量級(jí)。
圖 1 Cisco發(fā)布的數(shù)據(jù)中心年流量增長(zhǎng)趨勢(shì)
當(dāng)把若干個(gè)數(shù)據(jù)中心用光纖連接起來,并且采用光通信技術(shù)承載他們之間相互的信息傳遞,這就組成了數(shù)據(jù)中心間互聯(lián)光網(wǎng)絡(luò)(注,后面簡(jiǎn)稱DCI網(wǎng)絡(luò))。
從不同角度分析,DCI網(wǎng)絡(luò)有一些明顯特征:
1、網(wǎng)絡(luò)拓?fù)湟渣c(diǎn)到點(diǎn)和簡(jiǎn)單組網(wǎng)為主,復(fù)雜度較低。
2、城域數(shù)據(jù)中心間互聯(lián)距離較短,單位傳輸成本的降低對(duì)數(shù)據(jù)中心很有吸引力。
3、更加關(guān)心網(wǎng)絡(luò)時(shí)延,小的設(shè)備時(shí)延可以減輕數(shù)據(jù)中心選址的困難。
4、互聯(lián)業(yè)務(wù)種類相對(duì)單一,以100G的以太網(wǎng)為主,電層設(shè)備復(fù)雜度較低。
5、結(jié)合流量的快速增長(zhǎng),模塊化的設(shè)備以及靈活可擴(kuò)張的組網(wǎng)方式更受歡迎。
6、特殊的硬件要求,例如容納在服務(wù)器機(jī)柜中,滿足前后出風(fēng)、高壓直流供電方式等。
為了更好的建設(shè)和維護(hù)數(shù)據(jù)中心間互聯(lián)網(wǎng)絡(luò),適配快速增加的數(shù)據(jù)中心間流量,DCI技術(shù)應(yīng)運(yùn)而生。
從黑盒封閉到開放解耦
在過去的網(wǎng)絡(luò)運(yùn)營(yíng)體系中,系統(tǒng)廠商提供整套解決方案,包括設(shè)備安裝、系統(tǒng)調(diào)試、運(yùn)維支持等,系統(tǒng)整體類似于封閉的黑盒,不同廠家的硬件、軟件均不具備兼容互通的可能。
其次,成本問題。受益于相干光傳輸技術(shù)的不斷演進(jìn),單波速率從100Gb/s增長(zhǎng)到了800Gb/s,由于電層設(shè)備的主要成本來自于光學(xué)器件,因此單波速率提高有利于降低單位成本。不過,過去10年,很少有一家系統(tǒng)廠家持續(xù)保持產(chǎn)品上的領(lǐng)先優(yōu)勢(shì)。這意味著,如果繼續(xù)采用封閉系統(tǒng)構(gòu)建網(wǎng)絡(luò),將無法第一時(shí)間享受到技術(shù)發(fā)展的紅利。
圖 3 電層單波速率和單纖容量的演化圖
另外,封閉系統(tǒng)中的私有網(wǎng)管軟件無法與用戶已有資源管理、權(quán)限管理、建設(shè)流程和日常維護(hù)系統(tǒng)打通,難以提升端到端的自動(dòng)化水平,從而縮短業(yè)務(wù)開通時(shí)間。
DCI技術(shù)的第一個(gè)突破點(diǎn)就是打開封閉的系統(tǒng),讓用戶可以按需定制自己的網(wǎng)絡(luò),規(guī)避獨(dú)家綁定,確保供應(yīng)安全。
阿里云基礎(chǔ)設(shè)施光網(wǎng)絡(luò)團(tuán)隊(duì),研究提出開放解耦DCI技術(shù)的概念,并和行業(yè)合作伙伴一起推進(jìn)了DCI技術(shù)生態(tài)的形成和壯大,突破了傳統(tǒng)封閉式的系統(tǒng)理念。
DCI網(wǎng)絡(luò)可以看成由底層硬件設(shè)備和上層管控軟件共同組成,其中設(shè)備分為光層設(shè)備和電層設(shè)備,兩者的角色類比于城市的交通設(shè)施,光層設(shè)備類似基礎(chǔ)道路,電層設(shè)備則是路上的交通工具。同電層技術(shù)的快速演化相比,光層設(shè)備屬于基礎(chǔ)設(shè)施中的基礎(chǔ)設(shè)施,技術(shù)演進(jìn)相對(duì)較慢,往往都會(huì)超期服役。所以,解耦的第一刀就切在這里,把公路和交通工具分割開,把光層和電層解耦。光層設(shè)備和電層設(shè)備來自不同廠家,同時(shí)在一套光層設(shè)備組成的“公路”上,可以支持來自不同電層設(shè)備廠家的“交通工具”。
圖 4 日常生活中的道路上可以自由的行駛來自不同廠家的不同類型的交通工具,開放解耦DCI網(wǎng)絡(luò)也擁有類似的能力
同時(shí),需要設(shè)備提供統(tǒng)一接口能力。軟件定義網(wǎng)絡(luò)(Software defined networks)的發(fā)展,Netconf協(xié)議得到了大多數(shù)設(shè)備廠家的共識(shí)。阿里巴巴也在早期加入了OpenConfig組織,參與光網(wǎng)絡(luò)相關(guān)的數(shù)據(jù)模型定義?;贜etconf協(xié)議和OpenConfig模型,可以采用第三方云軟件平臺(tái)直接對(duì)接廠家設(shè)備實(shí)現(xiàn)管控,這種完全解耦的系統(tǒng)減少了管控路徑上的環(huán)節(jié),對(duì)響應(yīng)新增網(wǎng)絡(luò)級(jí)功能需求有更好的主動(dòng)性和自由度。
圖 5 開放解耦的DCI網(wǎng)絡(luò)
靈活架構(gòu)支持網(wǎng)絡(luò)可擴(kuò)張
封閉系統(tǒng)打開后,下一步就可選擇更合適的硬件來構(gòu)建可靈活擴(kuò)張的DCI網(wǎng)絡(luò)。
在較長(zhǎng)一段時(shí)間內(nèi),光層設(shè)備的合分波單元僅支持固定通道間隔,實(shí)際上,隨著單波速率不斷提升,電層設(shè)備需要的頻譜寬度也不斷增加。為了兼容不斷發(fā)展的單波速率,固定間隔的合分波單元要升級(jí)到基于波長(zhǎng)選擇開關(guān)(Wavelength Selective Switch,WSS)的靈活合分波單元。
圖 6 靈活合分波單元與靈活柵格頻譜,為了支持更多的上下路端口,需要將兩個(gè)WSS進(jìn)行合并
在規(guī)模大的DCI網(wǎng)絡(luò)中,業(yè)務(wù)分布更復(fù)雜,需要考慮基于ROADM(Reconfigurable Optical Add Drop Multiplexer)的Mesh網(wǎng)絡(luò)架構(gòu)。在數(shù)據(jù)中心較為分散的城市,往往會(huì)采用星型架構(gòu)。如果主站不具備光層穿通能力,那么衛(wèi)星站之間的流量需要在主站進(jìn)行光-電-光轉(zhuǎn)換,不僅增加額外成本,還會(huì)增加站點(diǎn)間的傳輸時(shí)延。當(dāng)主站是ROADM時(shí),衛(wèi)星站之間的業(yè)務(wù)可以在主站穿通直達(dá)對(duì)端,并且穿通的波長(zhǎng)和路由都可通過網(wǎng)管軟件進(jìn)行配置,大大減少DCI網(wǎng)絡(luò)的人工運(yùn)維成本,提升業(yè)務(wù)開通效率。
圖 7 IP網(wǎng)絡(luò)與能夠支持ROADM的DCI網(wǎng)絡(luò)之間的協(xié)同
點(diǎn)到點(diǎn)場(chǎng)景下,光層在第一天就已經(jīng)建設(shè)完畢,光電解耦是合理的。在Mesh DCI網(wǎng)絡(luò)中,考慮到后續(xù)站點(diǎn)的增加和網(wǎng)絡(luò)規(guī)模的擴(kuò)大,光層需要進(jìn)一步解耦。我們推薦將ROADM按照方向進(jìn)行解耦,同時(shí)確保光復(fù)用段(Optical Multiplex Section,OMS)內(nèi)的設(shè)備都來自于同一個(gè)廠家。這樣的方式即可將DCI網(wǎng)絡(luò)中的光層部分有效切割,同時(shí)又避免陷入過多的設(shè)備之間協(xié)議的約定細(xì)節(jié)中。網(wǎng)絡(luò)建設(shè)的第一天只有站點(diǎn)A和B之間的連接,設(shè)備來自于供應(yīng)商M。第二天增加了一個(gè)新的站點(diǎn)C,那么站點(diǎn)C與站點(diǎn)B之間的連接,站點(diǎn)C與站點(diǎn)A之間的連接分別由供應(yīng)商T1和T2承建。為了應(yīng)對(duì)不同廠商設(shè)備連接頭不同導(dǎo)致的無法互通的問題,我們?cè)O(shè)計(jì)了一款支持靈活插卡的萬能連纖盒,由全連接背板以及方向適配插卡組成。每個(gè)方向的適配板卡可以匹配廠家的接頭規(guī)格,并將廠家的線序“翻譯”成通用線序。這樣,任意兩個(gè)方向之間通過萬能連纖盒實(shí)現(xiàn)了全連接??梢哉f,萬能連纖盒以四兩撥千斤的方式實(shí)現(xiàn)了光層異構(gòu),為DCI網(wǎng)絡(luò)規(guī)模的擴(kuò)大打開了自由之門。
圖 8 基于萬能連纖盒的異構(gòu)ROADM和光層解耦方案示意
管控自動(dòng)化提升網(wǎng)絡(luò)效率
同IP數(shù)字通信系統(tǒng)相比,光網(wǎng)絡(luò)中依然保留了大量的模擬屬性,例如光功率如何調(diào)整,放大器的增益、斜率如何配置等。為了應(yīng)對(duì)這樣的挑戰(zhàn),需要能實(shí)現(xiàn)可供第三方使用的開放光網(wǎng)絡(luò)設(shè)計(jì)工具。通過抽象出多層級(jí)模型,描述不同廠家設(shè)備的行為和功能,廠家的差異性體現(xiàn)則在模型的關(guān)鍵規(guī)格參數(shù)中。結(jié)合實(shí)際組網(wǎng)拓?fù)鋽?shù)據(jù)、業(yè)務(wù)資源數(shù)據(jù)等信息,規(guī)劃器求解端到端最優(yōu)化問題,可以計(jì)算獲得所有設(shè)備上的目標(biāo)配置值以及此時(shí)的性能余量。
在已有網(wǎng)絡(luò)中新增業(yè)務(wù)或者做配置優(yōu)化時(shí),需要像一個(gè)攀巖高手一樣,小心的選擇從當(dāng)前配置到目標(biāo)配置的調(diào)節(jié)路徑。受限于光放大器非線性、光纖Kerr非線性以及受激拉曼散射效應(yīng)的影響,不僅當(dāng)前調(diào)節(jié)的業(yè)務(wù)通道需要關(guān)注,相鄰的通道以及附近相關(guān)OMS上的通道同樣需要監(jiān)測(cè)。在配置器中引入了實(shí)時(shí)狀態(tài)檢查單元,實(shí)時(shí)采集的設(shè)備性能數(shù)據(jù)經(jīng)過定制的檢查邏輯,判斷當(dāng)前調(diào)節(jié)路徑是否存在風(fēng)險(xiǎn),不斷更新。如此反復(fù),最終安全的實(shí)現(xiàn)預(yù)設(shè)的調(diào)節(jié)目標(biāo)。
圖 9 可供第三方使用的開放光網(wǎng)絡(luò)設(shè)計(jì)工具和自動(dòng)化配置流程
發(fā)展和挑戰(zhàn)
不斷涌現(xiàn)的互聯(lián)網(wǎng)服務(wù)以及快速演進(jìn)的云計(jì)算,推動(dòng)了DCI網(wǎng)絡(luò)在過去的十年里蓬勃發(fā)展。開放解耦的系統(tǒng),簡(jiǎn)單且靈活的架構(gòu)體系以及軟件自動(dòng)化是DCI的主要?jiǎng)?chuàng)新點(diǎn)。在可預(yù)見的未來里,5G網(wǎng)絡(luò),物聯(lián)網(wǎng)(IoT),增強(qiáng)現(xiàn)實(shí)技術(shù)(AR)和虛擬現(xiàn)實(shí)(VR),以及邊緣云計(jì)算將繼續(xù)推動(dòng)DCI網(wǎng)絡(luò)快速增長(zhǎng)。一個(gè)開放的DCI生態(tài)將會(huì)更有利于新技術(shù)的發(fā)展和引入、推動(dòng)技術(shù)創(chuàng)新和業(yè)界繁榮,更好滿足客戶和業(yè)務(wù)的需求,并最終推動(dòng)云計(jì)算邁向新的階段!