ICCSZ訊 2019年8月, 網(wǎng)絡(luò)界的兩大盛會(huì),ACM Sigcomm2019和APNet’19在北京相繼召開,來自世界各地的網(wǎng)絡(luò)界精英齊聚北京,共同分享他們在網(wǎng)絡(luò)研究中的成果和面臨的挑戰(zhàn)。兩個(gè)大會(huì)都從如何解決傳統(tǒng)TCP協(xié)議面臨的問題入手,提出了各種不同層面的解決方案,從4G/5G無線網(wǎng)絡(luò),到邊緣數(shù)據(jù)中心網(wǎng)絡(luò),到核心數(shù)據(jù)中心,再到跨數(shù)據(jù)中心的網(wǎng)絡(luò)等。
在數(shù)據(jù)中心網(wǎng)絡(luò)的報(bào)告中,RDMA的大規(guī)模應(yīng)用和網(wǎng)絡(luò)擁塞控制成為了兩個(gè)大會(huì)上的熱門話題,多篇論文談到了這個(gè)問題和他們的解決方案。其中的兩片論文《HPCC: High Precision Congestion Control》和《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》收到了格外的關(guān)注。
《HPCC: High Precision Congestion Control》是由哈佛大學(xué)、阿里巴巴公司和劍橋大學(xué)聯(lián)合發(fā)表,該論文介紹了由于RDMA技術(shù)的性能優(yōu)勢,基于RDMA技術(shù)的網(wǎng)絡(luò)已經(jīng)在數(shù)據(jù)中心中得到大規(guī)模部署,但是隨著部署規(guī)模的越來越大,傳統(tǒng)的擁塞控制CC(Congestion Control)機(jī)制暴露出了其局限性,如收斂速度、穩(wěn)定性、配置復(fù)雜等。為了解決這個(gè)問題,本論文中介紹了HPCC(High Precision Congestion Control)技術(shù),利用交換機(jī)網(wǎng)絡(luò)遙測技術(shù)(INT)來獲得精確的鏈路負(fù)載信息,并通知到發(fā)送端,由發(fā)送端根據(jù)鏈路負(fù)載進(jìn)行流量調(diào)整;同時(shí)通過將Per-ACK的Reaction做成Per-RTT的Reaction,來確保高性能的傳輸下不會(huì)出現(xiàn)Over-React。從而實(shí)現(xiàn)了高速且高精度的擁塞控制- High Precision Congestion Control。這個(gè)實(shí)現(xiàn)對于RDMA技術(shù)的大規(guī)模應(yīng)用起到了很重要的作用,為廣大的RDMA用戶提供了新的思路和方向。隨著數(shù)據(jù)中心的規(guī)模增大,RDMA技術(shù)成為了保障數(shù)據(jù)中心性能的重要手段,傳統(tǒng)的TCP網(wǎng)絡(luò)中的很多技術(shù)已經(jīng)不能適應(yīng)高速RDMA網(wǎng)絡(luò)的需求,新技術(shù)的涌現(xiàn)推動(dòng)力RDMA技術(shù)在大規(guī)模數(shù)據(jù)中心中應(yīng)用的成熟。
清華大學(xué)代表在介紹其論文《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》時(shí)強(qiáng)調(diào),無論是計(jì)算還是存儲(chǔ),分布式系統(tǒng)已經(jīng)成為了提升性能的必經(jīng)之路,很多基于分布式系統(tǒng)的應(yīng)用都需要無損網(wǎng)絡(luò)的支持。傳統(tǒng)的無損網(wǎng)絡(luò)實(shí)現(xiàn)方案(如PFC等)有時(shí)會(huì)帶來網(wǎng)絡(luò)的死鎖,目前面向解決網(wǎng)絡(luò)死鎖的方案增加了網(wǎng)絡(luò)配置的復(fù)雜度,同時(shí)也影響到了網(wǎng)絡(luò)的性能。針對這個(gè)問題,清華大學(xué)提出了溫和流量控制(GFC)的方式來控制端口速率,使所有端口都能保持?jǐn)?shù)據(jù)包的流動(dòng),即使存在循環(huán)緩存區(qū)的依賴關(guān)系,也可以避免網(wǎng)絡(luò)的死鎖。清華大學(xué)還用實(shí)驗(yàn)和仿真驗(yàn)證了GFC的實(shí)現(xiàn)和對網(wǎng)絡(luò)帶寬的影響(小于0.5%)。這篇文章提供了另一種實(shí)現(xiàn)大規(guī)模RDMA應(yīng)用的思路,值得數(shù)據(jù)中心用戶去借鑒。
Mellanox公司作為RDMA技術(shù)和設(shè)備的主要提供商,RDMA技術(shù)正在成為以數(shù)據(jù)為中心的計(jì)算模型的關(guān)鍵,如何快速、安全的傳輸和處理數(shù)據(jù),直接關(guān)系到數(shù)據(jù)中心性能的好壞。在Sigcomm和APNet這兩個(gè)大會(huì)中,關(guān)于對RDMA、無損網(wǎng)絡(luò)、擁塞控制等的探索和研究,為RDMA技術(shù)的大規(guī)模應(yīng)用起到了積極的推動(dòng)作用,證明了RDMA大規(guī)模應(yīng)用的可行性。Mellanox的網(wǎng)絡(luò)計(jì)算(In-Network Computing)技術(shù),除了RDMA以外,更是添加了SHARP(Scalable Hierarchical Aggregation and Reduction Protocol, 在交換機(jī)中做通信計(jì)算) 技術(shù), SHIELD(Self Healing Technology,網(wǎng)絡(luò)自愈) 技術(shù), AR(Adaptive Routing,動(dòng)態(tài)路由) 等新的技術(shù)來面對傳統(tǒng)以CPU為核心的數(shù)據(jù)中心面臨的通信和計(jì)算的瓶頸問題,通過新的網(wǎng)絡(luò)計(jì)算技術(shù),將網(wǎng)絡(luò)變成了IPU(I/O Process Unit),將計(jì)算工作分散到了數(shù)據(jù)中心的各個(gè)單元,計(jì)算將會(huì)發(fā)生在最合適的地方,而不是必須要發(fā)送到CPU再做計(jì)算,實(shí)現(xiàn)了真正的以數(shù)據(jù)為中心。 In-CPU Computing,In-Network Computing和In-Storage Computing的有效整合,將會(huì)是構(gòu)建未來高性能數(shù)據(jù)中心的關(guān)鍵。網(wǎng)絡(luò)作為CPU到CPU, CPU到存儲(chǔ)以及存儲(chǔ)到存儲(chǔ)之間通信的必經(jīng)之路,已經(jīng)成為了數(shù)據(jù)中心性能的最大挑戰(zhàn)。新的挑戰(zhàn)需要新的技術(shù)來解決,增加蠟燭的數(shù)量不能發(fā)明電力;增加CPU的數(shù)量、網(wǎng)絡(luò)的帶寬和降低網(wǎng)絡(luò)的延遲不再能解決目前數(shù)據(jù)中心的挑戰(zhàn),我們需要新的創(chuàng)意、新的技術(shù)來構(gòu)建下一代的數(shù)據(jù)中心。
Mellanox 公司的英文全稱是 Mellanox Technologies(中文名:邁絡(luò)思),是一家在全球范圍內(nèi)為服務(wù)器和存儲(chǔ)提供端到端InfiniBand和以太網(wǎng)智能互連解決方案及服務(wù)的領(lǐng)軍企業(yè)。Mellanox互連解決方案憑借其低延遲、高帶寬、網(wǎng)絡(luò)計(jì)算等優(yōu)勢, 可在應(yīng)用之間快速地傳遞數(shù)據(jù),提升系統(tǒng)性能和提高數(shù)據(jù)安全性,極大地提升了數(shù)據(jù)中心效率。Mellanox的端到端高速互連產(chǎn)品包括: 網(wǎng)卡、交換機(jī)、線纜、光模塊、軟件和芯片等,用以加速應(yīng)用的性能、優(yōu)化業(yè)務(wù)的投資回報(bào)率,覆蓋云服務(wù)、超大規(guī)模數(shù)據(jù)中心、高性能計(jì)算、人工智能、企業(yè)級數(shù)據(jù)中心、網(wǎng)絡(luò)安全、存儲(chǔ)以及金融服務(wù)等各個(gè)行業(yè)。更多信息請關(guān)注:www.mellanox.com。