2022ODCC峰會(huì)上,華為為數(shù)據(jù)中心持續(xù)進(jìn)化提供了哪些解題思路

訊石光通訊網(wǎng) 2022/9/7 14:53:54

 ICC訊 2022年9月5日,一年一度的開放數(shù)據(jù)中心(ODCC)峰會(huì)在京舉辦。本次峰會(huì)以“暢享算力精彩、共赴低碳未來”為主題,邀請(qǐng)眾多行業(yè)知名專家與企業(yè)共同探討了雙碳減排背景下數(shù)據(jù)中心持續(xù)發(fā)展所遇到的挑戰(zhàn)以及多種可行的應(yīng)對(duì)方案。而作為ODCC生態(tài)的重要參與者,華為不僅參加了本次峰會(huì)的眾多環(huán)節(jié),更用主題分享和精準(zhǔn)的展臺(tái)內(nèi)容給出了這一復(fù)雜問題的綜合答案。

  華為中國(guó)政企媒資系統(tǒng)部總經(jīng)理李騰

  領(lǐng)獎(jiǎng)“ODCC優(yōu)秀合作伙伴”

  在華為看來,要實(shí)現(xiàn)低碳前提下的算力發(fā)展,簡(jiǎn)單來看是個(gè)PUE問題,但真正標(biāo)本兼治的答案則是多樣算力的融合發(fā)展。通過將多樣算力合而為一、綜合運(yùn)用,數(shù)據(jù)中心便有能力在不同的業(yè)務(wù)負(fù)載類型和專業(yè)化的算力硬件之間實(shí)現(xiàn)精確匹配,從而讓不同類型的基礎(chǔ)架構(gòu)盡可能的處理自己所擅長(zhǎng)的任務(wù)、始終工作在高效區(qū)間;由此,數(shù)據(jù)中心的服務(wù)產(chǎn)出和能源消耗才能實(shí)現(xiàn)一升一降,低碳與算力兩大目標(biāo)才能兼得。

  對(duì)此,華為計(jì)算產(chǎn)品線品牌及產(chǎn)業(yè)營(yíng)銷總監(jiān)白晨表示,實(shí)現(xiàn)低碳發(fā)展、促進(jìn)多樣性算力的融合發(fā)展絕非傳統(tǒng)算力和AI算力的簡(jiǎn)單堆砌,而是需要算力、通訊、操作系統(tǒng)、應(yīng)用使能等多重因素的通盤考量;其實(shí)踐方法便是“硬件一體、軟件融合”。

  達(dá)成這一目標(biāo)并非易事,但好在華為已經(jīng)蹚出了一條頗具可行性的實(shí)踐路徑。

  華為計(jì)算產(chǎn)品線品牌及產(chǎn)業(yè)營(yíng)銷總監(jiān)白晨

  發(fā)表主題演講“算力筑基,以綠色DC共創(chuàng)數(shù)智未來”

  DC as a Computer,

  讓下一代數(shù)據(jù)中心像電腦一樣高度協(xié)同

  “2021年底,我國(guó)數(shù)據(jù)中心機(jī)架規(guī)模達(dá)到520萬架,近5年復(fù)合增長(zhǎng)率超過30%。此外,對(duì)非結(jié)構(gòu)化數(shù)據(jù)的處理及AI計(jì)算需求仍在快速增長(zhǎng);到2030年,人工智能算力需求將達(dá)到目前的500倍。”

  這是白晨在ODCC主論壇的分享環(huán)節(jié)所給出的一組數(shù)字,既闡釋了數(shù)據(jù)中心重要性,也表明了多樣化算力發(fā)展的巨大前景。但在進(jìn)行算力擴(kuò)張的同時(shí),數(shù)據(jù)中心還應(yīng)該提前做好規(guī)劃,為異構(gòu)算力的高效應(yīng)用鋪平道路。

  在這一領(lǐng)域,華為的解題思路是“硬件一體、軟件融合”。

  1、硬件一體

  針對(duì)很多數(shù)據(jù)中心所面臨的能效、部署周期、管理和空間挑戰(zhàn),華為攜手伙伴,推出了全新的液冷集群整機(jī)柜產(chǎn)品。通過計(jì)算平臺(tái)、服務(wù)器節(jié)點(diǎn)、供電、網(wǎng)絡(luò)、布線、散熱等層面的一體化設(shè)計(jì),新的集群整機(jī)柜不僅在性能方面能夠做到“一柜頂四柜”,節(jié)約70%機(jī)房空間,更能通過冷板式液冷散熱技術(shù)、集中供電、全背板總線等設(shè)計(jì)實(shí)現(xiàn)能效、部署和運(yùn)維表現(xiàn)的全維升級(jí)。而以機(jī)柜為單位進(jìn)行預(yù)制、交付和部署,數(shù)據(jù)中心用戶的產(chǎn)品交付周期也能從過去的3-4月縮短至1周,并在安裝過程中做到0水管連接、0電源線連接、0信號(hào)線連接的極簡(jiǎn)部署。

  2、軟件融合

  與硬件系統(tǒng)的通盤考慮一樣,華為也在系統(tǒng)和軟件層面不遺余力;而其發(fā)力點(diǎn)則是歐拉生態(tài)和北冥多樣性計(jì)算融合架構(gòu)以及鴻蒙、openGauss等一系列基礎(chǔ)軟件的相互加持。

  過去兩年中,華為完成了歐拉操作系統(tǒng)的開源,并將歐拉捐贈(zèng)給開放原子開源基金會(huì)。而由此,歐拉也從創(chuàng)始企業(yè)主導(dǎo)的開源項(xiàng)目演進(jìn)到產(chǎn)業(yè)共建,社區(qū)自治,以更加開放的模式整合全球開發(fā)者貢獻(xiàn),openEuler生態(tài)體系保持快速發(fā)展。在眾多生態(tài)伙伴的貢獻(xiàn)之下,目前openEuler已經(jīng)實(shí)現(xiàn)ARM、x86、RISC-V等主流處理器指令集+GPU、NPU、DPU等多種異構(gòu)算力的計(jì)算架構(gòu)100%支持覆蓋,適配超100款整機(jī)和300余款板卡。

  可以說,openEuler已經(jīng)成為最佳支持多樣性算力的數(shù)字基礎(chǔ)設(shè)施開源操作系統(tǒng)。

  而在極速成長(zhǎng)的AI計(jì)算領(lǐng)域,華為則通過北冥多樣性計(jì)算融合架構(gòu)的持續(xù)更新,進(jìn)一步拓展了昇騰AI的能力、效率和適用場(chǎng)景。北冥多樣性計(jì)算融合架構(gòu)能在基礎(chǔ)架構(gòu)層面支持算力的統(tǒng)一調(diào)度,形成基礎(chǔ)使能層;此外,還提供了統(tǒng)一的開發(fā)工具鏈和管理軟件,讓開發(fā)者、算力使用者和數(shù)據(jù)中心都能在一套框架內(nèi)高效協(xié)作,實(shí)現(xiàn)“書同文、車同軌”的效果。

  從傳統(tǒng)計(jì)算平臺(tái)到以用于各類場(chǎng)景的多種加速卡,從服務(wù)器和存儲(chǔ)產(chǎn)品生態(tài)到兼顧算力、密度和能效的液冷集群整機(jī)柜,從服務(wù)器所使用的操作系統(tǒng)到輔助多樣算力協(xié)作發(fā)揮效能的計(jì)算架構(gòu),華為正在攜手生態(tài)為整個(gè)數(shù)據(jù)中心產(chǎn)業(yè)上下游提供相互兼容、運(yùn)行高效且快速迭代的產(chǎn)品、解決方案體系,讓復(fù)雜、龐大、應(yīng)用多樣的數(shù)據(jù)中心也能像一臺(tái)電腦一樣有機(jī)高效運(yùn)行。這正是從更高維度解決應(yīng)用需求、算力發(fā)展和綠色節(jié)能等一系列復(fù)雜問題的靠譜解題思路。

  多點(diǎn)發(fā)力,

  為算力的高效與安全筑牢根基

  算力方面的問題給出答案之后,我們也同樣要重視數(shù)據(jù)中心在網(wǎng)絡(luò)通信、安全可靠等所面臨的眾多實(shí)際挑戰(zhàn)。

  在從系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)上,數(shù)據(jù)中心當(dāng)?shù)拿總€(gè)節(jié)點(diǎn)都有1-4顆處理器以及0-N個(gè)GPU、NPU或DPU;而這樣的節(jié)點(diǎn),數(shù)據(jù)中心里有成千上萬,甚至十余萬個(gè)。并且伴隨分布式軟件架構(gòu)的迅速普及,數(shù)據(jù)中心所要面對(duì)的業(yè)務(wù)很多時(shí)候已不再是節(jié)點(diǎn)內(nèi)或單節(jié)點(diǎn)對(duì)單節(jié)點(diǎn)資源協(xié)同,而是多對(duì)多的大規(guī)??绻?jié)點(diǎn)協(xié)作。

  要解決如此規(guī)模、如此復(fù)雜的問題,我們當(dāng)然需要更先進(jìn)的數(shù)據(jù)中心通訊技術(shù)。

  在本次峰會(huì)的新技術(shù)與測(cè)試組分論壇當(dāng)中,華為DCN標(biāo)準(zhǔn)代表呂云屏女士則為與會(huì)嘉賓分享了解決這一問題的最新方法——NDMA(NetworkDMA)技術(shù)。呂云屏女士表示:NDMA技術(shù)以降低多對(duì)多集合通信任務(wù)完成時(shí)間為優(yōu)化目標(biāo);通過端網(wǎng)協(xié)同構(gòu)建統(tǒng)一的傳輸框架,將多對(duì)多通信邏輯下沉到網(wǎng)絡(luò)/傳輸層。相比點(diǎn)到點(diǎn)傳輸,如RDMA、NDMA降低額外系統(tǒng)開銷,最優(yōu)化多對(duì)多通信吞吐與時(shí)延性能,打破分布式系統(tǒng)性能擴(kuò)展天花板,為大規(guī)模數(shù)據(jù)中心內(nèi)部的多算力協(xié)同和分布式業(yè)務(wù)系統(tǒng)持續(xù)演進(jìn)提供了更強(qiáng)大的支撐。

  華為DCN標(biāo)準(zhǔn)代表呂云屏做主題報(bào)告

  《NDMA,分布式系統(tǒng)高效傳輸新探索》

  而在安全層面,華為安全解決方案首席架構(gòu)師王雨晨則在本次峰會(huì)的安全分論壇中分享了全新的“韌性”安全理念。王雨晨表示:當(dāng)前,由于安全只以防御威脅為目標(biāo),造成系統(tǒng)一定會(huì)被攻破的必然結(jié)果。華為的“韌性”安全架構(gòu),不以盡力而為地對(duì)抗威脅為目標(biāo),而是致力于通過“三維度”技術(shù)體系,構(gòu)建可信與韌性的網(wǎng)絡(luò)安全環(huán)境,保證系統(tǒng)行為始終處于可預(yù)期、可驗(yàn)證的安全狀態(tài)。從而保證關(guān)鍵信息系統(tǒng)在“漏洞開放、威脅存在、防御失效”的極限條件下,確保業(yè)務(wù)安全底線。

  華為安全產(chǎn)品線首席架構(gòu)師王雨晨

  做主題報(bào)告《建立韌性安全,確保安全底線》

  同時(shí),在本次峰會(huì)上,華為參與制定的《分布式存儲(chǔ)多協(xié)議融合互通技術(shù)規(guī)范》正式發(fā)布。這一規(guī)范的誕生打破了當(dāng)前多種分布式存儲(chǔ)系統(tǒng)在綜合部署時(shí)經(jīng)常面對(duì)的數(shù)據(jù)格式壁壘,能夠幫助用戶以0拷貝實(shí)現(xiàn)數(shù)據(jù)格式的轉(zhuǎn)換,能夠大幅提升多樣性數(shù)據(jù)的分析效率。

  此規(guī)范項(xiàng)目經(jīng)理,華為高級(jí)標(biāo)準(zhǔn)工程師趙麗麗

  榮獲“2022ODCC Manger Award”

  展臺(tái)展示

  在華為展示區(qū),圍繞數(shù)據(jù)中心計(jì)算、數(shù)據(jù)中心網(wǎng)絡(luò)及數(shù)字基礎(chǔ)設(shè)施操作系統(tǒng)精煉的展示了最新技術(shù)成果及生態(tài)進(jìn)展。展現(xiàn)了“多樣算力,筑根DC”理念。

  華為以“多樣算力,筑根DC”為主題參展

  硬件一體、軟件融合、多點(diǎn)發(fā)力;

  為數(shù)據(jù)中心持續(xù)高速發(fā)展鋪平道路

  從整個(gè)市場(chǎng)趨勢(shì)來看,2030年前,方興未艾的AI市場(chǎng)還將迎來500倍的算力擴(kuò)張,而已經(jīng)擁有龐大體量的通用算力市場(chǎng)也仍將獲得10倍算力的規(guī)模增長(zhǎng)。誠(chéng)然,在如此速度的增長(zhǎng)之下,數(shù)據(jù)中心行業(yè)還要面臨很多挑戰(zhàn)、還要解決眾多具體問題;我們希望通過硬件一體、軟件融合、多點(diǎn)發(fā)力思路,助力ICT產(chǎn)業(yè)快速進(jìn)化,構(gòu)筑安全穩(wěn)固的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,讓數(shù)字經(jīng)濟(jì)基于技術(shù)和算力的持續(xù)進(jìn)步而獲得快速躍遷的能力。

新聞來源:華為官微

相關(guān)文章