分布式數(shù)據(jù)中心(Distributed Data Center),簡稱DDC,是利用網(wǎng)絡(luò)把成千上萬臺存儲服務(wù)器連接、組合而成的一臺虛擬超級存儲服務(wù)器,用以完成單臺存儲服務(wù)器無法完成的超大規(guī)模問題求解。分布式數(shù)據(jù)中心除了虛擬超級存儲服務(wù)器外,還由多個數(shù)據(jù)中心組網(wǎng)形成多中心服務(wù)網(wǎng)絡(luò)。
云計算加速分布式發(fā)展
云計算的發(fā)展與普及,改變了數(shù)據(jù)中心的IT基礎(chǔ)架構(gòu),使得分布式數(shù)據(jù)中心成為流行。過去幾年,“互聯(lián)網(wǎng)﹢”作為熱詞,不斷在我們的日常生活中出現(xiàn),改變商業(yè)模式的同時也逐漸改變了我們的生活習慣與思維方式,大數(shù)據(jù)的價值愈發(fā)凸顯,圍繞其誕生的企業(yè),如云計算、大數(shù)據(jù)分析企業(yè)等層出不窮,數(shù)據(jù)成為企業(yè)最寶貴的資產(chǎn)。而數(shù)據(jù)中心正是承載數(shù)據(jù)的核心容器。
傳統(tǒng)數(shù)據(jù)中心通過硬件、軟件等設(shè)備以及網(wǎng)絡(luò)通信資源等對數(shù)據(jù)進行存儲、分析,并有效助力企業(yè)業(yè)務(wù)覆蓋。但隨著業(yè)務(wù)的日益發(fā)展,在大規(guī)模、高密度數(shù)據(jù)承載的需求下,傳統(tǒng)集中式數(shù)據(jù)中心因其設(shè)備與網(wǎng)絡(luò)機構(gòu)因素,在存儲、處理、安全、網(wǎng)絡(luò)時延等方面逐漸顯得力不從心。而云計算的出現(xiàn)則解決了此類問題,使得集中式架構(gòu)得以向分布式架構(gòu)發(fā)展。分布式數(shù)據(jù)中心極大地突破了規(guī)模的限制,通過云連接與云組網(wǎng),將多個數(shù)據(jù)中心聯(lián)合在一起,實現(xiàn)數(shù)據(jù)共享、多中心運營、業(yè)務(wù)高覆蓋,并極大程度上降低了運維成本,同時實現(xiàn)災(zāi)備建設(shè),降低業(yè)務(wù)中斷的風險。
技術(shù)層次可分兩層
分布式架構(gòu)數(shù)據(jù)中心在技術(shù)層次上可分為單數(shù)據(jù)中心分布式架構(gòu)與多數(shù)據(jù)中心分布式架構(gòu)這兩層。前者主要由分布式計算、存儲、安全網(wǎng)絡(luò)等多種分布式技術(shù)集成,后者主要指通過云計算實現(xiàn)多數(shù)據(jù)中心的一體化,例如分布式云數(shù)據(jù)中心。
單數(shù)據(jù)中心分布式架構(gòu)
分布式計算架構(gòu) 分布式計算架構(gòu)指的是以分布式計算技術(shù)為基礎(chǔ),用于解決大規(guī)模問題的軟件架構(gòu)。分布式軟件架構(gòu)伸縮性較好,尤其在處理大數(shù)據(jù)相關(guān)問題時,分布式架構(gòu)能顯著提高處理速度。常見的分布式軟件架構(gòu)有Hadoop、Spark等。
分布式存儲架構(gòu) 分布式存儲架構(gòu)具備高擴展性,能有效解決海量數(shù)據(jù)存儲與處理問題。分布式存儲架構(gòu)由客戶端、元數(shù)據(jù)服務(wù)器和數(shù)據(jù)服務(wù)器三部分組成??蛻舳素撠煱l(fā)送請求,元數(shù)據(jù)服務(wù)器響應(yīng)請求并處理,數(shù)據(jù)服務(wù)器存儲處理后的數(shù)據(jù),三部分協(xié)同完成存儲功能,且能有效解決傳統(tǒng)存儲的彈性擴展問題。
分布式安全網(wǎng)絡(luò) 分布式安全網(wǎng)絡(luò)通過部署安全管理軟件或系統(tǒng),對整個數(shù)據(jù)中心的安全進行防護。其通常由集中管理平臺和分布式安全管理軟件組成。集中管理平臺安裝在指定的硬件服務(wù)器上,負責對安全策略進行集中管理,并對安全策略的遷移功能提供支持。同時接收虛擬化安全設(shè)備的日志以及統(tǒng)計信息,并對整個數(shù)據(jù)中心的安全態(tài)勢進行分析。安全軟件則更貼近虛擬機,利用引流或重定向機制,獲取所有虛擬機的流量,實現(xiàn)分布式的安全防護。
多數(shù)據(jù)中心分布式架構(gòu)
分布式云數(shù)據(jù)中心通過云計算技術(shù)、廣域網(wǎng)二層網(wǎng)絡(luò)互聯(lián)(大二層)技術(shù)等,將多個數(shù)據(jù)中心組建成一個融合計算、存儲、網(wǎng)絡(luò)等的分布式“虛擬資源池”,該資源池可將各地數(shù)據(jù)中心統(tǒng)一整合,通過多數(shù)據(jù)中心融合實現(xiàn)去地域化和自動化,提升企業(yè)效率。相比傳統(tǒng)數(shù)據(jù)中心的“同城主備/雙活數(shù)據(jù)中心”或“兩地三中心”,分布式云數(shù)據(jù)中心的部署方案實現(xiàn)了所有業(yè)務(wù)數(shù)據(jù)的統(tǒng)一調(diào)配與管理,災(zāi)備遷移與業(yè)務(wù)處理效率將得到有效提升。
四大挑戰(zhàn)不容忽視
目前,分布式數(shù)據(jù)中心在建設(shè)過程中面臨一些挑戰(zhàn),主要包括網(wǎng)絡(luò)、存儲、計算和安全四個方面。
在網(wǎng)絡(luò)方面,多個分布式數(shù)據(jù)中心間的通信是首要問題。建設(shè)時需考慮多區(qū)域間如何實現(xiàn)靈活組網(wǎng)與入云連接。目前主流的技術(shù)方案是基于大二層網(wǎng)絡(luò)技術(shù),構(gòu)建多數(shù)據(jù)中心間組網(wǎng),形成統(tǒng)一的邏輯網(wǎng)絡(luò)。但目前各個網(wǎng)絡(luò)設(shè)備供應(yīng)商間的大二層網(wǎng)絡(luò)和協(xié)議并未統(tǒng)一,故在設(shè)備的兼容性上可能存在一定問題。
在存儲方面,如何實現(xiàn)數(shù)據(jù)協(xié)同是一大難題。隨著業(yè)務(wù)高覆蓋,各地數(shù)據(jù)中心協(xié)同的重要性日益提高。分布在各地的數(shù)據(jù)中心通常由運營商網(wǎng)絡(luò)帶寬、傳輸專線等實現(xiàn)協(xié)同,但囿于距離與規(guī)模,各地數(shù)據(jù)中心間網(wǎng)絡(luò)寬帶無法保證數(shù)據(jù)實時同步,目前各地數(shù)據(jù)中心協(xié)同只能采用異步傳輸,這對數(shù)據(jù)的一致性與完整性、業(yè)務(wù)的連續(xù)性造成一定影響。
在計算方面,對計算資源的管理是重大挑戰(zhàn)。例如分布式數(shù)據(jù)中心的數(shù)據(jù)遷移和災(zāi)備建設(shè),如何在應(yīng)用或業(yè)務(wù)突發(fā)性中斷時,快速實現(xiàn)數(shù)據(jù)遷移與重啟,這要求數(shù)據(jù)中心日常進行計算資源管理時,不僅要做好常規(guī)故障排查,還要做好數(shù)據(jù)資源的遷移規(guī)劃和安排工作。
在安全方面,如何保證數(shù)據(jù)中心安全性是嚴峻考驗。傳統(tǒng)數(shù)據(jù)中心普遍采取星形組網(wǎng)方式,即所有分支機構(gòu)點對點直連總部數(shù)據(jù)中心,此時盡管分支缺乏靈活性,但位于總部的安全網(wǎng)關(guān)足夠保證傳統(tǒng)數(shù)據(jù)中心數(shù)據(jù)存儲、處理安全。而當基于云計算的分布式數(shù)據(jù)中心引入后,總部與分支通過云網(wǎng)進行融合,此時安全問題便成為重大挑戰(zhàn)。據(jù)此,安全廠商得到了迅猛發(fā)展,以防火墻和安全網(wǎng)關(guān)為代表的安全解決方案層出不窮,但目前仍未形成完整統(tǒng)一的安全產(chǎn)品解決方案。
* * *
隨著業(yè)務(wù)的發(fā)展與數(shù)據(jù)量的增長,在存儲、計算、安全等方面占據(jù)優(yōu)勢的分布式架構(gòu)數(shù)據(jù)中心或?qū)⒊蔀?A href="http://3xchallenge.com/site/CN/Search.aspx?page=1&keywords=%e6%95%b0%e6%8d%ae%e4%b8%ad%e5%bf%83&column_id=ALL&station=%E5%85%A8%E9%83%A8" target="_blank">數(shù)據(jù)中心未來發(fā)展的趨勢。與此同時,分布式數(shù)據(jù)中心帶來的建設(shè)挑戰(zhàn)也為數(shù)據(jù)中心可持續(xù)發(fā)展指明方向。未來的數(shù)據(jù)中心架構(gòu)發(fā)展必將精彩紛呈。