在本文中,康寧光通信與達(dá)拉斯的Citadel Analytics展開(kāi)了合作,而后者一直在托管數(shù)據(jù)中心(MTDC)中部署AI平臺(tái)。
在互聯(lián)網(wǎng)上通常有這樣的一句話:“知識(shí)告訴你說(shuō)應(yīng)該把雞蛋放進(jìn)籃子,智慧則是叫你不要把所有雞蛋都放進(jìn)一個(gè)籃子” 。機(jī)器學(xué)習(xí)(ML)會(huì)引導(dǎo)我們認(rèn)識(shí)雞蛋并放進(jìn)籃子,但是人工智能(AI)建議我們不要將其放入一個(gè)籃子。
撇開(kāi)笑話而言,從語(yǔ)言翻譯到對(duì)復(fù)雜疾病的診斷,AI和ML的應(yīng)用非常廣泛,遠(yuǎn)遠(yuǎn)不止于視覺(jué)領(lǐng)域。為了讓您了解AI和ML需要多少計(jì)算能力,百度在2017年展示了一種中文語(yǔ)音識(shí)別模型,在整個(gè)訓(xùn)練周期內(nèi),不僅需要4TB的培訓(xùn)數(shù)據(jù),而且還需要2000億億次的運(yùn)算。
我們需要把握一個(gè)平衡點(diǎn),那就是既要滿足AI和ML需求,還需要以最低的成本提供最高的服務(wù)質(zhì)量。那么如何提供最高的服務(wù)質(zhì)量呢?通過(guò)減少數(shù)據(jù)在終端設(shè)備和處理器之間傳輸?shù)奈锢砭嚯x,以改善延遲對(duì)傳輸?shù)挠绊憽N覀兛梢园堰吘墧?shù)據(jù)中心建設(shè)在更靠近創(chuàng)建和使用數(shù)據(jù)的地方,這樣可以?xún)?yōu)化傳輸成本和服務(wù)質(zhì)量。其次是尋求最低的成本。傳輸成本會(huì)隨著傳輸?shù)臄?shù)據(jù)量、距離或“跳數(shù)”的增加而增加。而AI和ML大大增加了傳輸?shù)臄?shù)據(jù)量,從而導(dǎo)致更高的傳輸成本。邊緣數(shù)據(jù)中心靠近數(shù)據(jù)創(chuàng)建的地方,因此日益成為重要的解決方案,而一大部分邊緣計(jì)算都部署在MTDC中。MTDC可以提供最低的本地?cái)?shù)據(jù)中心部署風(fēng)險(xiǎn),而且可以最快實(shí)現(xiàn)收益。
什么是AI、ML、MTDC?
在討論AI,ML,邊緣數(shù)據(jù)中心和MTDC之前,有必要仔細(xì)研究一下它們的概念,以確保每個(gè)人都在同一個(gè)理解層面上。
人工智能是計(jì)算機(jī)系統(tǒng)理論的延伸發(fā)展,它能夠執(zhí)行通常需要人類(lèi)執(zhí)行的智能任務(wù),例如視覺(jué)感知,語(yǔ)音識(shí)別,決策和語(yǔ)言之間的翻譯。如果利用玩具套娃來(lái)描述這些關(guān)系,那么 AI是最大的那個(gè)套娃,機(jī)器學(xué)習(xí)位于其中,而深度學(xué)習(xí)則位于機(jī)器學(xué)習(xí)套娃中。機(jī)器學(xué)習(xí)是AI的一種應(yīng)用,它使系統(tǒng)能夠自動(dòng)學(xué)習(xí)并從經(jīng)驗(yàn)中進(jìn)行改進(jìn),而無(wú)需進(jìn)行編程。
邊緣數(shù)據(jù)中心是通過(guò)從核心數(shù)據(jù)中心分散一些對(duì)延遲較敏感的應(yīng)用程序,使數(shù)據(jù)中心的計(jì)算和處理能力更接近創(chuàng)建數(shù)據(jù)的地方。
多租戶數(shù)據(jù)中心(MTDC)也稱(chēng)為托管數(shù)據(jù)中心,用戶可以通過(guò)租用空間來(lái)托管其設(shè)施。 MTDC提供了空間和網(wǎng)絡(luò)設(shè)備,以最小的成本將用戶連接到服務(wù)提供商。用戶可以租用空間、服務(wù)器機(jī)架或完整的專(zhuān)用模塊,來(lái)滿足其各種需求。
AI有那么厲害?
AI和ML是自電力出現(xiàn)以來(lái)我們所見(jiàn)過(guò)的最具革命性的技術(shù)。它比互聯(lián)網(wǎng)和移動(dòng)革命的總和還要強(qiáng)大。AI技術(shù)之所以如此強(qiáng)大和如此具有影響力,是因?yàn)樗鼈兛梢钥焖佟⒂行У乩斫獯罅繑?shù)據(jù)。我們生活在一個(gè)數(shù)據(jù)不斷生成并且由數(shù)據(jù)驅(qū)動(dòng)的世界中(市場(chǎng)分析師預(yù)測(cè),如今存在的數(shù)據(jù)中有80%以上是在最近兩年內(nèi)創(chuàng)建的),如果沒(méi)有能夠理解這些數(shù)據(jù)的工具,我們將會(huì)淹沒(méi)在這些數(shù)據(jù)中。
舉個(gè)簡(jiǎn)單的例子,今年全世界將創(chuàng)造大約40兆字節(jié)的信息。那就是40萬(wàn)億GB的信息。人類(lèi)無(wú)法理解所有這些信息,即使每個(gè)人晝夜不停地工作,從理論上講也是不可能的。
那么我們?nèi)绾卫斫馑羞@些數(shù)據(jù)呢?答案是使用AI和ML。這些技術(shù)偏愛(ài)數(shù)據(jù),數(shù)據(jù)就像是它們的氧氣。通過(guò)使用功能強(qiáng)大且經(jīng)過(guò)適當(dāng)培訓(xùn)的AI / ML模型,我們可以準(zhǔn)確地處理大量信息,從而揭示非常有價(jià)值的數(shù)據(jù)來(lái)指導(dǎo)我們的行動(dòng)。
核磁共振(MRI)的ML模型就是一個(gè)很好的例子。他們針對(duì)已知的癌癥或非癌癥結(jié)果進(jìn)行了測(cè)試(陽(yáng)性和陰性結(jié)果),這個(gè)過(guò)程被稱(chēng)為訓(xùn)練。之后將一組新的MRI加載到經(jīng)過(guò)訓(xùn)練的模型中并進(jìn)行分析。這些新的MRI被稱(chēng)為驗(yàn)證數(shù)據(jù)集。該數(shù)據(jù)通過(guò)已經(jīng)訓(xùn)練有素的模型運(yùn)行,計(jì)算并顯示結(jié)果,然后再根據(jù)為該模型選擇的性能指標(biāo)評(píng)估結(jié)果。如果結(jié)果可接受,則對(duì)模型進(jìn)行培訓(xùn),并準(zhǔn)備進(jìn)行更多測(cè)試和驗(yàn)證。如果驗(yàn)證數(shù)據(jù)不符合指標(biāo),則我們回過(guò)頭來(lái),要么重新設(shè)計(jì)模型,要么為它提供更多數(shù)據(jù),以便為下一次驗(yàn)證測(cè)試提供更好的培訓(xùn)。此階段稱(chēng)為驗(yàn)證階段。
人工智能的好處有時(shí)會(huì)帶來(lái)額外的驚喜。例如,Citadel Analytics處理過(guò)的大多數(shù)業(yè)務(wù)都是客戶期望通過(guò)AI技術(shù)提高效率來(lái)實(shí)現(xiàn)銷(xiāo)售增長(zhǎng)或降低成本。但他們很快發(fā)現(xiàn),通過(guò)AI可以大大提高員工的工作效率和愉悅性,最大的受益者居然是員工。一家懂得利用AI / ML的公司,其員工往往也對(duì)工作更加滿意,這一點(diǎn)比不使用AI的公司高得多。
這很有意義,因?yàn)锳I / ML就是要使“無(wú)聊”的東西自動(dòng)化,并讓您的員工在不降低效率的情況下做他們擅長(zhǎng)和充滿熱情的事情。使用AI技術(shù)帶來(lái)的巨大好處是,使員工擁有更多快樂(lè),并減少員工的流失。但是這一點(diǎn)許多企業(yè)一開(kāi)始并不重視。
如何部署AI / ML并為其提供合理的布線方案
AI需要巨大的處理能力,這一直是一個(gè)問(wèn)題。值得慶幸的是,像NVIDIA,Intel,AMD等公司正在縮小處理能力的差距。這使BMW,沃爾瑪,Target等公司以及更多公司都可以部署邊緣AI功能。這需要以安裝功能強(qiáng)大的硬件為前提,這些硬件將使用預(yù)先訓(xùn)練的模型來(lái)處理本地?cái)?shù)據(jù)。這大大減少了等待時(shí)間和對(duì)實(shí)時(shí)帶寬的需求。
但問(wèn)題在于,沒(méi)有人能真正做到邊緣的AI / ML部署,因?yàn)殡m然硬件的預(yù)訓(xùn)練模型可以處理數(shù)據(jù),但它的能力不足以更新此模型,并使其功能更強(qiáng)大。
因此,混合方案便應(yīng)用而生。
在混合方案設(shè)計(jì)中,邊緣服務(wù)器將使用經(jīng)過(guò)訓(xùn)練的模型來(lái)處理所有本地?cái)?shù)據(jù)。而這些“最適合的服務(wù)器”則可能位于不同的MTDC,從而實(shí)現(xiàn)網(wǎng)絡(luò)和應(yīng)用程序選擇的靈活性。MTDC的光網(wǎng)絡(luò)基礎(chǔ)架構(gòu)通常采用單模光纖來(lái)部署,目的是滿足最終用戶對(duì)未來(lái)擴(kuò)展的需求。對(duì)于部署AI / ML的公司,重要的是需要同時(shí)考慮現(xiàn)在和未來(lái)網(wǎng)絡(luò)中的帶寬需求。 Citadel Analytics通常有一個(gè)經(jīng)驗(yàn)法則,即取期望帶寬的平均值并乘以4倍,就是應(yīng)該在其系統(tǒng)內(nèi)部署的帶寬。在當(dāng)前的AI / ML部署中,帶寬尤其重要,是首要考量的因素。
帶寬的增加也凸顯了MTDC和最終用戶對(duì)高密度解決方案的需求。高密度方案可以使MTDC空間實(shí)現(xiàn)最大化收益,而最終用戶可以更有效地利用他們投資的空間。由于基礎(chǔ)架構(gòu)會(huì)隨著不同用戶的需求而變化,因此尋找具有產(chǎn)品寬度(單?;蚨嗄#琇C或MTP等)和擴(kuò)展靈活性的產(chǎn)品供應(yīng)商顯得尤為重要。對(duì)于最終用戶,降低成本的一種方法是增加密度并降低功耗。這可以通過(guò)并行光學(xué)器件和端口分離來(lái)實(shí)現(xiàn),即通過(guò)使用分支線纜來(lái)實(shí)現(xiàn)將一個(gè)高速帶寬端口分解為多個(gè)低帶寬端口。比如使用一個(gè)40g并行收發(fā)器端口分解為4個(gè)單獨(dú)的10g收發(fā)器端口,以實(shí)現(xiàn)高密度的線纜轉(zhuǎn)換。
通過(guò)減小10公里以?xún)?nèi)的傳輸距離,通??梢詫⒀舆t減少45%。這意味著什么?這將推動(dòng)更多的和更小的區(qū)域性數(shù)據(jù)中心部署,使其更靠近產(chǎn)生數(shù)據(jù)的地方。 MTDC將成為這些較小數(shù)據(jù)中心的主要承載工具。邊緣數(shù)據(jù)中心將托管在這些互連密集型MTDC中,兩者相互配合,為客戶提供更全面的服務(wù)。擁有互聯(lián)的基礎(chǔ)設(shè)施、生態(tài)系統(tǒng)和豐富的客戶組合的MTDC,將能把握邊緣計(jì)算發(fā)展的商業(yè)機(jī)遇。
期望
AI和ML技術(shù)將持續(xù)為采用者創(chuàng)收和提高生產(chǎn)率。未來(lái)我們將看到更多公司將應(yīng)用程序運(yùn)行在邊緣MTDC。對(duì)于這些公司而言,MTDC提供了較低的風(fēng)險(xiǎn)和較快的收益增長(zhǎng)。這將導(dǎo)致會(huì)出現(xiàn)更多的邊緣區(qū)域數(shù)據(jù)中心,而不是像我們以前看到的那樣集中的大型數(shù)據(jù)中心,同時(shí)也將帶來(lái)更多的互聯(lián)設(shè)施和更高密度的解決方案。