ICC訊 鋼鐵一直以來都是工業(yè)化的象征。而在AI時代,NVIDIA DGX A100則將成為現(xiàn)代數(shù)據(jù)中心的基石。
如今,眾多企業(yè)所面臨的最大的挑戰(zhàn)和機遇,其根源都在于數(shù)據(jù)。DGX A100作為當今全球最先進的AI系統(tǒng),能夠幫助企業(yè)機構以前所未有的速度解決復雜問題,同時為跨分析、訓練和推理的AI計算力交付帶來強大的彈性和靈活性。
去年,NVIDIA基于多臺DGX系統(tǒng)組合構建了DGX SuperPOD,該超計算機以遠低于一般超級計算機的成本和能耗躋身性能世界前20之列。
如今,NVIDIA揭開了第二代SuperPOD的帷幕。該產(chǎn)品不但具有創(chuàng)紀錄的性能,而且能夠在短短三周內(nèi)完成部署。它的出現(xiàn)使得構建世界一流AI超級計算集群所需的時間不再需要花費漫長的數(shù)個月。
SuperPOD基于NVIDIA DGX A100系統(tǒng)和NVIDIA Mellanox網(wǎng)絡架構構建,其證明了可以憑借單個平臺將全球最復雜語言理解模型的處理時間從數(shù)周縮短至一個小時之內(nèi)。
重新定義基礎設施擴展
無論你是需要一個超級計算集群解決復雜繁重的問題,還是需要一個性能卓越的數(shù)據(jù)中心來實現(xiàn)研究人員和開發(fā)者們的資源訪問民主化,AI都是提供重要保障的基礎設施。
在傳統(tǒng)的搭建流程中,一項關鍵性的工作就是要預先規(guī)劃好你需要將你的基礎設施擴展到多大的規(guī)模,然后開始構建網(wǎng)絡架構,直至達到最終目標。雖然這種方法能夠實現(xiàn)增長,但會產(chǎn)生大量前期成本。
NVIDIA Mellanox技術讓我們能夠重新定義數(shù)據(jù)中心,其所擁有的架構能以最快的速度并行處理解決那些最復雜的問題。DGX A100配備具有200Gbps HDR InfiniBand的全新Mellanox ConnectX-6 VPI網(wǎng)絡適配器,每個系統(tǒng)有多達9個接口。我們可以憑借Mellanox的交換功能更輕松地將多個系統(tǒng)互連在一起,以至最終達到SuperPOD的規(guī)模。
借助于DGX SuperPOD和DGX A100,NVIDIA所提出的AI網(wǎng)絡架構幫助用戶實現(xiàn)了“按自身業(yè)務增長需求購買”模式,這使得業(yè)務增長變得更輕松,同時也最大程度地減少了其對運營的影響。
而且,該網(wǎng)絡架構極具靈活性與可擴展性。NVIDIA已將SuperPOD模塊化,成為每組配置有20臺DGX A100系統(tǒng)的可擴展組。每個擴展組均由使用Mellanox HDR InfiniBand的二層胖樹(two-tiered fat-tree)交換網(wǎng)絡拓撲提供支持,提供完整的對分寬帶,且沒有過載(oversubscription)。在添加第三個交換層后,用戶可以在NVIDIA的擴展參考設計中使用DragonFly+或胖樹拓撲將其擴展至數(shù)千個節(jié)點。
憑借這種新的拓展單位,企業(yè)機構的增長速度將會更加趨向于線性增長,并且每次增加這一個這種20系統(tǒng)模塊時所產(chǎn)生的支出也將變得更少。
通過SuperPOD擴展DGX SATURNV
從研發(fā)和自動駕駛汽車系統(tǒng)開發(fā)到游戲和機器人技術,DGX SATURNV為NVIDIA最重要的工作提供了支持。而且SATURNV并非一個一成不變的系統(tǒng),它會隨著業(yè)務需求的增加而不斷擴展。因此它也成為了NVIDIA全新SuperPOD設計的理想試驗場。
在發(fā)布DGX A100之前,NVIDIA的工程師們部署了最新SuperPOD,實現(xiàn)了700 petaflops的AI性能。 此擴展包含:
· 140臺DGX A100系統(tǒng)
· 1,120個NVIDIA A100 GPU
· 170個Mellanox Quantum 200G InfiniBand交換機
· 15千米光纜
· 4PB高性能存儲
此次擴展,在存儲基礎設施方面,NVIDIA與DDN展開了合作。作為NVIDIA DGX POD的合作伙伴之一,DDN正在幫助NVIDIA實現(xiàn)AI基礎設施產(chǎn)品所需的性能和規(guī)模。SuperPOD讓NVIDIA能夠使用DDN技術,從而幫助其最先進的系統(tǒng)處理那些交給它的高難度任務。
最佳擴展架構
并非所有AI項目都需要DGX SuperPOD。 但每個希望在其業(yè)務中應用AI技術的企業(yè)機構都可以運用DGX A100或DGX POD的性能、敏捷性和可擴展性。
具有前瞻性的企業(yè)機構關注于保持客戶的忠誠度、降低成本并拉開與競爭對手的距離。而AI在所有這些方面有著獨特的優(yōu)勢。
但如今AI技術創(chuàng)新發(fā)展迅速,而且模型和數(shù)據(jù)集的規(guī)模也都在呈指數(shù)級增長。企業(yè)需要合適的架構,使其在現(xiàn)在和將來都能夠應對最大的AI挑戰(zhàn),而不至于在中途“夭折”。
了解如何改進您的AI基礎設施戰(zhàn)略以及讓DGX A100的訪問變得更簡單的消費模式,請訪問www.nvidia.com/DGXA100。
關于NVIDIA
NVIDIA(納斯達克股票代碼:NVDA)在1999年發(fā)明的GPU激發(fā)了PC游戲市場的增長,重新定義了現(xiàn)代計算機顯卡,并且對并行計算進行了革新。最近,通過將GPU作為可以感知和理解世界的計算機、機器人乃至自動駕駛汽車的大腦,GPU深度學習再度點燃了全新的計算時代——現(xiàn)代人工智能。更多信息,請訪問http://nvidianews.nvidia.com/。