AMD公布瘋狂芯片計(jì)劃,用能效挑戰(zhàn)英偉達(dá)會(huì)成功嗎?

訊石光通訊網(wǎng) 2024/5/29 14:38:34

  ICC訊 近日,在比利時(shí)舉辦的ITF World 2024大會(huì)上,AMD董事長(zhǎng)兼CEO蘇姿豐獲得了IMEC創(chuàng)新大獎(jiǎng),以此表彰其在行業(yè)創(chuàng)新與領(lǐng)導(dǎo)方面的成就,大家熟悉的戈登·摩爾(提出著名的摩爾定律)和比爾·蓋茨都曾經(jīng)獲得該大獎(jiǎng)。

圖源:tomshardware

  而在獲獎(jiǎng)后的演講中,蘇姿豐透露了AMD未來三年的計(jì)劃,一個(gè)充滿野心的計(jì)劃:AMD正在努力實(shí)現(xiàn)2025年將計(jì)算能效提高到2020年的30倍的計(jì)劃,而在這個(gè)計(jì)劃之后,還有在2027年將能效提高到100倍(相對(duì)于2020年)的目標(biāo)。

圖源:AMD

  計(jì)算能效,簡(jiǎn)單來說就是指計(jì)算機(jī)在執(zhí)行計(jì)算任務(wù)時(shí),利用能源的有效程度,雖然在各種算力、核心數(shù)等性能參數(shù)面前,計(jì)算能效看起來不太起眼,實(shí)質(zhì)上卻是核心性能、功耗管理、制程工藝等技術(shù)的體現(xiàn)。

  更高的計(jì)算能效,能夠讓計(jì)算機(jī)系統(tǒng)在運(yùn)行時(shí)有著更高的效率,早在2014年,AMD就曾經(jīng)設(shè)定過一個(gè)名為“25x20”的計(jì)劃,希望用6年時(shí)間將AMD的處理器、顯卡等產(chǎn)品的能效提高25倍。

  這個(gè)計(jì)劃的結(jié)果,就是我們現(xiàn)在所熟知的Zen架構(gòu)和RDNA架構(gòu),憑借兩個(gè)架構(gòu)的出色表現(xiàn),AMD在2020年不僅完成了既定的目標(biāo),還超額做到了31.77倍的能效提升。

  AMD為何一直將計(jì)算能效提升作為核心目標(biāo)之一?首先,我們從目前的AI運(yùn)算需求出發(fā),看看計(jì)算能效提升會(huì)帶來什么?

  狂奔的超級(jí)計(jì)算中心

  眾所周知,AI已經(jīng)成為當(dāng)前半導(dǎo)體業(yè)界最核心、最龐大的需求,這個(gè)需求正在驅(qū)動(dòng)著半導(dǎo)體戰(zhàn)車的車輪滾滾向前。前段時(shí)間,作為AI時(shí)代的領(lǐng)航者,半導(dǎo)體公司英偉達(dá)的市值就一度達(dá)到2.62萬億美元,甚至超過了德國(guó)所有上市公司的市值總和。

  讓英偉達(dá)市值暴漲的唯一原因,就是其在AI計(jì)算硬件領(lǐng)域的統(tǒng)治級(jí)實(shí)力,目前全球最頂尖的專業(yè)計(jì)算卡均出自英偉達(dá),除了主流的H100、H200等芯片外,英偉達(dá)前段時(shí)間又發(fā)布了GB100和GB200,僅單個(gè)芯片的算力就相當(dāng)于以前的一臺(tái)超級(jí)計(jì)算機(jī)。


圖源:英偉達(dá)

  當(dāng)然,強(qiáng)大的算力背后并不是沒有代價(jià)的,H100的TDP高達(dá)700W,而最新的GB200的TDP更是高達(dá)2700W。而英偉達(dá)提供的官方方案中,單個(gè)GB200 NVL72服務(wù)器就可以搭載最高36個(gè)GB200芯片,僅芯片本身的功耗就最高可達(dá)97200W,并且不包括配套的其他硬件功耗。

  這還僅僅是開始,一個(gè)超級(jí)計(jì)算中心往往由多個(gè)服務(wù)器單元組合而成,亞馬遜此前就公布了一項(xiàng)計(jì)劃,預(yù)計(jì)采購(gòu)2萬個(gè)GB200用來組建一個(gè)全新的服務(wù)器集群。而走在AI研究最前沿的微軟和OpenAI,前段時(shí)間更是公布了一個(gè)雄心勃勃的計(jì)劃——星際之門。

  據(jù)悉,該計(jì)劃共分為五個(gè)階段,目的是建造一個(gè)人類歷史上最大的超級(jí)計(jì)算中心,預(yù)計(jì)整個(gè)計(jì)劃的投資將達(dá)到1150億美元,建成后將需要數(shù)十億瓦的電力支持。這座‘星際之門’建成后,僅以耗電量算就足以在全球各大城市中排名前20,更何況它還只是眾多計(jì)算中心的一員而已。

圖源:AI Revolution

  實(shí)際上,早在去年開始,就有多份報(bào)告指出計(jì)算中心的耗電量正在猛增,并且一度導(dǎo)致美國(guó)部分城市出現(xiàn)電力供應(yīng)不足的問題。從能源角度來說,一座發(fā)電廠從選址到建成運(yùn)行,往往需要數(shù)年的時(shí)間,如果遇到環(huán)保組織的抗議,還有可能拖延更久。

  在能源問題短時(shí)間內(nèi)無法解決的情況下,提高計(jì)算能效就是唯一的方法,通過更高效地利用每瓦時(shí)電力來維持更大規(guī)模的AI模型訓(xùn)練。實(shí)際上,有人認(rèn)為OpenAI的ChatGPT-5進(jìn)展緩慢,很大程度上就是受限于算力規(guī)模無法大幅度提升。

  蘇姿豐在演講中也提到,提高計(jì)算能效可以更好地解決能源與算力之間的矛盾,并且讓超級(jí)計(jì)算中心可以被部署到更多的地方。在一些AI企業(yè)的構(gòu)想中,未來每一座城市都應(yīng)該擁有自己的超級(jí)AI中心,負(fù)責(zé)處理智能駕駛、城市安全等各方面的AI需求。

  想要達(dá)成這個(gè)目標(biāo),同時(shí)不顯著增加城市的能源負(fù)擔(dān),更高計(jì)算能效的顯卡就是唯一的解決方案。而且,計(jì)算能效也直接關(guān)系到AI計(jì)算的成本,只有將AI計(jì)算的成本降到更低,大面積普及AI才可能成為現(xiàn)實(shí)。

  AMD的瘋狂計(jì)劃

  在英偉達(dá)的刺激下,作為在GPU領(lǐng)域唯一能夠與英偉達(dá)抗衡的企業(yè),AMD一直在加速推進(jìn)旗下AI芯片的研發(fā)與上市進(jìn)度,并先后發(fā)布了MI300、V80等多款專業(yè)運(yùn)算卡。

  據(jù)報(bào)道,為了能夠加速AI芯片的進(jìn)度,蘇姿豐對(duì)GPU團(tuán)隊(duì)進(jìn)行重組,抽調(diào)大量人員支持AI芯片的研發(fā),以至于下一代的AMD消費(fèi)級(jí)顯卡發(fā)布計(jì)劃受到嚴(yán)重影響,比如取消原定的旗艦產(chǎn)品發(fā)布計(jì)劃,僅保留中端顯卡的發(fā)布計(jì)劃等。

  在集中科研力量后,AMD目前的進(jìn)展速度飛快,最新的MI300X在性能上已經(jīng)超過英偉達(dá)的H100,大多42 petaFLOPs,并且擁有高達(dá)192GB的顯存,功耗卻與H100相當(dāng),僅為750W。


圖源:AMD

  憑借優(yōu)異的計(jì)算能效,MI300X成功引起了市場(chǎng)的關(guān)注,微軟、OpenAI、亞馬遜等科技巨頭都提交了采購(gòu)需求,讓AMD在計(jì)算領(lǐng)域的芯片出貨量暴增。根據(jù)相關(guān)機(jī)構(gòu)預(yù)測(cè),2024年AMD的AI芯片出貨量可能達(dá)到英偉達(dá)出貨量的10%,并在明年增長(zhǎng)至30%。

  據(jù)蘇姿豐介紹,為了能夠提高芯片的計(jì)算能效,AMD研發(fā)了多項(xiàng)新的技術(shù),比如2.5D/3D混合封裝技術(shù)。利用這項(xiàng)技術(shù),AMD可以在封裝面積不變的前提下給芯片塞入更多的晶體管和內(nèi)存,降低芯片與內(nèi)存交換數(shù)據(jù)的消耗,有效提升每瓦時(shí)的計(jì)算性能。

圖源:AMD

  此外,AMD還將改進(jìn)芯片架構(gòu),推出能效更高的新一代架構(gòu),預(yù)計(jì)最快將于2025年發(fā)布,并實(shí)現(xiàn)25x30(2025年計(jì)算能效提升30倍)的目標(biāo)。不過,想要實(shí)現(xiàn)27x100(2027年計(jì)算能效提升100倍)的目標(biāo),還需要在諸多領(lǐng)域做出提升,僅靠制程工藝升級(jí)和架構(gòu)升級(jí)恐怕還不太夠。

  不得不說,AMD的這個(gè)計(jì)劃非常瘋狂,一旦成功,那么AMD將有望再次與英偉達(dá)并肩而行。

  那么英偉達(dá)的反應(yīng)是什么?其實(shí)英偉達(dá)很早就給出了回應(yīng),早前發(fā)布的GB200就是答案,這顆史無前例的算力怪物在計(jì)算能效方面的提升同樣矚目。據(jù)英偉達(dá)的介紹,GB200的推理性能是H100的30倍,計(jì)算能效是H100的25倍(綜合考慮算力、功耗等參數(shù)后的結(jié)果)。

  顯然,英偉達(dá)的腳步也并不慢,在接下來的3年時(shí)間里,不管AMD能否完成瘋狂的百倍計(jì)劃,AI芯片市場(chǎng)都會(huì)迎來一場(chǎng)革新。

新聞來源:雷科技

相關(guān)文章