英偉達A800芯片也要被禁售了？中國AI大模型還能怎么玩？國產GPU能否挑大梁

訊石光通訊網發(fā)布時間:2023/6/30 9:19:49 編者:iccsz

摘要：近日消息，美國考慮進一步限制向中國出口AI芯片，商務部最早可能在下個月初采取行動。

ICC訊 近日消息，美國考慮進一步限制向中國出口AI芯片，商務部最早可能在下個月初采取行動。在沒有獲得許可證的情況下，美商務部將禁止英偉達等制造商向中國客戶運送AI芯片。英偉達專供中國的A800芯片，在無許可證的情況下也將被禁售。A800是英偉達專為中國客戶推出的產品，用以解決美國商務部的半導體出口新規(guī)，取代A100 GPU，該產品在2022年第三季度起投產。近段時間，大模型迅猛發(fā)展，國內在新規(guī)之前采購的可流通A100并不多，目前各互聯網廠商爭相采購的主要是A800。

A800被禁售，國內AI大模型訓練受阻?

在AI大模型的訓練上，現在基本上是用英偉達的A100、H100以及特供中國的減配版 A800、H800。2020年和2022年，英偉達先后推出了A100芯片、H100芯片，其中A100顯卡又提供80GB、40GB兩個顯存版本，H100則提供80GB顯存。A100擁有540億晶體管，采用臺積電7nm工藝制程，支持FP16、FP32和FP64浮點運算，為人工智能、數據分析和HPC數據中心等提供算力。

H100集成800億晶體管，采用臺積電定制的4nm工藝，相比于A100，H100在FP16、FP32和FP64計算上比A100快三倍，非常適用于當下流行且訓練難度高的大模型。

2022年9月，美國商務部對GPU 的出口規(guī)定，主要限制是顯卡的算力和帶寬，算力上線是4800 TOPS，帶寬上線是600 GB/s。A800的帶寬為400GB/s，低于A100的600GB/s，H800的參數并未公布，據知情人士透露只有H100(900 GB/s)到約一半。這意味著A800、H800在進行AI模型訓練的時候，需要耗費更長的時間，不過這相比于其他的同類產品，性能仍然是高的。

最近大半年時間，隨著ChatGPT的出圈，國內外各大互聯網公司、AI企業(yè)都在大力研發(fā)自己的AI大模型產品，而這也造成了對GPU的極大需求。各大互聯網廠商都在大力采購英偉達的GPU芯片，包括百度、阿里、騰訊、字節(jié)跳動等等。在國內，還可流通的A100并不多，據一家服務器定制企業(yè)的銷售經理描述，需求太過火爆，甚至有人從機房里把芯片禁運政策生效前購買的A100 80GB拆出來倒賣。如今，國內市場還是主要倚賴在政策允許范圍內的A800芯片。不過大模型火爆之后，因為需求太大，A800也出現供貨周期拉長、價格上漲的情況，據業(yè)內人士透露，之前兩周時間就能到貨，現在樂觀的情況也要4-6周的時間，甚至更長。如今，根據美國商務部的意思，A800在無許可證的情況下將被禁售，這意味著，后續(xù)國內企業(yè)在大模型的研究中，不僅僅是買到A800需要更長時間的問題，而是很可能買不到的問題。而且不僅僅是A800，其他AI芯片向中國的銷售也可能受阻，包括原本也可以用于一些模型訓練，性能較差一些的V100等。這意味著，國內企業(yè)AI大模型后續(xù)的訓練將受阻。

國產GPU能否挑大梁?

如此看來，國內AI后續(xù)的發(fā)展，它對算力的需求似乎就只能指望國產GPU了。目前國產GPU的情況如何呢?

大模型訓練需要處理高顆粒度的信息，對云端訓練芯片的芯片處理信息的精細度和算力速度要求更高，現階段國產GPU大多數不具備支撐大模型訓練所需的能力。不同于多媒體和圖形處理的單精度浮點計算(FP32)計算需求，在超算領域，雙精度浮點計算能力FP64是進行高算力計算的硬性指標。目前國內GPU芯片的云端訓練公司，大多只能處理單精度浮點計算，如壁仞科技(通用GPU芯片BR100)、天數智芯(“智鎧100”)、寒武紀(云端推理思元270)的產品在FP32的理論指標上做得不錯，但沒有處理FP64的能力。

根據公開消息，目前國內唯一支持FP64雙精度浮點運算的只有某司推出的DCU(協處理器)，但是它的性能只有A100的60%左右。所以說，從短期來看，國產的GPU產品還難以支撐起AI大模型的訓練，這意味著英偉達A800芯片被禁售，國內AI大模型接下來的研究將難以為繼。那是不是說，無論是國內的AI大模型企業(yè)，還是國產的GPU企業(yè)，真的就束手無策了?也并不是。據業(yè)內人士介紹，對于算力的需求主要與模型參數有關，大廠現在所做的通用大模型依然只能使用英偉達的產品。但是，垂類行業(yè)的大模型(金融、醫(yī)療等)或者參數量不像GPT那樣大的模型，一些國產GPU也能夠做到。比如，國內某短視頻平臺參數量約為1000億的大模型，就用了寒武紀的產品，做訓練和推理。當然該模型訓練使用了英偉達的A100。

此外，今年6月10日，天數智芯對外宣布，在天垓100加速卡的算力集群，基于北京智源人工智能研究院70億參數的Aquila語言基礎模型，使用代碼數據進行繼續(xù)訓練，穩(wěn)定運行19天，模型收斂效果符合預期，證明天數智芯有支持百億級參數大模型訓練的能力。摩爾學院院長李豐此前對媒體表示，公司已經可以支持3億參數量模型的訓練。首都在線表示，公司與燧原科技聯合開發(fā)的AIGC模型方案已發(fā)布內測，產品可以從容應對前期投入大、算力要求高、算法模型快速迭代創(chuàng)新的需求，并廣泛支持文本、語音、視覺等各技術方向的模型訓練?？梢姡壳皣aGPU雖然在參數量較大的模型訓練上存在不足，但是確實已經能夠在一些中小參數模型的訓練上有所作為。登臨科技聯合創(chuàng)始人王平此前對媒體表示，相比于國際領先的GPU產品，國產GPU確實在滿足大模型訓練上存在差距，因為此前行業(yè)在產品定義上未朝大模型方向做設計。

而現在國產GPU公司都在朝著大模型方向去布局，相信未來終能夠找到方向，進行突破。而且如今A800在無許可證的情況下如果禁售，這對于國產GPU的發(fā)展將會有強大的刺激作用，因為如果不突破，意味著國內未來AI大模型的發(fā)展將無計可施，這似乎成了唯一的出路。目前業(yè)界正在做相關的探索，比如，思考能否通過Chiplet、先進封裝的方式提高算力。研究如何提升芯片與芯片間的數據傳輸速度等。昆侖芯就表示，相較于第一代產品，昆侖芯2在算力、互聯上都有大幅優(yōu)化，公司正在不斷研發(fā)新的產品和技術，以滿足ChatGPT等大模型的應用需求。

小結

很顯然，在A100、H100之后，若A800在無許可證下被禁售，意味著國內AI大模型后續(xù)的訓練將無GPU可用。目前而言國產GPU幾乎還不能用于較大規(guī)模參數模型的訓練。不過可以看到，一些產品在較小規(guī)模，比如幾億、甚至百億級別參數規(guī)模的模型訓練上，已經可以有所作為。而且目前眾廠商都在朝著大模型應用方向進行探索，從長遠來看，必然會逐步取得進展。

來源：電子發(fā)燒友網報道(文/李彎彎)

內容來自：電子發(fā)燒友網
本文地址：http://3xchallenge.com//Site/CN/News/2023/06/30/20230630013144395384.htm 轉載請保留文章出處
關鍵字: 英偉達
文章標題:英偉達A800芯片也要被禁售了？中國AI大模型還能怎么玩？國產GPU能否挑大梁

1、凡本網注明“來源：訊石光通訊網”及標有原創(chuàng)的所有作品，版權均屬于訊石光通訊網。未經允許禁止轉載、摘編及鏡像，違者必究。對于經過授權可以轉載我方內容的單位，也必須保持轉載文章、圖像、音視頻的完整性，并完整標注作者信息和本站來源。
2、免責聲明，凡本網注明“來源：XXX（非訊石光通訊網）”的作品，均為轉載自其它媒體，轉載目的在于傳遞更多信息，并不代表本網贊同其觀點和對其真實性負責。因可能存在第三方轉載無法確定原網地址，若作品內容、版權爭議和其它問題，請聯系本網，將第一時間刪除。
聯系方式：訊石光通訊網新聞中心　電話：0755-82960080-168 Right

英偉達A800芯片也要被禁售了？中國AI大模型還能怎么玩？國產GPU能否挑大梁

相關新聞

英偉達A800芯片也要被禁售了？中國AI大模型還能怎么玩？國產GPU能否挑大梁