暴擊美股
就在北京時間1月27日深夜,國產(chǎn)大模型公司深度求索(DeepSeek)憑一己之力掀翻美國科技股。
截至美股1月27日收盤,道指漲0.65%,標普500指數(shù)跌1.46%,納指跌3.07%。英偉達暴跌16.97%,單日市值蒸發(fā)5890億美元,創(chuàng)史上最大單日個股市值蒸發(fā)紀錄。英偉達的暴跌也使得創(chuàng)始人黃仁勛的身家大幅縮水210億美元。
此外,甲骨文下跌13.78%,超微電腦下跌12.49%,芯片制造商博通下跌17.4%,臺積電跌13%。《華爾街日報》稱,道瓊斯市場數(shù)據(jù)顯示,周一的“市場大屠殺”總共使股市市值蒸發(fā)了約1萬億美元。
消息面上,1月27日早間,DeepSeek應用登頂蘋果中國地區(qū)和美國地區(qū)應用商店免費APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。DeepSeek系量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。
1月27日早間,DeepSeek應用登頂蘋果中國地區(qū)和美國地區(qū)應用商店免費APP下載排行榜,在美區(qū)下載榜上甚至超越了ChatGPT。DeepSeek是量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。
推出后不久,R1就憑借其開源的性質(zhì)、大幅下降的售價和訓練成本獲得了廣泛關注。作為一款開源模型,R1在數(shù)學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協(xié)議,支持免費商用、任意修改和衍生開發(fā)等。
更令市場驚訝的是,據(jù)DeepSeek介紹,R1的預訓練費用只有557.6萬美元,在2048塊英偉達H800 GPU(針對中國市場的低配版GPU)集群上運行55天完成。
市場人士稱,DeepSeek的R1大型語言模型或引發(fā)行業(yè)重估大模型成本。華爾街開始考慮科技行業(yè)巨頭對AI基礎設施的巨額投資以及對英偉達芯片的需求是否合理。
值得注意的是,近日DeepSeek需求火爆,AI服務在24小時內(nèi)經(jīng)歷了多次宕機。服務狀態(tài)頁面顯示,“近期DeepSeek線上服務受到大規(guī)模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持?!?
暴擊完美股,DeepSeek又拋出新模型。
1月28日,DeepSeek發(fā)布開源多模態(tài)模型Janus-Pro,其中70億參數(shù)版本的Janus-Pro-7B模型在使用文本提示的圖像生成排行榜中優(yōu)于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。
Github社區(qū)信息顯示,Janus-Pro是去年發(fā)布的Janus的高級版本,可顯著提高多模式理解和視覺生成。相比此前的Janus,Janus-Pro優(yōu)化的訓練策略、擴展的訓練數(shù)據(jù)和擴展到更大的模型尺寸。通過這些改進,Janus-Pro在多模態(tài)理解和文本到圖像的指令遵循能力方面都取得了顯著的進步,同時也增強了文本到圖像生成的穩(wěn)定性。
英偉達:DeepSeek未來仍需大量芯片
據(jù)路透社等外媒報道,當?shù)貢r間27日,英偉達發(fā)表聲明表示,中國人工智能公司深度求索(DeepSeek)所取得的進展,顯示出其芯片在中國市場的實用價值,且未來為滿足DeepSeek的服務需求,將需要更多英偉達芯片。
當?shù)貢r間27日,因投資者擔憂DeepSeek的英偉達芯片遠少于美國公司,卻達到了與OpenAI等競爭對手相當?shù)乃?,英偉達股價暴跌17%。之后,英偉達發(fā)布了一份聲明。
英偉達在聲明中稱:“DeepSeek在人工智能領域取得了卓越進展,是‘測試時間縮放’的絕佳范例。DeepSeek的成果展示了如何利用這一技術,借助廣泛可得的模型以及完全符合出口管制規(guī)定的計算資源,來創(chuàng)建新模型?!?
英偉達還表示,DeepSeek等AI公司的推理需要大量英偉達GPU(圖形處理器)和高性能網(wǎng)絡,DeepSeek的爆火表明市場對其芯片仍有需求。
開源和閉源的沖突 對AI行業(yè)和英偉達都是短期利空長期利好
DeepSeek暴擊美股的消息忙壞了中國網(wǎng)友,以下摘選一些犀利表達供參考:
當初openAI推出的時候,整個中國的科技界似乎都被震動了。悲觀者感嘆中國幾十年也趕不上美國的人工智能,樂觀者也覺得至少差那么三五年。
短短半年多以后,中國就推出了Deep SeekR1,用僅僅不到600萬美元的成本實現(xiàn)了openAI幾十億美元才達到的性能和效率,更是打破了依靠先進芯片堆砌算力而壟斷人工智能優(yōu)勢的夢想。
這可不是彎道超車啊,而是頭頂飛躍。簡直讓人瞠目結舌,目瞪口呆!用不入流的芯片,只用了讓覺得可憐得要命的資金就占領了人工智能的高地。
開源和閉源的沖突。正確的理解是開放源代碼正在超越傳統(tǒng)專有模式,但關于開源是否真的僅僅只是開放源代碼這么簡單,這部分暫時超出了我的認知,我不懂。但可以確定的是deepseek背后是接近50000臺英偉達最先進A100芯片在支撐,而不是某些傻白甜想的對算力的需求大降,反而是隨著使用的人數(shù)開始爆發(fā)式增長,面臨著頂級算力不夠的風險。但關于在美國技術封鎖后這家公司為何依然能源源不斷獲得英偉達最先進的算力顯卡,這部分無法明說,我只能說我認知之內(nèi)的是,開源的投喂量和訓練量是閉源是幾十倍,開源想長期領跑,最好的顯卡就是唯一的競爭。開源能長期獲勝的關鍵是是否能一直拿到老黃的最新的芯片,中長期而言CUDA 無法替代。
兩千年前中國人發(fā)明弩,普通農(nóng)民稍加訓練就可以洗腳上陣,戰(zhàn)爭不再是貴族的專利,直接導致中國貴族社會解體;又如這一年多戰(zhàn)場上廣泛應用的廉價無人機干掉昂貴傳統(tǒng)兵器,小技術低價格往往能改變戰(zhàn)爭勝負的天平。
真正的仿大腦結構,就如人的記憶,需要的時候調(diào)出數(shù)據(jù),不需要時就沉默在記憶深處。
DeepSeek團隊剛在康奈爾發(fā)表的論文,其中每一個作者都值得我們銘記,大部分都是30歲以下的年輕人,來自國內(nèi)的頂尖大學,有的還在讀博士,其中,無人具有海外的學術背景。(也有網(wǎng)友表示“偷著樂悶頭整就成了,為何非要去康奈爾發(fā)表?”)
用后反饋
關于DeepSeek的使用反饋,不少網(wǎng)友表示“比其他國產(chǎn)AI平臺更好用?!?
網(wǎng)友隨機提問截圖
但DeepSeek的使用仍需要細化問題,也就是你的提問必須要精準,它才能提供即時的詳細答案。不過在提問了大宗商品相關后,如果參照它的答案,還是有可能掉坑的。它總結了一些謠言在里面作為分析結論。
但有個反之的問題,如果市場交易者應用這個模型做分析,形成共識,就會影響一段行情。然后分析師依靠AI寫報告,AI再根據(jù)分析師報告做深度思考,提供結果,分析師再根據(jù)AI模型寫報告.......
不管怎樣,DeepSeek請繼續(xù)折射人類千年文明的星光吧~