絕地反擊GPT-4，谷歌推出最強(qiáng)大模型Gemini

訊石光通訊網(wǎng) 發(fā)布時間:2023/12/8 8:57:53 編者:陳興華

摘要：谷歌CEO桑達(dá)爾·皮查伊（Sundar Pichai）和Deepmind CEO戴密斯·哈薩比斯（Demis Hassabis）在谷歌官網(wǎng)聯(lián)名發(fā)文稱，其最新大模型Gemini 1.0（雙子星）版本正式上線。

ICC訊 被ChatGPT壓制整整一年之后，谷歌展開了最強(qiáng)反擊戰(zhàn)。12月7日凌晨，谷歌CEO桑達(dá)爾·皮查伊（Sundar Pichai）和Deepmind CEO戴密斯·哈薩比斯（Demis Hassabis）在谷歌官網(wǎng)聯(lián)名發(fā)文稱，其最新大模型Gemini 1.0（雙子星）版本正式上線。在他們看來，Gemini的發(fā)布僅僅是一個開始，更大的技術(shù)迭代、產(chǎn)品應(yīng)用和生態(tài)構(gòu)建宏圖即將展開。

從測試數(shù)據(jù)來看，Gemini大模型在知識儲備、專業(yè)能力和多模態(tài)等方面均超越GPT-4，而且部分核心能力首次超越了人類專家，這不僅對OpenAI構(gòu)成了強(qiáng)有力的沖擊和挑戰(zhàn)，也標(biāo)志著AI大模型浪潮進(jìn)入一個新的階段。但即使Gemini“效果驚人”，谷歌似乎并沒有十足底氣，包括沒有公布Gemini頂尖大模型的性能數(shù)據(jù)，不免被質(zhì)疑吹噓過度和測試標(biāo)準(zhǔn)偏頗。

首超人類專家，多維領(lǐng)先GPT-4

作為籌備一年之久的GPT-4強(qiáng)力競品，Gemini 1.0是目前谷歌能拿出手的功能最為強(qiáng)悍、適配最為靈活的大模型，分別包括Gemini Ultra、Gemini Pro和Gemini Nano三種不同套件。其中Ultra是谷歌最大、最強(qiáng)模型，適用于高度復(fù)雜的任務(wù)；Pro能力稍弱，是一個可擴(kuò)展至多任務(wù)的模型；Nano則是一款適用于端側(cè)設(shè)備運行的模型。

不過，谷歌方面并沒有透露Gemini Ultra和Gemini Pro的具體參數(shù)大小，只是明確稱規(guī)模最小的Gemini Nano的參數(shù)分別為18億（Nano-1）和32.5億（Nano-2）。但有傳言稱，Gemini Ultra的參數(shù)規(guī)模達(dá)到萬億級別，訓(xùn)練動用的算力是GPT-4的5倍以上。

Gemini發(fā)布后，外界尤其關(guān)注其對GPT-4的挑戰(zhàn)。谷歌DeepMind產(chǎn)品副總裁伊萊·柯林斯（Eli Collins）表示，團(tuán)隊一直在對Gemini進(jìn)行嚴(yán)格的測試并評估其在各種任務(wù)中的性能。從自然圖像、音頻和視頻理解到數(shù)學(xué)推理，在被大型語言模型（LLM）研究和開發(fā)中廣泛使用的32項學(xué)術(shù)基準(zhǔn)中，Gemini Ultra的性能有30項都超過了目前最先進(jìn)的水平。

據(jù)MMLU（大規(guī)模多任務(wù)語言理解數(shù)據(jù)集）的測試結(jié)果，Gemini Ultra的得分率為90%，這款MMLU數(shù)據(jù)集包含數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理等57個科目，專門用于測試大模型的知識儲備和解決問題能力。作為對比，人類專家的得分率為89.8%，GPT4得分率為86.4%。這說明Gemini Ultra是第一個在MMLU測試中超過人類專家的模型。

在多模態(tài)方面，Gemini Ultra在權(quán)威MMMU基準(zhǔn)測試中也獲得了59.4%的SOTA分?jǐn)?shù)，高于GPT-4V的56.8%。這項基準(zhǔn)測試是由跨不同領(lǐng)域的多模式任務(wù)組成，需要大模型進(jìn)行深思熟慮的推理過程，而谷歌Gemini大模型多模態(tài)背后的技術(shù)原理也引發(fā)業(yè)界關(guān)注。對此，谷歌DeepMind首席科學(xué)家杰夫·迪恩（Jeff Dean）團(tuán)隊撰寫了60頁技術(shù)報告來闡述。

以往，多模態(tài)大模型是將純文本、純視覺和純音頻模型拼接在一起，例如OpenAI的GPT-4、DALL·E和Whisper等，但這并不是最優(yōu)解。據(jù)戴密斯·哈薩比斯透露，Deepmind團(tuán)隊將Gemini設(shè)計為原生多模態(tài)，從一開始就在不同模態(tài)上進(jìn)行預(yù)訓(xùn)練。然后，利用額外的多模態(tài)數(shù)據(jù)對其進(jìn)行微調(diào)，以進(jìn)一步提高其有效性。這有助于Gemini從最初階段就能對輸入的各種內(nèi)容順暢地進(jìn)行理解和推理，并優(yōu)于現(xiàn)有的多模態(tài)模型。

谷歌方面稱，Gemini將通過其系列產(chǎn)品推向數(shù)十億用戶，其中谷歌聊天機(jī)器人Bard由Gemini Pro微調(diào)版本驅(qū)動，在170多個國家和地區(qū)提供英語服務(wù)并持續(xù)擴(kuò)展，這是Bard自推出后的最大升級。而谷歌的Pixel 8 Pro將成為首款搭載Gemini Nano的智能手機(jī)，明年年初將推出Bard Advanced，提供Gemini Ultra模型的最佳性能。此外，值得注意的是，在Gemini亮相同時谷歌還推出了專為大模型設(shè)計的新一代TPU——Cloud TPU v5p。

“復(fù)仇者聯(lián)盟”坐鎮(zhèn)，競爭行業(yè)王座

一定程度上，谷歌發(fā)布Gemini多少讓外界有些意外。在今年5月谷歌的開發(fā)者大會上，谷歌便高調(diào)對外宣布下一代大語言模型Gemini，按照原計劃將在12月份對外正式發(fā)布。但近期傳出谷歌將發(fā)布Gemini推遲至明年1月，谷歌方面給出的理由是“在某些非英語任務(wù)方面的表現(xiàn)不佳”，這曾引發(fā)了外界猜測谷歌在Gemini研發(fā)方面遇到了困難和挑戰(zhàn)。

過去一年來，全世界的AI公司掀起“對標(biāo)”GPT熱潮，其中谷歌被視為當(dāng)仁不讓的最強(qiáng)大對手，但在與OpenAI的競爭中，回應(yīng)卻總步履蹣跚?；蛟S是迫于外界預(yù)期壓力以及加速追趕OpenAI，谷歌最終按原計劃對外發(fā)布了Gemini。無論如何，Gemini的正式登場不僅形成了對OpenAI的有力反擊，也意味著AI大模型浪潮進(jìn)入到一個全新階段。

從如今公布的Gemini參數(shù)和使用效果來看，谷歌的“AI家底”自然不菲。例如在官方技術(shù)報告中，谷歌提到是使用TPUv5e和TPUv4對Gemini進(jìn)行大規(guī)模訓(xùn)練，旨在將其打造成可靠、可擴(kuò)展的訓(xùn)練模型和最高效的服務(wù)模型。在TPU上，Gemini的運行速度明顯快于其早期規(guī)模較小、能力較弱的模型，如被曝參數(shù)規(guī)模為3400億的PaLM-2。而最新的TPU v5p一旦納入運營，將進(jìn)一步減少谷歌訓(xùn)練Gemini大模型相關(guān)的時間投入等。

此外，為了強(qiáng)化技術(shù)班底，谷歌曾在今年4月直接把谷歌大腦（Google Brain）和DeepMind合并在一起，其中Google Brain曾經(jīng)締造了Tensorflow與Transformer架構(gòu)，DeepMind則曾憑借AlphaGo掀起上一輪AI熱潮、創(chuàng)造了AlphaFold預(yù)測蛋白質(zhì)折疊。由于此前在行業(yè)競爭中失利，這一團(tuán)隊也被外界調(diào)侃是“AI復(fù)仇者聯(lián)盟”。而正是基于匯合兩個頂尖實驗室力量的緊密攻關(guān)，Gemini才得以在多項指標(biāo)上實現(xiàn)了對GPT-4的絕地反擊。

前不久，OpenAI經(jīng)歷了全球矚目的戲劇性“董事會內(nèi)亂”，其CEO山姆·阿爾特曼（Sam Altman）突遭董事會罷免，但最終迅速回歸。此后，OpenAI的未來發(fā)展增添許多新的不確定性，包括推出的GPT高級版無限期暫停等，這也給了谷歌等公司更多追趕的時間和機(jī)會。

目前來看，雖然OpenAI占有先機(jī)，通過ChatGPT獲得了大量訓(xùn)練數(shù)據(jù)反饋，但谷歌也依然有著自身的技術(shù)和生態(tài)優(yōu)勢。據(jù)外媒此前報道稱，Gemini至少在一個重要方面比GPT-4強(qiáng)，即除了來自網(wǎng)絡(luò)的公共信息之外，Gemini還利用了來自谷歌旗下產(chǎn)品的大量專有數(shù)據(jù)。因此，在理解用戶特定查詢的意圖時更準(zhǔn)確，而且錯誤答案（即幻覺）也似乎更少。

在Gemini正式亮相后，業(yè)界不乏對其肯定和追捧，其中英偉達(dá)AI科學(xué)家范麟熙（Jim Fan）表示，遲到總比不做好，OpenAI王座終于有了強(qiáng)力競爭者。但對于Gemini“效果驚人”，也有分析稱，谷歌有些吹噓過度以及測試標(biāo)準(zhǔn)有失偏頗等，包括即便是通過Gemini Ultra對比，但很多項也都僅是略高于GPT-4和GPT-4V等模型。不過，艾倫人工智能研究所前CEO奧倫·埃齊奧尼（Oren Etzioni）則稱，“沒有理由懷疑Gemini在這些基準(zhǔn)上比GPT-4更好，但沒準(zhǔn)GPT-5會比Gemini做得更好?！?

內(nèi)容來自：愛集微
本文地址：http://3xchallenge.com//Site/CN/News/2023/12/08/20231208010853545382.htm 轉(zhuǎn)載請保留文章出處
關(guān)鍵字:
文章標(biāo)題:絕地反擊GPT-4，谷歌推出最強(qiáng)大模型Gemini

1、凡本網(wǎng)注明“來源：訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品，版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位，也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和本站來源。
2、免責(zé)聲明，凡本網(wǎng)注明“來源：XXX（非訊石光通訊網(wǎng)）”的作品，均為轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無法確定原網(wǎng)地址，若作品內(nèi)容、版權(quán)爭議和其它問題，請聯(lián)系本網(wǎng)，將第一時間刪除。
聯(lián)系方式：訊石光通訊網(wǎng)新聞中心　電話：0755-82960080-168 Right

絕地反擊GPT-4，谷歌推出最強(qiáng)大模型Gemini

相關(guān)新聞

絕地反擊GPT-4，谷歌推出最強(qiáng)大模型Gemini