ICC訊 說(shuō)到當(dāng)前這輪人工智能熱潮背后的支持技術(shù),Alphabet旗下的谷歌其實(shí)是發(fā)明者,但其產(chǎn)品的受歡迎程度卻明顯滯后。谷歌希望透過(guò)發(fā)布備受期待的Gemini來(lái)改變這種局面,這是該公司迄今為止構(gòu)建的“規(guī)模最大、功能最強(qiáng)的工人智能模型”。
自從OpenAI去年憑借其對(duì)話式聊天機(jī)械人ChatGPT取得巨大成功以來(lái),越來(lái)越多的公司一直在嘗試產(chǎn)生式人工智能,這種技術(shù)可以根據(jù)用戶的要求自動(dòng)執(zhí)行編碼、總結(jié)報(bào)告或建立營(yíng)銷活動(dòng)等任務(wù)。在12月6日發(fā)布這款產(chǎn)品前的一次演示會(huì)上,谷歌強(qiáng)調(diào),Gemini是其構(gòu)建的最靈活的模型,因?yàn)樗胁煌?guī)模的版本,包括一個(gè)可以直接在智能手機(jī)上執(zhí)行的版本。這使它有別于其他競(jìng)爭(zhēng)對(duì)手。
這款人工智能模型是一個(gè)用于支持各種產(chǎn)生式人工智能應(yīng)用程序的系統(tǒng),它有三個(gè)不同的版本:Gemini Ultra、Gemini Pro和Gemini Nano。谷歌DeepMind部門產(chǎn)品副總裁柯林斯(Eli Collins)表示,這種多樣性意味著Gemini“能夠在從流動(dòng)裝置到大型數(shù)據(jù)中心的所有裝置上執(zhí)行”。
“長(zhǎng)期以來(lái),我們一直希望構(gòu)建新一代人工智能模型,其靈感來(lái)自于人們理解這個(gè)世界并與其互動(dòng)的方式——這種人工智能感覺(jué)更像是一個(gè)助人為樂(lè)的合作者,而不是一款智慧軟件,”柯林斯在接受電話采訪時(shí)說(shuō)道,“Gemini讓我們離這個(gè)愿景又靠近了一步?!?
在這款模型發(fā)布前,該公司對(duì)Gemini進(jìn)行了一系列標(biāo)準(zhǔn)的行業(yè)基準(zhǔn)檢驗(yàn),并表示,在八項(xiàng)測(cè)試中有六項(xiàng)結(jié)果顯示,Gemini Pro的表現(xiàn)優(yōu)于OpenAI的GPT-3.5。谷歌稱,在對(duì)通用語(yǔ)言理解、推理、數(shù)學(xué)和編碼進(jìn)行的八項(xiàng)基準(zhǔn)檢驗(yàn)中,Gemini有七項(xiàng)結(jié)果優(yōu)于OpenAI通用模型的最新版本GPT-4。與此同時(shí),谷歌估計(jì),該公司最新的可解釋和產(chǎn)生程序代碼的產(chǎn)生式人工智能產(chǎn)品AlphaCode 2在競(jìng)爭(zhēng)性程序設(shè)計(jì)領(lǐng)域超過(guò)了85%的競(jìng)爭(zhēng)對(duì)手。該公司將發(fā)布一份技術(shù)報(bào)告,更深入地解釋Gemini的模型架構(gòu)、訓(xùn)練過(guò)程和評(píng)估情況。
從12月6日開(kāi)始,想要為智能手機(jī)和平板計(jì)算機(jī)編寫Gemini支持的應(yīng)用程序的Android開(kāi)發(fā)人員將能夠注冊(cè)使用這款人工智能模型的“nano”版本,該版本可以直接在此類裝置上執(zhí)行。谷歌還表示,將立即在其旗艦手機(jī)Pixel 8 Pro上啟用Gemini,它將支持新的產(chǎn)生式人工智能功能,例如從電話錄音中總結(jié)要點(diǎn)。下周,谷歌將透過(guò)其Vertex AI和AI Studio平臺(tái)向云客戶提供Gemini Pro。
Gemini Ultra是最大版本的谷歌人工智能模型,最初將在面向開(kāi)發(fā)者和企業(yè)公司的搶先體驗(yàn)計(jì)劃中推出,有關(guān)該計(jì)劃的詳細(xì)信息將于下周公布。這個(gè)版本將于明年早些時(shí)候向公眾廣泛推出。
Gemini還能透過(guò)Bard與谷歌的大量應(yīng)用程序和服務(wù)整合在一起,Bard是該公司的對(duì)話式聊天機(jī)械人,是ChatGPT的競(jìng)爭(zhēng)對(duì)手。此前,Bard使用的是谷歌的PaLM 2模型,這是該公司在5月份的年度開(kāi)發(fā)者大會(huì)上宣布的大型語(yǔ)言模型。
在過(guò)去一年中,谷歌一直面臨壓力,既要重塑其核心搜尋業(yè)務(wù),又要應(yīng)對(duì)產(chǎn)生式人工智能程序興起的浪潮。盡管該公司長(zhǎng)期以來(lái)一直被視為人工智能研究領(lǐng)域的先驅(qū),但一些人批評(píng)其管理層在人工智能產(chǎn)品營(yíng)銷方面反應(yīng)遲緩,尤其是在ChatGPT和影像產(chǎn)生器Dall-E等產(chǎn)品大獲成功之后。自O(shè)penAI于3月份發(fā)布GPT-4以來(lái),谷歌一直在努力重申其在該領(lǐng)域的領(lǐng)導(dǎo)地位,包括將這項(xiàng)新技術(shù)注入其成熟的搜尋業(yè)務(wù)。
Gemini就是該公司面對(duì)這種市場(chǎng)壓力給出的答案。谷歌表示,人工智能模型是“天然多模式”,這意味著它從一開(kāi)始就經(jīng)過(guò)預(yù)先訓(xùn)練,可以處理使用者給出的基于文字和影像的提示。例如,在一則影片演示中,谷歌展示了家長(zhǎng)可以透過(guò)上傳某道某數(shù)學(xué)題的影像以及在草稿紙上嘗試解題的步驟照片,來(lái)幫助孩子完成家庭作業(yè)。
在演示影片中,谷歌的軟件工程師阿普爾鮑姆表示:“Gemini不僅能解出這些題目,還可以閱讀這些答案并理解哪些是對(duì)的,哪些是錯(cuò)的,并對(duì)需要進(jìn)一步澄清的概念作出解釋?!痹摴具€表示,其“搜尋產(chǎn)生體驗(yàn)”——谷歌利用其產(chǎn)生式人工智能技術(shù)構(gòu)建的實(shí)驗(yàn)版本的搜索引擎——將在明年融入Gemini的新功能。
盡管如此,該公司的代表警告說(shuō),Gemini仍然容易“產(chǎn)生幻覺(jué)”,也就是產(chǎn)生式人工智能產(chǎn)生的虛假或捏造的信息??铝炙狗Q這種現(xiàn)象為“一個(gè)未解決的研究問(wèn)題”。該公司向記者展示的演示影片是預(yù)先錄制的。
柯林斯說(shuō),Gemini“在谷歌所有人工智能模型中擁有最全面的安全評(píng)估”。他說(shuō),為了評(píng)估Gemini的安全性,谷歌對(duì)這款人工智能模型進(jìn)行了對(duì)抗性測(cè)試,也就是模仿一位試圖利用該程序的壞人給出提示。此次測(cè)試包括“真實(shí)毒性提示”,這是艾倫人工智能研究所開(kāi)發(fā)的一項(xiàng)測(cè)試,其中包含從網(wǎng)上提取的10萬(wàn)多個(gè)提示,旨在幫助人工智能研究人員檢查大型語(yǔ)言模型中是否存在仇恨言論和政治偏見(jiàn)。
谷歌還強(qiáng)調(diào),這項(xiàng)工具的速度將會(huì)很快。該公司表示,Gemini使用了一種新的底層超級(jí)計(jì)算器架構(gòu)和更新的處理芯片,使其比早前較小的模型執(zhí)行得更快。谷歌正在使用一種新版本的云芯片——Cloud Tensor Processing Units (簡(jiǎn)稱TPUs),這是一種內(nèi)部設(shè)計(jì)的芯片,和前代產(chǎn)品相比,它訓(xùn)練現(xiàn)有模型的速度要快2.8倍。谷歌機(jī)器學(xué)習(xí)副總裁阿明·瓦赫達(dá)特說(shuō),這種方法讓谷歌“對(duì)未來(lái)標(biāo)準(zhǔn)人工智能基礎(chǔ)設(shè)施有了新的認(rèn)識(shí)”。他補(bǔ)充說(shuō),該公司仍然會(huì)使用第三方人工智能芯片來(lái)執(zhí)行其Gemini模型。
Gemini將被整合到3月份推出的谷歌產(chǎn)生式人工智能聊天機(jī)械人Bard當(dāng)中,使其能夠利用該公司最受歡迎的服務(wù),包括Gmail、地圖、檔案(Docs)和YouTube。此次推出將分為兩個(gè)不同的階段進(jìn)行:從12月6日開(kāi)始,Bard將由Gemini Pro提供支持,它將實(shí)現(xiàn)高階推理、規(guī)劃、理解和其他功能。它將能夠在170個(gè)國(guó)家和地區(qū)以英語(yǔ)執(zhí)行,但值得注意的是,不包括歐洲或英國(guó),該公司表示它正在和當(dāng)?shù)乇O(jiān)管機(jī)構(gòu)協(xié)商。
明年初,該公司打算發(fā)布Bard Advanced,這款產(chǎn)品將由功能更強(qiáng)大的Gemini Ultra模型提供支持。谷歌表示,它很快將推出一個(gè)值得信賴的測(cè)試程序,以便在向公眾廣泛推出之前改進(jìn)Bard Advanced。谷歌負(fù)責(zé)Bard產(chǎn)品的副總裁Sissie Hsiao表示,“有了Gemini的加持,Bard正在進(jìn)行迄今為止最大、最好的升級(jí),它將為人們開(kāi)啟創(chuàng)作、互動(dòng)和協(xié)作的新方式?!?