ICC訊 亞馬遜云科技 re:Invent — 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務,支持企業(yè)將自定義大語言模型與企業(yè)數據相連接,使其 AI 應用能夠提供高度準確的響應。
NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務,通過企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應用。
作為一項語義檢索微服務,NeMo Retriever 借助經 NVIDIA 優(yōu)化的算法,幫助生成式 AI 應用作出更加準確的回答。使用該微服務的開發(fā)者,可以將其 AI 應用與位于各個云和數據中心的業(yè)務數據相連通。該服務為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。
Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務中。
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應用是企業(yè)的下一個殺手級應用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務數據,通過準確且有價值的生成式 AI 智能來提高生產力?!?
全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準確性
電子系統(tǒng)設計領導廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務。該公司正與 NVIDIA 合作,為工業(yè)電子設計領域的生成式 AI 應用開發(fā) RAG 功能。
Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設計流程早期發(fā)現潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進一步提高生成式 AI 應用的準確性和相關性,以便發(fā)現問題,并幫助客戶更快地將優(yōu)質產品推向市場?!?
破解精確的生成式 AI 應用的“密碼”
與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補丁和企業(yè)級支持,來為生產就緒型生成式 AI 賦能。
經 NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產出準確性最高的結果。經過優(yōu)化的嵌入模型能夠捕捉單詞之間的關系,使 LLM 能夠處理和分析文本數據。
企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數據源和知識庫,這樣用戶就可以輕松地與數據交互,并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅動的應用,企業(yè)可以使用戶安全地訪問多種數據格式的信息,如文本、PDF、圖像和視頻等。
借助 NeMo Retriever,企業(yè)能夠以更少的訓練獲得更準確的結果,加快產品上市時間,并減少生成式 AI 應用開發(fā)產生的能耗。
通過 NVIDIA AI Enterprise 實現可靠、簡單且安全的部署
企業(yè)可以在幾乎任何數據中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅動的應用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。
供應情況
開發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever。
關于NVIDIA
自 1993 年成立以來,NVIDIA(NASDAQ: NVDA)一直是加速計算領域的先驅。NVIDIA 1999 年發(fā)明的 GPU 驅動了 PC 游戲市場的增長,并重新定義了現代計算機圖形,開啟了現代 AI 時代,正在推動跨市場的工業(yè)數字化。NVIDIA 現在是一家全棧計算公司,其數據中心規(guī)模的解決方案正在重塑整個行業(yè)。更多信息,請訪問 https://nvidianews.nvidia.com/。