用戶名: 密碼: 驗證碼:

NVIDIA 通過企業(yè)級生成式 AI 微服務 為聊天機器人、AI 助手和摘要工具帶來商業(yè)智能

摘要:Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 優(yōu)化語義檢索,實現(xiàn)準確的 AI 推理。

  ICC訊 亞馬遜云科技 re:Invent — 太平洋時間 2023 年 11 月 28 日 — NVIDIA 今日宣布推出一項生成式 AI 微服務,支持企業(yè)將自定義大語言模型與企業(yè)數(shù)據(jù)相連接,使其 AI 應用能夠提供高度準確的響應。

  NVIDIA NeMo? Retriever 是 NVIDIA NeMo(一個用于構(gòu)建、自定義和部署生成式 AI 模型的框架和工具系列)的一項全新服務,通過企業(yè)級檢索增強生成(RAG)功能,幫助組織加強其生成式 AI 應用。

  作為一項語義檢索微服務,NeMo Retriever 借助經(jīng) NVIDIA 優(yōu)化的算法,幫助生成式 AI 應用作出更加準確的回答。使用該微服務的開發(fā)者,可以將其 AI 應用與位于各個云和數(shù)據(jù)中心的業(yè)務數(shù)據(jù)相連通。該服務為 AI 代工添加了 NVIDIA 優(yōu)化的 RAG 功能,并被整合到亞馬遜云科技 Marketplace 上的 NVIDIA AI Enterprise 軟件平臺中。

  Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先與 NVIDIA 合作,將生產(chǎn)就緒型 RAG 功能整合至其自定義生成式 AI 應用和服務中。

  NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“具有 RAG 功能的生成式 AI 應用是企業(yè)的下一個殺手級應用。借助 NVIDIA NeMo Retriever,開發(fā)者可以創(chuàng)建自定義生成式 AI 聊天機器人、AI 助手和摘要工具。它們能夠訪問企業(yè)的業(yè)務數(shù)據(jù),通過準確且有價值的生成式 AI 智能來提高生產(chǎn)力?!?

  全球頭部企業(yè)借助 NeMo Retriever 提高大語言模型(LLM)準確性

  電子系統(tǒng)設計領導廠商 Cadence 為超大規(guī)模計算、5G 通信、汽車、移動、航空航天、消費和醫(yī)療市場的企業(yè)提供服務。該公司正與 NVIDIA 合作,為工業(yè)電子設計領域的生成式 AI 應用開發(fā) RAG 功能。

  Cadence 總裁兼首席執(zhí)行官 Anirudh Devgan 表示:“生成式 AI 引入了創(chuàng)新方法來滿足客戶需求,比如能在設計流程早期發(fā)現(xiàn)潛在缺陷的工具等。我們的研究人員正在與 NVIDIA 合作,使用 NeMo Retriever 進一步提高生成式 AI 應用的準確性和相關性,以便發(fā)現(xiàn)問題,并幫助客戶更快地將優(yōu)質(zhì)產(chǎn)品推向市場。”

  破解精確的生成式 AI 應用的“密碼”

  與開源 RAG 工具套件不同,NeMo Retriever 是通過具有商業(yè)可行性的模型、API 穩(wěn)定性、安全補丁和企業(yè)級支持,來為生產(chǎn)就緒型生成式 AI 賦能。

  經(jīng) NVIDIA 優(yōu)化的算法使 Retriever 的嵌入模型能夠產(chǎn)出準確性最高的結(jié)果。經(jīng)過優(yōu)化的嵌入模型能夠捕捉單詞之間的關系,使 LLM 能夠處理和分析文本數(shù)據(jù)。

  企業(yè)可以使用 NeMo Retriever 將 LLM 連接到多個數(shù)據(jù)源和知識庫,這樣用戶就可以輕松地與數(shù)據(jù)交互,并通過簡單的對話指令獲得準確且最新的答案。通過使用由 Retriever 驅(qū)動的應用,企業(yè)可以使用戶安全地訪問多種數(shù)據(jù)格式的信息,如文本、PDF、圖像和視頻等。

  借助 NeMo Retriever,企業(yè)能夠以更少的訓練獲得更準確的結(jié)果,加快產(chǎn)品上市時間,并減少生成式 AI 應用開發(fā)產(chǎn)生的能耗。

  通過 NVIDIA AI Enterprise 實現(xiàn)可靠、簡單且安全的部署

  企業(yè)可以在幾乎任何數(shù)據(jù)中心或云端的 NVIDIA 加速計算上部署由 NeMo Retriever 驅(qū)動的應用,以便在推理過程中運行。NVIDIA AI Enterprise 可支持通過 NVIDIA Triton 推理服務器?、NVIDIA TensorRT?、NVIDIA TensorRT-LLM 及其他 NVIDIA AI 軟件進行加速的高性能推理。

  供應情況

  開發(fā)者可以注冊并搶先體驗 NVIDIA NeMo Retriever。

  關于NVIDIA

  自 1993 年成立以來,NVIDIA(NASDAQ: NVDA)一直是加速計算領域的先驅(qū)。NVIDIA 1999 年發(fā)明的 GPU 驅(qū)動了 PC 游戲市場的增長,并重新定義了現(xiàn)代計算機圖形,開啟了現(xiàn)代 AI 時代,正在推動跨市場的工業(yè)數(shù)字化。NVIDIA 現(xiàn)在是一家全棧計算公司,其數(shù)據(jù)中心規(guī)模的解決方案正在重塑整個行業(yè)。更多信息,請訪問 https://nvidianews.nvidia.com/。

1、凡本網(wǎng)注明“來源:訊石光通訊網(wǎng)”及標有原創(chuàng)的所有作品,版權均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。
2、免責聲明,凡本網(wǎng)注明“來源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。因可能存在第三方轉(zhuǎn)載無法確定原網(wǎng)地址,若作品內(nèi)容、版權爭議和其它問題,請聯(lián)系本網(wǎng),將第一時間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right