會話 AI 服務已經存在多年,但不論是聊天機器人,還是智能個人助理或搜索引擎,其理解能力很難達到與人類相當的水平。主要瓶頸則在于超大型AI模型的實施部署無法實現。正因如此,不論是Google、Microsoft、Facebook,還是阿里巴巴、百度等,都在模型的部署方面孜孜以求。
NVIDIA于太平洋時間8月13日宣布重大突破:BERT訓練時間實現創紀錄的53分鐘,推理時間縮短至2毫秒,并構建了迄今為止同類型中最大的語言模型,使得實時會話 AI與用戶進行互動時更為自然。
超大模型面前,GPU再證強大可擴展性
BERT(Bidirectional Encoder Representations from Transformers)是世界上最先進的AI語言模型之一,Google于去年發布不久就刷爆AI業界。作為一種新型的語言模型,它只需一個額外的輸出層對預訓練BERT進行微調就可以滿足各種任務,而無需再對模型進行修改,實現了在11項NLP任務上取得突破進展。在對BERT模型進行訓練時,NVIDIA使用搭載了92臺 NVIDIA DGX-2H系統的 NVIDIA DGX SuperPOD運行該模型的大型版本,憑借1472個NVIDIA V100 GPU的強大性能,NVIDIA將BERT-Large的典型訓練時間從幾天縮短至僅僅 53 分鐘。
此外,NVIDIA還在單獨一臺NVIDIA DGX-2系統上執行了BERT-Large 模型的訓練任務,用時也僅為 2.8天,充分體現了GPU在會話 AI 方面的可擴展性。
推理方面,借助于運行了NVIDIA TensorRT的NVIDIA T4 GPU,NVIDIA 執行 BERT-Base SQuAD數據集的推理任務,用時僅為2.2毫秒,遠低于許多實時應用程序所需的10毫秒處理閾值;與使用高度優化的CPU代碼時所測得的40多毫秒相比,有著顯著改進。
對此,NVIDIA 深度學習應用研究副總裁 Bryan Catanzaro 表示,“對于適用于自然語言的AI而言,大型語言模型正在為其帶來革新。NVIDIA 所取得的突破性工作成果加速了這些模型的創建,它們能夠幫助解決那些最為棘手的語言問題,讓我們距離實現真正的會話 AI 更進了一步。
NVIDIA BERT推理解決方案Faster Transformer宣布開源
開發者們對于更大模型的需求正在日益增長,NVIDIA 研究團隊基于Transformer構建并訓練了世界上最大的語言模型。Transformer是BERT的技術構件,正被越來越多的其他自然語言AI模型所使用。NVIDIA定制的模型包含83億個參數,是BERT-Large的24 倍。2017年12月Google在論文“Attention is All You Need”中首次提出了Transformer,將其作為一種通用高效的特征抽取器。至今,Transformer已經被多種NLP模型采用,比如BERT以及上月發布重刷其記錄的XLNet,這些模型在多項NLP任務中都有突出表現。在NLP之外,TTS、ASR等領域也在逐步采用Transformer。可以預見,Transformer這個簡潔有效的網絡結構會像CNN和RNN一樣被廣泛采用。
不過,雖然Transformer在多種場景下都有優秀表現,但是在推理部署階段,其計算性能卻受到了巨大的挑戰:以BERT為原型的多層Transformer模型,其性能常常難以滿足在線業務對于低延遲(保證服務質量)和高吞吐(考慮成本)的要求。以BERT-BASE為例,超過90%的計算時間消耗在12層Transformer的前向計算上。因此,一個高效的Transformer 前向計算方案,既可以為在線業務帶來降本增效的作用,也有利于以Transformer結構為核心的各類網絡在更多實際工業場景中落地。
NVIDIA GPU計算專家團隊針對Transformer推理提出的性能優化方案Faster Transformer宣布開源,其底層基于CUDA和cuBLAS,是一個BERT Transformer 單層前向計算的高效實現,其代碼簡潔明了,后續可以通過簡單修改支持多種Transformer結構。目前優化集中在編碼器(encoder)的前向計算(解碼器decoder開發在后續特性規劃中),能夠助力于多種BERT的應用場景。Faster Transformer對外提供C++ API,TensorFlow OP 接口,以及TensorRT插件,并提供了相應的示例,用以支持用戶將其集成到不同的線上應用代碼中。
2021年15%的客服互動將通過AI完成
預計未來幾年,基于自然語言理解的 AI 服務將呈指數級增長。根據Juniper Research 的研究表明,在未來4年中,僅數字語音助手的數量就將有望從25 億攀升到 80 億。此外,據Gartner預計,到 2021 年,15%的客服互動都將通過AI完成,相比2017年將增長4倍。當前,全球數以百計的開發者都使用 NVIDIA 的 AI 平臺,來推進他們自己的語言理解研究并創建新的服務。
Microsoft Bing正在通過先進的 AI 模型和計算平臺,為客戶提供更好的搜索體驗。通過與 NVIDIA 密切合作,Bing 使用 NVIDIA GPU(Azure AI 基礎設施的一部分)進一步優化了熱門自然語言模型 BERT 的推理功能,從而大幅提升了 Bing 于去年部署的排名搜索的搜索質量。與基于 CPU 的平臺相比,使用 Azure NVIDIA GPU 進行推理,延遲降低了一半,吞吐量提升了5倍。
多家初創公司(例如Clinc、Passage AI 和Recordsure等)正在使用 NVIDIA的AI平臺為銀行、汽車制造商、零售商、醫療服務提供商、旅行社和酒店等客戶構建先進的會話 AI 服務。據悉,中國市場也有相應的合作伙伴,日后將進一步公開。
會話AI才是真正意義上的人工智能的基本特征,不論是語言模型還是訓練、推理,底層技術的逐步強大,才是實現這一切的基礎。距離我們所期望的人工智能雖然還很遙遠,但技術上的每一次突破都值得記載。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
NVIDIA
+關注
關注
14文章
5598瀏覽量
109803 -
gpu
+關注
關注
28文章
5196瀏覽量
135514
發布評論請先 登錄
相關推薦
熱點推薦
百度蘿卜快跑與Uber進一步深化戰略合作
今天,蘿卜快跑與全球最大的移動出行服務平臺Uber共同宣布,雙方將進一步深化戰略合作,計劃于2026年第一季度在阿聯酋迪拜正式推出全無人駕駛出行服務,這也是迪拜首次迎來全無人駕駛出行服務。
天合儲能與Lightshift Energy進一步擴大戰略合作
近日,天合儲能宣布將與美國領先的儲能開發、建設及運營方 Lightshift Energy(以下簡稱 “Lightshift”) 進一步擴大戰略合作。在既有合作基礎上,雙方歷史累計及在建、將建項目合計,保障聯合交付儲能項目規模超過 1GWh,持續支持美國多個州的電網建設與穩定運行。
晶科儲能進一步擴大英國儲能項目布局
晶科儲能近日宣布進一步擴大其在英國的項目布局,新增加一套140MWh的電網級儲能系統。首期的140MWh項目正在交付過程中,兩期項目合計容量達到280MWh,成為英國規模最大的電池儲能項目之一。兩期項目均將采用晶科儲能最先進的U
BlackBerry QNX與芯馳科技進一步深化戰略合作
BlackBerry有限公司(紐約證券交易所代碼:BB;多倫多證券交易所代碼:BB)旗下業務部門QNX與中國創新汽車半導體供應商芯馳科技今日宣布,雙方將進一步深化合作,基于芯馳科技最新一代X10
BlackBerry QNX與眾森軟件進一步深化戰略合作
今日,深圳市眾森軟件有限公司(以下簡稱"眾森軟件")正式宣布與全球領先的實時操作系統與嵌入式軟件供應商 QNX(BlackBerry有限公司旗下部門QNX)進一步深化戰略合作。此次合作將進一步推動下一代智能網聯汽車與智慧出行解決
納微半導體與文曄科技進一步強化戰略合作
——文曄科技股份有限公司(臺股代碼:3036)今日宣布雙方將進一步強化戰略合作,共同為亞洲市場提供更強大的氮化鎵與碳化硅功率器件技術支持與供應鏈服務。
上汽奧迪與創維汽車智能合作進一步深化升級
近日,創維汽車智能迎來重要突破:上汽奧迪客戶將當前公司開發的顯示屏項目沿用至上汽奧迪其他主力車型。這一決定不僅體現了客戶對創維汽車智能技術實力與服務品質的高度認可,更標志著雙方合作進一步深化升級。
NVIDIA DGX Spark助力構建自己的AI模型
2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 項目,并于 3 月 18 日更名為 NVIDIA DGX Spark,進一步公布了產品細節。DGX Spark
通過NVIDIA Jetson AGX Thor實現7倍生成式AI性能
Jetson Thor 平臺還支持多種主流量化格式,包括 NVIDIA Blackwell GPU 架構的新 NVFP4 格式,有助于進一步優化推理性能。該平臺同時支持推測解碼等新技術,為在邊緣端加速生成式
美國 | FCC即將通過新規,進一步封堵華為、海康威視
FCC即將通過新規,進一步封堵華為、海康威視2025年10月7日,美國聯邦通信委員會(FCC)主席宣布,FCC委員會即將投票表決一項新規,旨在填補現有法規中可能被利用的兩大漏洞,以阻止存在“風險
云知聲與頭部財產保險公司進一步擴大合作
近日,云知聲智能科技股份有限公司(以下簡稱“云知聲”,股票代碼:9678.HK)與某頭部財產保險公司(以下簡稱“該財險公司”)進一步擴大合作,雙方正式簽署協議,將業務從智能醫療審核延伸至該財險公司關注的傷殘等級、三期鑒定等更多維度的車險核賠風控業務,標志著雙方合作進入規模化、深層次新階段。
蔚來進一步拓展其全球業務
8月18日,蔚來公司宣布將于2025年至2026年期間陸續進入新加坡、烏茲別克斯坦和哥斯達黎加三個市場,進一步拓展其全球業務,為當地用戶帶來創新、可持續、高品質的智能電動出行體驗。
軟通動力與中國聯通合作關系進一步深化
近日,軟通動力成功中標聯通(廣東)產業互聯網有限公司2025年軟件技術開發集中采購項目,中標份額位列榜首。這一突破性成果,不僅彰顯了軟通動力在數字技術服務領域的綜合實力,也標志著其與中國聯通合作關系的進一步深化。
NVIDIA虛擬GPU 18.0版本的亮點
生產力、安全性和性能。新版軟件可幫助企業和開發者進一步推動創新、改變工作流并更大限度地發揮加速計算的潛力。
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發
NVIDIA GTC 推出新一代專業級 GPU 和 AI 賦能的開發者工具—同時,ChatRTX 更新現已支持 NVIDIA NIM,RTX
NVIDIA GPU再創壯舉,距真正會話AI又進一步!
評論