国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力騰訊助力“開悟”AI開放研究平臺

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡介

? 本案例中通過NVIDIA V100 GPUTensorRT,騰訊“開悟”AI開放研究平臺將強化學習模型訓練中的自對弈推理部分,從CPU遷移到GPU上,實現了10倍的加速,并使推理成本下降90%,整體訓練成本下降 67%。

? 本案例主要應用到 NVIDIA V100 GPU 和 TensorRT。

客戶簡介及應用背景

騰訊一直積極地推動強化學習在游戲AI領域的發展,并在2019年推出了“開悟”AI開放研究平臺,提供不同游戲的訓練場景、支撐AI進行強化訓練的大規模算力、統一的強化學習框架以加速研發速度、通用的訓練與推理服務,加快AI訓練速度。

客戶挑戰

和圖像以及語音的訓練方式不同,目前在游戲AI訓練上表現最好的方式是強化學習。強化學習除了需要大量的算力來訓練深度學習網絡之外,還需要一個自對弈的模塊用來產生訓練數據。在自對弈模塊當中,會模擬游戲環境,并且選擇不同時期的模型來操控游戲內的角色,AI對游戲內角色的每一操控都需要對模型進行一次前向推理。由于更新模型的訓練數據來自于自對弈模塊,因此自對弈的推理速度會對整個模型的訓練速度和效果造成非常大的影響。

而自對弈推理每一次前向推理對延時的要求比實際的線上服務小,因此常見的方式是通過CPU來進行自對弈中的推理,但CPU成本太高。為了提高自對弈的速度與吞吐,減少推理成本,騰訊希望在“開悟”AI開放研究平臺里面充分利用GPU去進行自對弈中的模型前向推理。

應用方案

為了解決上述在自對弈推理當中GPU利用率不高的問題, 騰訊“開悟”AI開放研究平臺選擇使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎來加速推理。

為了自動化地將模型從TensorFlow轉換到TensorRT, 騰訊“開悟”AI開放研究平臺一開始通過自行開發parser,將TensorFlow的算子映射到TensorRT的算子。同時,為了支持更廣泛的模型與算子,減少維護和開發的成本, 騰訊“開悟”AI開放研究平臺也積極地與NVIDIA合作,推動從TensorFlow轉換成ONNX模型,再通過TensorRT ONNX parser轉換到TensorRT的流程。

在自對弈的過程中,需要頻繁地更新模型的權重,讓自對弈模型始終能保持在較新的狀態。這個更新的頻率大概幾分鐘一次,每次必須限制在幾百個毫秒。如果通過重新build engine 的方式來更新模型的話,無法滿足上述要求。因此 騰訊“開悟”AI開放研究平臺采用 TensorRT refit engine的功能來更新權重。同時,為了對更新權重有更好的支持、以及支持更多的算子, 騰訊“開悟”AI開放研究平臺從原本的TensorRT 5 升級到TensorRT 7。

TensorRT 7雖然在部分算子上支持權重更新,但并不支持LSTM這個在游戲AI當中很重要的算子。為了解決這個問題, 騰訊“開悟”AI開放研究平臺通過開發TensorRT插件的方式封裝LSTM算子,并在插件當中更新權重。

為了充分利用NVIDIA V100 GPU的Tensor core, 騰訊“開悟”AI開放研究平臺希望能夠使用TensorRT FP16精度來加速推理。由于TensorRT對FP16的支持非常成熟和簡便,整個推理流程很快被切換到FP16,并取得了2倍左右的加速。

尋找模型推理時的性能瓶頸,通過開發TensorRT插件進行算子融合,進一步地提升推理的速度。

在完成以上的工作之后,對比TensorFlow的基礎版本,TensorRT 7 能提供5倍以上的加速效果。

使用效果及影響

通過NVIDIA V100 GPU以及TensorRT推理引擎加速自對弈訓練的推理部分,騰訊“開悟”AI開放研究平臺極大地提升了自對弈推理的吞吐量與速度,進一步地提升了整個模型訓練的速度與降低訓練成本,加快模型迭代的周期。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5592

    瀏覽量

    109722
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135433
  • AI
    AI
    +關注

    關注

    91

    文章

    39768

    瀏覽量

    301371
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA DRIVE AV軟件平臺與Halos架構助力梅賽德斯奔馳CLA車型獲得最高安全評分

    NVIDIA DRIVE AV 軟件平臺NVIDIA Halos 架構助力 CLA 車型獲得最高安全評分(top safety rating)。
    的頭像 發表于 02-02 09:28 ?1236次閱讀

    生命科學領先企業采用 NVIDIA BioNeMo 平臺加速 AI 驅動的藥物研發

    —— NVIDIA 近日宣布對 NVIDIA BioNeMo? 進行重大擴展, 將通過一個開放式開發平臺支持實現實驗室閉環(lab-in-the-loop)工作流,以推動
    的頭像 發表于 01-14 11:40 ?468次閱讀
    生命科學領先企業采用 <b class='flag-5'>NVIDIA</b> BioNeMo <b class='flag-5'>平臺</b>加速 <b class='flag-5'>AI</b> 驅動的藥物研發

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發

    NVIDIA 最近發布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助 NVID
    的頭像 發表于 12-01 09:25 ?1132次閱讀

    NVIDIA DGX Spark助力構建自己的AI模型

    作為個人 AI 超級計算機,為世界各地的 AI 研究人員、數據科學家和學生提供 NVIDIA Grace Blackwell 平臺的強大功
    的頭像 發表于 11-21 09:25 ?1160次閱讀
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>構建自己的<b class='flag-5'>AI</b>模型

    騰訊地圖推出全新時空智能開放平臺“蓋亞”

    )。 該平臺基于騰訊位置服務開放平臺與位置大數據平臺的底層能力,深度融合騰訊混元大模型與時空動態
    的頭像 發表于 09-18 10:26 ?2024次閱讀

    Arm率先適配騰訊混元開源模型,助力端側AI創新開發

    共同賦能端側人工智能 (AI) 部署,助力本土開發者實現 AI 應用創新! 這次的首日開源適配是雙方再次攜手提升端側應用功能和用戶體驗的又一例證。去年,Arm 將 Arm KleidiAI 技術與
    的頭像 發表于 08-08 09:16 ?1385次閱讀
    Arm率先適配<b class='flag-5'>騰訊</b>混元開源模型,<b class='flag-5'>助力</b>端側<b class='flag-5'>AI</b>創新開發

    NVIDIA AI助力科學研究領域持續突破

    隨著 AI 技術的廣泛應用,AI 正在成為科學研究的引擎。NVIDIA 作為重要的技術推手,持續驅動著 AI 系統解鎖更多領域的科學突破。
    的頭像 發表于 08-05 16:30 ?1185次閱讀

    安森美助力NVIDIA AI系統檢測實驗室

    NVIDIA Halos綜合安全系統,將NVIDIA的汽車硬件、軟件安全解決方案與其自動駕駛汽車安全領域前沿的AI研究相結合。
    的頭像 發表于 07-10 16:21 ?817次閱讀

    NVIDIA AI技術助力歐洲醫療健康行業發展

    從構建全球規模最大的生物多樣性數據庫,到打造賦能罕見病研究AI 工廠,NVIDIAAI 初創企業生態系統正持續為歐洲醫療健康領域注入創新動能。
    的頭像 發表于 06-19 14:40 ?3384次閱讀

    NVIDIA AI如何助力藝術創意落地

    本次 GTC 將在歐洲著名藝術之都巴黎舉辦,特別策劃的藝術畫廊將展示 AI 如何助力創意落地,實現技術與靈感碰撞的愿景。
    的頭像 發表于 06-12 15:26 ?973次閱讀

    NVIDIA助力解決量子計算領域重大挑戰

    NVIDIA 加速量子研究中心提供了強大的工具,助力解決量子計算領域的重大挑戰。
    的頭像 發表于 03-27 09:17 ?1260次閱讀

    NVIDIA AI Enterprise助力AI智能體重構工作模式

    無論是為人道主義援助、客戶服務還是醫療健康而開發,基于NVIDIA AI Enterprise軟件平臺構建的 AI 智能體構成了新型數字勞動力,幫助專業人士以更低的成本、更大的影響力來
    的頭像 發表于 03-25 14:59 ?1042次閱讀

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    和 Renesas一直致力于推動開源生態的發展,并積極合作打造高效、開放的計算平臺。BPI-AI2N & BPI-AI2N Carrier 的發布,不僅為開發者提供了強大的硬
    發表于 03-19 17:54

    Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 與 NVIDIA AI Enterprise 軟件平臺之間的集成,將使 160 多個 AI 工具和 100 多個
    發表于 03-19 15:24 ?577次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作<b class='flag-5'>助力</b>企業加速代理式 <b class='flag-5'>AI</b> 推理

    NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發者和企業提供業務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜任務的高級 AI 智能體。
    發表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出<b class='flag-5'>開放</b>推理 <b class='flag-5'>AI</b> 模型系列,<b class='flag-5'>助力</b>開發者和企業構建代理式 <b class='flag-5'>AI</b> <b class='flag-5'>平臺</b>