国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力騰訊AI LAB打造一體AI生態

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡介

? 本案例中通過使用NVIDIA T4 GPUTensorRT,OpenGL,CUDA, CUDA/OpenGL interoperability等GPU軟件技術棧,助力騰訊AI LAB虛擬人項目在人臉生成階段達到了超過3倍的加速。

? 本案例主要應用到 NVIDIA T4 GPU,TensorRT, OpenGL,CUDA, CUDA/OpenGL interoperability等AI加速平臺。

客戶簡介及應用背景

騰訊AI LAB致力于打造產學研用一體的 AI 生態,主要的研究方向包括計算機視覺語音識別、自然語言處理和機器學習,結合騰訊場景與業務優勢,在社交AI,游戲AI,內容AI及平臺AI等領域取得了顯著的成果,技術被應用于微信、QQ、天天快報和QQ音樂等上百個騰訊產品。其中圍棋AI “絕藝” 多次獲得世界人工智能圍棋大賽的冠軍。

騰訊AI LAB打造的虛擬人,具有自然,生動且飽含情緒的表情,其背后由一套騰訊 AI Lab 自研的復雜系統支撐,系統首先要從文本中提取不同信息,包括表情、情感、重音位置、和激動程度等;之后,這些信息被輸入到模型中生成,再同步生成語音、口型和表情參數,最終才有了虛擬人自然生動的表現。

客戶挑戰

根據虛擬人物需要表達的語言和情感,生成自然生動的人臉,是打造虛擬人重要的一個階段。需要先渲染人臉的紋理圖和渲染圖,并將它們輸入到深度學習模型中,最終生成自然生動的人臉。在這個過程中,需要用到OpenGL、OpenCV、CUDA、TensorFlow等軟件技術,騰訊原有的方案有很多CPU與GPU的數據交互,且有很多計算型的操作通過CPU來實現,效率非常低下, 無論是吞吐還是延時都不滿足要求,具體體現在:

OpenGL在GPU上渲染好圖像繪制到framebuffer后,需要先用glReadPixels拷貝數據到CPU,再用cudaMemcpy將數據從CPU拷回到GPU以進行深度學習模型的推理,這里有兩次不必要的CPU與GPU之間的數據傳輸。

顏色空間轉換,深度學習推理的前后處理等操作在CPU上完成,效率非常低下。

應用方案

NVIDIA 技術在虛擬人項目的渲染和推理階段均提供了強大的支持。在渲染階段,NVIDIA 助力提升了顏色空間轉換效率,降低整體延時,主要體現在:

用NVIDIA CUDA/OpenGL interoperability 代替騰訊之前使用glReadPixels在CUDA和OpenGL之間拷貝數據的方案,大幅減少了CPU和GPU之間的數據拷貝,從而降低了整體的延時。

把原來在CPU上做的顏色空間轉換的操作,遷移到NVIDIA T4 GPU上用CUDA kernel實現,利用GPU的并行優勢,大大提高了顏色空間轉換的效率,進一步降低了整體的延時。

將多幀的mesh組成一個batch分別繪制到framebuffer的不同區域,在提高OpenGL并行度的同時,給下一階段的深度學習模型的推理提供了更大的輸入數據的batch size,充分發揮NVIDIA T4 GPU高并發計算的優勢,進一步提高GPU的利用率,從而提高整體的吞吐。

在推理階段,NVIDIA助力提高推理整體吞吐,降低推理延時,主要體現在以下幾點:用NVIDIA TensorRT替換TensorFlow對模型推理進行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進一步提升推理的吞吐,降低推理延時。

用NVIDIA TensorRT替換TensorFlow對模型推理進行加速,并利用NVIDIA T4 GPU上的FP16 Tensor Core可以極大提高矩陣乘等操作速度的特性,在最終視覺效果幾乎不變的情況下,進一步提升推理的吞吐,降低推理延時。

在NVIDIA T4 GPU上利用CUDA kernel 替代原始流程中在CPU上使用OpenCV實現 Mat-to-Tensor 和 Tensor-to-Mat 等格式轉換操作,并使用OpenCV-CUDA版替換OpenCV-CPU版的部分操作(如Resize等),充分發揮GPU相對于CPU更高的并發優勢,在加速這些操作的同時減少GPU到CPU的數據傳輸通信量,提高格式轉換效率,降低端到端的推理延時。

通過Pipeline的方式,使GPU和CPU上的操作進行overlap,并結合NVIDIA的MPS技術提高單卡上多個進程同時處理多個數據流的同時提高整體的吞吐。

使用效果及影響

在虛擬人項目中,NVIDIA CUDA技術大幅提升了渲染速度,NVIDIA TensorRT 方便快速地加速深度學習模型的推理,結合MPS技術,實現了單卡多路推流,使整體推理效率達到了原來的三倍!性能的大幅提升,既提升了GPU的利用率,又降低了AI技術的使用成本。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109743
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135461
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301427
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    生命科學領先企業采用 NVIDIA BioNeMo 平臺加速 AI 驅動的藥物研發

    —— NVIDIA 近日宣布對 NVIDIA BioNeMo? 進行重大擴展, 將通過個開放式開發平臺支持實現實驗室閉環(lab-in-the-loop)工作流,以推動
    的頭像 發表于 01-14 11:40 ?473次閱讀
    生命科學領先企業采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺加速 <b class='flag-5'>AI</b> 驅動的藥物研發

    NVIDIA Spectrum-X以太網硅光技術助力AI工廠網絡創新

    NVIDIA 將率先為 AI 工廠引入采用光電一體封裝 (CPO) 的優化以太網網絡,通過 NVIDIA Spectrum-X 以太網硅光技術,為
    的頭像 發表于 01-14 09:06 ?612次閱讀
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太網硅光技術<b class='flag-5'>助力</b><b class='flag-5'>AI</b>工廠網絡創新

    南京微雀與華為打造法律AI一體機聯合解決方案

    站式“行業+AI”解決方案,讓服務更精準、決策更高效、治理更智能。本期將重點呈現南京微雀與華為共同打造的法律AI一體機聯合解決方案,讓我們
    的頭像 發表于 10-24 09:23 ?927次閱讀
    南京微雀與華為<b class='flag-5'>打造</b>法律<b class='flag-5'>AI</b><b class='flag-5'>一體</b>機聯合解決方案

    BPI-AIM7 RK3588 AINvidia Jetson Nano 生態系統兼容的低功耗 AI 模塊

    應用。 []() AIM-IO是款專為 Jetson Nano 生態系統設計的開源擴展板。它與 RK3588 AI Module7 配合使用,為您提供個微型
    發表于 10-11 09:08

    基于飛騰騰云S5000C打造的多款AI一體機亮相WAIC

    第七屆世界人工智能大會(WAIC)7月26日在上海拉開大幕,飛騰攜手合作伙伴在核心技術館(H1館)全面展示了 “云邊端” 一體化智算方案,基于飛騰騰云 S5000C 打造的多款 AI 一體
    的頭像 發表于 07-29 17:33 ?2608次閱讀
    基于飛騰騰云S5000C<b class='flag-5'>打造</b>的多款<b class='flag-5'>AI</b><b class='flag-5'>一體</b>機亮相WAIC

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦下?

    大家都在用什么AI軟件?有沒有好用的免費的AI軟件推薦下?直接發個安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    發表于 07-09 18:30

    IQVIA和NVIDIA合作推出多款AI Orchestrator智能

    IQVIA 發布由 IQVIA Connected Intelligence 和 NVIDIA AI Foundry 提供技術支持的 AI Orchestrator 智能,提升臨床試
    的頭像 發表于 06-19 14:43 ?1287次閱讀

    NVIDIA AI技術助力歐洲醫療健康行業發展

    從構建全球規模最大的生物多樣性數據庫,到打造賦能罕見病研究的 AI 工廠,NVIDIAAI 初創企業生態系統正持續為歐洲醫療健康領域注
    的頭像 發表于 06-19 14:40 ?3388次閱讀

    NVIDIA技術助力企業創建主權AI智能

    AI Factory 的經驗證設計將加速基礎設施與軟件(包括全新 NVIDIA NIM 微服務和經擴展的 NVIDIA Blueprint)相結合,為各國和企業簡化了全棧式 AI 開發
    的頭像 發表于 06-16 14:28 ?1346次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    套件2.0,打造整套圍繞AI開發效率與落地路徑展開的“系統性解法”,為開發者提供了AI應用開發工具全家桶。同時,全新升級的旗艦5G智能
    發表于 04-13 19:52

    硅基覺醒已至前夜,聯發科攜手生態加速智能化用戶體驗時代到來

    、適配與部署;Dimensity Profiler提供深層調試能力;而天璣AI開發套件2.0則在模型規模、訓練性能與平臺接口全面升級,為開發者打造從芯片到底層算法的閉環支持。 駛向AI
    發表于 04-13 19:51

    Banana Pi 發布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    和 Renesas直致力于推動開源生態的發展,并積極合作打造高效、開放的計算平臺。BPI-AI2N & BPI-AI2N Car
    發表于 03-19 17:54

    NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發者和企業提供業務就緒型基礎,助力構建能夠獨立工作或以團隊形式完成復雜任務的高級 AI 智能
    發表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 <b class='flag-5'>AI</b> 模型系列,<b class='flag-5'>助力</b>開發者和企業構建代理式 <b class='flag-5'>AI</b> 平臺

    《零基礎開發AI Agent——手把手教你用扣子做智能

    《零基礎開發AI Agent——手把手教你用扣子做智能》是本為普通人量身打造AI開發指南。它不僅深入淺出地講解了Agent的概念和發展
    發表于 03-18 12:03

    夜爆火的DeepSeek一體機,如何改寫AI游戲規則?

    夜爆火的DeepSeek一體機,如何改寫AI游戲規則? 過去個多月,科技圈有個“新晉頂流”C位出道,名字叫DeepSeek一體機。 它火
    的頭像 發表于 03-11 15:52 ?1207次閱讀
    <b class='flag-5'>一</b>夜爆火的DeepSeek<b class='flag-5'>一體</b>機,如何改寫<b class='flag-5'>AI</b>游戲規則?