国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TensorRT和Triton助力微信OCR降低耗時和成本

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-13 14:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡介

? 本案例中通過NVIDIA T4 GPUTensorRT和Triton, 幫助微信OCR降低整體耗時46%, 并將系統的失敗率降低81%,同時降低了高達78%的服務器數量。

? 本案例主要應用到 NVIDIA GPU ,TensorRT和Triton。

客戶簡介

騰訊微信是一款跨平臺的通訊工具。支持通過手機網絡發送語音、圖片、視頻和文字等。截至2021年6月,微信在全球擁有超過12億活躍用戶,是國內活躍用戶最多的社交軟件。

微信識物是一款主打物品識別的 AI 產品,通過相機拍攝物品,更高效、更智能地獲取信息。2020 年,微信識物拓展了更多識別場景,上線了微信版的圖片搜索。打開微信掃一掃,左滑切換到“識物”功能,對準想要了解的物品正面,可以獲取對應的物品信息,包括物品百科、相關資訊、相關商品

2021年1月, 微信發布的微信8.0,版本更新支持圖片文字提取的功能。用戶在聊天界面和朋友圈中長按圖片就可以提取圖片中文字,然后一鍵轉發、復制或收藏。

挑戰

微信識物包含檢測、圖像召回、信息提煉等環節,OCR主要包括識別和檢測,這兩種應用都有非常大的計算量,在用Pytorch進行模型的推理時,一方面時延特別大,導致用戶體驗受損;另一方面,顯存占用很大,單張NVIDIA T4上部署的模型數比較少,導致推理請求的并發數上不去,請求失敗的概率太高,只能通過增加機器的方式來提高并發能力,業務部署成本較高。再次,使用的模型經常變化,而業務需要更換后的模型能夠快速地加速和上線部署。

方案

基于以上挑戰,騰訊微信選擇了采用NVIDIA 的TensorRT對模型進行推理加速,并利用NVIDIA Triton推理服務器在T4 GPU上進行在線部署,在提升用戶體驗的同時,大幅降低了服務成本。

1、 通過使用TensorRT對微信識物和OCR的模型進行加速,在都使用FP32的情況下,與Pytorch相對,時延降低50%左右。

2、 在OCR的識別和檢測階段,使用TensorRT結合NVIDIA T4 GPU 的FP16 Tensor Core,在保證精度的同時,識別的時延進一步降低了50%,檢測降低了20%。

3、 在微信識物的分類和檢測任務中,通過使用NVIDIA T4 GPU 的int8 Tensor Core,并結合QAT,在滿足精度要求的前提下,進一步大幅提升了性能。

4、 通過使用FP16和int8 低精度模式,在大幅降低推理時延的同時,大大減少了顯存的占用,在FP16模式下,單模型顯存占用僅占FP32模式的40%–50%, 而在int8模式下,單模型顯存占用僅占FP32模式的30%左右。在提高單張T4卡上部署的模型數量的同時,大幅提高了單GPU的推理請求并發能力。

5、 Triton的dynamic batch和多實例等特性,幫助微信將在滿足時延要求的同時,提高了系統整體的并發能力,將系統失敗降低了81%。

6、 TensorRT可以對模型進行快速的加速,Triton則可以對加速后的模型進行快速的部署,滿足了業務對修改后的模型進行快速部署的需求,同時也大大減少了工程人員的工作量。

效果

通過使用NVIDIA的TensorRT對微信識物和OCR的模型進行加速,在降低單次推理時延50%以上的同時,節約了多達64%的顯存。結合Triton的dynamic batch和多實例的功能,OCR的整體時延降低了46%,系統失敗率降低了81%。大大提高了用戶的體驗,并且服務器的數量減少了多達78%,極大降低了服務的成本。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5594

    瀏覽量

    109724
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135438
  • 服務器
    +關注

    關注

    14

    文章

    10253

    瀏覽量

    91484
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    工業級OCR手持終端怎么選?國產OCR智能識別pda實測

    工業環境專用OCR智能PDA怎么選?鳥鳥科技N70Socr具備IP67防塵防水+1.5米抗跌落,5000mAh可拆卸電池支持24小時輪班作業。專業OCR掃描頭+斑馬/霍尼二維碼引擎雙模組,285g人體工學設計,讓高強度數據采集更輕松。點擊查看詳細防護測試與續航實測數據!
    的頭像 發表于 02-07 17:45 ?215次閱讀
    工業級<b class='flag-5'>OCR</b>手持終端怎么選?國產<b class='flag-5'>OCR</b>智能識別pda實測

    愛芯與工部電子第五研究所達成戰略合作

    近日,無錫中愛芯電子有限公司與工部電子第五研究所(中國賽寶實驗室)正式簽署車規項目全面合作協議,標志著國產芯片企業與權威技術機構深度攜手,共同為車規級芯片產業筑牢質量根基,助力汽車電子產業鏈自主可控。
    的頭像 發表于 02-06 14:16 ?402次閱讀

    HarmonyOS首登公開課,分享跨平臺適配與體驗提升實踐經驗

    近日,2026公開課PRO在廣州舉行。值得關注的是,HarmonyOS開發專家首次以官方分享嘉賓身份亮相開發者專場,并圍繞“跨平臺適配與體驗提升”這一主題,深入剖析了小程序在跨
    的頭像 發表于 02-02 09:22 ?302次閱讀
    HarmonyOS首登<b class='flag-5'>微</b><b class='flag-5'>信</b>公開課,分享跨平臺適配與體驗提升實踐經驗

    DeepX OCR:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規模化的高性能 OCR 能力

    落地過程中,企業逐漸意識到:** 制約 OCR 應用進一步擴展的核心因素,已不再是模型準確率本身,而是整體推理性能與部署成本。 具體來說,規模化 OCR 應用主要面臨以下幾方面挑戰: 吞吐量(FPS)不足 ,難以支撐高并發或多路
    的頭像 發表于 01-22 21:02 ?151次閱讀
    DeepX <b class='flag-5'>OCR</b>:以 DeepX NPU 加速 PaddleOCR 推理,在 ARM 與 x86 平臺交付可規模化的高性能 <b class='flag-5'>OCR</b> 能力

    瑞芯(EASY EAI)RV1126B OCR文字識別

    1.OCR文字識別簡介文字識別也是圖像領域一個常見問題。然而,對于自然場景圖像,首先要定位圖像中的文字位置,然后才能進行文字的識別。所以一般包含兩個步驟:文字檢測:解決的問題是哪里有文字,文字的范圍
    的頭像 發表于 01-12 10:19 ?5722次閱讀
    瑞芯<b class='flag-5'>微</b>(EASY EAI)RV1126B <b class='flag-5'>OCR</b>文字識別

    TensorRT-LLM的大規模專家并行架構設計

    之前文章已介紹引入大規模 EP 的初衷,本篇將繼續深入介紹 TensorRT-LLM 的大規模專家并行架構設計與創新實現。
    的頭像 發表于 09-23 14:42 ?1107次閱讀
    <b class='flag-5'>TensorRT</b>-LLM的大規模專家并行架構設計

    小語種OCR標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰解析

    摘要 :小語種OCR研發的核心瓶頸在于高質量標注數據的稀缺與高昂成本。本文介紹一種創新的自動化標注方案,利用 PaddleOCR 進行文本檢測與裁剪,并調用 ERNIE 4.5 大模型進行雙重預測
    的頭像 發表于 08-29 11:26 ?3638次閱讀
    小語種<b class='flag-5'>OCR</b>標注效率提升10+倍:PaddleOCR+ERNIE 4.5自動標注實戰解析

    鴻蒙系統怎么安裝企業

    系統自帶的應用市場中無法下載企業,卓易通中的無法用登錄,使用不了
    發表于 08-26 15:43

    如何利用OCR技術實現高效集裝箱箱號識別?

    在現代物流和海關監管領域,快速準確地識別集裝箱箱號是提升通關效率、降低運營成本的關鍵。OCR(光學字符識別)技術的應用,為這一需求提供了智能化解決方案。通過結合高清成像設備和先進的算法,OCR
    的頭像 發表于 08-12 10:48 ?864次閱讀
    如何利用<b class='flag-5'>OCR</b>技術實現高效集裝箱箱號識別?

    小程序+淘寶API,無縫購物體驗提升復購率!

    ? 在當今電商競爭激烈的時代,消費者渴望更便捷、流暢的購物體驗。作為中國最大的社交平臺,擁有龐大的用戶基礎;淘寶則是電商巨頭,提供豐富的商品資源。通過將小程序與淘寶API無縫整
    的頭像 發表于 07-29 14:35 ?676次閱讀
    <b class='flag-5'>微</b><b class='flag-5'>信</b>小程序+淘寶API,無縫購物體驗提升復購率!

    進迭時空同構融合RISC-V AI CPU的Triton算子編譯器實踐

    Triton是由OpenAI開發的一個開源編程語言和編譯器,旨在簡化高性能GPU內核的編寫。它提供了類似Python的語法,并通過高級抽象降低了GPU編程的復雜性,同時保持了高性能。目前
    的頭像 發表于 07-15 09:04 ?1851次閱讀
    進迭時空同構融合RISC-V AI CPU的<b class='flag-5'>Triton</b>算子編譯器實踐

    使用NVIDIA TritonTensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA TritonTensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發表于 06-12 15:37 ?1877次閱讀
    使用NVIDIA <b class='flag-5'>Triton</b>和<b class='flag-5'>TensorRT</b>-LLM部署TTS應用的最佳實踐

    OCR識別訓練完成后給的是空壓縮包,為什么?

    OCR識別 一共弄了26張圖片,都標注好了,點擊開始訓練,顯示訓練成功了,也將壓縮包發到郵箱了,下載下來后,壓縮包里面是空的 OCR圖片20幾張圖太少了。麻煩您多添加點,參考我們的ocr識別訓練數據集 請問訓練id是?
    發表于 05-28 06:46

    高能耗時代,安科瑞能量管理系統如何化解電網能量管理難題?

    電網技術的提出,為高效利用這些新能源電力提供了重要的技術方向。? 一、高能耗時代,電網能量管理面臨哪些挑戰? 在當今高能耗時代,電網能量管理正面臨著諸多嚴峻挑戰,這些挑戰猶如一道道
    的頭像 發表于 04-01 16:12 ?775次閱讀
    高能<b class='flag-5'>耗時</b>代,安科瑞能量管理系統如何化解<b class='flag-5'>微</b>電網能量管理難題?