国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何降低開發門檻助力音視頻創新玩法

華為麒麟 ? 來源:華為麒麟 ? 作者:華為麒麟 ? 2021-09-28 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

9月16日,華為多媒體管線服務(AV Pipeline Kit)技術直播正式開啟。華為多媒體管線服務產品經理Michelle、華為多媒體技術專家Salvatore、華為計算機視覺算法專家Ting、和華為AI技術專家Eric相聚直播間,深度解析了AV Pipeline Kit的技術要點和應用場景,助力廣大音視頻開發者以更輕松更高效的方式,為用戶提供新玩法,新交互。

緣起:音視頻開發面臨諸多挑戰,麒麟協同各團隊力量推AV Pipeline Kit

隨著寬帶提速,5G 普及,AI技術應用,用戶對網絡視頻的內容、互動性、播放速度和清晰度的要求越來越高。相應的,多媒體開發呈現出實時化和智能化的趨勢,開發者在開發與管理過程中,面臨更高的技術門檻、更多的開發工作量等諸多挑戰。

其一,開發難度進一步加大,開發成本更高。很多視頻+AI的開發,需要在傳統管線中加入AI處理技術,這涉及到諸多數據處理能力,對于開發者來說技術門檻很高。

其二,端側實時化的智能視頻開發可能會遇到算力和功耗的限制。以端側超分為例,手機端算力比較受限,而視頻逐幀的超分實時處理對時延和功耗的要求是極高的。此外,視頻解碼后的數據要拿去做超分,就涉及到數據在不同IP之間的流轉和拷貝,會影響功耗,導致手機發燙。

以上諸多痛點,阻礙了開發者創新的腳步。為此,麒麟團隊整合了各個部門的能力,包括多媒體團隊、NPU團隊以及算法團隊,在今年7月份推出了華為多媒體管線服務(AV Pipeline Kit)。AV Pipeline Kit是一個面向安卓開發者的多媒體開放能力體系,它包含一個輕量級的多媒體開發框架和一系列高性能的音視頻處理插件,幫助開發者們降低開發難度,讓開發者們可以通過自定義流水線編排,將多種高性能插件快速集成到應用中,輕松實現更加豐富的多媒體功能。

輕量化設計:“拼樂高”式的流水線編排,助力開發者高效開發

在AV Pipeline Kit多媒體開發框架中,包含了多個預置的流水線編排,即一些現成的開箱即用的業務場景,被封裝成了接口供直接調用;同時也支持自定義流水線編排,將不同插件按不同的連接關系串聯起來形成新的業務場景。

如何簡單理解流水線編排的過程呢?以視頻超分為例,按照插件之間的處理順序來看,首先是一個音視頻的解封裝過程,然后會經歷音視頻的解碼,而后解碼視頻幀會進行視頻超分處理,最后進行送顯。從輸入到輸出,可以看成是一個流水線的過程。

談及流水線編排的設計思路,華為多媒體技術專家Salvator表示,首先是對業務進行抽象,然后把它分割成子過程,對子過程再進行一個抽象,實現具體的插件,最后再把插件用Pipeline的方式拼接起來。這樣的好處一方面是便于統一管理,另一方面提高了復用度。

這個過程可以簡單理解為拼樂高,一個個插件就是一個個不同形狀的樂高片,開發者的業務就像搭樂高一樣,不同的開發者可以從插件庫里選擇需要的插件,拼成想要的業務場景。AV Pipeline Kit定義了一套插件標準接口,開發者只需要繼承這個接口類,并實現初始化和數據處理相關的邏輯即可,無需考慮并發、線程同步、狀態轉移、buffer池管理、多實例等問題,這些已經全部由框架層實現好了。

突破:視頻超分,最高3倍超分效果背后的技術優勢

所謂“超分”,可以理解為在視頻播放過程中進行智能識別與銳度優化,從而讓視頻看起來比原本更清晰、明麗。在大型影視和游戲制作中,超分是一種非常關鍵的技術。想要在端側在線場景中,幫助開發者獲得實時化、高性能、低功耗的超分,就需要從AI技術到硬件資源調用的一系列優化。

據華為計算機視覺算法專家Ting介紹,AV Pipeline Kit提供傳統的GPU超分方案和AI超分方案兩種,以達到性能和功耗的平衡。“比如我們檢測到在麒麟高端芯片上,就會優先采用NPU的AI超分算法,最高可實現3倍的超分效果。如果沒有NPU的硬件,我們就會選擇GPU方案做超分處理,效果可能會有一些下降,但性能上是滿足了實時性要求的。”

為了幫助開發者便捷獲取真實可用的逐幀超分能力,實現超分不卡頓的體驗,AV Pipeline Kit首先在機器視覺算法上進行了一系列技術突破。比如,在AI模型結構上應用了卷積神經網絡,提升了復雜真實場景的超分效果;在數據工程方面,用一系列方法還原了多媒體數據的構造過程,提升網絡的優化結果;在端側模型壓縮方面,進行了新的網絡小型化探索,確保超分效果可以在端側場景中被很好地執行。

其次,為了兼顧高性能與低功耗,AV Pipeline Kit和華為 HiAI Foundation之間也有不少配合。據華為AI技術專家Eric介紹,華為HiAI Foundation作為NPU使能的基礎平臺,能夠快速將原始模型轉換成華為Davinci Model,并通過Davinci Model的調優技術,優化模型結構,充分發揮NPU硬件單元的算力,令模型算子以更低功耗在手機端側高效運轉。

在超分業務中,內存DDR的頻繁讀寫對性能和功耗都是很大的挑戰。HiAI Foudation算子庫在優化模型執行時,重點對算力和帶寬利用做了平衡,在滿足業務要求的算力情況下,盡可能的減少對于內存的反復讀寫,更多的利用內部buffer和cache,極大地提供了性能,降低了功耗。

在一系列的技術突破之后,用戶可以獲得更好的畫質體驗,視頻平臺可以節省帶寬和服務器資源,開發者則能夠高效集成業務,降低工作量。

突破:聲音事件檢測,為實現98%識別率攻克的技術難題

對于開發者來說,聲音事件檢測是相對比較復雜的技術,需要豐富的技術資源與開發經驗。AV Pipeline Kit將這些功能以文件配置的形式直接帶給開發者,且經過麒麟團隊的長期深耕,聲音檢測事件插件可以確保聲音識別的準確與穩定。

目前,AV Pipeline Kit聲音事件檢測目前已經可以支持日常使用的13種聲音,包括無障礙功能、健康檢測、輔助安全駕駛、安全防盜、事故報警防剮蹭、停車啟動安全等豐富的場景。經過研發團隊的深度優化和組合驗證,當前識別準確率平均在98%以上,無論從聲音事件類別還是識別性能上來看,都屬于業界領先。

據華為計算機視覺算法專家Ting介紹,團隊主要聚焦在兩個點上做突破,確保了聲音識別的準確及穩定性。一是解決了不同聲音事件的時間片段的長短。不同聲音事件長短不同,比如孩子的哭聲以及寵物叫聲,貓叫狗叫是瞬發型的,而哭是一個持續性的動作,所以他們的事件片段,時間片和長短是不一樣的,聲音事件檢測插件在設計網絡的時候,參考了Inception網絡,計算多個不同大小的卷積,這樣感受野就不同,進而提出的特征就更加具有針對性,特征空間更加豐富。

二是易混淆類別頻譜的區分。有一些聲音事件的混淆度比較高,比如在某些情況下小孩的哭聲和貓叫聲相當接近,無論是人區分以及轉化為頻譜信息之后去查看,都很容易混淆。聲音事件檢測插件引入技術注意力機制,對易混淆的類別做一個區分。

面向未來:

深挖視頻播放、編輯場景,為開發者提供創新能力

最后,華為多媒體技術專家Salvatore表示,AV Pipeline Kit后續會繼續完善框架和插件,重點關注如視頻播放、視頻編輯等對性能要求比較高,對功耗比較敏感的場景,包括考慮預置錄制和編輯業務,以及與人像拍攝美化相關的插件能力。

未來,麒麟團隊將持續投入核心技術,突破技術難點,簡化底層開發繁瑣流程和難點,降低智能化視頻開發的門檻,助力音視頻開發者技術創新,在激烈的競爭角逐中取勝。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DDR
    DDR
    +關注

    關注

    11

    文章

    754

    瀏覽量

    69125
  • 帶寬
    +關注

    關注

    3

    文章

    1040

    瀏覽量

    43370
  • 服務器
    +關注

    關注

    14

    文章

    10253

    瀏覽量

    91489
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301424
  • AV
    AV
    +關注

    關注

    2

    文章

    269

    瀏覽量

    45318

原文標題:如何降低開發門檻,助力音視頻創新玩法?AV Pipeline Kit深度技術解析

文章出處:【微信號:Huawei_Kirin,微信公眾號:華為麒麟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從 “卡脖子” 到 “自主可控”,音視頻分布式系統國產化實踐之路

    在當前全球音視頻芯片市場格局中,國外企業長期占據主導地位,核心技術與核心器件的壟斷的局面,曾是國內音視頻行業發展的重要制約因素。近年來,隨著國際形勢的深刻變化,國外對我國芯片行業的技術封鎖與市場打壓
    的頭像 發表于 03-02 11:18 ?56次閱讀
    從 “卡脖子” 到 “自主可控”,<b class='flag-5'>音視頻</b>分布式系統國產化實踐之路

    2025年中國音視頻產業十大創新進展

    2021-2025年中國音視頻產業取得“萬億顯示 + 6 萬億產業鏈”1規模佳績,成為制造強國建設的核心支柱。產業立足規模優勢、響應“質量領跑”號召,在標準、芯片、應用、AI賦能等領域,以創新為抓手促內需、強產業。
    的頭像 發表于 01-04 16:04 ?920次閱讀

    洲明科技榮獲2025年度音視頻行業品牌評選九項大獎

    2025年12月20日,由DAV數字音視工程網與《數字音視工程》雜志聯合主辦的第17屆音視頻行業品牌評選結果正式揭曉。
    的頭像 發表于 12-28 11:45 ?671次閱讀

    打破國外壟斷!自主分布式音視頻方案筑牢行業安全根基

    在當前的全球音視頻芯片市場中,國外公司一直占據著主導地位,然而,近年來國外對中國芯片行業的打壓讓國內音視頻行業的發展面臨了巨大的挑戰。在這樣的背景下,國內領先的音視頻技術企業挺身而出,成功完成
    的頭像 發表于 12-19 11:28 ?373次閱讀
    打破國外壟斷!自主分布式<b class='flag-5'>音視頻</b>方案筑牢行業安全根基

    專業音視頻板卡核心接口科普 + 產品優劣全解析

    在航空航天、工業測控、多屏監控等專業場景中,音視頻板卡的接口類型直接決定信號傳輸質量與應用適配性,而板卡本身的性能參數則影響系統穩定性與拓展性。本文將結合 8 款專業板卡(CPCI/PXIe 系列
    的頭像 發表于 12-11 17:09 ?803次閱讀

    三款PXIe板卡科普:解鎖專業音視頻處理的核心力量

    一、KS-PXIe638:8通道音視頻采集的“數據捕捉能手” 在航空航天測控、工業自動化等對數據采集精度要求極高的領域,一款穩定高效的音視頻采集板卡至關重要,KS-PXIe638型8通道音視頻采集板
    的頭像 發表于 12-04 17:04 ?845次閱讀
    三款PXIe板卡科普:解鎖專業<b class='flag-5'>音視頻</b>處理的核心力量

    KS-PXIe638 型 8 通道音視頻采集板:高清同步采集,專業場景 “性能標桿”

    在航空航天的數據記錄、工業測控的實時監測、交通控制的畫面留存等專業場景中,多通道、高保真的音視頻采集是核心訴求 ——KS-PXIe638 型 8 通道音視頻采集板,依托高速 FPGA 架構,以 8
    的頭像 發表于 11-26 13:24 ?449次閱讀
    KS-PXIe638 型 8 通道<b class='flag-5'>音視頻</b>采集板:高清同步采集,專業場景 “性能標桿”

    音視頻編解碼封裝解封裝部件介紹

    是否有探索開源鴻蒙音視頻編解碼技術的欲望?是否對開源鴻蒙音視頻編解碼格式支持有訴求?別急——今天這份開源鴻蒙AVCodec Kit介紹文章,就是解答疑惑的指南!參考這份指南,可以使用開源鴻蒙的音視頻編解碼能力,進行應用
    的頭像 發表于 10-31 09:15 ?500次閱讀
    <b class='flag-5'>音視頻</b>編解碼封裝解封裝部件介紹

    從 “單一控制” 到 “智能可視”:分布式系統與傳統音視頻控制系統的關鍵區別

    分布式可視化控制系統與傳統的音視頻控制系統的區別主要體現在以下幾個方面: 1.系統架構:分布式可視化控制系統采用分布式架構,將音視頻處理、數據通信等功能分散到多個節點上,各個節點之間通過網絡進行連接
    的頭像 發表于 10-21 10:52 ?394次閱讀

    音視頻開發全棧解析

    Media Kit 讓開發者可以調用系統的音視頻能力,涵蓋播放、錄制、錄屏、元數據提取與轉碼六大核心功能模塊,支撐系統應用與第三方應用在視頻播放、內容創作、教學錄屏、直播互動等典型場景下的音視
    的頭像 發表于 09-18 14:42 ?847次閱讀
    <b class='flag-5'>音視頻</b><b class='flag-5'>開發</b>全棧解析

    千視電子受邀亮相2025音視頻產業鏈研討會,引領全鏈路音視頻IP化新趨勢

    2025年8月22日,由中國電子音響行業協會和湖南省工業和信息化廳聯合主辦的“2025音視頻產業鏈發展研討暨對接會”在長沙舉行。活動匯聚音視頻產業鏈上下游企業,以及長沙市相關政府領導與行業
    的頭像 發表于 08-27 11:33 ?1348次閱讀
    千視電子受邀亮相2025<b class='flag-5'>音視頻</b>產業鏈研討會,引領全鏈路<b class='flag-5'>音視頻</b>IP化新趨勢

    泰芯半導體推出星閃音視頻無線SOC芯片TXW828

    ,以技術創新突破行業邊界,為智能終端設備帶來革命性音視頻處理方案,標志著無線音視頻傳輸正式邁入“超高速、低時延、高可靠”的新紀元。
    的頭像 發表于 06-20 15:51 ?2757次閱讀

    中國音視頻產業邁向高質量發展

    隨著超高清先鋒計劃的逐步推進,截至2024年底,中國音視頻產業規模超5萬億,包括個人消費電子、家庭影音娛樂、行業多媒體應用及車載視聽產業和相關衍生應用等行業企業超過百萬家,音視頻產業已經成為國家數字經濟發展的重要支柱。
    的頭像 發表于 04-24 11:10 ?1276次閱讀

    音視頻一體化解決方案

    隨著數字化轉型加速,音視頻技術在各行業深度應用,傳統音視頻分散式管理系統面臨多源異構設備接入困難、數據孤島林立、運維復雜、協作效率低下等挑戰,各行業對信息技術的需求逐漸從單一化向集成化、系統化轉變
    的頭像 發表于 04-24 09:14 ?1139次閱讀

    2025年6月2日起,印度尼西亞對音視頻產品實施強制SNI認證!

    印度尼西亞/強制實施音視頻產品SNI認證2025年6月2日正式生效2024年11月13日,印度尼西亞工業部(MoI)頒布了第75號工業部條例《關于強制實施音視頻產品國家標準
    的頭像 發表于 03-14 17:37 ?3120次閱讀
    2025年6月2日起,印度尼西亞對<b class='flag-5'>音視頻</b>產品實施強制SNI認證!