国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI提供更好的視頻溝通體驗(yàn),GAN消除視頻通話(huà)中的抖動(dòng)

火花 ? 來(lái)源:IT專(zhuān)家網(wǎng) ? 作者:火花 ? 2020-10-22 12:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Maxine是一款云AI視頻流平臺(tái),將使用GAN來(lái)提高帶寬性能

Ming-Yu Liu 和Arun Mallya 正在進(jìn)行視頻通話(huà),其中一個(gè)人的畫(huà)面開(kāi)始出現(xiàn)卡頓,直至畫(huà)面定格。這是一種常見(jiàn)且令人反感的情況。但與大多數(shù)人不同的是,Liu和Mallya可以做出一些改變。他們是NVIDIA的AI研究人員,專(zhuān)攻計(jì)算機(jī)視覺(jué)。在與Ting-Chun Wang共事中,他們意識(shí)到可以使用神經(jīng)網(wǎng)絡(luò)來(lái)替代被稱(chēng)為視頻編解碼器的軟件,這種軟件通常用于視頻在網(wǎng)絡(luò)傳輸過(guò)程中的壓縮和解壓縮。

迄今為止,他們的工作成果將用戶(hù)在視頻通話(huà)時(shí)所需的網(wǎng)絡(luò)帶寬壓縮至原來(lái)的十分之一,還有望將帶寬消耗降低數(shù)個(gè)數(shù)量級(jí)。Mallya表示:“我們希望通過(guò)AI提供更好的視頻溝通體驗(yàn),即使在帶寬極低的情況下,也可以從語(yǔ)音升級(jí)到視頻通話(huà)?!?/span>

GAN讓連接質(zhì)量更佳

即使用戶(hù)的面部有遮擋(比如戴著帽子、眼鏡、耳機(jī)或口罩),這項(xiàng)技術(shù)同樣適用。為了增加趣味性,他們?cè)谘菔局惺褂昧艘恍┭b飾物,這樣用戶(hù)可以在線(xiàn)上更改其發(fā)型或衣服或者創(chuàng)建頭像。更重要的是,如上圖所示,借助神經(jīng)網(wǎng)絡(luò)定位,無(wú)需再盯著顯示器上方攝像頭才能與對(duì)方對(duì)視,這增強(qiáng)了面對(duì)面對(duì)話(huà)的感覺(jué)。Wang表示:“借助計(jì)算機(jī)視覺(jué)技術(shù),我們可以從多個(gè)角度來(lái)定位頭部。我們認(rèn)為這將幫助人們更自然地進(jìn)行對(duì)話(huà)?!?/span>迎接最前沿的AI技術(shù),讓虛擬生活更真實(shí)。

AI賦能視頻通話(huà)的原理

AI輔助視頻通話(huà)的工作機(jī)制十分簡(jiǎn)單。與目前使用壓縮的視頻流的系統(tǒng)類(lèi)似,參考圖像發(fā)送后,僅用戶(hù)眼睛、鼻子和嘴巴周?chē)鷰讉€(gè)關(guān)鍵點(diǎn)的位置數(shù)據(jù)被發(fā)送,而非發(fā)送大量壓縮過(guò)像素的圖像。接收端的生成式對(duì)抗網(wǎng)絡(luò)通過(guò)初始圖像和面部關(guān)鍵點(diǎn),在本地GPU上重構(gòu)后續(xù)圖像。因此,通過(guò)網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)要比之前少得多。

Liu在GAN領(lǐng)域的工作成果GauGAN曾引發(fā)關(guān)注。GauGAN是一種可以將涂鴉轉(zhuǎn)化為寫(xiě)實(shí)藝術(shù)作品的AI工具,目前已經(jīng)創(chuàng)建了超過(guò)一百萬(wàn)張圖像。該工具可在AI Playground中獲取。Liu表示:“疫情期間頻繁的視頻會(huì)議啟發(fā)了我們,因此我們開(kāi)始探索突破帶寬瓶頸的方式,讓供應(yīng)商可以同時(shí)為更多人提供服務(wù)?!?/span>

GPU突破帶寬瓶頸

這一方法順應(yīng)當(dāng)前行業(yè)趨勢(shì),將網(wǎng)絡(luò)瓶頸轉(zhuǎn)化為計(jì)算任務(wù),從而借助本地或云端資源更輕松地解決此類(lèi)問(wèn)題。NVIDIA媒體集團(tuán)高級(jí)產(chǎn)品總監(jiān)Andrew Page表示:“如今,許多公司希望將帶寬問(wèn)題轉(zhuǎn)化為計(jì)算問(wèn)題,這是因?yàn)閹捯话愫茈y增加,而增強(qiáng)算力則相對(duì)容易?!?/span>

NVIDIA Maxine搭配了一套視頻會(huì)議和流媒體服務(wù)工具

AI 工具優(yōu)化視頻服務(wù)

GAN視頻壓縮是NVIDIA Maxine即將推出的幾個(gè)功能之一,這是一個(gè)云AI視頻流平臺(tái),用于增強(qiáng)視頻會(huì)議和電話(huà)質(zhì)量。它將音頻、視頻和對(duì)話(huà)式AI功能整合在一個(gè)工具包中,并支持多種設(shè)備。在上周的GTC大會(huì)上,NVIDIA宣布推出了Maxine平臺(tái)?;谠撈脚_(tái),服務(wù)提供商能夠在提供超高分辨率的視頻的同時(shí),實(shí)現(xiàn)實(shí)時(shí)翻譯、噪聲消除和情景感知的閉路字幕。用戶(hù)可以享受到人臉校正、虛擬助手和化身逼真的動(dòng)畫(huà)角色等功能。

Page表示:“視頻會(huì)議正在經(jīng)歷一場(chǎng)復(fù)興。疫情期間,它的缺點(diǎn)給所有人帶來(lái)了不愉快的使用體驗(yàn),但回歸視覺(jué)動(dòng)物的屬性,視頻終將成為人們今后生活中的一部分。”通過(guò)利用基于Tensor Core核心的NVIDIA GPU,Maxine可運(yùn)行如NVIDIA Jarvis的軟件。NVIDIA Jarvis是用于對(duì)話(huà)式AI的SDK,提供了一套語(yǔ)音和文本功能。 它們共同提供了當(dāng)今有用的AI功能,并成為未來(lái)視頻產(chǎn)品和服務(wù)的基石。

fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301405
  • 視頻通話(huà)
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    12392
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    CDC7005:高性能時(shí)鐘合成器與抖動(dòng)消除

    CDC7005:高性能時(shí)鐘合成器與抖動(dòng)消除器 在電子工程師的日常工作,時(shí)鐘合成器與抖動(dòng)消除器是至關(guān)重要的元件,它們能夠?yàn)橄到y(tǒng)
    的頭像 發(fā)表于 02-10 14:00 ?220次閱讀

    MAXIM CMOS視頻復(fù)用器/放大器:高性能視頻應(yīng)用的理想之選

    、MAX454和MAX455,為視頻應(yīng)用提供了出色的解決方案。本文將詳細(xì)介紹這些產(chǎn)品的特點(diǎn)、技術(shù)參數(shù)和應(yīng)用場(chǎng)景,幫助電子工程師更好地了解和使用這些產(chǎn)品。 文件下載: MAX453.pdf 一、產(chǎn)品概述
    的頭像 發(fā)表于 01-29 16:45 ?185次閱讀

    重塑音頻通話(huà)體驗(yàn)!A-29P AI 降噪回音消除模塊賦能千行百業(yè)

    A-29P神經(jīng)網(wǎng)絡(luò)AI降噪回音消除模塊創(chuàng)新突破音頻處理技術(shù)瓶頸,融合DSP數(shù)字處理與AI降噪算法,實(shí)現(xiàn)100dB回音消除深度和45-90dB降噪效果,有效解決車(chē)載
    的頭像 發(fā)表于 11-18 09:33 ?1200次閱讀
    重塑音頻<b class='flag-5'>通話(huà)</b>體驗(yàn)!A-29P <b class='flag-5'>AI</b> 降噪回音<b class='flag-5'>消除</b>模塊賦能千行百業(yè)

    高效降噪,清晰通話(huà):NR-37 回音消除模塊賦能多場(chǎng)景音頻溝通

    NR-37雙麥陣列回音消除模塊采用數(shù)字語(yǔ)音處理技術(shù),提供高效音頻解決方案。其核心優(yōu)勢(shì)包括60dB回音消除能力、20dB降噪效果,支持單/雙麥模式,兼容差分/單端接口。模塊采用插針與半孔焊盤(pán)雙
    的頭像 發(fā)表于 11-13 09:18 ?584次閱讀
    高效降噪,清晰<b class='flag-5'>通話(huà)</b>:NR-37 回音<b class='flag-5'>消除</b>模塊賦能多場(chǎng)景音頻<b class='flag-5'>溝通</b>

    ?LMH1981多格式視頻同步分離器技術(shù)文檔總結(jié)

    三電平同步,輸出提供CMOS邏輯的所有關(guān)鍵定時(shí)信號(hào),其中 從軌道到軌道的擺動(dòng) (V~CC~和 GND),包括復(fù)合、水平和 垂直同步、連拍/后廊定時(shí)、奇數(shù)/偶數(shù)場(chǎng)和視頻格式輸出。HSync 功能 其前緣(下降)沿的
    的頭像 發(fā)表于 09-19 10:18 ?962次閱讀
    ?LMH1981多格式<b class='flag-5'>視頻</b>同步分離器技術(shù)文檔總結(jié)

    ?LMH1983 3G/HD/SD視頻時(shí)鐘發(fā)生器技術(shù)文檔總結(jié)

    字音頻 AES3/EBU 標(biāo)準(zhǔn)的應(yīng)用。 它為任何 SDI 發(fā)射器提供抖動(dòng)參考時(shí)鐘,以滿(mǎn)足嚴(yán)格的輸出抖動(dòng) 規(guī)格,沒(méi)有額外的時(shí)鐘清潔電路。
    的頭像 發(fā)表于 09-16 15:26 ?1054次閱讀
    ?LMH1983 3G/HD/SD<b class='flag-5'>視頻</b>時(shí)鐘發(fā)生器技術(shù)文檔總結(jié)

    高通如何利用AI提升關(guān)鍵用例的用戶(hù)體驗(yàn)

    在這個(gè)數(shù)字連接日益重要的世界,人工智能(AI)在提升日常連接體驗(yàn)方面的作用不容小覷。從優(yōu)化游戲體驗(yàn)到確保無(wú)縫視頻通話(huà),AI正悄然變革人們與
    的頭像 發(fā)表于 08-28 10:22 ?1145次閱讀

    RK3576賦能無(wú)人機(jī)巡檢:多路視頻+AI識(shí)別引領(lǐng)智能化變革

    巡檢,需要快速、大量的采集作物表型信息并進(jìn)行分析; 難點(diǎn)在于: 1)多路視頻同步采集對(duì)帶寬和處理能力要求高; 2)飛行過(guò)程AI識(shí)別必須實(shí)時(shí),否則漏檢率高; 3)機(jī)載設(shè)備功耗過(guò)高會(huì)
    發(fā)表于 08-20 17:26

    AI視頻分析系統(tǒng)

    方案背景人工智能大時(shí)代背景下,視頻應(yīng)用領(lǐng)域相關(guān)的行業(yè)應(yīng)用方式已經(jīng)發(fā)生了深刻的變化,各論安防監(jiān)控還是各類(lèi)垂直行業(yè)視頻應(yīng)用,都需要AI視覺(jué)分析與識(shí)別技術(shù)助力,而且需求廣泛而迫切。在應(yīng)用層面,以AI
    的頭像 發(fā)表于 08-06 14:39 ?938次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>分析系統(tǒng)

    AI視頻識(shí)別系統(tǒng)的應(yīng)用領(lǐng)域

    一、城市治理現(xiàn)代化 AI視頻識(shí)別技術(shù) 正深度重構(gòu)城市管理體系。在城市安防領(lǐng)域,系統(tǒng)通過(guò)行為模式分析實(shí)現(xiàn)異常事件主動(dòng)預(yù)警,對(duì)人員聚集、異常滯留等場(chǎng)景進(jìn)行智能識(shí)別;交通治理實(shí)時(shí)監(jiān)測(cè)車(chē)流密度、違法行為
    的頭像 發(fā)表于 07-24 11:06 ?1201次閱讀

    【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】視頻會(huì)議場(chǎng)景下的 AI 應(yīng)用(電子云臺(tái) EPTZ、人像居中 / 追蹤、畫(huà)中畫(huà))

    下,人物居中功能可將教師人像保持在畫(huà)面中間,并且相比全景畫(huà)面能看到更多教師動(dòng)作細(xì)節(jié)。   蘋(píng)果設(shè)備在近年也推出了人像居中功能來(lái)提供更好視頻通話(huà)體驗(yàn)。 3、畫(huà)中畫(huà) PIP   當(dāng)參
    發(fā)表于 07-09 20:56

    神經(jīng)網(wǎng)絡(luò)AI降噪回音消除模塊 A-29說(shuō)明書(shū)

    A-29P 是一款高性能的 DSP 數(shù)字語(yǔ)音處理模塊,針對(duì)所有免提全雙工通話(huà)設(shè)備的回音 問(wèn)題進(jìn)行消除(AEC),并具有超強(qiáng)的 AI 環(huán)境噪音壓制(
    發(fā)表于 06-18 15:23 ?0次下載

    4K、多模態(tài)、長(zhǎng)視頻AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線(xiàn)視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)視頻
    的頭像 發(fā)表于 06-16 00:13 ?7288次閱讀

    A-29P AI智能降噪回音消除模塊說(shuō)明書(shū)

    通話(huà)設(shè)備獲得更好的語(yǔ)音品質(zhì)。在同類(lèi)型模塊,主芯片的處理能力,及算法差異,在外形結(jié)構(gòu)比較小,喇叭音量又很大的通話(huà)產(chǎn)品,回音
    發(fā)表于 05-26 16:51 ?1次下載

    鯤云科技提供智慧高速AI視頻分析解決方案

    鯤云科技響應(yīng)國(guó)家及地方的高速公路信息化、智能化政策,提供“算力+算法+平臺(tái)”一體化的智慧高速 AI 視頻分析解決方案,滿(mǎn)足交警部門(mén)和高速集團(tuán)日常運(yùn)營(yíng)和管理需求,通過(guò)智能化的手段,提高工作效率。
    的頭像 發(fā)表于 03-27 14:53 ?1060次閱讀