国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

應用深度學習變革傳統語音信號處理,讓機器擁有類似人耳一樣的聽覺感知能力

MEMS ? 來源:MEMS ? 2020-09-01 13:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能語音是人工智能技術的重要組成部分,包括聲音前端信號處理、語音識別、語義理解、自然語言處理、語音合成等細分領域。在技術的具體落地中,消費級智能硬件是最早顯示出市場潛力的賽道,從藍牙耳機到可穿戴設備再到智能家居,各種產品都離不開相關的智能語音技術,而語音交互的第一步就是聽見,聲音前端信號處理的效果一定程度上制約了語音識別的效果,當前也有一些公司正在解決這一讓各類產品“聽得更清晰”的問題。

36氪日前接觸到的「大象聲科」,是一家專注于機器聽覺的人工智能公司。該公司于2017年在深圳成立,致力于應用深度學習變革傳統語音信號處理,讓機器擁有類似人耳一樣的聽覺感知能力。據了解,「大象聲科」技術的理論基礎為CASA(計算機聽覺場景分析)+DNN(深度神經網絡技術)。CASA 解決的問題是基于人的聽覺原理來實現聲源分離,該理論的奠基人汪德亮教授也是「大象聲科」的首席科學家和聯合創始人。公司通過將CASA和深度學習相結合,在業內首家成功實現大規模商用級的噪音和人聲的分離,后續有望進一步解決雞尾酒會問題。(注:雞尾酒會問題是語音識別領域的痛點和難點,人們在雞尾酒會中交談,語音信號會重疊在一起,機器需要將它們分離成獨立的信號)

公司創始人兼CEO苗健彰向記者對比了傳統信號處理和基于深度學習的信號處理方式的差別——傳統的數字信號處理方式主要依據固定噪音特性和方向,通過濾波器對信號進行相應的過濾和增強。但因為生活中的噪音不一定存在固定特性,并可能來自于各種方向反射,所以傳統方式或許無法徹底解決復雜噪聲環境中的問題。而CASA+DNN的方案是讓機器通過訓練獲得與人類聽覺感知相似的機制,從而去認知周邊的聲場環境,在復雜場景中提取、識別人聲。

在技術產業化這一塊,「大象聲科」首先從“降噪”切入,一方面解決通訊過程中的噪音干擾問題,讓人們在復雜的現實噪聲場景中擁有更加清晰、更加私密的通話體驗;另一方面解決語音識別中噪聲干擾問題,讓機器在“聽清”之后聽得“更懂”。為此,公司推出了Vocplus智能語音增強和Vocplus Smart智能語音交互方案,目前已經在手機、耳機、PC、對講機、VoIP、IoT等行業成功落地。

在研發過程中,苗健彰認為,把技術從理論進行工程落地轉化是最大的難點,其中將神經網絡小型化和模型的泛化是決定深度學習能否應用于實際產品中的重要環節。“大象聲科在這方面有一套獨特的技術,能夠在不損失精度的情況下,使得算法參數盡量少,計算速度盡量快,這也是為什么目前我們的深度學習降噪算法快速落地到像耳機這類可穿戴產品。另外,市面上已經有上千萬臺設備搭載了公司的算法,幫助公司沉淀了大量數據。大象聲科將人耳的聽覺機理與深度學習相結合,也大幅提升了算法的泛化性能,形成了較高的技術壁壘。”他介紹。

相較而言,公司目前在手機、耳機等消費電子行業有比較多的應用案例,這和行業本身的需求和規模相關。“現在中國絕大部分的手機品牌,比如小米、OPPO、vivo都已經有使用「大象聲科」的通話降噪技術(Vocplus Telecom)以及游戲抗嘯叫技術(DHS)的量產案例。”苗健彰說。在前不久發布的華為FreeLace Pro耳機上,也搭載了公司的Vocplus AI三麥通話降噪方案。

此外,自去年以來的TWS耳機增長浪潮,也讓越來越多的耳機廠商逐漸采納以AI技術為主導的通話降噪方案。「大象聲科」是率先在藍牙耳機上落地AI語音降噪的公司,首個成功量產案例是OPPO Enco Q1 。并且,2020年「大象聲科」與漫步者合作,成功落地了第一個AI算法結合骨傳導sensor的通話降噪方案,可以讓TWS耳機在通話時完全屏蔽周圍噪音(包含人聲噪音在內),實現私密性更強的通話體驗。

談及客戶方的具體考量維度,苗健彰介紹客戶主要會圍繞通話清晰度進行評價,在這方面,業內有一套衡量通話降噪效果的客觀標準3QUEST,測試指標包括:S-MOS(人聲保留程度),N-MOS(噪音消除程度),G-MOS(綜合通話降噪性能),而公司由于采用較獨特的AI技術,在測評中得以展現優勢。

在產業合作上,「大象聲科」目前已與Qualcomm,CEVACirrus Logic,Infineon,Rockchip和BES等國內外知名芯片廠商建立合作關系。其中值得一提的是,公司在2018年拿到了小米和高通的融資,并在之后和高通一起進行聯合技術推廣,這也為公司在市場拓展和品牌建設方面提供了一定幫助。在收費模式上,大象有按照license授權和按項目收費兩種方式,當前license總裝機量在數千萬級別,今年的營收在數千萬元量級。

在未來的行業延展中,「大象聲科」計劃進一步完善整個語音技術鏈條,把應用場景從近場拓展到遠場,為更多行業如助聽器、智能家居、會議系統、智能車載等帶來更精準更智能的語音解決方案。

團隊方面,公司創始人兼CEO苗健彰UBC軟件工程學碩士畢業,曾就職于IBM、RBC等500強企業,并在加拿大成功創辦過一家軟件公司 。聯合創始人兼首席科學家汪德亮教授是計算機聽覺場景分析奠基人之一,也是全球首位將深度學習應用于語音增強的科學家。聯合創始人兼CTO張學良多年從事語音分離、增強算法研發工作,是內蒙古大學計算機學院教授。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50106

    瀏覽量

    265561
  • 智能語音
    +關注

    關注

    11

    文章

    826

    瀏覽量

    50280
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124418

原文標題:用深度學習改變語音信號處理,大象聲科讓機器像人耳一樣“聆聽”

文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SLAM如何為自動駕駛提供空間感知能力

    [首發于智駕最前沿微信公眾號]在人工智能與機器人領域,如何機器像生物一樣理解空間,是個繞不開的核心命題。當人類在
    的頭像 發表于 02-09 09:12 ?422次閱讀
    SLAM如何為自動駕駛提供空間<b class='flag-5'>感知能力</b>?

    基于NVIDIA VLA模型打造通用人形機器能力

    要讓人形機器人真正有用,它們需要具備認知能力和移動操作能力,涵蓋感知、規劃以及在動態環境中的全身控制。
    的頭像 發表于 01-14 09:53 ?1911次閱讀

    如何在NVIDIA Jetson Thor上提升機器感知效率

    構建自主機器人需要具備可靠且低延遲的視覺感知能力,以實現在動態環境中的深度估計、障礙物識別、定位與導航。這些功能對計算性能有較高要求。NVIDIA Jetson 平臺雖為深度
    的頭像 發表于 12-24 10:14 ?4396次閱讀
    如何在NVIDIA Jetson Thor上提升<b class='flag-5'>機器</b>人<b class='flag-5'>感知</b>效率

    四川大學:研究種具有四重感知能力的柔性機器人傳感器

    在本研究中,作者受自然皮膚感知能力的啟發,提出了種新型的內在柔性機器人傳感器,其四重感知功能集成于單設備中,包括空間接近
    的頭像 發表于 12-10 18:16 ?2298次閱讀
    四川大學:研究<b class='flag-5'>一</b>種具有四重<b class='flag-5'>感知能力</b>的柔性<b class='flag-5'>機器</b>人傳感器

    如何選擇合適的語音識別芯片型號

    語音識別芯片(又稱語音識別IC)是現代智能設備的核心組件,與傳統語音芯片相比,其最大特點是能夠主動識別并處理
    的頭像 發表于 10-30 16:32 ?629次閱讀

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    更多"、"互動更流暢"是開發者面臨的核心挑戰。傳統的單屏幕和有限的視覺輸入已成為提升機器人智能化水平的瓶頸。而瑞芯微RK3576高性能處理器的出現
    發表于 10-29 16:41

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    物理形狀的信息,分為緩慢適應1型神經元(SA-1)和快速適應1型神經元(FA-1)。 4、聽覺 具身智能需要像人耳一樣強大的聽力感官來感知聲音,并將他們傳輸到認知系統,從而使系統通過聲
    發表于 09-18 11:45

    語音機器人交互系統:核心技術與應用挑戰

    、核心技術模塊 1. 自動語音識別(ASR):這是系統的“耳朵”。它負責將用戶輸入的模擬語音信號轉換為計算機可處理的文本信息。當前,基于深度
    的頭像 發表于 09-02 11:08 ?842次閱讀

    再掀語音交互革命,廣和通AI解決方案加速機器聽覺進化

    機器人世界里,感知是智能化的第步,是機器人獲取環境信息,學習適應并自主決策的前提。聽覺作為五
    的頭像 發表于 08-26 17:44 ?904次閱讀

    機器人競技幕后:磁傳感器芯片激活 “精準感知力”

    幫助機器人實時修正重心,大幅降低翻倒風險。 在關節運動控制上,磁傳感器芯片實現 “毫米級精度保障”。以昆泰芯 KTM59 系列磁編碼器的離軸應用為例,其非接觸式磁信號捕捉技術,解決了傳統光學編碼器在
    發表于 08-26 10:02

    顆TTS語音芯給產品增加智能語音播報能力

    ,正在逐漸登上舞臺中央。 TTS語音合成芯片和傳統播報語音芯片的優缺點 傳統播報語音芯片 本質是 "聲音 U 盤",通過 ADC 將
    的頭像 發表于 08-14 16:33 ?751次閱讀

    明遠智睿SSD2351開發板:語音機器人領域的變革力量

    的四核1.4GHz處理器具備強勁的運算性能,能夠高效處理語音機器人運行過程中的復雜任務。語音識別和合成需要大量的計算資源,該
    發表于 05-28 11:36

    仿生傳感器:機器擁有“生命感知”的神奇科技

    在科幻電影中,機器人通過皮膚感知溫度、用“鼻子”識別氣味、用“耳朵”捕捉聲音的場景曾令人驚嘆。如今,這些“超能力”正通過仿生傳感器逐漸走進現實。仿生傳感器,這融合生物學與工程學的創新
    的頭像 發表于 04-28 17:25 ?1323次閱讀

    涂鴉打造超強AI IPC技術!深度融合視覺+聽覺感知能力,顛覆傳統IPC交互玩法

    隨著AI大模型能力的突破與成本的下降,IPC開始從單的“看得見”向“看得懂”迭代,并進步向“智能交互、主動決策”的方向升級演進。目前主流設備已標配三大能力:即智能識別與分析、多模態
    的頭像 發表于 04-17 18:20 ?1183次閱讀
    涂鴉打造超強AI IPC技術!<b class='flag-5'>深度</b>融合視覺+<b class='flag-5'>聽覺</b><b class='flag-5'>感知能力</b>,顛覆<b class='flag-5'>傳統</b>IPC交互玩法

    人形機器人像人一樣感知,這家國產芯片公司選擇從信號鏈入手

    電子發燒友網報道(文/吳子鵬)人形機器人的感知系統,作為其與物理世界交互的關鍵窗口,極大程度上決定了機器人的智能化水平與應用價值。借助多模態傳感器融合,人形機器人有望實現比肩甚至超越人
    的頭像 發表于 04-10 00:09 ?3116次閱讀
    <b class='flag-5'>讓</b>人形<b class='flag-5'>機器</b>人像人<b class='flag-5'>一樣</b>去<b class='flag-5'>感知</b>,這家國產芯片公司選擇從<b class='flag-5'>信號</b>鏈入手