端側(cè)AI降噪模組產(chǎn)品概述
隨著智能會(huì)議、直播和游戲語(yǔ)音交流的普及,高質(zhì)量的音頻輸入設(shè)備變得越來(lái)越重要。專為語(yǔ)音收集和處理設(shè)計(jì)的USB AI降噪麥克風(fēng)模組,這是一款基于XMOS XU316芯片和Codec芯片的專業(yè)音頻處理模組。
基于XMOS XU316和Codec芯片,專為麥克風(fēng)輸入和耳機(jī)輸出場(chǎng)景設(shè)計(jì)的模組。該模組集成了強(qiáng)大的音頻處理能力,搭配不同的固件,可以實(shí)現(xiàn)直播麥克風(fēng)、游戲耳機(jī)等多種產(chǎn)品應(yīng)用。
作為一款USB即插即用設(shè)備,A316-Codec-V1無(wú)需額外驅(qū)動(dòng),支持多種采樣率(16kHz/48kHz)和位深(16bit/24bit/32bit),能夠滿足不同場(chǎng)景下的音頻處理需求。
核心功能
AI降噪技術(shù):采用先進(jìn)的AI算法實(shí)現(xiàn)環(huán)境噪聲抑制
自動(dòng)增益控制:智能調(diào)節(jié)音量,確保語(yǔ)音清晰度
硬件配置
核心模組:
采用U316-Codec-V1模組,提供強(qiáng)大的數(shù)字信號(hào)處理能力
音頻接口:
1、USB音頻輸入輸出,支持UAC 1.0/2.0協(xié)議
2、耳機(jī)輸入、輸出,支持mini3.5接口
3、卡農(nóng)輸入、輸出
4、I2S輸入、輸出
參數(shù)調(diào)試接口:
1、USB參數(shù)調(diào)試接口
2、SPI參數(shù)調(diào)節(jié)接口
監(jiān)聽輸出:
提供耳機(jī)監(jiān)聽輸出,便于實(shí)時(shí)監(jiān)聽音頻效果
端側(cè)AI降噪模組功能設(shè)計(jì)架構(gòu)
無(wú)論是工業(yè)現(xiàn)場(chǎng)的機(jī)械轟鳴、交通樞紐的嘈雜人聲,還是居家環(huán)境的電器運(yùn)轉(zhuǎn)聲,端側(cè)AI 降噪模組均能通過(guò)智能頻譜分析,精準(zhǔn)剝離復(fù)雜背景噪音,同時(shí)保留語(yǔ)音信號(hào)的完整性與自然度。相較傳統(tǒng)降噪方案,其深度學(xué)習(xí)算法可針對(duì)非平穩(wěn)噪音實(shí)現(xiàn)毫秒級(jí)動(dòng)態(tài)響應(yīng),有效避免語(yǔ)音失真與信息損耗,確保語(yǔ)音交互的清晰度與流暢性。
傳統(tǒng)降噪技術(shù)(如線性濾波、譜減法)依賴固定參數(shù)設(shè)定,在處理復(fù)雜動(dòng)態(tài)噪音時(shí)易出現(xiàn)適應(yīng)性不足問(wèn)題。端側(cè)AI 降噪模組采用RNnoise算法,通過(guò)提前語(yǔ)音特征值,融合神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)端到端深度學(xué)習(xí)架構(gòu),通過(guò)海量聲學(xué)數(shù)據(jù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型,能夠?qū)崟r(shí)分析語(yǔ)音與噪音的時(shí)域、頻域及空間特征。當(dāng)含噪語(yǔ)音輸入時(shí),模型可智能識(shí)別噪音成分并生成反向聲波進(jìn)行抵消,實(shí)現(xiàn)從 “被動(dòng)過(guò)濾” 到 “主動(dòng)抑制” 的技術(shù)跨越,顯著提升復(fù)雜場(chǎng)景下的降噪性能。端側(cè)AI降噪模組功能框圖如圖1所示。

圖1 端側(cè)AI降噪模組功能框圖
端側(cè)AI降噪模組硬件架構(gòu)
模組硬件架構(gòu)
端側(cè)AI降噪模組的硬件架構(gòu)是一個(gè)以高集成度異構(gòu)SoC為核心的精密系統(tǒng),其設(shè)計(jì)核心是在嚴(yán)格的功耗、成本和尺寸限制下實(shí)現(xiàn)高效實(shí)時(shí)處理。該架構(gòu)通常包含音頻輸入、核心處理芯片(XMOS XU31芯片)、高效電源管理單元及各類接口。端側(cè)AI降噪模組硬件架構(gòu)如圖2所示。

圖2 端側(cè)AI降噪模組硬件架構(gòu)圖
模組硬件接口解析
模組采用郵票半孔封裝設(shè)計(jì),高度集成化布局兼容多種設(shè)備形態(tài)。其功能接口涵蓋:
1、電源管理接口:
支持寬電壓輸入(2.8V-5.5V),內(nèi)置電源穩(wěn)壓模塊,確保復(fù)雜供電環(huán)境下的穩(wěn)定運(yùn)行
2、音頻輸入輸出接口
模擬音頻接口:兼容傳統(tǒng)駐極體麥克風(fēng)與揚(yáng)聲器,支持即插即用(如耳機(jī)、卡農(nóng))
數(shù)字音頻接口:支持 I2S、USB,實(shí)現(xiàn)高保真音頻數(shù)據(jù)傳輸
(如I2S、USB)
3、智能交互接口
USB 接口:支持 Windows、Android、Linux 系統(tǒng)免驅(qū)連接,集成固件在線升級(jí)功能
SPI 調(diào)試接口:提供降噪?yún)?shù)實(shí)時(shí)調(diào)節(jié)動(dòng)態(tài)配置等功能
端側(cè)AI降噪模組可調(diào)參數(shù)
AGC參數(shù)
1、AGCGAIN :AGC增益系數(shù)
2、AGCMAXGAIN :AGC增益系數(shù)最大值
3、AGCONOFF :設(shè)置AGCGAIN的值是否可變
測(cè)試調(diào)試參數(shù)方法:
近端音頻信號(hào)源: IEEE_269-2010_Male_mono_48_kHz.wav,調(diào)整參數(shù)后,播放近端音頻,觀察輸出音頻為合適電平
AI降噪?yún)?shù)
1、AI_denoise_ONOFF : 設(shè)置是否采用AI降噪功能
2、NS_Parameter :噪聲衰減系數(shù),NS_Parameter默認(rèn)值為0.15,表示了在設(shè)備輸出音頻信號(hào)中大約實(shí)現(xiàn)了15dB 的噪聲衰減處理,增加NS_Parameter參數(shù)值會(huì)增加噪聲抑制,同時(shí)也會(huì)增加近端語(yǔ)音失真。因此,需要做好語(yǔ)音質(zhì)量和穩(wěn)定性噪聲抑制兩方面平衡。增加這個(gè)參數(shù)值會(huì)影響進(jìn)度語(yǔ)音的音質(zhì),尤其在混響存在的環(huán)境下更加顯著。
端側(cè)AI降噪模組加密
采用XMOS提供的片內(nèi)OTP, 高安全性AES加密模塊,加密方式、過(guò)程,以及加密效果待驗(yàn)證,查到資料表示OTP一次性編程,且容量偏小,最大代碼量為8KB
XMOS芯片包含一個(gè)片上的 OTP存儲(chǔ)器,我們能夠?qū)MOS的AES模塊的配置信息 存儲(chǔ)到芯片的OTP上,這樣程序在被燒錄到Flash上的時(shí)候就會(huì)被加密。XMOS的AES模塊不會(huì)被自身程序或是第三方程序修改;程序通過(guò)密鑰進(jìn)行AES加密,不會(huì)被第三方設(shè)備進(jìn)行盜用。所以XMOS的AES加密具有非常好的安全性和可靠性。
XMOS的AES加密步驟:
1、使用XBURN命令生成128位密鑰對(duì),寫入密鑰文件
$ xburn --genkey keyfile
其中密鑰文件第一行是公鑰(認(rèn)證密鑰),第二行是私鑰(解密密鑰)。
2、使用XBURN命令將AES模塊和安全密鑰寫入目標(biāo)設(shè)備的OTP存儲(chǔ)器,并設(shè)置其安全啟動(dòng)位
$ xburn --lock keyfile --target-file target.xn --enable-jtag --disable-master-lock
3、加密燒寫固件并將其寫入閃存
$ xflash target.xe --key keyfile
XMOS加密后程序的運(yùn)行過(guò)程如圖3所示。首先XMOS芯片從自身的Boot ROM加載基本啟動(dòng)程序,啟動(dòng)程序會(huì)查詢安全寄存器(Security Register)的所有安全設(shè)置位,其中如果安全啟動(dòng)位(secure boot bit)沒(méi)有置位,程序就會(huì)使用正常啟動(dòng)方式,把控制權(quán)交個(gè)外部的SPI Flash,運(yùn)行外部的 Flash loader和用戶應(yīng)用程序。如果置位了,則會(huì)使用安全啟動(dòng)模式,并且會(huì)使用OTP內(nèi)部的引導(dǎo)啟動(dòng)程序 (boot loader) 。從OTP內(nèi)部拷貝出AES的設(shè)置資料并加載AES模塊。AES模塊通過(guò)SPI讀取外部Flash loader 到RAM里面,然后使用AES128-CMAC運(yùn)算法則和一個(gè)128bit的加密密鑰對(duì)Flash loader進(jìn)行進(jìn)行校驗(yàn),如果校驗(yàn)失敗,那么啟動(dòng)程序(boot loader)將會(huì)被終止。若校驗(yàn)成功,則AES會(huì)讀取Flash 對(duì)應(yīng)的鏡像程序塊,使用一個(gè)解密密鑰進(jìn)行解碼,并正常運(yùn)行程序。

圖3 XMOS使用AES模塊加密后程序的運(yùn)行過(guò)程
-
麥克風(fēng)
+關(guān)注
關(guān)注
16文章
696瀏覽量
57830 -
音頻
+關(guān)注
關(guān)注
31文章
3208瀏覽量
85903 -
AI
+關(guān)注
關(guān)注
91文章
40458瀏覽量
302071 -
模組
+關(guān)注
關(guān)注
6文章
1785瀏覽量
32320
原文標(biāo)題:端側(cè)AI降噪模組設(shè)計(jì)
文章出處:【微信號(hào):PHILISENSE,微信公眾號(hào):飛利信】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
端側(cè)AI模組再進(jìn)化!移遠(yuǎn)通信和美格智能在MWC如何放大招?
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
啟英泰倫通話降噪方案,采用深度學(xué)習(xí)降噪算法,讓通話更清晰
廣和通端側(cè)AI解決方案驅(qū)動(dòng)性能密集型場(chǎng)景商用型場(chǎng)景商用
廣和通端側(cè)AI解決方案驅(qū)動(dòng)性能密集型場(chǎng)景商用型場(chǎng)景商用
廣和通開啟端側(cè)AI新時(shí)代
中信建投建議關(guān)注端側(cè)AI模組機(jī)會(huì)
廣和通發(fā)布Fibocom AI Stack,助力客戶快速實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的端側(cè)AI部署
廣和通發(fā)布Fibocom AI Stack,助力客戶快速實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的端側(cè)AI部署
廣和通發(fā)布Fibocom AI Stack,助力客戶快速實(shí)現(xiàn)跨平臺(tái)跨系統(tǒng)的端側(cè)AI部署
廣和通Fibocom AI Stack:加速端側(cè)AI部署新紀(jì)元
端側(cè)AI元年爆發(fā)!廣和通AI模組及解決方案全面支持DeepSeek-R1蒸餾模型
MWC 2025 | 廣和通發(fā)布全矩陣AI解決方案“星云”系列,創(chuàng)新變革端側(cè)AI
AI大模型端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大模型解決方案,激活場(chǎng)景智能新范式
AI大模型端側(cè)部署正當(dāng)時(shí):移遠(yuǎn)端側(cè)AI大模型解決方案,激活場(chǎng)景智能新范式
解讀端側(cè)AI降噪模組設(shè)計(jì)方案
評(píng)論