端側AI降噪模組產品概述
隨著智能會議、直播和游戲語音交流的普及,高質量的音頻輸入設備變得越來越重要。專為語音收集和處理設計的USB AI降噪麥克風模組,這是一款基于XMOS XU316芯片和Codec芯片的專業音頻處理模組。
基于XMOS XU316和Codec芯片,專為麥克風輸入和耳機輸出場景設計的模組。該模組集成了強大的音頻處理能力,搭配不同的固件,可以實現直播麥克風、游戲耳機等多種產品應用。
作為一款USB即插即用設備,A316-Codec-V1無需額外驅動,支持多種采樣率(16kHz/48kHz)和位深(16bit/24bit/32bit),能夠滿足不同場景下的音頻處理需求。
核心功能
AI降噪技術:采用先進的AI算法實現環境噪聲抑制
自動增益控制:智能調節音量,確保語音清晰度
硬件配置
核心模組:
采用U316-Codec-V1模組,提供強大的數字信號處理能力
音頻接口:
1、USB音頻輸入輸出,支持UAC 1.0/2.0協議
2、耳機輸入、輸出,支持mini3.5接口
3、卡農輸入、輸出
4、I2S輸入、輸出
參數調試接口:
1、USB參數調試接口
2、SPI參數調節接口
監聽輸出:
提供耳機監聽輸出,便于實時監聽音頻效果
端側AI降噪模組功能設計架構
無論是工業現場的機械轟鳴、交通樞紐的嘈雜人聲,還是居家環境的電器運轉聲,端側AI 降噪模組均能通過智能頻譜分析,精準剝離復雜背景噪音,同時保留語音信號的完整性與自然度。相較傳統降噪方案,其深度學習算法可針對非平穩噪音實現毫秒級動態響應,有效避免語音失真與信息損耗,確保語音交互的清晰度與流暢性。
傳統降噪技術(如線性濾波、譜減法)依賴固定參數設定,在處理復雜動態噪音時易出現適應性不足問題。端側AI 降噪模組采用RNnoise算法,通過提前語音特征值,融合神經網絡模型實現端到端深度學習架構,通過海量聲學數據訓練的神經網絡模型,能夠實時分析語音與噪音的時域、頻域及空間特征。當含噪語音輸入時,模型可智能識別噪音成分并生成反向聲波進行抵消,實現從 “被動過濾” 到 “主動抑制” 的技術跨越,顯著提升復雜場景下的降噪性能。端側AI降噪模組功能框圖如圖1所示。

圖1 端側AI降噪模組功能框圖
端側AI降噪模組硬件架構
模組硬件架構
端側AI降噪模組的硬件架構是一個以高集成度異構SoC為核心的精密系統,其設計核心是在嚴格的功耗、成本和尺寸限制下實現高效實時處理。該架構通常包含音頻輸入、核心處理芯片(XMOS XU31芯片)、高效電源管理單元及各類接口。端側AI降噪模組硬件架構如圖2所示。

圖2 端側AI降噪模組硬件架構圖
模組硬件接口解析
模組采用郵票半孔封裝設計,高度集成化布局兼容多種設備形態。其功能接口涵蓋:
1、電源管理接口:
支持寬電壓輸入(2.8V-5.5V),內置電源穩壓模塊,確保復雜供電環境下的穩定運行
2、音頻輸入輸出接口
模擬音頻接口:兼容傳統駐極體麥克風與揚聲器,支持即插即用(如耳機、卡農)
數字音頻接口:支持 I2S、USB,實現高保真音頻數據傳輸
(如I2S、USB)
3、智能交互接口
USB 接口:支持 Windows、Android、Linux 系統免驅連接,集成固件在線升級功能
SPI 調試接口:提供降噪參數實時調節動態配置等功能
端側AI降噪模組可調參數
AGC參數
1、AGCGAIN :AGC增益系數
2、AGCMAXGAIN :AGC增益系數最大值
3、AGCONOFF :設置AGCGAIN的值是否可變
測試調試參數方法:
近端音頻信號源: IEEE_269-2010_Male_mono_48_kHz.wav,調整參數后,播放近端音頻,觀察輸出音頻為合適電平
AI降噪參數
1、AI_denoise_ONOFF : 設置是否采用AI降噪功能
2、NS_Parameter :噪聲衰減系數,NS_Parameter默認值為0.15,表示了在設備輸出音頻信號中大約實現了15dB 的噪聲衰減處理,增加NS_Parameter參數值會增加噪聲抑制,同時也會增加近端語音失真。因此,需要做好語音質量和穩定性噪聲抑制兩方面平衡。增加這個參數值會影響進度語音的音質,尤其在混響存在的環境下更加顯著。
端側AI降噪模組加密
采用XMOS提供的片內OTP, 高安全性AES加密模塊,加密方式、過程,以及加密效果待驗證,查到資料表示OTP一次性編程,且容量偏小,最大代碼量為8KB
XMOS芯片包含一個片上的 OTP存儲器,我們能夠將XMOS的AES模塊的配置信息 存儲到芯片的OTP上,這樣程序在被燒錄到Flash上的時候就會被加密。XMOS的AES模塊不會被自身程序或是第三方程序修改;程序通過密鑰進行AES加密,不會被第三方設備進行盜用。所以XMOS的AES加密具有非常好的安全性和可靠性。
XMOS的AES加密步驟:
1、使用XBURN命令生成128位密鑰對,寫入密鑰文件
$ xburn --genkey keyfile
其中密鑰文件第一行是公鑰(認證密鑰),第二行是私鑰(解密密鑰)。
2、使用XBURN命令將AES模塊和安全密鑰寫入目標設備的OTP存儲器,并設置其安全啟動位
$ xburn --lock keyfile --target-file target.xn --enable-jtag --disable-master-lock
3、加密燒寫固件并將其寫入閃存
$ xflash target.xe --key keyfile
XMOS加密后程序的運行過程如圖3所示。首先XMOS芯片從自身的Boot ROM加載基本啟動程序,啟動程序會查詢安全寄存器(Security Register)的所有安全設置位,其中如果安全啟動位(secure boot bit)沒有置位,程序就會使用正常啟動方式,把控制權交個外部的SPI Flash,運行外部的 Flash loader和用戶應用程序。如果置位了,則會使用安全啟動模式,并且會使用OTP內部的引導啟動程序 (boot loader) 。從OTP內部拷貝出AES的設置資料并加載AES模塊。AES模塊通過SPI讀取外部Flash loader 到RAM里面,然后使用AES128-CMAC運算法則和一個128bit的加密密鑰對Flash loader進行進行校驗,如果校驗失敗,那么啟動程序(boot loader)將會被終止。若校驗成功,則AES會讀取Flash 對應的鏡像程序塊,使用一個解密密鑰進行解碼,并正常運行程序。

圖3 XMOS使用AES模塊加密后程序的運行過程
-
麥克風
+關注
關注
16文章
695瀏覽量
57667 -
音頻
+關注
關注
31文章
3188瀏覽量
85551 -
AI
+關注
關注
91文章
39755瀏覽量
301360 -
模組
+關注
關注
6文章
1768瀏覽量
32252
原文標題:端側AI降噪模組設計
文章出處:【微信號:PHILISENSE,微信公眾號:飛利信】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
端側AI模組再進化!移遠通信和美格智能在MWC如何放大招?
啟英泰倫通話降噪方案,采用深度學習降噪算法,讓通話更清晰
廣和通端側AI解決方案驅動性能密集型場景商用型場景商用
中信建投建議關注端側AI模組機會
廣和通發布Fibocom AI Stack,助力客戶快速實現跨平臺跨系統的端側AI部署
廣和通發布Fibocom AI Stack,助力客戶快速實現跨平臺跨系統的端側AI部署
廣和通發布Fibocom AI Stack,助力客戶快速實現跨平臺跨系統的端側AI部署
廣和通Fibocom AI Stack:加速端側AI部署新紀元
端側AI元年爆發!廣和通AI模組及解決方案全面支持DeepSeek-R1蒸餾模型
MWC 2025 | 廣和通發布全矩陣AI解決方案“星云”系列,創新變革端側AI
AI大模型端側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式
AI大模型端側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式
解讀端側AI降噪模組設計方案
評論