電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)在AI大模型的加持下,AI玩具的最重要的功能便是語(yǔ)音交互,而要做到較好的語(yǔ)音交互,少不了語(yǔ)音前端處理芯片的加持。
因?yàn)橥婢啕溈孙L(fēng)拾到的聲音里混有喇叭回聲、環(huán)境噪聲、混響,而主控SoC的算力/功耗/實(shí)時(shí)性都扛不住這些7×24的AEC+NR+Beamforming+喚醒運(yùn)算;前端芯片把“干凈的人聲”先截出來(lái),再送給主控或云端,才能保證打斷喚醒、低誤觸發(fā)、低功耗三樣同時(shí)成立。
因此,目前AI玩具中,一款好的語(yǔ)音前端處理芯片,帶來(lái)的用戶使用體驗(yàn)的提升是非常明顯的。
以今年市場(chǎng)中已量產(chǎn)的AI玩具為例,如Haivivi BubblePal、字節(jié)“顯眼包”掛件,采用的是啟英泰倫CI1302/1303,這兩款都是針對(duì)智能語(yǔ)音交互場(chǎng)景設(shè)計(jì)的專用芯片,尤其適合AI玩具、智能家電等輕量化語(yǔ)音交互設(shè)備。
這兩款新品均采用220 MHz 32-bit CPU以及第三代BNPU(腦神經(jīng)網(wǎng)絡(luò)處理器),在語(yǔ)音交互上,內(nèi)置128ms頻域回聲消除,喇叭→MIC回采衰減≥45dB。與BNPU聯(lián)合做“DNN殘差降噪”,70dB環(huán)境噪聲下實(shí)測(cè)識(shí)別率仍≥85 %,喚醒率≥90%。
啟英泰倫還有一款CI1306用在兒童陪護(hù)機(jī)器人上,這是其第三代高性能神經(jīng)網(wǎng)絡(luò)智能語(yǔ)音芯片的旗艦型號(hào),專為高復(fù)雜度離線語(yǔ)音交互場(chǎng)景設(shè)計(jì),尤其適合對(duì)語(yǔ)音識(shí)別精度、抗噪能力、自然對(duì)話能力要求較高的產(chǎn)品。
相比CI1302/1303的單麥方案,CI1306則采用雙麥克風(fēng)深度語(yǔ)音增強(qiáng),也是CI130X 系列中唯一明確支持完整雙麥算法棧的型號(hào),因此擁有波束成形、聲源定位、深度人聲分離、AEC、混響抑制等功能。
湯姆貓AI童伴機(jī)器人采用的是全志R128-S3,采用RISC-V XuanTie C906與Arm M33 Star MCU雙核異構(gòu)架構(gòu),搭配HiFi5 DSP。集成1個(gè)24位音頻編解碼器DAC通道,3個(gè)ADC通道,DAC播放路徑中的信噪比高達(dá)119dB,ADC記錄路徑期間的信噪比高達(dá)98dB,可提供高質(zhì)量的語(yǔ)音輸入輸出處理,確保語(yǔ)音信號(hào)的清晰和準(zhǔn)確。
簡(jiǎn)單來(lái)說(shuō),全志的這款R128-S3,單芯片就可以讓200元以內(nèi)的AI玩具實(shí)現(xiàn)5米遠(yuǎn)場(chǎng)打斷喚醒、本地500命令詞、云端大模型連續(xù)對(duì)話,是目前市場(chǎng)上把性能-功耗-BOM平衡得極為出色的中端陪護(hù)機(jī)器人的語(yǔ)音SoC方案。
還有如使用在一些繪本機(jī)器人的炬芯ATS3703,這是一顆定位中端AI玩具+早教機(jī)器人的多媒體SoC,官方把語(yǔ)音交互做成硬加速模塊,而不是外掛DSP。參數(shù)上擁有雙路24-bit ADC,SNR 98 dB,可直接接2×差分模擬MIC或4×PDM數(shù)字麥,內(nèi)置128 ms硬件頻域AEC,回聲消除深度≥45 dB,芯片級(jí)DNN降噪加速單元(10 GOPS INT8),60 dB環(huán)境噪聲下喚醒率保持≥ 90%。
炬芯ATS3703單芯片即可讓200-400元的早教機(jī)器人實(shí)現(xiàn)3-5米遠(yuǎn)場(chǎng)打斷喚醒、本地自然說(shuō)、視頻聊天、人臉識(shí)別,是目前中端陪護(hù)類AI玩具出貨量靠前的多媒體語(yǔ)音方案。
一些能夠看向人再進(jìn)行交互的AI玩具采用了泰芯TXW81x,這是一枚Wi-Fi+藍(lán)牙雙模、音視頻All-in-One的2.4 GHz SoC,官方把語(yǔ)音前端和聲學(xué)前處理做成硬加速IP,主打50–300元價(jià)位帶屏AI玩具。
參數(shù)上,Audio Codec采用雙路24-bit ADC,SNR 98 dB;DAC SNR 95 dB,采樣率8–48 kHz可配。PDM接口上內(nèi)置4× PDM 通道,可直接接4路數(shù)字MEMS麥。硬件AEC擁有128ms頻域回聲消除,回聲抑制≥45 dB,喇叭90dB播放時(shí)仍可打斷喚醒。還具有嘯叫抑制功能,片內(nèi)自適應(yīng)Howling-suppression,增益> 40 dB無(wú)自激,適合喇叭-麥克風(fēng)同腔玩具。
該芯片可以讓帶屏AI玩具實(shí)現(xiàn)5 米遠(yuǎn)場(chǎng)打斷、本地 500 命令詞、云端大模型連續(xù)對(duì)話、媽媽音色克隆,是目前中高端陪護(hù)類玩具出貨量增長(zhǎng)最快的音視頻無(wú)線SoC方案。
小結(jié)
AI玩具的對(duì)話體驗(yàn)不是由大模型單獨(dú)決定;一顆成本占比可能極低的語(yǔ)音前端處理芯片先把聲學(xué)環(huán)境打掃干凈,后面的云端/端側(cè)大模型才能聽(tīng)得清、答得快、功耗低。
因?yàn)橥婢啕溈孙L(fēng)拾到的聲音里混有喇叭回聲、環(huán)境噪聲、混響,而主控SoC的算力/功耗/實(shí)時(shí)性都扛不住這些7×24的AEC+NR+Beamforming+喚醒運(yùn)算;前端芯片把“干凈的人聲”先截出來(lái),再送給主控或云端,才能保證打斷喚醒、低誤觸發(fā)、低功耗三樣同時(shí)成立。
因此,目前AI玩具中,一款好的語(yǔ)音前端處理芯片,帶來(lái)的用戶使用體驗(yàn)的提升是非常明顯的。
以今年市場(chǎng)中已量產(chǎn)的AI玩具為例,如Haivivi BubblePal、字節(jié)“顯眼包”掛件,采用的是啟英泰倫CI1302/1303,這兩款都是針對(duì)智能語(yǔ)音交互場(chǎng)景設(shè)計(jì)的專用芯片,尤其適合AI玩具、智能家電等輕量化語(yǔ)音交互設(shè)備。
這兩款新品均采用220 MHz 32-bit CPU以及第三代BNPU(腦神經(jīng)網(wǎng)絡(luò)處理器),在語(yǔ)音交互上,內(nèi)置128ms頻域回聲消除,喇叭→MIC回采衰減≥45dB。與BNPU聯(lián)合做“DNN殘差降噪”,70dB環(huán)境噪聲下實(shí)測(cè)識(shí)別率仍≥85 %,喚醒率≥90%。
啟英泰倫還有一款CI1306用在兒童陪護(hù)機(jī)器人上,這是其第三代高性能神經(jīng)網(wǎng)絡(luò)智能語(yǔ)音芯片的旗艦型號(hào),專為高復(fù)雜度離線語(yǔ)音交互場(chǎng)景設(shè)計(jì),尤其適合對(duì)語(yǔ)音識(shí)別精度、抗噪能力、自然對(duì)話能力要求較高的產(chǎn)品。
相比CI1302/1303的單麥方案,CI1306則采用雙麥克風(fēng)深度語(yǔ)音增強(qiáng),也是CI130X 系列中唯一明確支持完整雙麥算法棧的型號(hào),因此擁有波束成形、聲源定位、深度人聲分離、AEC、混響抑制等功能。
湯姆貓AI童伴機(jī)器人采用的是全志R128-S3,采用RISC-V XuanTie C906與Arm M33 Star MCU雙核異構(gòu)架構(gòu),搭配HiFi5 DSP。集成1個(gè)24位音頻編解碼器DAC通道,3個(gè)ADC通道,DAC播放路徑中的信噪比高達(dá)119dB,ADC記錄路徑期間的信噪比高達(dá)98dB,可提供高質(zhì)量的語(yǔ)音輸入輸出處理,確保語(yǔ)音信號(hào)的清晰和準(zhǔn)確。
簡(jiǎn)單來(lái)說(shuō),全志的這款R128-S3,單芯片就可以讓200元以內(nèi)的AI玩具實(shí)現(xiàn)5米遠(yuǎn)場(chǎng)打斷喚醒、本地500命令詞、云端大模型連續(xù)對(duì)話,是目前市場(chǎng)上把性能-功耗-BOM平衡得極為出色的中端陪護(hù)機(jī)器人的語(yǔ)音SoC方案。
還有如使用在一些繪本機(jī)器人的炬芯ATS3703,這是一顆定位中端AI玩具+早教機(jī)器人的多媒體SoC,官方把語(yǔ)音交互做成硬加速模塊,而不是外掛DSP。參數(shù)上擁有雙路24-bit ADC,SNR 98 dB,可直接接2×差分模擬MIC或4×PDM數(shù)字麥,內(nèi)置128 ms硬件頻域AEC,回聲消除深度≥45 dB,芯片級(jí)DNN降噪加速單元(10 GOPS INT8),60 dB環(huán)境噪聲下喚醒率保持≥ 90%。
炬芯ATS3703單芯片即可讓200-400元的早教機(jī)器人實(shí)現(xiàn)3-5米遠(yuǎn)場(chǎng)打斷喚醒、本地自然說(shuō)、視頻聊天、人臉識(shí)別,是目前中端陪護(hù)類AI玩具出貨量靠前的多媒體語(yǔ)音方案。
一些能夠看向人再進(jìn)行交互的AI玩具采用了泰芯TXW81x,這是一枚Wi-Fi+藍(lán)牙雙模、音視頻All-in-One的2.4 GHz SoC,官方把語(yǔ)音前端和聲學(xué)前處理做成硬加速IP,主打50–300元價(jià)位帶屏AI玩具。
參數(shù)上,Audio Codec采用雙路24-bit ADC,SNR 98 dB;DAC SNR 95 dB,采樣率8–48 kHz可配。PDM接口上內(nèi)置4× PDM 通道,可直接接4路數(shù)字MEMS麥。硬件AEC擁有128ms頻域回聲消除,回聲抑制≥45 dB,喇叭90dB播放時(shí)仍可打斷喚醒。還具有嘯叫抑制功能,片內(nèi)自適應(yīng)Howling-suppression,增益> 40 dB無(wú)自激,適合喇叭-麥克風(fēng)同腔玩具。
該芯片可以讓帶屏AI玩具實(shí)現(xiàn)5 米遠(yuǎn)場(chǎng)打斷、本地 500 命令詞、云端大模型連續(xù)對(duì)話、媽媽音色克隆,是目前中高端陪護(hù)類玩具出貨量增長(zhǎng)最快的音視頻無(wú)線SoC方案。
小結(jié)
AI玩具的對(duì)話體驗(yàn)不是由大模型單獨(dú)決定;一顆成本占比可能極低的語(yǔ)音前端處理芯片先把聲學(xué)環(huán)境打掃干凈,后面的云端/端側(cè)大模型才能聽(tīng)得清、答得快、功耗低。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
芯片
+關(guān)注
關(guān)注
463文章
54183瀏覽量
467832 -
語(yǔ)音芯片
+關(guān)注
關(guān)注
13文章
2347瀏覽量
40982
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
當(dāng)星閃遇見(jiàn)AI語(yǔ)音:破解智能家居“聽(tīng)不懂、聯(lián)不穩(wěn)”兩大痛點(diǎn)
當(dāng)智能家電的通信還在糾結(jié)傳統(tǒng)Wi-Fi與藍(lán)牙的局限,當(dāng)語(yǔ)音交互還停留在“聽(tīng)懂基礎(chǔ)指令”的階段,明裕豐基于啟英泰倫CI1302AI語(yǔ)音芯片和海
語(yǔ)音識(shí)別IC分類,語(yǔ)音識(shí)別芯片的工作原理
語(yǔ)音識(shí)別芯片,也叫語(yǔ)音識(shí)別集成電路,是一種集聲音存儲(chǔ)、播放、錄音及語(yǔ)音識(shí)別功能于一體的專用芯片。語(yǔ)音
MediaTek揭秘AI語(yǔ)音交互背后的關(guān)鍵技術(shù)
從智能音箱到智能家居,以及更常見(jiàn)的手機(jī) AI 助手等使用場(chǎng)景中,語(yǔ)音已經(jīng)成為可以解放雙手,更自然、更直接的交互方式。用戶希望 AI 助手不僅能聽(tīng)得
AI玩具麥克風(fēng)技術(shù)演進(jìn),從拾音到智能交互的跨越
電子發(fā)燒友網(wǎng)綜合報(bào)道 AI玩具的智能交互體驗(yàn),核心依賴于麥克風(fēng)技術(shù)的精準(zhǔn)拾音與信號(hào)處理能力。作為兒童與設(shè)備溝通的聽(tīng)覺(jué)系統(tǒng),AI玩具麥克風(fēng)需在
RTC技術(shù)重塑AI玩具體驗(yàn),實(shí)時(shí)交互的未來(lái)演進(jìn)之路
電子發(fā)燒友網(wǎng)綜合報(bào)道 在全球AI玩具市場(chǎng)迅猛發(fā)展的浪潮中,實(shí)時(shí)通信(RTC)技術(shù)正從幕后走向臺(tái)前,成為定義下一代產(chǎn)品體驗(yàn)的核心力量。當(dāng)AI玩具從簡(jiǎn)單的
唯創(chuàng)知音AI語(yǔ)音交互芯片與模組介紹
AI語(yǔ)音交互已經(jīng)成為智能產(chǎn)品的基礎(chǔ)配置,比如常見(jiàn)的AI玩具、智能家居、帶AI功能的藍(lán)牙音響,還有
IOTE 2025|30天打造一款AI玩具!美格智能發(fā)布高性價(jià)比AI玩具解決方案
當(dāng)前全球AI玩具市場(chǎng)已進(jìn)入高速發(fā)展期,根據(jù)市場(chǎng)研究數(shù)據(jù)顯示,2025年中國(guó)智能玩具市場(chǎng)規(guī)模預(yù)計(jì)突破300億元,年增長(zhǎng)率保持在25%以上。AI玩具
家電與玩具的 “語(yǔ)音大腦”:NVA 系列 OTP 語(yǔ)音芯片來(lái)襲!
在電子產(chǎn)品不斷追求智能化、人性化的今天,語(yǔ)音交互成為提升用戶體驗(yàn)的關(guān)鍵因素。廣州九芯電子科技有限公司推出的OTP語(yǔ)音芯片NVA系列,正以卓越性能和廣泛適用性,為家用電器和
小智AI正式授權(quán)!安信可小安派語(yǔ)音AI開(kāi)發(fā)板更新啦
安信可正式推出 語(yǔ)音AI開(kāi)發(fā)板—— AiPi-PalChatV1 為毛絨玩具、桌搭機(jī)器人、 陪伴手辦注入更有溫度的AI對(duì)話體驗(yàn)! ? AiP
從“聽(tīng)得見(jiàn)”到“聽(tīng)得懂”:語(yǔ)音識(shí)別芯片的AI進(jìn)化
在科技飛速發(fā)展的當(dāng)下,語(yǔ)音識(shí)別技術(shù)已成為人機(jī)交互領(lǐng)域的核心力量。從最初只能簡(jiǎn)單接收聲音信號(hào),到如今能夠理解語(yǔ)義并作出準(zhǔn)確回應(yīng),語(yǔ)音識(shí)別芯片經(jīng)歷了一場(chǎng)深刻的
AI玩具爆發(fā),音頻編解碼器如何滿足語(yǔ)音交互需求
電子發(fā)燒友網(wǎng)綜合報(bào)道,在AI玩具已經(jīng)開(kāi)始逐漸爆發(fā)的當(dāng)下,人機(jī)交互已經(jīng)成為標(biāo)配功能,而最重要的便是語(yǔ)音控制。而語(yǔ)音控制的第一步,便需要讓
AI語(yǔ)音開(kāi)發(fā)板AiPi-PalChatV1教程:燒錄與調(diào)試
AiPi-PalChatV1 是一款接入了小智AI智能體的微型語(yǔ)音交互開(kāi)發(fā)板,專為輕量級(jí)智能語(yǔ)音
AI玩具芯片如何尋找性能、功耗與成本之間的平衡點(diǎn)
電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)近年來(lái),智能玩具市場(chǎng)增長(zhǎng)迅速,語(yǔ)音識(shí)別、圖像交互等功能逐漸成為產(chǎn)品競(jìng)爭(zhēng)的關(guān)鍵要素。然而,芯片成本過(guò)高與開(kāi)發(fā)難度大,讓許多開(kāi)發(fā)者難以推進(jìn)項(xiàng)目。如何在
90元打造小智AI腕表,語(yǔ)音交互超有趣!
的不同。只有一點(diǎn),由于是單麥克風(fēng),不能語(yǔ)音中斷,觸碰一下屏幕就能中斷。
硬件上,使用了一顆電源管理芯片(AXP2101),所以支持電量查詢,長(zhǎng)按4秒關(guān)機(jī)、短按開(kāi)機(jī)。
顯示屏幕:1.69 寸圓角屏幕
發(fā)表于 04-16 14:26
揭秘AI玩具“聽(tīng)得清”的秘密!這幾款語(yǔ)音前端芯片撐起交互體驗(yàn)天花板
評(píng)論