近日,國(guó)際語(yǔ)音與語(yǔ)言處理領(lǐng)域頂級(jí)賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場(chǎng)首次將評(píng)估焦點(diǎn)從“答案正確性”轉(zhuǎn)向“推理過(guò)程質(zhì)量”的變革性賽事中,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)?wèi){借創(chuàng)新的多智能體協(xié)同方案,在全球眾多頂尖科研團(tuán)隊(duì)的角逐中脫穎而出,斬獲智能體賽道亞軍。
這一成績(jī)不僅彰顯了思必馳在音頻與多模態(tài)前沿領(lǐng)域的深度探索能力,更與企業(yè)近年在頂級(jí)學(xué)術(shù)會(huì)議上的密集突破、核心人才的國(guó)際認(rèn)可、以及“1+N”分布式智能體系統(tǒng)在硬件產(chǎn)品上的成功落地形成完美呼應(yīng),共同勾勒出思必馳從技術(shù)深耕到產(chǎn)業(yè)賦能的全景畫(huà)卷。
方案解碼:多智能體協(xié)同實(shí)現(xiàn) “透明化推理”
不同于傳統(tǒng)語(yǔ)音識(shí)別聚焦 “精準(zhǔn)轉(zhuǎn)寫(xiě)” 的核心訴求,Interspeech 2026音頻推理挑戰(zhàn)賽更強(qiáng)調(diào)模型的 “認(rèn)知與解釋能力”—— 要求系統(tǒng)不僅能輸出結(jié)果,更需生成清晰的中間思維鏈,證明其真正理解音頻中的邏輯關(guān)系、物理規(guī)律及情感內(nèi)涵。這一變革性要求,恰好與思必馳 “構(gòu)建可靠性優(yōu)先的 1+N 分布式智能體系統(tǒng)” 的技術(shù)愿景高度契合。
面對(duì)復(fù)雜的音頻推理任務(wù),思必馳聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)創(chuàng)新性地采用“跨模態(tài)轉(zhuǎn)化 + 多智能體協(xié)作”方案:先將音頻信號(hào)轉(zhuǎn)化為 Mel 頻譜圖、CQT 頻譜圖等視覺(jué)表征,借助成熟的視覺(jué)語(yǔ)言模型精準(zhǔn)分析頻譜結(jié)構(gòu),大幅提升數(shù)值計(jì)算與時(shí)間結(jié)構(gòu)理解類任務(wù)的推理精度;更核心的是引入多智能體投票機(jī)制與一致性路由策略,通過(guò)中樞大模型統(tǒng)籌調(diào)度 N 個(gè)垂域子智能體,從不同維度交叉驗(yàn)證結(jié)論,有效規(guī)避單一模型的決策偏差,最終在 “推理過(guò)程質(zhì)量” 這一核心評(píng)估維度獲得賽事高度認(rèn)可。
這一技術(shù)方案的成功,正是思必馳“1+N 分布式智能體系統(tǒng)”核心理念的前沿實(shí)踐 —— 通過(guò)一個(gè)中樞大模型負(fù)責(zé)全局理解與任務(wù)拆解,協(xié)同 N 個(gè)垂直領(lǐng)域模型或工具模塊精準(zhǔn)賦能,實(shí)現(xiàn)更可靠、更可解釋的復(fù)雜任務(wù)處理能力,為 AI 技術(shù)從“黑盒預(yù)測(cè)”走向“透明決策”提供了可行路徑。
學(xué)術(shù)厚積:一年內(nèi)十余篇論文入選全球頂會(huì)
此次在Interspeech 2026上的佳績(jī),并非孤立的幸運(yùn),而是思必馳長(zhǎng)期堅(jiān)持“產(chǎn)業(yè)需求驅(qū)動(dòng)的有組織科研”模式的必然結(jié)果。作為科技部批準(zhǔn)建設(shè)的 “語(yǔ)言計(jì)算國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)”,思必馳近年來(lái)在全球頂級(jí)學(xué)術(shù)舞臺(tái)持續(xù)發(fā)力,形成高密度、高質(zhì)量的成果輸出。
僅2025年,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室便有 20 篇論文入選人工智能領(lǐng)域頂級(jí)會(huì)議:13篇成果同時(shí)收錄于語(yǔ)音領(lǐng)域旗艦會(huì)議Interspeech 2025與計(jì)算語(yǔ)言學(xué)頂會(huì)ACL 2025,覆蓋大模型檢索增強(qiáng)生成、低比特率語(yǔ)音編解碼、低延遲語(yǔ)音合成等關(guān)鍵方向,其中針對(duì)大模型幻覺(jué)問(wèn)題的 NeuSym-RAG 框架,通過(guò)神經(jīng)與符號(hào)檢索協(xié)同,顯著提升復(fù)雜文檔問(wèn)答的可靠性;2 篇論文入選機(jī)器學(xué)習(xí)頂會(huì)ICML 2025,提出的 Relign 可靠性對(duì)齊框架,首次系統(tǒng)化解決大模型 “工具幻覺(jué)” 問(wèn)題,為安全調(diào)用外部工具開(kāi)辟新路徑;5 篇論文亮相神經(jīng)信息處理系統(tǒng)大會(huì)NeurIPS 2025,聚焦指令微調(diào)與模型可解釋表征研究,為智能體規(guī)劃能力與魯棒性提升提供理論支撐。
一系列高密度、高質(zhì)量的學(xué)術(shù)產(chǎn)出,清晰地展示了思必馳在對(duì)話式AI核心技術(shù)領(lǐng)域的系統(tǒng)性布局和源頭創(chuàng)新能力。
人才引領(lǐng):首席科學(xué)家獲評(píng)內(nèi)地首位ISCA Fellow,搭建國(guó)際學(xué)術(shù)橋梁
學(xué)術(shù)突破的背后,是頂級(jí)人才的戰(zhàn)略引領(lǐng)。2025年8月,思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱教授被國(guó)際語(yǔ)音通訊協(xié)會(huì)授予ISCA Fellow榮譽(yù),成為自該協(xié)會(huì)2008年成立以來(lái)中國(guó)內(nèi)地首位獲此殊榮的學(xué)者。這一榮譽(yù)不僅是對(duì)俞凱教授在語(yǔ)音識(shí)別、口語(yǔ)對(duì)話系統(tǒng)及技術(shù)部署領(lǐng)域杰出貢獻(xiàn)的國(guó)際認(rèn)可,更是對(duì)思必馳整體科研實(shí)力的有力背書(shū)。
同年年底,俞凱教授邀請(qǐng)經(jīng)典著作《強(qiáng)化學(xué)習(xí)導(dǎo)論》的合著者、2024年圖靈獎(jiǎng)得主Richard Sutton教授訪華,在上海交通大學(xué)、蘇州大學(xué)等高校開(kāi)展高規(guī)格學(xué)術(shù)交流。這場(chǎng)“強(qiáng)化學(xué)習(xí)之父”與本土學(xué)者的深度對(duì)話,不僅推動(dòng)了國(guó)內(nèi)AI前沿研究的發(fā)展,也進(jìn)一步鞏固了思必馳在強(qiáng)化學(xué)習(xí)與對(duì)話決策領(lǐng)域的理論根基。依托俞凱教授領(lǐng)銜的科研團(tuán)隊(duì),思必馳牽頭組建江蘇省語(yǔ)言計(jì)算及應(yīng)用重點(diǎn)實(shí)驗(yàn)室,與上海交通大學(xué)、南京大學(xué)等 16 所高校開(kāi)展專項(xiàng)技術(shù)攻關(guān),構(gòu)建起 “產(chǎn)學(xué)研用” 一體化的人才培養(yǎng)與創(chuàng)新生態(tài)。
產(chǎn)品落地:多智能體理念在硬件領(lǐng)域的快速落地
前沿研究并非束之高閣,思必馳“產(chǎn)學(xué)研用”的閉環(huán)能力在其產(chǎn)品端展現(xiàn)得淋漓盡致。2025年下半年發(fā)布的AI辦公本X5系列,正是其“多智能體協(xié)作”理念在消費(fèi)級(jí)硬件上的集大成者。
X5內(nèi)置的多智能體協(xié)作專業(yè)會(huì)議大模型,構(gòu)建了“記錄-歸納-決策-執(zhí)行”的一體化工作流。它不僅能精準(zhǔn)識(shí)別會(huì)議內(nèi)容,更能通過(guò)分場(chǎng)景AI洞察機(jī)制,自動(dòng)提取關(guān)鍵議題、生成待辦事項(xiàng),甚至給出風(fēng)險(xiǎn)提示和行動(dòng)建議。這實(shí)現(xiàn)了從被動(dòng)“記錄員”到主動(dòng)“決策官”的質(zhì)變,其背后的技術(shù)邏輯與在Interspeech 2026挑戰(zhàn)賽中獲獎(jiǎng)的多智能體投票、交叉驗(yàn)證機(jī)制一脈相承。同時(shí),X5所實(shí)現(xiàn)的端側(cè)大模型離線部署,既呼應(yīng)了學(xué)術(shù)界對(duì)模型效率與數(shù)據(jù)安全的追求,更實(shí)現(xiàn)了 “數(shù)據(jù)本地處理” 的隱私保護(hù),讓用戶在無(wú)網(wǎng)絡(luò)環(huán)境下也能享受智能辦公體驗(yàn),真正將論文中的可靠性技術(shù)轉(zhuǎn)化為手中的實(shí)用價(jià)值。
此外,思必馳在智慧辦公領(lǐng)域推出的高端矩陣麥克風(fēng)MA600D、拾擴(kuò)一體吸頂麥MCS06等產(chǎn)品,同樣凝聚了其在聲學(xué)信號(hào)處理、AI降噪等領(lǐng)域的多年學(xué)術(shù)積淀,通過(guò)AI算法重構(gòu)空間聲學(xué),重新定義了企業(yè)級(jí)的溝通體驗(yàn)。從國(guó)際賽事領(lǐng)獎(jiǎng)臺(tái)到日常辦公場(chǎng)景,思必馳正通過(guò)“學(xué)術(shù)筑基-技術(shù)創(chuàng)新-產(chǎn)品賦能”的閉環(huán),讓“可靠 AI”走進(jìn)千行百業(yè)。
從國(guó)際頂級(jí)的學(xué)術(shù)講臺(tái),到競(jìng)爭(zhēng)激烈的賽事榜單,再到觸手可及的智能硬件,思必馳正以實(shí)際行動(dòng)踐行其“構(gòu)建可靠性優(yōu)先的分布式智能體系統(tǒng)”的技術(shù)愿景。此次Interspeech 2026智能體賽道亞軍的獲得,不僅是對(duì)思必馳在音頻推理這一前沿方向上技術(shù)領(lǐng)先性的證明,更是對(duì)其過(guò)去一年在人才、學(xué)術(shù)、產(chǎn)業(yè)三維度協(xié)同并進(jìn)、厚積薄發(fā)態(tài)勢(shì)的最佳注腳。未來(lái),思必馳將繼續(xù)秉持科研與產(chǎn)業(yè)深度融合的理念,以更可靠的對(duì)話式AI,推動(dòng)更多前沿技術(shù)落地為實(shí)用產(chǎn)品,賦能辦公、座艙、家居等全場(chǎng)景,為產(chǎn)業(yè)高質(zhì)量發(fā)展注入創(chuàng)新動(dòng)能。
-
AI
+關(guān)注
關(guān)注
91文章
39755瀏覽量
301355 -
智能體系
+關(guān)注
關(guān)注
0文章
2瀏覽量
5637 -
思必馳
+關(guān)注
關(guān)注
4文章
397瀏覽量
15979
原文標(biāo)題:Interspeech 2026 | 思必馳斬獲全球亞軍,多智能體技術(shù)引領(lǐng) “可靠AI”落地新實(shí)踐
文章出處:【微信號(hào):思必馳,微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
思必馳亮相ISE 2026歐洲視聽(tīng)技術(shù)及系統(tǒng)集成展覽會(huì)
AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動(dòng)
蘇州市委書(shū)記范波一行蒞臨思必馳調(diào)研
思必馳任務(wù)型對(duì)話算法通過(guò)國(guó)家備案
思必馳聲音轉(zhuǎn)換算法通過(guò)國(guó)家備案
思必馳一鳴智能客服大模型通過(guò)生成式人工智能服務(wù)備案
思必馳空調(diào)大模型解決方案
思必馳7月份大事件回顧
思必馳北京AI展廳升級(jí)亮相
思必馳宣布,再獲新一輪融資
傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍
思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍
評(píng)論