近日,機器學習與計算神經科學領域全球頂級學術頂級會議NeurIPS 2025公布論文錄用結果,思必馳-上海交大聯合實驗室共有5篇論文被收錄。NeurIPS(Conference on Neural Information Processing Systems)是機器學習與計算神經科學領域的頂級學術盛會,長期匯聚來自學術界與產業界的最新突破,具有廣泛而深遠的國際影響力。
本次收錄的論文成果聚焦大模型訓練與指令微調的數據工程、可解釋表征與穩健泛化等前沿方向,為思必馳大模型人機對話產品的核心能力提供技術支撐。相關研究成果在實際應用中,支撐了多智能體協同與復雜任務拆解執行、提升了Agent的自治規劃與容錯能力,在端到端語音理解與生成中實現了更高的魯棒性與跨模態一致性,同時為生態Agent的分發管控與個性化對話記憶提供了可解釋的模型基礎。這些進展讓產品在車載語音、家庭助手、客服中臺等場景下,能夠以更穩定、更智能、更自然的方式完成任務與交互,推動人機協同體驗的全面升級。下面介紹本次收錄的代表性成果:
指令微調的數據選取與可解釋表征學習
Task-Specific Data Selection for Instruction Tuning via Monosemantic Neuronal Activations
以模型內部神經元激活而非僅文本語義來表征樣本,并通過稀疏自編碼器將多義激活解耦為可解釋的“單義”特征,在稀疏空間完成任務對齊與相似度度量,實現更穩健的數據精選,為企業級指令微調與垂直應用提供“少而精”的數據基座。

論文簡介:指令微調顯著提升了大語言模型對多樣化人類指令的遵循能力,但在特定目標任務上取得更優表現的關鍵瓶頸在于如何以盡可能小的代價挑選最相關的數據。現有方法要么依賴易受噪聲與實現細節影響的影響力估計,要么采用穩定但高度依賴樣本表征質量的分布對齊。而無論是BM25等淺層特征,還是BGE、LLM2Vec等神經嵌入,都往往難以反映模型實際的內部計算。為此,本文提出以模型為中心的數據選擇范式MONA:以基座模型特定層的神經元激活直接表征樣本,使表示與模型決策過程同構。再利用稀疏自編碼器將多義激活解耦為稀疏、可解釋的單義特征,并在該空間構建更契合稀疏性的相似性度量以對齊目標任務原型,從而穩健打分并篩選候選樣本。覆蓋多數據源、多任務、多模型與多選取比例的系統實驗表明,MONA在穩定性與任務特定性能上持續優于現有基線。在若干設置下,經MONA精選的少量數據即可達到或超過全量微調的效果,同時顯著降低訓練成本并提升可解釋性與遷移性。
長期以來,思必馳深度參與國內外學術前沿研究,在ICASSP、INTERSPEECH、ACL、EMNLP、AAAI、ICML、NeurIPS等頂級學術會議上屢獲佳績,持續產出高質量科研成果。思必馳-上海交大聯合實驗室憑借一系列高水平論文,彰顯了在人工智能語音語言關鍵技術領域的深度探索和重大突破,為行業的發展注入了強大動力。思必馳秉持科研與產業應用緊密結合的理念,未來也將持續探索科技成果的應用轉化。
作為專業的對話式人工智能平臺型企業,思必馳具有源頭技術創新和應用創新的能力,自2022年7月獲國家科技部批準建設“語言計算國家新一代人工智能開放創新平臺”以來,接連于2023-2024年獲批組建蘇州市、江蘇省、長三角三級創新聯合體,并于2025年攜手上海交通大學、蘇州大學,牽頭組建“江蘇省語言計算及應用重點實驗室”,成為國家人工智能戰略科技力量的重要組成部分。
思必馳承擔了包括國家重點研發計劃、國家發改委“互聯網+”重大工程和人工智能創新發展工程、國家工信部人工智能與實體經濟深度融合項目、長三角科技創新共同體聯合攻關計劃項目等十余項國家級、省部級項目,展現出卓越的科研實力與項目落地能力。
思必馳深耕語音語言領域,憑借自主研發的核心技術多次在國際研究機構評測中奪得冠軍;曾三度斬獲國內人工智能最高獎“吳文俊獎”,榮獲中國專利優秀獎,以及信通院車載智能語音交互系統最高級別認證等重要榮譽。技術創新能力備受全球矚目,被高盛全球人工智能報告列為關鍵參與者,也被Gartner評為東亞五大明星AI公司之一。
截至2024年年底,思必馳擁有近100項全球獨創技術,已授權知識產權1597件,其中已授權發明專利633項,參與了71項國家/行業/團體標準,獲得23項國家級的產品認證。近期,大模型人機對話技術創新與產業賦能發展提速,思必馳堅持自主的大模型技術路線,即“構建可靠性優先的1+N分布式智能體系統:1 個中樞大模型+ N 個垂域模型及全鏈路交互組件組成全功能系統”,以任務型交互為核心,結合智能硬件感知優勢,構建垂域大模型和中樞大模型系統,服務企業客戶。
-
實驗室
+關注
關注
0文章
321瀏覽量
20628 -
機器學習
+關注
關注
66文章
8558瀏覽量
137102 -
思必馳
+關注
關注
4文章
407瀏覽量
16020
原文標題:NeurIPS2025|思必馳-上海交大聯合實驗室5篇論文被收錄
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
江蘇省語言計算及應用重點實驗室聯合培養計劃啟動
昆山數科集團與思必馳達成戰略合作
思必馳斬獲Interspeech 2026音頻推理挑戰賽智能體賽道亞軍
思必馳高始興入選工信部制造業人才支持計劃創新企業家
思必馳出席江蘇省語言計算及應用重點實驗室學術委員會第一次會議
地平線五篇論文入選NeurIPS 2025與AAAI 2026
思必馳入選2025年度視聽系統典型案例
強強聯合:之江實驗室與沐曦股份共建智算集群聯合實驗室
思必馳與上海交大聯合實驗室兩篇論文入選ICML 2025
思必馳與上海交大聯合實驗室五篇論文入選NeurIPS 2025
評論