傳音持續(xù)深化AI領(lǐng)域的產(chǎn)學(xué)研協(xié)同,積極推動與國內(nèi)外知名高校的深度合作,圍繞AI視覺、語音、語言與大模型等方向推進(jìn)協(xié)同創(chuàng)新。日前,傳音TEX AI中心與中山大學(xué)、穆罕默德·本·扎耶德人工智能大學(xué)(Mohamed bin Zayed University of Artificial Intelligence,簡稱MBZUAI)聯(lián)合開展的“拍照解題”項目研究取得重要進(jìn)展,相關(guān)成果論文已被計算機視覺領(lǐng)域的國際頂級學(xué)術(shù)會議CVPR 2026正式錄用。

論文鏈接:https://arxiv.org/abs/2512.19554
代碼鏈接:GitHub - yongxinwang-ai/CARE
CVPR是IEEE主辦的計算機視覺與模式識別領(lǐng)域的頂級會議,是中國計算機學(xué)會(CCF)推薦的A類會議,它與ICCV、ECCV并稱為計算機視覺領(lǐng)域“三大頂會”。據(jù)最新數(shù)據(jù),CVPR 2026共有逾三萬人投稿,在進(jìn)入評審流程的16,092篇有效文章中,最終接收率僅25.42%,每篇論文都必須通過3-5位全球頂尖專家的雙盲評審。
近年來,AI大模型在邏輯推理與復(fù)雜問題求解方面的能力持續(xù)提升,但在實際應(yīng)用中,其在復(fù)雜數(shù)學(xué)題上的處理表現(xiàn)仍存在不足。例如,解題結(jié)果正確但推理過程存在邏輯漏洞,或步驟看似完整但實際推導(dǎo)錯誤。這類問題在學(xué)習(xí)場景中尤為關(guān)鍵,相較于答案本身,推理過程的準(zhǔn)確性更直接影響學(xué)生對知識的理解與掌握。
針對這一問題,傳音TEX AI中心與中山大學(xué)、MBZUAI團隊合作,開發(fā)了CARE(Contrastive Anchored REflection)技術(shù),從訓(xùn)練機制上對傳統(tǒng)路徑進(jìn)行了優(yōu)化。不同于僅以“結(jié)果對錯”作為反饋信號的方式,CARE技術(shù)將關(guān)注點前移到推理過程本身,重點引入“高質(zhì)量錯誤樣本”——即那些接近正確但存在關(guān)鍵步驟偏差的解題路徑。通過將這類樣本與標(biāo)準(zhǔn)解法進(jìn)行對比分析,并結(jié)合反思式重推理機制,模型能夠識別具體錯誤環(huán)節(jié),并完成自我修正,從而形成更穩(wěn)定、連貫的推理能力。在引入反思機制后,模型對復(fù)雜問題的二次推理成功率由約10%–19%提升至76.6%,有效增強了面對復(fù)雜題目時的穩(wěn)定性。
此外,CARE技術(shù)還引入“救援機制”:即使多次嘗試均未得到正確結(jié)果,系統(tǒng)仍會從已有錯誤路徑中篩選出“相對最優(yōu)解”,作為進(jìn)一步學(xué)習(xí)的起點,使模型在復(fù)雜問題下仍能持續(xù)優(yōu)化推理能力。
在實際效果上,該方法顯著提升了模型的解題質(zhì)量。在MathVista(圖像數(shù)學(xué)推理)測試中,CARE準(zhǔn)確率比傳統(tǒng)方法的68.9%高13.2個百分點,提升至82.1%;在MMMU-Pro(多學(xué)科綜合推理)測試中,CARE將準(zhǔn)確率從36.4%提升至46.7%。整體來看,CARE 比傳統(tǒng)方法平均提升 4.6 個百分點。
目前,該技術(shù)已進(jìn)入產(chǎn)品化階段,并逐步應(yīng)用于傳音手機智能助手中。基于CARE優(yōu)化后的能力,傳音手機智能助手拍照解題功能在輸出結(jié)果時不僅能夠提供答案,還能呈現(xiàn)更清晰、結(jié)構(gòu)更完整的解題步驟,在面對多步驟推導(dǎo)問題時也更不容易出現(xiàn)邏輯中斷或錯誤累積。這種“過程可解釋”的能力,使AI從單純的解題工具,進(jìn)一步向“可輔助理解”的學(xué)習(xí)工具演進(jìn)。

拍照解題是傳音在 AI 教育應(yīng)用上的重要方向。在非洲、南亞等地區(qū),教育資源相對稀缺,部分家庭在課后輔導(dǎo)方面仍面臨一定困難。傳音推出的拍照解題功能為學(xué)生提供即時的解題思路與步驟解析,在一定程度上彌補學(xué)習(xí)支持資源的不足,幫助用戶更高效地理解知識點,提升學(xué)習(xí)效率,讓前沿科技真正服務(wù)于每個人的生活。
隨著AI技術(shù)持續(xù)向真實場景滲透,AI已經(jīng)成為理解用戶需求、創(chuàng)造新體驗的重要工具。傳音積極將 AI 能力深度融入社交、出行、健康、教育等高頻場景,讓技術(shù)從“可用” 變?yōu)椤罢鎸嵖筛小保瑢崿F(xiàn)用戶的體驗升級。此次聯(lián)合研究成果的落地,也為AI在教育場景中的進(jìn)一步應(yīng)用提供了新的技術(shù)路徑與實踐基礎(chǔ)。通過持續(xù)推進(jìn)以用戶需求為導(dǎo)向的技術(shù)創(chuàng)新,并深化與高校的協(xié)同研發(fā),傳音正不斷將前沿AI能力轉(zhuǎn)化為可落地的產(chǎn)品體驗,讓更多用戶能夠享受到AI帶來的便利。
-
AI
+關(guān)注
關(guān)注
91文章
40647瀏覽量
302307 -
傳音
+關(guān)注
關(guān)注
0文章
88瀏覽量
6602 -
大模型
+關(guān)注
關(guān)注
2文章
3720瀏覽量
5251
原文標(biāo)題:AI拍照解題技術(shù)新突破,傳音相關(guān)研究成果入選計算機視覺頂會CVPR 2026
文章出處:【微信號:TranssionHoldings,微信公眾號:傳音控股】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
奕行智能論文入選國際計算機體系結(jié)構(gòu)頂級會議 ISCA 2026
Nullmax研發(fā)團隊靜態(tài)元素檢測和拓?fù)渫评硇?b class='flag-5'>成果入選CVPR 2026
思特威于ISSCC 2026發(fā)表論文研究成果
西井科技攜手同濟大學(xué) 三篇AI研究成果入選頂會ICLR 2026
光庫科技創(chuàng)新成果亮相APE 2026亞洲光電博覽會
普華基礎(chǔ)軟件開源小滿入選2025中國汽車ESG案例研究成果
時識科技聯(lián)合創(chuàng)新成果SpikeRAM芯片入選ISSCC 2026
上海計算機視覺企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技
奧比中光3D視覺技術(shù)賦能IROS 2025研究成果
易控智駕榮獲計算機視覺頂會CVPR 2025認(rèn)可
Nullmax端到端自動駕駛最新研究成果入選ICCV 2025
理想汽車八篇論文入選ICCV 2025
傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍
傳音相關(guān)研究成果入選計算機視覺頂會CVPR 2026
評論