當全球產(chǎn)業(yè)格局和競爭形態(tài)重塑之時,AI將如何發(fā)展?11月6日,在第八屆世界聲博會暨2025科大訊飛全球1024開發(fā)者節(jié)發(fā)布會上,科大訊飛董事長劉慶峰以《更懂你的AI》為主題,給出了清晰回答。
發(fā)布會上,訊飛星火X1.5發(fā)布,在數(shù)學(xué)、多語言等核心能力上持續(xù)突破。劉慶峰指出:“迄今為止,在中國主流大模型中,訊飛星火仍然是唯一基于國產(chǎn)算力訓(xùn)練的通用大模型?!?/p>
在自主可控的核心源頭技術(shù)底座之上,軟硬一體是科大訊飛AI紅利兌現(xiàn)獨特而清晰的落地路徑。通過將訊飛星火大模型與麥克風陣列、揚聲器系統(tǒng)、顯示與攝像頭等硬件深度融合,AI不再停留在電腦屏幕和APP應(yīng)用上,而是真正深入到家庭、學(xué)校、醫(yī)院、汽車和各種各樣場景中,去解決“真問題”。
而這一切的最終指向,是讓AI邁向“更懂你”的價值階躍。“懂你的AI”就是要懂你的成長、懂你的工作、懂你的生活、懂你的情感,讓每個人都能夠站在AI的肩膀上釋放獨特價值,成為更好的自己。
以下為劉慶峰演講實錄:
尊敬的各位來賓、各位開發(fā)者朋友,歡迎來到2025科大訊飛全球1024開發(fā)者節(jié)現(xiàn)場。
一直以來,我們見證了人工智能不斷發(fā)展進步,日益深入地改變世界的生產(chǎn)和生活方式,尤其是過去3年,以大模型為代表的通用人工智能在全球蓬勃興起。在千行百業(yè)被日益深刻改變的同時,如何讓每個人能夠獲得更大的時代紅利?如何讓AI成為生活、工作助手的同時還能繼續(xù)保留每個人的特色和人格魅力?如何讓AI懂我們自己、家人的成長和健康需求?
這就是今天發(fā)布會的核心主題——更懂你的AI。我們希望讓每個開發(fā)者、每個用戶,都能夠共享AI發(fā)展的時代紅利,那就必須讓AI更懂每個人的特質(zhì)和需求。過去一年,AI蓬勃發(fā)展的速度,可以說是歷次技術(shù)革命從來沒有達到的節(jié)奏和速度,中國生成式人工智能的用戶規(guī)模去年底達到2.49億,已經(jīng)引發(fā)大家的驚嘆,到了今年6月已經(jīng)超過5億多。
今年的世界經(jīng)濟論壇《2025年未來就業(yè)報告》指出,未來五年AI即將取代900萬崗位,也將催生1100萬新崗位,怎么定義職業(yè)、能力數(shù)字模型、培訓(xùn)標準以及職業(yè)測試方法等,這正是我們的教育在AI賦能每個人的過程中要探索的問題。從產(chǎn)業(yè)和資本角度看,今年上半年新誕生的全球54家獨角獸公司中,57%是AI相關(guān)的公司,可以說占了未來全球最頂尖公司的半壁江山。
星火行業(yè)分析師首獲工信部考試認證
300+智能體重要崗位創(chuàng)造巨大價值
在這過程中,訊飛星火大模型在各行業(yè)深度落地,除了教育、醫(yī)療、汽車這些行業(yè)持續(xù)保持行業(yè)第一、擴大領(lǐng)先優(yōu)勢之外,2025年前三季度,央國企的大模型公開招標市場,科大訊飛再次蟬聯(lián)第一名,超過第二名和第五名的總和。
更重要的是,我們看到越來越多的智能體在越來越多的重要崗位創(chuàng)造巨大價值。截至2025年10月,國家能源集團“智能評審系統(tǒng)”,累計評審超18萬單,評審準確率97%,年均產(chǎn)生經(jīng)濟效益19億元。
今天大家都在考慮大數(shù)據(jù)分析師,作為公司戰(zhàn)略咨詢專家、地方經(jīng)濟發(fā)展的關(guān)鍵分析顧問,大數(shù)據(jù)分析師越來越重要,國際能源的態(tài)勢、國際糧食價格怎么變化,怎么受政治、經(jīng)濟、交通、氣候的影響都能夠精準分析,也是大家對AI在發(fā)揮全局性、戰(zhàn)略性指導(dǎo)意義的期待。
就在幾天前,“星火行業(yè)分析師”通過了《大數(shù)據(jù)分析師技術(shù)水平考試》,得分92分(滿分100分),超過85%的人類考生,是國內(nèi)首個參加并通過工信部教考中心技術(shù)水平考試的行業(yè)分析AI應(yīng)用。
科大訊飛已經(jīng)聯(lián)合央國企打磨了300多個“開箱即用”的重要崗位智能體,涵蓋能源、汽車、金融、電力等多個行業(yè)。
2025年科大訊飛AI開發(fā)者大賽有幾個數(shù)據(jù)也令人興奮:一個是參賽隊伍再創(chuàng)歷史新高,來自17個國家、325座城市的36898支隊伍參加。其中有50多個團隊是跨國組隊的,AI讓世界更緊密。我們在東盟博覽會期間發(fā)布覆蓋東盟十國語言的星火東盟多語言大模型底座,就有非常多的東盟團隊和中國團隊聯(lián)合組隊。
智能體是聯(lián)動人工智能各項特定能力與當下生產(chǎn)生活、并以此完成相對復(fù)雜任務(wù)的平臺,本次參賽的4622個垂類智能體中,有近一半團隊并無技術(shù)背景,這也說明會編程、擁有專業(yè)技術(shù)背景似乎并非關(guān)鍵,在具備基礎(chǔ)科學(xué)認知的前提下,更重要的是對AI的把握能力,是靈感、創(chuàng)意、想象力以及對需求的敏銳洞察。
今年,團中央高度重視人工智能發(fā)展,在“挑戰(zhàn)杯”賽事中與科大訊飛聯(lián)合發(fā)起智能體大挑賽,吸引366所院校的676支團隊參賽,之所以選擇與訊飛聯(lián)合發(fā)起,核心在于我們是當前中國主流大模型中唯一實現(xiàn)全國產(chǎn)、全棧自主可控的平臺,且智能體在各行業(yè)的應(yīng)用深度也是最深的。
AI紅利兌現(xiàn)四大關(guān)鍵核心
自主可控、軟硬一體、行業(yè)縱深、個性化
今年以來,亞馬遜是美國硅谷在美國的紐交所和納斯達克市場上增速最快的科技公司之一,杰夫·貝索斯一度成為美國沖頂?shù)氖赘?,可是他剛剛宣布裁員3萬人。今天擁有單一技能已經(jīng)變得越來越危險,必須要有綜合的素養(yǎng)和能力。為什么要做“更懂你的AI”?(因為)我們不能在技術(shù)發(fā)展越來越快、能力越來越強的時候,找不到人類的價值。
更懂你的AI,讓每個人都站在AI肩膀上發(fā)揮他獨特的價值,避免同質(zhì)化內(nèi)卷,讓每個人都站在AI肩膀上綻放,讓世界更加豐富多彩,每個人有成就自己的空間和舞臺。這既是我們的使命,也是我們的初心。
在人工智能蓬勃發(fā)展的當下,AI產(chǎn)業(yè)紅利的充分兌現(xiàn)還需哪些突破?
我們看到,如今不少開發(fā)者的產(chǎn)品不僅面向國內(nèi)市場,更要推向全球——AI產(chǎn)業(yè)生態(tài)究竟該建立在自主可控的堅實地基上,還是把大樓建在別人的院子里?產(chǎn)業(yè)紅利如何跳出手機、電腦等傳統(tǒng)載體,落地到更多生活與工作場景,同時深度對接工業(yè)生產(chǎn)?機器人怎樣擺脫“玩具”標簽,真正成為生產(chǎn)生活中的實用助手?智能體又該以何種方式深度理解行業(yè),在工業(yè)體系中切實發(fā)揮作用?
我們認為,AI紅利兌現(xiàn)有四個關(guān)鍵核心:自主可控、軟硬一體、行業(yè)縱深、個性化。
訊飛星火X1.5升級發(fā)布
自主可控+多語言助力企業(yè)出海“有底氣”
首先來看自主可控方面的進展。2023年,我們和華為共建了中國首個萬卡國產(chǎn)算力集群“飛星一號”,在這個國產(chǎn)算力基礎(chǔ)上我們訓(xùn)練出來中國第一個全棧自主可控的大模型——訊飛星火。
今年以來,科大訊飛再次攻克國產(chǎn)算力訓(xùn)練的兩座大山:一是攻克長思維鏈強化學(xué)習(xí)訓(xùn)練效率,深度推理訓(xùn)練效率從30%提升至84%以上;二是攻克MoE模型全鏈路訓(xùn)練效率,實現(xiàn)大幅提升。
30%是什么概念?別人訓(xùn)練一個模型需要三個月,我們訓(xùn)練一個模型需要一年,人家要五千萬美金,我們要幾億美金,這個仗就沒法打。我們有著像華為這樣的英雄團隊,加上科大訊飛對人工智能底層算法的深度洞察和創(chuàng)新能力,聯(lián)手解決了大量的算子庫的優(yōu)化、平臺適配優(yōu)化等問題,在這個基礎(chǔ)上,我們在全國產(chǎn)算力平臺上訓(xùn)練出深度推理大模型訊飛星火X1。
在過去7個多月時間里,我們又攻克了國產(chǎn)算力MoE模型全鏈路訓(xùn)練效率。什么叫MoE?如果說傳統(tǒng)大模型是一位無所不知的全能天才,有一個“超級大腦”,但每次問他問題,他都得動用整個大腦,非常耗費精力(計算資源),而且他的知識容量總有上限。MoE模型就像一個由多位頂級專家組成的委員會,當你提出一個具體問題,會有一個專家來分析你的問題,其他專家此時可以休息,不參與工作。MoE模型可以實現(xiàn)效率的極致優(yōu)化。今年3月份,MoE模型的訓(xùn)練效率只能達到英偉達A800卡的30%,我們現(xiàn)在把它提高到93%,這兩個都是在國產(chǎn)算力平臺上從0到1的重大突破。
再來看原創(chuàng)性技術(shù)突破:我們?nèi)蚴装l(fā)了非自回歸語音大模型架構(gòu),實現(xiàn)推理效率的大幅提升。非自回歸語音大模型與傳統(tǒng)自回歸模型逐字順序生成文本不同,能夠并行、一次性輸出整個文本序列。全世界都在用自回歸模型,而我們用了非自回歸模型,把語音大模型的訓(xùn)練效果相對提升16%,推理成本大幅下降520%。該項技術(shù)已經(jīng)應(yīng)用在訊飛輸入法15.0版。
正是因為持續(xù)的技術(shù)突破,我們的全棧自主可控大模型不斷進步。迄今為止,在中國主流大模型中,訊飛星火仍然是唯一基于國產(chǎn)算力訓(xùn)練的通用大模型。在這個硬科技輸不起的人工智能時代,我們?yōu)橹袊拇竽P蛧覒?zhàn)略托了底,主流大模型的定義就是:國內(nèi)通用大模型APP下載量排名前十,或大模型招投標市場份額排名前十。
在十大模型外,我們也沒有看到第二個有影響力的模型是通過國產(chǎn)算力訓(xùn)練出來的,為什么?因為太難了,有太多的“坑”要踩,還會影響到模型訓(xùn)練。如果沒有真正底層創(chuàng)新的能力,就不敢用國產(chǎn)卡,發(fā)現(xiàn)問題也解決不了。訊飛做到了的原因,既有訊飛對自身的核心技術(shù)、創(chuàng)新能力的自我期許和自信,也有家國情懷的初心鞭策,還有像華為這樣的偉大公司的聯(lián)手推動。
今天,我們正式發(fā)布訊飛星火X1.5,大家現(xiàn)在就可以在APP上下載,體驗最新的能力。
給大家概括一下它的能力,在全棧自主可控模型參數(shù)小一倍的情況下,我們是293B的MoE模型,就是2930億的模型,激活之后是30B,就是300億的模型。為什么選擇這個參數(shù)?因為我們的用戶在這樣的模型架構(gòu)上,如果醫(yī)院、學(xué)校、政府機構(gòu)、央國企單位要用它,只要購買一臺標準的國產(chǎn)昇騰服務(wù)器就可以部署這個模型,而其他的MoE模型至少兩臺才能部署。
在這樣一種性能、成本優(yōu)化的前提下,可以看到訊飛星火X1.5的語言理解、邏輯推理、數(shù)學(xué)能力都是與業(yè)界主流最好的模型GPT-5(high)版來對標,和國內(nèi)很多大模型比,我們的指標也是排在最前面的。
再往深度一點看,比如數(shù)學(xué),數(shù)學(xué)絕不只用在教育上,還用在AI for Science的復(fù)雜計算、行業(yè)分析師以及各行業(yè)的縱深領(lǐng)域。今年6月8日高考數(shù)學(xué)一卷解密的時候,第三方的權(quán)威機構(gòu)就做了測評,把國內(nèi)六個最主流的大模型和OpenAI o3放在一起測。高考數(shù)學(xué)一卷我們得了141分(滿分150分),我們跟DeepSeek V3.2-Exp是僅有的兩家過了140分的大模型,OpenAI o3是138分,其余大部分大模型是120分左右。經(jīng)過這次升級,數(shù)學(xué)一卷我們已經(jīng)可以得147分,在綜合的各類高考卷子中,訊飛星火X1.5能得145分,美國最好的模型GPT-5(high)是141分,DeepSeek V3.2-Exp也進步很快,是140分。
真正難的題目是用來區(qū)分誰是真正的高手,在這次高考中我們表現(xiàn)最好。所以,我特別想用數(shù)學(xué)舉例,不像知識問答,今天錯了,補一個問答就可以做對,對于數(shù)學(xué),不會就是不會。總體來說,數(shù)學(xué)是真正能看到大模型深度推理能力的一個標志。
在各種各樣的國際數(shù)學(xué)奧林匹克競賽中,訊飛星火X1.5均表現(xiàn)很好。一些問答中,你去提問,不要過度推理,訊飛星火X1.5能給你簡潔而正確的答案。訊飛星火X1.5這些能力的提升,對我們下一步在重點行業(yè)落地有非常重要的戰(zhàn)略意義。用國際數(shù)學(xué)奧林匹克競賽的題目舉例,需要對數(shù)論和方程有比較好的理解能力才能做好,從簡單推理入手,不斷擴散開來,最終找到合理路徑的過程。國際和國內(nèi)所有主流模型都做不出來這道題,但我們能做出來,訊飛星火X1.5在這類推理題目上有更強的能力。
正因為有了底座模型,所以我們才能在小一個數(shù)量級的參數(shù)下和國際最先進的大模型進行對標,在行業(yè)大模型中的領(lǐng)先優(yōu)勢才能進一步擴大。今年10月份互聯(lián)網(wǎng)教育智能技術(shù)及應(yīng)用國家工程研究中心發(fā)布的《教育大模型“成績單”公布:誰是最懂教學(xué)的AI》,我們的教育大模型是第一名且領(lǐng)先優(yōu)勢不斷擴大,在教育領(lǐng)域中用于輔助教學(xué)、輔助學(xué)習(xí)、輔助考試、輔助評價和輔助管理,綜合成績過了90分。85分是一個門檻,在業(yè)界能過85分的只有幾家,而我們顯著領(lǐng)先第二名。
醫(yī)療上的領(lǐng)先更加明顯,基于訊飛星火X1.5,星火醫(yī)療大模型在醫(yī)療的語言理解、診療推薦等功能上遠超其它模型,平均分已經(jīng)達到91分以上。
在行業(yè)模型不斷進步的基礎(chǔ)上,我們也在不斷為世界提供“第二種選擇”,訊飛星火的多語言大模型能力持續(xù)升級,我們的戰(zhàn)略生態(tài)位和使命就是:自主可控對標全球頂尖,行業(yè)模型做到全世界第一,多語言模型為世界提供“第二種選擇”。
現(xiàn)在我們可以支持超過130種語言,整體性能達到最新的GPT-5(high)的95%以上,確保不出現(xiàn)代差,在最迫切需要的行業(yè)中還要實現(xiàn)超越。在底座模型層面,針對拉美、東盟等與中國關(guān)聯(lián)密切的重點國家和地區(qū)所需語言,我們以14種語言覆蓋超過60個國家和地區(qū),且已實現(xiàn)效果領(lǐng)先。
想要實現(xiàn)很好的翻譯能力,不光要單個語種做得好,還需要多語種聯(lián)動的基礎(chǔ)。在今年的國際數(shù)據(jù)公司(IDC)《中國AI翻譯技術(shù)評估》報告中,星火語音同傳大模型在所有8項指標:推薦度、翻譯速度、翻譯效果、專業(yè)度、擬人度等都是行業(yè)第一。
今天,這么多開發(fā)者關(guān)注訊飛的技術(shù)進展,我特別自豪地告訴大家,中國的開發(fā)者們只要用訊飛星火,出海再也不用擔心“卡脖子”了!

AI+麥克風、揚聲器、攝像頭、視覺呈現(xiàn)
“軟硬一體”獨特路徑讓大模型“真”落地
結(jié)合剛才提到的自主可控進展與底座模型,大模型應(yīng)用落地紅利兌現(xiàn)的第二大關(guān)鍵是“軟硬一體”——核心在于讓大模型跳出手機、電腦等傳統(tǒng)設(shè)備,走進真實生活場景,在各類智能終端及家庭設(shè)備中充分發(fā)揮作用,這也是AI在真實世界應(yīng)用落地的關(guān)鍵。
這個關(guān)鍵中當前最欠缺的是有沒有麥克風陣列?能不能遠距離多人說話都能聽懂?與機器人或智能設(shè)備溝通能不能不需要操控和觸摸?能不能用揚聲器陣列,在一個小小汽車空間、在教室里面營造出來大劇院式的聲場效果,讓每個角落都能聽得清?能不能用攝像頭陣列,不僅能聽懂聲音,還能看懂手勢、知道現(xiàn)場環(huán)境,用更護眼的方式來呈現(xiàn)?這是四個最重要的大模型落地的需求。
在過去的幾年中,科大訊飛最重要的一件事情是在全國產(chǎn)平臺上實現(xiàn)軟硬一體化,把硬件能力和大模型深度對接,然后形成了AI+多個硬件系列的創(chuàng)新技術(shù)。
例如,我們原創(chuàng)了AI+麥克風陣列技術(shù),不是簡單的硬件布置,是基于AI的測算和動態(tài)調(diào)節(jié)使用激活相關(guān)部件,實現(xiàn)了語音屬性解耦,不同的人講話可以解耦,噪音和人聲解耦,信號的時空分離,不同位置上的聲源精確定位,自適應(yīng)的背景降噪,回聲消除以及說話分離等技術(shù)。
給大家看一個例子,科大訊飛智能辦公本X5 Pro和iPhone17 Pro這兩個設(shè)備在遠場抗噪的情況下怎么樣?如果背景噪音不斷加大,誰能聽得懂?如果放在3米、5米之外誰能聽得清?來做一個真實的測試。
這就是我們在辦公本上首創(chuàng)的上4下4環(huán)麥克風大陣列,辦公本今年“雙十一”到目前為止都是銷量排行榜的冠軍,很多人都在使用。為什么用iPhone進行比較?因為它一直把語音作為非常重要的核心能力。如果在幾米之外卻沒法操控,無論你有多聰明的對話系統(tǒng),多聰明的生成能力,都沒法在真實生活中發(fā)揮作用??梢钥闯?,遠場高噪情況下,我們的技術(shù)在國際上有顯著領(lǐng)先優(yōu)勢。
再看剛剛推出來的訊飛AI翻譯耳機,用了“骨導(dǎo)+氣導(dǎo)”雙拾音降噪,首創(chuàng)單耳三麥多感融合降噪系統(tǒng)。拿蘋果最新第三代耳機AirPods 3來比,在食堂、地鐵等80分貝的高噪環(huán)境中,它的識別準確率達到97.1%,而蘋果耳機識別準確率是77.7%,這個耳機不僅有最好的翻譯能力,還有最好的降噪能力,戴在耳朵上也很輕巧。
我們在今年大阪世博會上還發(fā)布了新一代雙屏翻譯機,其中特別重要的一個亮點就是獨創(chuàng)了強降噪模式,1米以內(nèi)穹頂式隔音。當我聽到主席臺上甚至聽到更遠的人講話的時候,照樣可以翻譯;希望兩個人交流的時候,一米之外無論多吵,都不會有干擾,就可以直接啟動穹頂式隔音。
穹頂式隔音的能力和水平,絕不只是翻譯機上使用,在各種需要降噪的(工具)上都可以使用。
在噪音環(huán)境下如何精準去除噪音、把聲音有效提升、精準聽到遠距離低分貝的聲音、進行更有效的分區(qū)域的隔音等等技術(shù),都是大模型以及人工智能要應(yīng)用在我們?nèi)粘I钪斜仨毥鉀Q的技術(shù)。很高興地告訴大家,這些技術(shù)科大訊飛不僅是全球第一,而且很多技術(shù)都是我們獨創(chuàng)的。
在這個基礎(chǔ)上,我們還推出了業(yè)界首個軟硬件一體的同傳麥克風。
這個同傳麥克風可以非常快速,2秒內(nèi)低延遲地、精準地進行同傳后的語音播報,因為要解決離線問題,目前擁有10種語言能力,將來要做到上百種語言?,F(xiàn)在訊飛星火支持的語言已經(jīng)有130多種,翻譯機的離線語言將近20種。同時還能私有化部署實現(xiàn)完全加密,在單邊會議、多邊會議、外事會見、餐敘交流中都可以充分使用,讓AI翻譯機來翻譯,就不會丟失相關(guān)細節(jié),信息更全面、談判更精準。
還想和大家分享的是軟硬件一體在汽車上的應(yīng)用效果。
在奇瑞的汽車上,我們已經(jīng)有很多來賓體驗過劇院式的臨場音響效果,自研的揚聲器的硬件設(shè)計技術(shù)和低音炮效果用合理的方式進行組合,用更輕的、更好的材料進行設(shè)計,并聯(lián)動AI算法,實現(xiàn)相位校準和延時同步、聲場重建及控制、動態(tài)范圍的壓縮和均衡以及車內(nèi)聲場空間的環(huán)境渲染等,能讓你聽到更清楚的細節(jié),聽到更棒、更保真的音效。
它還能分區(qū),駕駛員講話,后面的乘客可以不受干擾,后座講話駕駛員都聽不見。有人看大片,有人聽新聞,有人聽音樂,各不干擾。在汽車中,我們支持46個高品質(zhì)聲學(xué)單元,通過AI后臺自動聯(lián)動,聲音的隔離度超過了22dBA,聲能量的隔絕率超過99.3%,只留出不到1%的聲音能聽到,只要不是故意大聲說,其他位置根本聽不見。
到今年9月,我們iFLYSOUND智慧聲場產(chǎn)品的累計出貨量已經(jīng)超過100萬臺,明年單年就會超過100萬臺。
11月5日,我們在合肥大劇院上演一場“聽覺盛宴”,虛擬現(xiàn)場的音響效果令大家非常激動。我們的合作伙伴奇瑞等車企開展過盲測,在不知道是誰的設(shè)備(的情況下),請用戶來測。售價15萬元的奇瑞車搭載了iFLYSOUND智慧聲場,音效效果可以超越寶馬740i,媲美最頂級豪配的邁巴赫S680的效果。
我們打破了過去30年車內(nèi)音響所有關(guān)鍵組件要依賴進口的情況,實現(xiàn)100%國產(chǎn)化,歐洲的一些頂尖的音響硬件品牌現(xiàn)在想要搭載奇瑞的“伯牙之音”(背后的技術(shù))。這個技術(shù)結(jié)果就是軟硬件一體所帶來的“魔力”,絕不僅僅是硬件的創(chuàng)新,還要跟AI深度聯(lián)動,才能做出原來根本沒法想象的事。
科博展的展位上,在全球首發(fā)的AI黑板上,因為有24通道的AI揚聲器陣列以及和教室場景的均衡處理能力,讓同學(xué)們在教室每個角落都能輕松聽清。
原來,在前排的同學(xué)聽的聲音太大,時間長了會損傷大家的聽力,而后排的同學(xué)聽不清?,F(xiàn)在,我們可以做到,前后排10米空間聲壓差小于3dB(20米房屋蚊子的叫聲大約20dB),讓孩子不再擔心困擾,再也不會出現(xiàn)老師用一個“小蜜蜂”回聲聽不清的情況。
在聲音播放中的聲場重建的能力,已經(jīng)在汽車和教室中深度落地。
再進一步講到“顯示”,10月24日,我們發(fā)布了新一代訊飛AI黑板,是全球首款、經(jīng)過歐盟認證和國內(nèi)各種各樣的護眼認證的圓偏類自然光護眼大屏。
這個大屏的特點是什么?
它能讓教室任何角落的孩子都看清黑板——過去坐在中間的孩子看黑板看得清晰,坐在邊角就看不清,而AI黑板的130度視角可完全覆蓋教室各個角落,讓每個孩子都能看得清清楚楚。
它不僅視覺效果出色,還具備深度護眼能力,能通過模擬自然光、合理提升并均衡亮度視角等功能呵護視力,最終讓教室里的每個同學(xué),無論“聽”還是“看”,都能擁有C位體驗。
除此之外,科大訊飛AI學(xué)習(xí)機上已經(jīng)有了專門的護眼模式,不僅有微納米類紙屏防止眩光、高透更清晰,還有AI環(huán)境光檢測算法,讓直頻調(diào)光無頻閃,充分護眼,獲得了國內(nèi)外10多項的護眼認證。
AI除了在顯示中結(jié)合,還能對坐姿進行自動判斷。孩子坐得過近,姿勢歪斜、躺著看書等,AI全部能自動提醒,全方位護眼。
屏幕是孩子以及我們每一個人接觸世界的窗口,很多人說近視眼是中國中小學(xué)孩子最大的健康問題,10年之后,因為刷視頻、刷手機時間太多,非常多的人眼睛會出大問題。在護眼上,我們有了軟硬件一體化和AI的對接,這也是讓最好的大模型進入到每個人身邊,來到更多場景使用的關(guān)鍵。
除此之外,我們還專門打造獨家的AI+攝像頭陣列技術(shù),能實現(xiàn)目標的精準識別與實時跟隨。云臺攝像頭內(nèi)置全棧自主可控的芯片與AI算法,即便跑得最快的人也無法脫離其跟蹤與識別。
我們可以在車內(nèi)外云臺,做視線估計、圖像彎曲矯正、360度環(huán)視拼接、多攝像頭跨視角追蹤、拍照識別等功能,這些東西組合起來就是軟硬件一體。通過視頻攝像頭陣列、麥克風陣列、聲場、顯示來構(gòu)建AI融入真實世界的物理基礎(chǔ),硬科技創(chuàng)新融入以后,這個物理世界的人物是什么樣的?我想帶大家感受一下。
首發(fā)個性化記憶能力和百變聲音復(fù)刻
超擬人多模態(tài)交互是AI進入每個家庭的標配
今天為什么有很多的虛擬形象、APP沒法進入到日常生活?
一個真正的多模態(tài)交互技術(shù)要具備哪些東西?麥克風的遠場識別(在遠距離、高噪聲的環(huán)境下精準語音識別),3D視覺感知(比如知道你給他做的手勢是暫停還是表揚),多人主動交互(數(shù)字員工要像真人員工一樣提供服務(wù),對于見到過的朋友、董事長、員工、客人等可以非常清晰地判斷出來),有類人的舉止反饋,能夠進行視覺、聽覺融合理解(把麥克風和攝像頭完整組合在一起理解),實現(xiàn)超擬人數(shù)字人,還要有個性化記憶和有情感語義的理解,有了這些技術(shù)的綜合聯(lián)動,我們的AI就不再是一個簡單的APP軟件了,可以更有情感,更有深度。
這次在訊飛星火深度推理大模型X1.5中,首發(fā)了個性化記憶能力。通過多語言的信息檢索和相關(guān)的應(yīng)用,能夠找到相關(guān)用戶的個人記憶(包括個性化的記憶識別,提取以及更新),可以畫你的人設(shè)。
比如現(xiàn)在有一輛奇瑞新能源汽車,對汽車標注“新能源”,你說汽車要去續(xù)航,就知道需要到加電站去。如果最近生病了,就會提醒你最近要注意哪些問題。包括個人的學(xué)習(xí)和工作資料庫,使我寫出來的內(nèi)容和別人不一樣,更符合我的要求。
這些整體個人的資料和畫像,基于對話反饋的進行動態(tài)更新,是訊飛星火X1.5非常重要的特色,用戶都能感受到,而且在持續(xù)深化。
另外,業(yè)界首發(fā)百變聲音復(fù)刻能力。當年模仿林志玲,要到臺灣錄一個禮拜的聲音;后來模仿郭德綱,要錄一天;后來復(fù)刻聲音需要一小時語料,到現(xiàn)在錄制一句話就可以模仿,技術(shù)在迅速進步。
原來的一句話模仿,你讀的什么腔調(diào),生成的對話也是這個腔調(diào)。現(xiàn)在,技術(shù)進一步提升,用戶可以隨意定義自己要的風格,馬上自動生成。也可以錄制一句話后,用這個聲音生成各種各樣的風格,而不受限于講這個話的風格限制。
剛才給大家看到的超擬人數(shù)字人的多模態(tài)對話,不僅要有硬件的麥克風、視頻攝像頭和AI的聯(lián)動,后臺一定要有超強的大模型多輪對話、指令跟隨、語義語解和生成能力,再配合超強風格的個性化音色,才能把看起來同質(zhì)化內(nèi)卷的大模型變成每個人都喜歡的、身邊的學(xué)習(xí)和工作助手。這些技術(shù)在業(yè)界踏踏實實往前走了一步,無論是語音識別的效率和水平,還是語音合成,我們在業(yè)界都是代差級領(lǐng)先。
未來,超擬人多模態(tài)交互將是AI進入每一個家庭的標配。
為什么要花這么長時間和大家說這個事?因為開發(fā)者都面臨著一個重大的機會。大模型紅利兌現(xiàn),我們有更有力的手段和底層技術(shù),讓它能夠幫助到每個人,也能賦能到每個行業(yè)。
更懂你的AI
“工作、生活、成長、情感”通通都要
我們這次發(fā)布會的主題叫“更懂你的AI”,要讓每個人站在AI肩膀之上,而不是在關(guān)鍵能力上被AI替代。我們的個人特質(zhì)再加上AI,會使它更有風格、更有特色,也比通用的AI更吸引人、更有個人魅力,同時也更懂我們的需求,無論是教育成長還是健康需求。
什么是“更懂你的AI”?
根據(jù)認知心理和發(fā)展心理的相關(guān)理論,大致把每個人的需求分為工作、生活、成長、情感的需求。
人們要追求進步和自我實現(xiàn),AI要懂他的潛能,因材施教,幫助他成長;在工作中,人們要追求效率和成就,AI要懂邏輯、懂任務(wù),幫他提效,而不是簡單地做一個大家看起來好用、第一眼驚艷,但是沒法落地的東西;在生活中,人們要追求安全、追求穩(wěn)定、追求愉快和健康,AI要懂健康、知習(xí)慣;人們有情感需求,追求良好的關(guān)系與深度的理解,AI要懂語言、能共情。
這些是“更懂你的AI”的基本要素。
我們今天打造“更懂你的AI”,需要有歷史記憶、人格特征、多維理解、專有知識。
這樣一個非常抽象的、涵蓋面如此之廣的“更懂你的AI”,怎么讓大家體驗到,我通過一些應(yīng)用給大家解釋。
比如說教育,怎么更懂孩子的成長?
最關(guān)鍵的是怎么樣給學(xué)業(yè)減負增效,騰出更多時間去玩、去鍛煉、去發(fā)展自己的興趣愛好,那么最重要的是要懂學(xué)情。我們做了整題評分技術(shù),不僅做到業(yè)界領(lǐng)先,還在持續(xù)擴大我們的領(lǐng)先優(yōu)勢,已經(jīng)達到高考級閱卷的要求。
在此基礎(chǔ)上,我們做了分步驟批改技術(shù),能分析到底哪一步、哪一個環(huán)節(jié)出錯,在業(yè)界首次達到實用門檻。今天,我們又率先在全球?qū)崿F(xiàn)了基于分步驟批改作業(yè)的錯因分析,告訴孩子是什么原因錯的,應(yīng)該從哪些維度去復(fù)習(xí),去提升自己的能力。
我們首創(chuàng)了“三級錯因體系”,從一級錯因是知識掌握、思維方法、解題習(xí)慣,二級錯因有公式混淆、方法選擇錯誤、書寫不規(guī)范等錯誤,再到三級具體知識點錯因,整體呈現(xiàn)出三大類三層級4000多個錯因標簽。
這個錯因體系經(jīng)過了非常嚴格的一線驗證和專家測試,最近國家義務(wù)教育數(shù)學(xué)課程標準修訂組組長曹一鳴教授專門帶領(lǐng)專家組做了鑒定,認為體系創(chuàng)新引領(lǐng)、科學(xué)嚴謹,錯因診斷水平超過了普通老師,已經(jīng)可以使用。
今天我們再次以軟硬件一體化的方式去實現(xiàn):首先是放在桌面上的星火智能批閱機,不僅能夠批改作業(yè)、給出錯因分析;再到通過星火教師助手給老師推送復(fù)習(xí)策略,及時調(diào)整課件;最后老師可以基于AI黑板實現(xiàn)精準教學(xué)。
這背后,既要有最好的教育大模型,又要有軟硬件一體化的星火智能批閱機和AI黑板。
我們和很多教研組老師溝通,他們特別興奮的一件事情是什么?
現(xiàn)在老師的工作任務(wù)很多,孩子頭一天的作業(yè)老師在第二天晚上才有時間批改,批改完之后才能發(fā)現(xiàn)孩子的薄弱點,但這中間有一天的時間差。有了星火智能批閱機,早讀課之前作業(yè)收上來,早讀課結(jié)束,老師上第一堂課的時候,學(xué)情分析報告就已經(jīng)拿出來了,真正快速聯(lián)動前一天學(xué)生的作業(yè)和第二天課堂教學(xué),實現(xiàn)作業(yè)批改到教學(xué)的小時級閉環(huán),使得按照知識習(xí)得的教學(xué)順序能夠更合理地往前推動,對教育的均衡和教學(xué)質(zhì)量的提升意義非常重大,可以說,這會引領(lǐng)一場教學(xué)范式的變革。
在教育領(lǐng)域,我們還在推動一件更有溫度的事情——AI老師。孩子的發(fā)展有其自身規(guī)律,有時候跟孩子溝通完全靠講道理是很難的,更多的是要用情感去打動他,一個好的老師可以讓孩子愛上學(xué)習(xí)。
什么是一個好的老師?我們做了很多調(diào)研,也問了很多專家和學(xué)生,說需要親切、陽光、愛笑、幽默,還想要善于鼓勵、有同理心、有耐心、能夠因材施教的老師——要求很寬泛,大概每個人心中都有一個自己想象的最好的老師。
根據(jù)普遍特征,我們研發(fā)了更有愛的AI老師。
有AI技術(shù)做支撐,這個老師不僅能完成因材施教,還十分有親和力、有耐心、善于鼓勵孩子。如果有這樣的老師,學(xué)習(xí)熱情會高漲很多,也可以防止“不輔導(dǎo)作業(yè)母慈子孝,一輔導(dǎo)作業(yè)雞飛狗跳”。這個AI老師,即將入駐科大訊飛教育產(chǎn)品。
還有一個大家特別關(guān)注的——什么是“更懂你的健康”。
AI要有最好的醫(yī)學(xué)診斷能力。但它不是替代醫(yī)生,而是幫助醫(yī)生一起做更好的服務(wù)。AI知道你本人、父母親以及孩子的健康檔案,包括每次體檢的變化,就能做健康管理、咨詢和就診前的各種各樣的咨詢和服務(wù),診后的身體調(diào)養(yǎng)和相關(guān)跟蹤。
訊飛智醫(yī)助理到目前為止仍然是獨家通過國家執(zhí)業(yè)醫(yī)師資格考試的人工智能系統(tǒng)。當年考了456分(滿分600分),現(xiàn)在可以考到520分以上,超過了99%的考生。目前智醫(yī)助理已經(jīng)為4.9億份電子病歷給出了11億次的輔助診斷,修改了186萬不合理的診斷,和1.1億不合理的處方提示,把基層的診斷合理率從70分提升到96分。安徽每一個村醫(yī)工作室、鄉(xiāng)鎮(zhèn)衛(wèi)生院和社區(qū)醫(yī)院都在使用,全國已經(jīng)有超過800個縣區(qū)在使用。
今天,我們結(jié)合星火醫(yī)療大模型,再次升級智醫(yī)助理。覆蓋病種從2000種拓展到2500種,首診合理度從95%提到98%,還新增了醫(yī)學(xué)思維鏈循證推理,展現(xiàn)給醫(yī)生和患者,讓他更了解邏輯而不是簡單給個結(jié)論,并且新增中醫(yī)輔助診斷。
現(xiàn)在,智醫(yī)助理每天在一線給超過100萬的病人提供診療服務(wù),有了智醫(yī)助理,每一個普通老百姓都可以享受最好的全科醫(yī)生服務(wù)。也是因為每天上百萬次的輔診,形成了很好的數(shù)據(jù)飛輪,所以智醫(yī)助理越來越聰明,越來越好用,在國際上,醫(yī)療大模型的領(lǐng)先優(yōu)勢不斷擴大。
這些能力從基層進一步延伸,已經(jīng)往等級醫(yī)院提升。在病情更復(fù)雜的住院場景,星火醫(yī)療大模型無論是準確度、完整性還是實用性上已經(jīng)達到等級醫(yī)院主任級醫(yī)師水平。
今天,星火醫(yī)療大模型的能力已經(jīng)達到三甲醫(yī)院門診和住院的水平。當人工智能的能力跟醫(yī)生結(jié)合之后帶來的幫助是什么???频脑\斷合理率從87%提高到96%,協(xié)助醫(yī)生看得更全;跨科室診斷合理率從81%提到91%,不僅讓醫(yī)生診斷得更準,還讓醫(yī)生的效率更高;病歷書寫時間減少50%,很多事情經(jīng)過對話交流自動生成相關(guān)病歷,只要最后確認一下就行,大幅提升了等級醫(yī)院醫(yī)生的診療和服務(wù)能力。
這次首發(fā)的智醫(yī)助理醫(yī)院版1.0已經(jīng)正式跟很多醫(yī)院開展了合作,并開始進入醫(yī)院真實場景中,從輔助診療到輔助會診,再到病歷生成和病歷質(zhì)控,從基層到等級醫(yī)院帶來巨大的進步。
我們還升級了訊飛曉醫(yī)APP,這是每一個老百姓都可以下載的(應(yīng)用)??床∏皢栆幌聲葬t(yī),知道應(yīng)該到哪個科室掛號,帶什么資料;吃藥前問一問,防止吃錯藥;體檢后問,它可以做前后對比,提醒你生活習(xí)慣,幫你解答各種問題。
根據(jù)剛才醫(yī)療大模型能力提升,我們再一次對訊飛曉醫(yī)做了升級。升級以后的訊飛曉醫(yī)APP,特別構(gòu)建了全新的健康空間,可以把你的健康檔案構(gòu)建得更完整。無論是體檢、自己問診買藥還是去看門診,99%的醫(yī)學(xué)報告訊飛曉醫(yī)全部都能讀懂。
有170種細分標簽維度來覆蓋個人的基本信息、健康狀況、手術(shù)用藥、疾病以及家族史等等,當出現(xiàn)一個緊急情況,它可以更精準地給出依據(jù)你的健康畫像做出的分析報告。
健康管理覆蓋20余個科室常見慢病及重要疾病,讓你在家里就能得到更精細的管理,以及隨時隨地服務(wù)和陪伴。
訊飛曉醫(yī)現(xiàn)在有1.6億次的AI咨詢,好評率達98%。
今天,中國新能源汽車、中國智能網(wǎng)聯(lián)汽車的發(fā)展這么快,怎么把大模型“做”到車上、在車上更懂你?懂你,知道你的健康、習(xí)慣;懂車,懂車內(nèi)的所有操控,不只是簡單的APP聊天;還要懂環(huán)境。
當汽車擁有了這樣“懂你”的能力,又上了一個很大的臺階。
今天發(fā)布的星火智能座艙2.0,懂你、懂車、懂環(huán)境,車內(nèi)的2000+原子化能力都可以(組合)操控,絕不是簡單的APP;懂車外環(huán)境,什么地方應(yīng)該停車,外面有沒有積水,前方的視覺死角有沒有人,都能看到;懂車內(nèi)情境,懂你的意圖,懂你的歷史,也懂你的健康。這樣一輛汽車,把生活、辦公和娛樂都搬上來了,我們再也不用擔心堵車過程中的煩惱。
最后給大家看一下,什么是更懂你工作的AI?這個工作中有懂你的崗位、懂你的風格、懂你的資料、懂你的同事。
介紹兩個身邊觸手可及的產(chǎn)品。
一個是訊飛智能辦公本,已經(jīng)連續(xù)6年市場品類第一,不僅可以快速地記錄,還可以幫你生成各種各樣的文稿等。最新的訊飛智能辦公本不僅具備超強的抗噪能力,能夠在極限噪音環(huán)境下仍然保持精準的轉(zhuǎn)寫,還可以幫我們生成各種待辦事項,并一鍵辦理。
它將來會真正成為我們貼身的辦公伙伴、辦公搭子。
很多沒有辦公本的朋友們怎么辦?可以下載訊飛聽見,它具有訊飛辦公本的核心能力。目前,訊飛聽見總用戶數(shù)已經(jīng)超過9800萬。
懂你工作的AI就一定要是自動便捷、越用越好用的,不需要額外再花精力去學(xué)習(xí)。
最后還有一個彩蛋送給大家,給大家介紹一位訊飛星火打造出來的新朋友,這個朋友是誰呢?
這個“AI星朋友”不是一個概念,而是大家可以掃碼體驗的。你可以問它,也可以設(shè)定需求,它會在特定時間主動打電話給你,它有自己的人設(shè)。當前,“AI星朋友”的初步用戶周均使用次數(shù)9.8次,56%的月活率,正向情緒反饋率達82%。
在這樣一個快速發(fā)展、極度競爭、充滿焦慮的時代,每個人都需要一個懂他的成長伙伴,陪他走向更好的自己。這個AI伙伴,不是消耗元氣的信息繭房,而是幫助人們走到更好的真實世界,走向更好的自己。
“AI星朋友”已經(jīng)上線,大家可以掃碼或微信搜索“AI星朋友”小程序,就可以體驗使用。
發(fā)布首個原生支持RPA智能體平臺Astron
“讓每個人都站在AI肩膀上”是訊飛初心
我們相信,只有整個生態(tài)的繁榮,才有人工智能的大未來。今天我們提到的所有能力,都將賦能給所有開發(fā)伙伴,共同擁抱這個未來。
在自主可控的底座上,我們的開發(fā)者在過去一年增長了200多萬,其中增長最快的是軟硬一體的智能硬件開發(fā)者,大模型的企業(yè)開發(fā)者增速更快,達到了125%;新型智能體的開發(fā)者有近一半來自非技術(shù)領(lǐng)域,現(xiàn)在不僅不用懂軟件,也不用懂硬件了,我們有最好的支撐給你做各種參考設(shè)計。
針對智能體的蓬勃發(fā)展,面向開發(fā)者,我們打造了首個原生支持RPA的智能體平臺叫Astron。
很多時候,你給智能體講一段話、提一個要求,它把這段話分解成各種任務(wù),知道找什么樣的工具,查找內(nèi)外信源完成你的任務(wù)。但是現(xiàn)在有很多正在運行的工業(yè)系統(tǒng)和各種賬號體系沒有接口,沒法拿到,怎么辦?假設(shè)有十個環(huán)節(jié),但凡有一個環(huán)節(jié)智能體沒法突破,就僵在這個地方?jīng)]法運行,現(xiàn)在我們用RPA自動模擬操作,改變純智能體達不到的場景中的快速聯(lián)動,從而實現(xiàn)用“Agent+RPA”跨越AI應(yīng)用鴻溝,有效打通企業(yè)內(nèi)部缺少接口的IT系統(tǒng)和賬號體系,以及卸載運行的各種系統(tǒng)。
這是一個非常大的變化,特別在那些萬無一失的場景下,用RPA來補充智能體和Agent是必要的選擇。我們在業(yè)界打造了首個原生支持RPA的智能體平臺,還有八大行業(yè)精品智能體,開箱即用,從教育、文旅、機器人到各種智能硬件,法律服務(wù)、企業(yè)出海、輕辦公以及數(shù)字員工。
我們想與千萬開發(fā)者共創(chuàng)生態(tài)繁榮,在這樣一個人工智能大模型紅利兌現(xiàn)的關(guān)鍵時點上,給大家呈現(xiàn)了自主可控、多語種、更懂你的AI、軟硬一體和多模交互,從技術(shù)能力上給大家更好的支撐,也從情感溫度和導(dǎo)向上讓大家在“更懂你的AI”上做得更好。
人工智能是硬科技,是強技術(shù)競爭,更是有溫度的技術(shù),讓所有人更好地融入這個世界,帶來更溫暖、更好的未來。
更懂你的AI,就是在大模型能力快速迭代、不斷進步、專業(yè)能力超過每個人的時代,讓人類站在它的肩膀上成為更好的自己,讓每個人獨特的閃光點綻放。
更懂你的AI,成就每一個更好的你,這不僅僅是科大訊飛的初心,更是使命。我們期待和所有的開發(fā)者們一起,成為更好的自己,成為更好的創(chuàng)業(yè)者,創(chuàng)造一個更好的未來,謝謝大家!
*文中數(shù)據(jù)來源于實際應(yīng)用
-
AI
+關(guān)注
關(guān)注
91文章
39490瀏覽量
300942 -
科大訊飛
+關(guān)注
關(guān)注
19文章
857瀏覽量
63641 -
開發(fā)者
+關(guān)注
關(guān)注
1文章
768瀏覽量
17989
原文標題:2025科大訊飛全球1024開發(fā)者節(jié)劉慶峰演講實錄來了!
文章出處:【微信號:iFLYTEK1999,微信公眾號:科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
科大訊飛設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局
2025樂鑫科技全球開發(fā)者大會圓滿落幕
虹科動態(tài) | 2025年11月精彩回顧
2025開放原子開發(fā)者大會精彩回顧
虹科動態(tài) | 2025年10月精彩回顧
2025科大訊飛全球1024開發(fā)者節(jié)正式開啟
2025新思科技開發(fā)者大會精彩回顧
虹科動態(tài) | 2025年9月精彩回顧
虹科動態(tài) | 2025年8月精彩回顧
HDC 2025開發(fā)者主題演講精彩回顧
回顧科大訊飛26周年慶精彩瞬間
科大訊飛深度解析DeepSeek-V3/R1推理系統(tǒng)成本
2025科大訊飛全球1024開發(fā)者節(jié)精彩回顧
評論