今天,基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型——訊飛星火X1升級(jí)版正式上線。
這是一次全面的躍升:
綜合能力大幅提升。整體效果對(duì)標(biāo)OpenAI o3等國(guó)內(nèi)外一流大模型最新版本效果,在翻譯、推理、文本生成、數(shù)學(xué)等方面保持領(lǐng)先。
幻覺治理取得顯著進(jìn)步。幻覺問題是掣肘大模型落地應(yīng)用的關(guān)鍵問題,升級(jí)后的星火X1在幻覺治理方面領(lǐng)先業(yè)界主流模型。
多語(yǔ)言能力已覆蓋130+語(yǔ)種。為世界提供全棧自主可控大模型底座的“第二種選擇”。
基于星火X1底座的語(yǔ)音同傳大模型在翻譯效果、實(shí)時(shí)響應(yīng)、語(yǔ)音聽感、專業(yè)精深等方面大幅躍升,持續(xù)行業(yè)領(lǐng)先。
得益于星火X1模型的升級(jí),教育、醫(yī)療、企業(yè)應(yīng)用、代碼、科研等行業(yè)大模型和智能體也取得了新的進(jìn)步,在復(fù)雜行業(yè)場(chǎng)景任務(wù)上進(jìn)一步解決用戶關(guān)鍵剛需。
星火X1最新升級(jí)的能力可直接在訊飛星火網(wǎng)頁(yè)版和APP進(jìn)行體驗(yàn),全新API已同步上線訊飛開放平臺(tái)。
構(gòu)建可信任的AI底座,打造懂你的“全場(chǎng)景助手”。
接下來(lái),我們一起來(lái)看看具體細(xì)節(jié)吧!
訊飛星火×1再升級(jí)
懂你的AI更進(jìn)一步
此次升級(jí),星火X1在多個(gè)任務(wù)上持續(xù)進(jìn)步,綜合能力再升級(jí),特別是在翻譯、推理、文本生成、數(shù)學(xué)、多語(yǔ)言上效果亮眼。
同時(shí),在幻覺治理方面,對(duì)于大模型自身生成內(nèi)容是否符合客觀事實(shí)的事實(shí)性幻覺治理,以及在用戶給定額外參考資料時(shí)大模型回復(fù)是否忠于原文的忠實(shí)性幻覺治理兩方面均取得明顯進(jìn)步,顯著提高了大模型行業(yè)落地應(yīng)用的可靠性。

*測(cè)試集合來(lái)源:基礎(chǔ)能力測(cè)試集來(lái)自真實(shí)的大模型請(qǐng)求任務(wù)數(shù)據(jù),來(lái)源分布包括訊飛星火APP、星火大模型API真實(shí)開發(fā)者場(chǎng)景、業(yè)界主流任務(wù)數(shù)據(jù)等進(jìn)行滾動(dòng)更新;公開測(cè)試集以數(shù)學(xué)、答題、推理、代碼等外部典型Benchmarks為主;忠實(shí)性幻覺測(cè)試集由Vectara推出的大模型排行榜Hallucination Leaderboard中公開的測(cè)試集,事實(shí)性幻覺測(cè)試集來(lái)自計(jì)算機(jī)、法律、歷史等30多個(gè)領(lǐng)域的真實(shí)知識(shí)問答數(shù)據(jù)組成。
今年6月,在國(guó)內(nèi)大模型挑戰(zhàn)全國(guó)高考數(shù)學(xué)一卷的評(píng)測(cè)中,星火X1-0420版本突破了140分。本次升級(jí),數(shù)學(xué)能力再次精進(jìn)。
例如,2025年全國(guó)高考數(shù)學(xué)一卷的最后一題,難住了不少大模型,星火X1-0720版本完美答對(duì)~
多語(yǔ)言也是此次升級(jí)的一大亮點(diǎn)。
現(xiàn)在,星火X1已經(jīng)能夠支持130多種語(yǔ)種了,不管是日常問答、解數(shù)學(xué)題、寫文章還是翻譯,都能搞定,無(wú)障礙跨語(yǔ)言交流更進(jìn)一步。
下面這個(gè)視頻就展示了多種語(yǔ)言的各方面能力,涵蓋了韓語(yǔ)、泰語(yǔ)、菲律賓語(yǔ)、老撾語(yǔ)、俄語(yǔ)、日語(yǔ)、法語(yǔ)、阿拉伯語(yǔ)、越南語(yǔ)、西班牙語(yǔ)、葡萄牙語(yǔ)、德語(yǔ)、印尼語(yǔ)、馬來(lái)語(yǔ)、緬甸語(yǔ)等。
有了星火X1強(qiáng)大的多語(yǔ)言能力加持,訊飛的同傳會(huì)議服務(wù)、SaaS端產(chǎn)品,還有訊飛翻譯機(jī)、訊飛AI錄音筆這些智能設(shè)備,翻譯效果和用戶體驗(yàn)都上了一個(gè)新臺(tái)階。
這背后離不開三大核心技術(shù)的突破——
強(qiáng)化學(xué)習(xí)技術(shù):提出了結(jié)合評(píng)語(yǔ)模型與細(xì)粒度反饋的強(qiáng)化學(xué)習(xí)技術(shù),將單一標(biāo)量獎(jiǎng)勵(lì)信號(hào)升級(jí)為文本級(jí)評(píng)語(yǔ)信號(hào)、在回復(fù)各步驟提供細(xì)粒度獎(jiǎng)勵(lì)的強(qiáng)化學(xué)習(xí)改進(jìn)方案,有效降低了數(shù)學(xué)答題等任務(wù)的訓(xùn)練難度,解決了獎(jiǎng)勵(lì)稀疏痛點(diǎn);
數(shù)據(jù)反寫技術(shù):提出基于人類專家數(shù)據(jù)的通用認(rèn)知任務(wù)數(shù)據(jù)反寫技術(shù),極大緩解了SFT高質(zhì)量數(shù)據(jù)獲取困難、人工標(biāo)注數(shù)據(jù)成本過高等問題,實(shí)現(xiàn)了主觀語(yǔ)言類任務(wù)文筆和風(fēng)格化的顯著提升;
幻覺治理技術(shù):提出了基于多路徑采樣驗(yàn)證及事實(shí)性約束強(qiáng)化學(xué)習(xí)的幻覺治理技術(shù),在大模型思考過程及回復(fù)生成階段實(shí)現(xiàn)客觀問題上與標(biāo)準(zhǔn)答案的深度強(qiáng)對(duì)齊,大幅減少了在慢思考下的幻覺率,有效保障了文本摘要、RAG等任務(wù)的回復(fù)可靠性。
星火語(yǔ)音同傳大模型
同傳體驗(yàn)大幅躍升
基于星火X1底座的語(yǔ)音同傳大模型也全面升級(jí),持續(xù)保持領(lǐng)先,在翻譯效果、實(shí)時(shí)響應(yīng)、語(yǔ)音聽感、專業(yè)精深四大維度實(shí)現(xiàn)了顯著進(jìn)步,并且具備語(yǔ)種免切換能力。


*測(cè)試集合來(lái)源:測(cè)試集合是根據(jù)訊飛翻譯機(jī)、訊飛同傳等真實(shí)業(yè)務(wù)場(chǎng)景隨機(jī)采樣構(gòu)建的測(cè)試集;測(cè)試指標(biāo)為翻譯綜合質(zhì)量得分(分值0~100分)
母語(yǔ)般交流,翻譯綜合質(zhì)量超90分
在翻譯效果上,基于內(nèi)容完整度、信息準(zhǔn)確度、語(yǔ)言質(zhì)量等多方面主客觀評(píng)價(jià)計(jì)算翻譯綜合質(zhì)量得分(分值0~100分),新版本同傳大模型效果較2025年1月首發(fā)版本提升20%,特別是有效消除了傳統(tǒng)同傳的碎片化割裂感,交流如母語(yǔ)般順暢。在多人會(huì)議等復(fù)雜場(chǎng)景中英雙向翻譯得分可達(dá)80分以上,單人演講翻譯得分超90分,顯著領(lǐng)先業(yè)界。
極致響應(yīng),首響快至2秒
響應(yīng)速度實(shí)現(xiàn)重大突破,在保證翻譯質(zhì)量的基礎(chǔ)上,中英同傳的首字響應(yīng)時(shí)間從首發(fā)版本的5秒縮短到最快2秒,達(dá)到了人類高階同傳的行業(yè)標(biāo)準(zhǔn)要求。即使在復(fù)雜會(huì)議或?qū)I(yè)研討這些高難度場(chǎng)景中,系統(tǒng)也能保持準(zhǔn)確性和穩(wěn)定的實(shí)時(shí)響應(yīng)能力。
邊譯邊說,語(yǔ)音聽感更擬人更舒適
業(yè)界首創(chuàng)基于文本自適應(yīng)調(diào)度的流式語(yǔ)音合成技術(shù),讓“譯”與“說”無(wú)縫耦合,在語(yǔ)音聽感上的自然度、擬人度和舒適度顯著躍升。點(diǎn)開音頻感受一下吧~
專業(yè)精深,高壁壘行業(yè)率先可用
針對(duì)醫(yī)療、制造業(yè)、金融等高壁壘專業(yè)領(lǐng)域進(jìn)行深度優(yōu)化,覆蓋超過8萬(wàn)個(gè)垂直領(lǐng)域?qū)I(yè)詞匯,專業(yè)內(nèi)容翻譯得分突破90分,在業(yè)內(nèi)率先達(dá)到可用水平,專業(yè)內(nèi)容和完整性方面甚至超過了一般同傳譯員,為跨國(guó)醫(yī)療合作、國(guó)際制造業(yè)交流等專業(yè)場(chǎng)景提供了可靠的技術(shù)支撐。
無(wú)縫交流,語(yǔ)種免切換
具備智能雙語(yǔ)識(shí)別功能,能夠自動(dòng)識(shí)別中英文混合發(fā)言并實(shí)時(shí)切換翻譯方向。在雙邊會(huì)議、國(guó)際商務(wù)洽談等中英交替的場(chǎng)景中,參會(huì)者可以隨時(shí)用母語(yǔ)發(fā)言,有效避免了因語(yǔ)言切換操作而造成的交流中斷。
全系產(chǎn)品上線,無(wú)障礙溝通
最新語(yǔ)音同傳大模型已經(jīng)在訊飛雙屏翻譯機(jī)2.0、訊飛AI錄音筆、訊飛同傳等產(chǎn)品中全面上線。
同時(shí),作為2025世界人工智能大會(huì)的“翻譯合作伙伴”,科大訊飛的系列AI翻譯產(chǎn)品將為大會(huì)提供“無(wú)障礙溝通”服務(wù)。
行業(yè)落地深入推進(jìn)
解決“真問題”,提升“真體驗(yàn)”
“能用”和“好用”之間,差的是技術(shù)深度與落地廣度。新版本的星火X1底座,已經(jīng)全面賦能了教育、醫(yī)療、企業(yè)應(yīng)用、代碼、科研等行業(yè)大模型和智能體,在復(fù)雜行業(yè)場(chǎng)景任務(wù)上進(jìn)一步解決用戶關(guān)鍵剛需。
教育:讓學(xué)習(xí)更個(gè)性,讓教學(xué)更高效
用于個(gè)性化教與學(xué)全場(chǎng)景的作業(yè)批改、個(gè)性化推薦、答疑輔學(xué)、科普問答、口語(yǔ)學(xué)習(xí)等各項(xiàng)能力顯著提升,持續(xù)保持業(yè)界領(lǐng)先,推動(dòng)應(yīng)用成效顯著提升。

*測(cè)試集合來(lái)源:測(cè)試集合基于備授課、考試、作業(yè)、科普、學(xué)習(xí)等真實(shí)場(chǎng)景數(shù)據(jù)隨機(jī)抽樣。
面向?qū)W生自主學(xué)習(xí)的科大訊飛AI學(xué)習(xí)機(jī):
AI 1對(duì)1精準(zhǔn)學(xué)、AI 1對(duì)1答疑輔導(dǎo)、AI 1對(duì)1互動(dòng)課、奇思妙問科普知識(shí)問答、英語(yǔ)口語(yǔ)學(xué)習(xí)等效果持續(xù)提升,通過個(gè)性化、啟發(fā)式、互動(dòng)式提升孩子學(xué)習(xí)興趣和學(xué)習(xí)效率,同時(shí)為孩子智能生成個(gè)性化的學(xué)習(xí)方案。
面向教師備授課的星火教師助手:
教案和課件生成的合理性與適切性大幅提升,更接近優(yōu)秀教師的水平,同時(shí)能夠提供更富創(chuàng)見的教學(xué)思路與活動(dòng)設(shè)計(jì),有效激發(fā)學(xué)生的好奇心與探究欲,有助于教師培養(yǎng)學(xué)生的高階思維能力。
面向校內(nèi)作業(yè)和考試的星火智能批閱機(jī):
實(shí)現(xiàn)“即掃即批即留痕”,數(shù)學(xué)主觀題步驟批改、英語(yǔ)作文評(píng)分批改及個(gè)性化評(píng)語(yǔ)效果顯著,助推全學(xué)科全題型批改邁上新臺(tái)階。
面向英語(yǔ)口語(yǔ)學(xué)習(xí)和模考的E聽說:
率先實(shí)現(xiàn)“檢錯(cuò)-評(píng)分-反饋-指導(dǎo)-提升”的英語(yǔ)口語(yǔ)學(xué)習(xí)閉環(huán),為英語(yǔ)學(xué)科的課堂教學(xué)、個(gè)人自主練習(xí)提供更加有效的反饋和指導(dǎo)。
醫(yī)療:讓診療更專業(yè),讓健康管理更主動(dòng)
星火X1升級(jí)助力醫(yī)療領(lǐng)域各項(xiàng)能力全面提升,在全科輔助診斷、體檢報(bào)告解讀、健康咨詢、導(dǎo)醫(yī)導(dǎo)診等通用醫(yī)療任務(wù)上持續(xù)保持業(yè)界大幅領(lǐng)先。

*測(cè)試集合來(lái)源:測(cè)試集合來(lái)自基層診療、醫(yī)院病歷、互聯(lián)網(wǎng)問診等真實(shí)場(chǎng)景數(shù)據(jù)隨機(jī)抽樣。
服務(wù)居民健康——
星火醫(yī)療大模型的體檢報(bào)告解讀、健康咨詢已經(jīng)應(yīng)用于AI健康助手“訊飛曉醫(yī)”APP,實(shí)現(xiàn)從“被動(dòng)咨詢”邁向“主動(dòng)干預(yù)”新階段。
出院患者康復(fù)——
星火醫(yī)療大模型賦能的全程患者管理平臺(tái),人機(jī)協(xié)同輔助醫(yī)生患者管理效率相比傳統(tǒng)患者管理方式目前已經(jīng)提升10倍以上。
醫(yī)生輔助診療——
實(shí)現(xiàn)從基層全科到院端專科、從門診到住院的快速技術(shù)演進(jìn),在四川大學(xué)華西醫(yī)院、北京安貞醫(yī)院、中國(guó)科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院等多家頭部醫(yī)院試點(diǎn)應(yīng)用,核心效果保持業(yè)界引領(lǐng)。
同時(shí),星火醫(yī)療大模型與三甲醫(yī)院主治醫(yī)師進(jìn)行了雙盲對(duì)比評(píng)測(cè),結(jié)果表明星火醫(yī)療大模型在心血管內(nèi)科、兒科、呼吸內(nèi)科三個(gè)科室的綜合診療能力總體達(dá)到三甲醫(yī)院主治醫(yī)師水平。模型給出的病因分析及診斷推薦在準(zhǔn)確性和專業(yè)性上已經(jīng)超過主治醫(yī)師水平,同時(shí)在可讀性和完整性方面具有明顯優(yōu)勢(shì),在實(shí)際應(yīng)用中可增強(qiáng)患者對(duì)診療建議的依從性。

*測(cè)試集合來(lái)源:測(cè)試集合來(lái)自心血管內(nèi)科、兒科、呼吸內(nèi)科真實(shí)場(chǎng)景數(shù)據(jù)隨機(jī)抽樣。

*評(píng)測(cè)說明(回溯性研究):構(gòu)建心血管內(nèi)科、兒科、呼吸內(nèi)科真實(shí)臨床診療病歷數(shù)據(jù),組建對(duì)應(yīng)專科4位三級(jí)甲等醫(yī)院主治醫(yī)師團(tuán)隊(duì),再由對(duì)應(yīng)專科2名主任醫(yī)師對(duì)星火醫(yī)療大模型和主治醫(yī)師回復(fù)結(jié)果進(jìn)行雙盲評(píng)測(cè)。
企業(yè):讓知識(shí)獲取更智能,讓場(chǎng)景應(yīng)用更深入
對(duì)于大模型企業(yè)落地深度應(yīng)用,將企業(yè)存量的知識(shí)通過智能零采編的方式為大模型所使用是激活企業(yè)知識(shí)應(yīng)用的重要技術(shù)。結(jié)合個(gè)人知識(shí)庫(kù)、企業(yè)知識(shí)庫(kù)和互聯(lián)網(wǎng)信息進(jìn)行知識(shí)融合,輔助行業(yè)研究人員開展政策研究、商情分析、態(tài)勢(shì)感知,將大幅提升企業(yè)經(jīng)營(yíng)決策效率。
多模態(tài)知識(shí)零采編系統(tǒng)升級(jí),加速支撐企業(yè)知識(shí)應(yīng)用
面向企業(yè)知識(shí)工程的多模態(tài)知識(shí)零采編系統(tǒng),目前能夠針對(duì)復(fù)雜的長(zhǎng)文檔自動(dòng)構(gòu)建語(yǔ)義圖譜,進(jìn)而實(shí)現(xiàn)行業(yè)推理能力提升15%,多模態(tài)融合問答能力提升30%,顯著助力行業(yè)高質(zhì)量數(shù)據(jù)集構(gòu)建,在規(guī)章制度推理、金融產(chǎn)品推理等復(fù)雜場(chǎng)景任務(wù)完成率提高10%以上。
多個(gè)分析型智能體的協(xié)同,高效支撐行業(yè)深度分析
面向行業(yè)深度分析的星火行業(yè)大師產(chǎn)品,通過混域檢索生成技術(shù),能夠?qū)€(gè)人知識(shí)、企業(yè)私域知識(shí)與互聯(lián)網(wǎng)知識(shí)等多級(jí)知識(shí)快速完成信息整合,結(jié)合宏觀經(jīng)濟(jì)分析智能體、產(chǎn)業(yè)鏈診斷智能體及競(jìng)爭(zhēng)格局預(yù)測(cè)智能體等多個(gè)分析型智能體有效協(xié)同,打造了專業(yè)的研究報(bào)告生成能力,目前在產(chǎn)業(yè)趨勢(shì)預(yù)測(cè)的核心結(jié)論采納率突破70%。面向金融、能源、制造等復(fù)雜領(lǐng)域的實(shí)踐表明,通過與資深分析師的緊密協(xié)作,可以在1小時(shí)內(nèi)完成復(fù)雜行業(yè)分析工作,大幅提升了工作效率。

*測(cè)試集合來(lái)源:測(cè)試集合來(lái)自認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室與多家企業(yè)聯(lián)合構(gòu)建的實(shí)用場(chǎng)景測(cè)試集。
項(xiàng)目級(jí)代碼理解與生成能力持續(xù)提升,各行業(yè)取得深度應(yīng)用
面向軟件研發(fā)提質(zhì)增效的星火代碼大模型,有效提升了項(xiàng)目級(jí)代碼理解與生成、單元測(cè)試智能體、WEB應(yīng)用對(duì)話式編程等核心任務(wù)表現(xiàn)。目前,星火代碼大模型已深度賦能金融、制造、能源、科技等100余家關(guān)鍵領(lǐng)域客戶,在典型應(yīng)用場(chǎng)景中驅(qū)動(dòng)研發(fā)效率提升超過50%,助力企業(yè)在數(shù)字時(shí)代贏得競(jìng)爭(zhēng)新優(yōu)勢(shì)。

*測(cè)試集合來(lái)源:測(cè)試集合來(lái)自認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室構(gòu)建的代碼實(shí)用場(chǎng)景測(cè)試集。
持續(xù)打造懂你的AI助手
個(gè)人用戶體驗(yàn)升級(jí)
訊飛星火(APP及PC版)已上線全新的星火X1推理模型,讓你的AI助手變得更聰明、更精準(zhǔn)!文本創(chuàng)作、數(shù)學(xué)解題、視頻制作、會(huì)議紀(jì)要、超擬人對(duì)話等核心功能持續(xù)優(yōu)化,真正成為懂你的AI助手。
另外,特別為大學(xué)生朋友們定制了科研論文輔助、簡(jiǎn)歷生成與潤(rùn)色、面試模擬等實(shí)用工具,全方位陪伴大家的成長(zhǎng)之路。
訊飛星火X1 PC版體驗(yàn)地址
https://xinghuo.xfyun.cn/desk
開發(fā)者平臺(tái)全面賦能
星火Agent平臺(tái)依托全開放架構(gòu),整合16000+個(gè)MCP工具,成為“效果最佳、工具最全、服務(wù)最優(yōu)”的生產(chǎn)級(jí)智能體平臺(tái)。提供Prompt對(duì)比調(diào)優(yōu)和全鏈路測(cè)評(píng)功能,讓開發(fā)者輕松搭建智能體應(yīng)用。
星火Agent平臺(tái)體驗(yàn)地址
https://agent.xfyun.cn/home
全新的星火X1 API已同步上線訊飛開放平臺(tái),通過AI技術(shù)與產(chǎn)業(yè)需求融合,在辦公協(xié)作、營(yíng)銷推廣、智能硬件等場(chǎng)景中發(fā)揮作用,為開發(fā)者提供全球一流的大模型服務(wù)。
訊飛星火X1 API體驗(yàn)地址
https://xinghuo.xfyun.cn/sparkapi
以“可信”與“更懂你”為目標(biāo),構(gòu)建“解放生產(chǎn)力、釋放想象力”的堅(jiān)實(shí)底座。
星火X1的每一次升級(jí),都是為了能夠成為更懂你的AI助手。
未來(lái),我們將繼續(xù)讓AI走進(jìn)教育、醫(yī)療、工作和生活的每一個(gè)角落,用科技點(diǎn)亮美好生活!
*文中數(shù)據(jù)來(lái)源于實(shí)際應(yīng)用
-
科大訊飛
+關(guān)注
關(guān)注
19文章
857瀏覽量
63639 -
算力
+關(guān)注
關(guān)注
2文章
1511瀏覽量
16703 -
大模型
+關(guān)注
關(guān)注
2文章
3621瀏覽量
5141
原文標(biāo)題:訊飛星火X1升級(jí)版正式上線!
文章出處:【微信號(hào):iFLYTEK1999,微信公眾號(hào):科大訊飛】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
訊飛智文產(chǎn)品完成重磅升級(jí)
科大訊飛發(fā)布訊飛星火X1.5及系列AI產(chǎn)品
訊飛星火電腦版全新升級(jí)
訊飛星辰Agent開發(fā)平臺(tái)發(fā)布
XT大升級(jí) 加量不加價(jià)|Amass LC2.0升級(jí)版新品連接器破界而來(lái)
訊飛星火X1升級(jí)版正式上線
評(píng)論