近日,階躍星辰在官方公眾號上宣布了一項重大突破——推出Step-1o千億參數端到端語音大模型。該模型被譽為“國內首個千億參數端到端語音大模型”,標志著我國在語音技術領域取得了新的里程碑。
據階躍星辰介紹,傳統的語音模型通常采用級聯方案,即先將用戶輸入的語音信息轉化為文本,再進行二次轉化以生成語音輸出。這種方案不僅過程繁瑣,降低了傳輸效率,而且在轉化過程中容易折損掉包括情緒在內的關鍵信息。這導致傳統語音模型存在時延長、反應慢、回答質量和智能水平不足,以及情感表達空洞刻板等缺陷。
而階躍星辰推出的Step-1o模型則采用了端到端的語音方案,實現了語音理解和生成的一體化。這一創新設計不僅提升了模型的智商上限,還使其能夠更好地理解和表達情感,從而克服了傳統語音模型的諸多缺陷。
Step-1o千億參數端到端語音大模型的發布,不僅展示了階躍星辰在語音技術領域的深厚實力,也為我國語音技術的發展注入了新的活力。未來,隨著該模型的不斷優化和應用推廣,相信將為用戶帶來更加智能、高效和自然的語音交互體驗。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
語音交互
+關注
關注
3文章
349瀏覽量
29140 -
大模型
+關注
關注
2文章
3621瀏覽量
5125
發布評論請先 登錄
相關推薦
熱點推薦
燧原科技訓推一體芯片L600適配階躍星辰基座模型Step 3.5 Flash
2026年2月2日,階躍星辰發布并開源最新基座模型 Step 3.5 Flash,該模型面向實時 Agent 工作流場景打造,兼顧推理速度、
沐曦曦云C600 GPU產品適配階躍星辰基座模型Step 3.5 Flash
今天,階躍星辰技術團隊發布并開源最新旗艦基座模型 Step 3.5 Flash。沐曦股份已實現曦云C600與該模型深度協同適配,為
端側大模型上車:從“語音助手”到“車內 AI 智能體”的躍遷革命
2025年,智能汽車的座艙不再只是“語音助手”的舞臺,而是一個搭載生成式AI和大語言模型(LLM)的智能體。從云端示范到車內落地,這一跨越不僅改變了人機交互的邊界,更重構了汽車作為“第三
Nullmax感知規劃端到端大模型進化提速
近日,2025年度浦東新區科技發展基金社會領域數字化轉型專項擬支持項目名單公布。經評審,Nullmax申報的《面向城市高級別輔助駕駛的感知規劃端到端大模型》項目入選。
福州移動與華為聯合推出國內首個端到端智能化體驗經營系統
近日,福州移動與華為聯合推出國內首個端到端智能化體驗經營系統,通過多智能管理系統協同,實現場景化體驗套餐的可預估、可保障、可保護、可評估,分
蔚來端到端模型化架構如何大幅提升安全上限
2024年7月,蔚來將行業首個基于端到端模型化架構的「自動緊急制動 AEB」推送上車,蔚來也成為了行業首家使用
階躍星辰和燧原科技亮相WAIC 2025
近日,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)在上海開幕。開幕前夕,中國AI大模型頭部企業階躍星辰發布新一代基礎大
廣和通發布自研端側語音識別大模型FiboASR
7月,全球領先的無線通信模組及AI解決方案提供商廣和通,發布其自主研發的語音識別大模型FiboASR。該模型專為端側設備上面臨的面對面實時對
德賽西威與面壁智能發布端側大模型語音交互方案
日前,全球領先的移動出行科技公司德賽西威與端側大模型技術領軍企業面壁智能共同發布業界首個基于高通座艙平臺(SA8255P,簡稱8255)的端
自動駕駛中基于規則的決策和端到端大模型有何區別?
在自動駕駛架構的選擇上,也經歷了從感知、決策控制、執行的三段式架構到現在火熱的端到端大模型,尤其是在2024年特斯拉推出FSD V12后,各車企更是陸續推出自家的
階躍星辰開源多模態模型,天數智芯迅速適配
近日,頭部大模型創業公司階躍星辰在行業內引起了軒然大波,宣布正式開源兩款Step系列多模態模型——Step-Video-T2V視頻生成模型和
階躍星辰發布國內首個千億參數端到端語音大模型
評論