從“屏幕幻象”到“物理實體”,智能體正在重塑生產力的邊界!
當大模型的敘事邏輯從“參數競賽”轉向“應用落地”,智能體從只會紙上談兵的“賽博玩具”,進化為真正下地干活的“生產工具”。感知、聲音、圖像、動作——這些被視為“輔助功能”的維度,成為智能體深入業務流程、實現規模化落地的“入場券”。
1月26日,星辰智能體平臺升級發布,讓智能體跨出屏幕,擁有“感知物理世界、理解復雜上下文、甚至像真人一樣多模態溝通”的能力。整合“語音、視覺、運動與執行”的多模交互全棧方案,讓智能體從“單點工具”,正式升級為具備“五官、手腳與個性”的「數字合伙人」。
01讓智能體走出屏幕
成為物理世界的得力助手
從智能音箱到企業客服,語音無疑是AI進入真實世界的關鍵入口。然而,將復雜的 Agent 接入語音鏈路并非易事——響應延遲、語義割裂、系統狀態不同步,已是行業普遍痛點。涉及硬件運動控制時,往往還需并行對接多套接口,研發周期動輒以月為單位。
本次發布會上,星辰智能體平臺和AIUI平臺實現完全打通,讓Agent一鍵接入語音交互,在AIUI“聽懂指令、理解意圖、執行動作、語音反饋”基礎之上,結合智能體讓交互更個性化,支持多模態感知和輸出。事實上,這意味著:
·場景打通:智能體能夠極速接入機器人、智能穿戴與各類智能硬件,實現工業、家庭與消費等場景落地。
·降本增效:通過更低的人力與時間成本,實現交互效率和效果的雙重提升。
桌面硬件機器人“小飛”現場展示了融合所帶來的進化,當主持人說:“小飛,你看看我們發布會現場感覺怎么樣?”。小飛準確識別指令,自主移動并環顧四周,調用視覺能力并回復:“我看到一個有柔和的燈光,還有好多正在關注我們的朋友”。
對于孩子難以理解古詩的場景,小飛也能輕松應對,可以調用繪本智能體,將詩句轉化為圖文和聲音結合的繪本,幫助孩子輕松學、快樂學。依托于訊飛AIUI 1.6s的秒極速響應,讓用戶幾乎感覺不到卡頓,像真人聊天一樣流暢,實現了人類對話中的精髓——“有來有往”。
02定義智能體的形象與聲音
多模態交互 懂你更智能
相較于千篇一律的文本/語音交互,用戶更喜愛有“溫度”的交互對象。智能體要走向真實世界,不僅要在復雜環境中被聽見、被看見、被理解,并與人自然互動,還需要一個“五官”。
本次發布會上,全新升級多模態超擬人交互技術,融合語音、人臉、環境等多模態信息,實現多人高噪場景下的自由交互,讓智能體得以搭載上豐富的聲音和形象,進行更具象的情感表達。
聲音層面,超擬人合成在語音合成大模型底座升級賦能下實現提升,在自然度、情感表達、節奏停頓等維度和細節上表現更好,尤其在多輪交互中的效果顯著提升,具備“更快響應、更懂情緒、更加靈活、更加百變”四大特點,能像真人聊天一樣和我們“交心”。同時一句話復刻能力,也在支持的語種、方言以及多風格表達上有了進一步的突破,交互的底層聲音表達上更加擬人、多元。
形象層面,僅需一張照片就能生成專屬的數字人形象,口型、表情、動作均由大模型自動生成,可以自動匹配文本的意圖,進一步降低數字人的應用門檻。多模態超擬人交互技術的升級可以幫助企業,快速打造專屬企業數字形象代言人,塑造統一、生動的品牌形象,積淀品牌資產,實現品牌傳播;同時,實現降本增效,賦能業務創新與全球化拓展。更重要的是,具備情感與溫度的交互方式,能夠顯著提升用戶粘性,持續驅動業務增長。
目前,搭載多模態超擬人交互技術的數字人已在企業服務、旅游導覽、陪伴學習、健康管理等多場景應用,重塑服務體驗。
在智慧大廳,數字人前臺通過多模態視覺理解,實時融合語音、人臉、環境等多模態信息,實現自動感知與主動迎賓。同時與多人自然交流,精準識別人人對話與人機對話的意圖,并輔以生動的手勢與類人舉止反饋,讓每一次指引都清晰親切。
在業務終端,通過人臉識別快速認證,數字人助手將引導用戶完成從查詢、填表到電子簽名的復雜業務流程,輕松自主辦結。
03智能體也有了MBTI
捏出懂你脾氣的專屬伙伴
“好看的形象”讓智能體擁有了辨識度,“有趣的靈魂”才是建立長期陪伴與信任的關鍵。此次升級,將角色性格從以往單薄的一段文案描述升級成了“可組合、可遷移”的能力模塊。
通過星辰MaaS的一句話精調模式,只需通過 “性格、經歷、技能、語言習慣” 幾個維度的精準描述,系統即可生成100條場景數據,自動定制場景的角色模型,實現Agent交互的千人千面,除了一句話精調,星辰MaaS基于高效的工具鏈+豐富的基座模型,還提供0代碼可視化精調、notebook精調,滿足Agent各個環節的效果精調,提升效果、效率的同時降低成本,助力應用規模化增長。
星辰智能體平臺還上線了音色創造功能——通過與語種、情感、風格等屬性的聯合訓練,實現了音色與風格的任意組合。不被錄音限制,一句指令要求,即可讓智能體實現聲音風格的“瞬間”切換。
假設要制作一款三國戰略游戲,對于精調的曹操人設,現在能夠在不改變角色模型前提下,僅僅調整音色描述,就可以賦予其“沉穩梟雄”或“意氣青年”的不同聲線,讓歷史人物栩栩如生。
這種能力的結合,為教育、玩具、虛擬IP等場景提供了更大的想象空間。在玩具、教育等長期陪伴、高頻使用場景,用戶留下來靠的不是技能,而是像不像一個真正的伙伴。同樣,對虛擬IP來說,角色扮演性格本身就是產品的一部分,換一個性格就相當于換了一種體驗。
04讓智能體擁有“靈巧手腳”
接管重復性工作
智能體不僅要“能言善辯”,更要“躬身入局”,唯有真正接管任務才能釋放生產力。通過將 Agent 與 RPA 深度融合,星辰讓智能體具備了“動手”的能力,讓聰明的大腦搭配7x24小時不知疲倦的雙手。
針對RPA需要有技術背景才能玩轉,大多數卡在“搭建流程”的尷尬處境。此次發布會,星辰平臺在RPA工作流編排層面帶來了兩項新能力——智能組件與數據表格,讓開發者能專注于業務邏輯編排,而非底層代碼實現。
智能組件:通過自然交互即可生成“可配置、可重復執行”自動化組件,應用于網頁自動化和基礎的數據、文本處理場景,極大地降低自動化能力的創造門檻。數據表格:用戶在流程中直接對數據進行“讀寫、編輯、展示和導出”,讓整個自動化流程涉及到數據獲取和處理的部分變得更加透明和可調試,提升了復雜數據處理任務的可靠性和執行效率。
發布會現場,通過在RPA設計器中拖入智能組件,一句自然語言指令就能自動打開指定網頁、精準抓取待辦事項的標題、時間等關鍵信息。整個流程還支持“對話式二次編輯”,可以像修改文檔一樣通過文字微調邏輯。流程運行后,RPA 將自動接管瀏覽器,實現數據自動化篩選與提取,將結構化信息呈現在“數據表格”,實現從原始網頁到業務報表的閉環。
事實上,在整場發布會中,多位RPA數字員工都在高效支撐——它們活躍在電腦中,幫助主持人自動通知演示官上場、回復同事信息、收取郵件設置待辦,完美展現了RPA的精準執行力。
05跨語言、懂業務的智能體
助力全球企業創新
在大模型時代,全球化成為企業的“共同選擇"。科大訊飛持續推進全球化戰略,向全球開發者開放核心AI能力與解決方案。聚焦中東與東南亞兩大新興市場,星辰智能體平臺將多模交互與執行能力同步延展至海外場景,構建起覆蓋多行業的海外智能體矩陣。
從數千頁基建標書的自動分析與比對,到多語言混雜的實時出行引導,再到隱藏于復雜合同中的合規風險透視,覆蓋公共服務與出行、大型基建招投標、金融與支付等場景,賦能全球企業業務的創新升級。在提升效率、管控風險的同時,為全球企業構建起可持續的智能化競爭力,打造全場景、全鏈路的智能新生態。
Agent的真正爆發,也將始于它不再是一個需要用戶去“遷就”的對話框,而是一個能聽懂情緒、能處理表格、能跨越國界解決復雜問題的“貼心伙伴”。
全新升級的星辰智能體平臺,補齊了通往物理世界的最后三塊拼圖——感知的“五官”、執行的“手腳”以及共情的“靈魂”。 從AIUI的語音閉環到RPA動作接管,從超擬人數字人的情感交互到出海場景的跨語言穿透,星辰正在構建一套完整的“Agent 基礎設施”。
從“AI 技術”向“AI 原生應用”跨越的臨界點,唯有智能體“移出屏幕”,才能將AI深度嵌入工業生產、家庭陪伴、全球貿易等真實的商業毛細血管中,讓技術在最堅硬的泥土里扎根。
當成千上萬個具備“執行力”的智能體走向生產一線,這場關于效率的革命,才算真正爆發!
-
智能體
+關注
關注
1文章
453瀏覽量
11590 -
科大訊飛
+關注
關注
19文章
857瀏覽量
63641
原文標題:星辰智能體煥新發布,多模協同的「AI實干派」
文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
訊飛星辰Agent平臺入選36氪WISE 2025年度焦點產品
2025科大訊飛全球1024開發者節科博展開幕
香港立法會與科大訊飛聯合打造智慧謄錄系統“智識聽”
科大訊飛加速東南亞企業的人工智能應用
訊飛星辰Agent開發平臺發布
科大訊飛亮相第137屆廣交會
科大訊飛深度解析DeepSeek-V3/R1推理系統成本
科大訊飛星辰智能體平臺升級發布
評論