2月10日,由上海創智學院孵化的模思智能及OpenMOSS團隊正式發布并開源了MOSS-TTS Family。模型發布后,壁仞科技(06082.HK)旗艦產品壁礪 166M率先完成其中語音生成基座MOSS-TTS模型的高性能推理部署。作為國內領軍的通用GPU芯片企業,壁仞科技成為首家完成MOSS-TTS模型適配的國產算力廠商。
這一成果充分顯示了壁礪 166M的強大通用性和全自研BIRENSUPA軟件棧的成熟度。壁仞科技軟硬一體解決方案可高效支持開發者適配新模型,顯著降低適配成本,為客戶日新月異的AI創新業務提供堅實的算力底座。
MOSS TTS模型在壁礪166M服務器上基于vLLM框架進行推理的演示
壁礪166 M為數據中心大算力訓推一體芯片,產品形態為4U OAM V1.1風冷模組,可滿足萬億參數模型需求,并廣泛應用于大語言模型、多模態AIGC、圖像與語音、推薦系統等。
MOSS-TTS Family是一套面向相高保真、高表現力與復雜場景生成的語音生成模型家族。它包含五個核心成員,共同構成了一個覆蓋“穩定生成、靈活設計、復雜對話、情境補全、實時交互”的聲音創作生態閉環。
MOSS-TTS:高保真、高表現力的語音生成基座,多語言、長音頻、精確時長控制;
MOSS-TTSD:全面更新1.0版本,面向真實對話場景的多說話人語音合成,不僅播客,支持更多復雜對話場景;
MOSS-VoiceGenerator:復雜文本指令跟隨、用于音色與角色設計;
MOSS-SoundEffect:環境音與音效生成模型;
MOSS-TTS-Realtime:面向實時交互的實時流式 TTS 模型;
MOSS-TTS Family是一整套可以使得用戶直接進入創作流程、產品系統與交互場景的聲音生產工具鏈。你可以用同一套模型體系完成以下任務:
克隆一個說話人的音色與表達風格,用于紀錄片、講解或新聞播報;
生成具備真實節奏的雙人或多人對話,用于播客、綜藝或解說;
通過指令設計帶有情緒與表演狀態的角色聲音;
為內容補全環境音與音效;
以及在實時系統中,以流式方式持續輸出自然語音。
壁仞科技選取了2個音色文件,分別基于2段臺詞合成了對應的音頻,達到了良好的展示效果:
壁仞科技本次適配的MOSS-TTS模型為高表現力語音生成基座,是整個MOSS-TTS Family的基礎模型,也是所有聲音能力得以成立的前提。它的核心目標是在真實內容與復雜場景中,穩定地復現一個說話者的聲音特征、表達方式與語言習慣,并穩定地生成長語音片段。 此次,壁仞科技與模思智能的軟硬協同,大幅降低各行業的應用門檻,讓中小制作團隊、內容創作者也能便捷使用高表現力的語音生成技術,未來將充分釋放語音內容創作的生產力,進一步拓展了語音合成技術在內容創作領域的應用邊界。
-
開源
+關注
關注
3文章
4203瀏覽量
46122 -
模型
+關注
關注
1文章
3751瀏覽量
52099 -
壁仞科技
+關注
關注
1文章
83瀏覽量
4008
原文標題:首家適配|壁仞科技壁礪? 166M極速支持MOSS-TTS Family
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
壁仞科技與階躍星辰及上海儀電智算服務成立人工智能聯合實驗室
壁仞科技壁礪166系列產品適配階躍星辰基座模型Step 3.5 Flash
壁仞科技亮相2026“智算申城”高峰論壇
上海市閔行區領導走訪調研壁仞科技
壁仞科技在香港聯合交易所掛牌上市
壁仞科技壁礪166M產品適配騰訊混元開源翻譯模型1.5版本
壁仞科技壁礪166M產品適配模思智能MOSS-TTS Family模型
評論