4月17日,昆侖萬維公司公布了天工3.0大模型的優異性能,同時啟動了天工SkyMusic音樂大模型的公益試用。
天工3.0擁有4000億參數,超越Grok-1的3140億參數,成為全球最大的開源MoE大模型。該模型在語義理解、邏輯推理、通用性、泛化性、不確定性知識以及學習能力等方面均有顯著提升,數學/推理/代碼/文創能力提高超過30%。此外,天工3.0還新增了多輪搜索與綜合工具調用、圖表繪制、研究模式、增強模式、改圖擴圖等AI功能。
天工SkyMusic音樂大模型也于同日開啟公益試用。昆侖萬維表示,天工SkyMusic在人聲&BGM音質、人聲自然度、發音可懂度等方面明顯優于競爭對手,綜合性能超越Suno V3,成為音樂大模型中的最高水準。
天工SkyMusic采用音樂音頻領域類Sora模型架構,Large-scale Transformer負責譜曲,學習Music Patches的上下文依賴關系,實現音樂可控性;而Diffusion Transformer則負責演唱,通過LDM將Music Patches還原為高質量音頻,支持生成80秒44100Hz采樣率雙聲道立體聲歌曲。
據悉,天工SkyMusic具有以下特色:
1. 高質量AI音樂:生成80秒44100Hz采樣率雙聲道立體聲AI歌曲
2. 人聲“以假亂真”:中文發音清晰無異響
3. 歌詞段落控制:歌曲能明確區分不同段落的情感變化
4. 多種音樂風格:支持說唱/民謠/放克/古風/電子等
5. 音樂智能表達:學習顫音、歌劇、吟唱、男女對唱等歌唱技巧
6. 參考音樂生成:用戶上傳參考音樂,生成相似風格和唱腔的歌曲
7. 方言歌曲生成:支持粵語、成都話、北京話等眾多方言
-
開源
+關注
關注
3文章
4207瀏覽量
46145 -
LDM
+關注
關注
0文章
6瀏覽量
10793 -
大模型
+關注
關注
2文章
3650瀏覽量
5186 -
昆侖萬維
+關注
關注
0文章
17瀏覽量
113
發布評論請先 登錄
昆侖天工Skywork與Google Cloud深度合作發布桌面級Agent
基于大模型衛星載荷智能運維保障分系統:功能特點與平臺架構解析
昆侖芯超節點亮相,單卡性能提升95%
谷歌AlphaEarth和維智時空AI大模型的核心差異
谷歌AlphaEarth和維智時空AI大模型的技術路徑
如何在vivadoHLS中使用.TLite模型
一代渝商的“數字中國”創新路——天工測控楊永輝董事長專訪
華測天工模力機房部署正式發布
華為助力中國石油發布3000億參數昆侖大模型
現場直擊:馬拉松明星“天工機器人”、兆威機電靈巧手等受熱捧
昆侖萬維天工3.0大模型性能顯著提升,天工SkyMusic音樂模型亮相
評論