12月1日,阿里云通義千問720億參數模型Qwen-72B宣布開源。與此同時,他們還開源了18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。
據了解,Qwen-72B是基于3T tokens高質量數據進行訓練的模型,在10個權威基準測試中表現出色,超越了閉源的GPT-3.5和GPT-4。
阿里云是國內最早開源自研大模型的科技企業,通義千問是第一個全尺寸開源的大模型,從18億、70億、140億到720億參數規模。用戶可以在魔搭社區直接體驗Qwen系列模型的效果,也可以通過阿里云靈積平臺調用模型API,或者在阿里云百煉平臺上定制大模型應用。此外,阿里云人工智能平臺PAI為通義千問全系列模型提供了輕量級微調、全參數微調、分布式訓練、離線推理驗證、在線服務部署等服務。
開源模型Qwen-1.8B在推理2K長度的文本內容時只需3G顯存,可以在消費級終端上進行部署。而Qwen-Audio可以感知和理解各種語音信號,包括人聲、自然聲、動物聲和音樂聲等。用戶可以輸入一段音頻,并要求模型對音頻進行理解,甚至進行文學創作、邏輯推理和故事續寫等任務。
阿里云CTO周靖人表示,開源生態對于推動中國大型模型的技術進步和應用實踐至關重要。通義千問將繼續投入開源,并希望成為“AI時代最開放的大型模型”,與合作伙伴共同推動大型模型生態建設。
審核編輯:黃飛
-
人工智能
+關注
關注
1817文章
50094瀏覽量
265273 -
GPT
+關注
關注
0文章
368瀏覽量
16869 -
阿里云
+關注
關注
3文章
1038瀏覽量
45688 -
大模型
+關注
關注
2文章
3648瀏覽量
5179
發布評論請先 登錄
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
聲智科技亮相2026阿里云通義智能硬件展
Powered by XuanTie,Qwen Inside:阿里通義大模型攜手玄鐵 RISC-V開啟“端側智能”新紀元
阿里云通義千問720億參數模型宣布開源
評論