近日,阿里云通義宣布了一項重大開源舉措,推出了支持100萬Tokens上下文的Qwen2.5-1M模型。這一新模型在處理長文本任務中展現出了卓越的性能,穩定超越了GPT-4o-mini。
Qwen2.5-1M模型提供了7B和14B兩種尺寸供用戶選擇,以滿足不同場景下的需求。在處理長文本輸入時,該模型能夠保持穩定的性能,為用戶提供更加準確、可靠的輸出結果。
除了推出新模型外,阿里云通義還同時開源了推理框架。這一框架在處理百萬級別長文本輸入時,可實現近7倍的提速,極大地提升了用戶的處理效率。通過這一框架,用戶可以更加便捷地應用Qwen2.5-1M模型,實現長文本處理的高效化。
阿里云通義此次開源的Qwen2.5-1M模型和推理框架,為人工智能領域帶來了新的突破。這一舉措不僅提升了長文本處理的能力,也為用戶提供了更加便捷、高效的使用體驗。未來,阿里云通義將繼續致力于人工智能技術的研發和創新,為用戶提供更加卓越的產品和服務。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
人工智能
+關注
關注
1817文章
50098瀏覽量
265372 -
模型
+關注
關注
1文章
3752瀏覽量
52109 -
阿里云
+關注
關注
3文章
1038瀏覽量
45690
發布評論請先 登錄
相關推薦
熱點推薦
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
今天,通義千問今天正式發布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權重版本。沐曦股
聲智科技亮相2026阿里云通義智能硬件展
1月8日至11日,備受矚目的阿里云通義智能硬件展在深圳火熱開啟。作為專注聲學AI的全球創新企業,聲智科技(SoundAI)與阿里
Powered by XuanTie,Qwen Inside:阿里通義大模型攜手玄鐵 RISC-V開啟“端側智能”新紀元
在 AI 邁向“端邊云協同”的新時代,大模型的價值不僅在于云端的超強算力,更在于能否高效、低成本地部署到千行百業的終端設備中。近日,阿里通義大模型
上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5
似乎國內外AI競爭日趨白熱化,就在阿里巴巴發布Qwen3(通義千問3)之后,引發業界廣泛關注;很多大廠在跟進,大模型不斷上新: 阿里巴巴
壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持
4月29日,阿里巴巴通義千問發布并開源8款新版Qwen3系列“混合推理模型”(簡稱“Qwen3”
利用英特爾OpenVINO在本地運行Qwen2.5-VL系列模型
近期阿里通義實驗室在 Hugging Face 和 ModelScope 上開源了 Qwen2.5-VL 的 Base 和 Instruct 模型
阿里云通義開源長文本新模型Qwen2.5-1M
評論