近日,阿里通義千問發布了兩款新版本30B(300億參數)MoE大模型——Qwen3-30B-A3B-Instruct-2507 和 Qwen3-Coder-30B-A3B-Instruct。在搭載英特爾? 酷睿? Ultra 200H處理器和32GB內存的AI PC上,英特爾可變顯存技術(Intel Variable VRAM Technology)可以將VRAM分配比例從57%提升到87%1,從而更加流暢地運行這兩款大模型,為本地部署注入新活力的同時,帶來“更聰明”的AI應用體驗。AI PC智能助手Flowy AI率先實現了這兩款模型的適配并開放下載,用戶可即刻下載體驗。
智能內存管理,動態按需分配
英特爾可變顯存技術適配了 MoE 架構模型在專家節點切換時的顯存波動特點,通過在軟件層面的調優,實現了突破性的高顯存分配率。該技術的核心在于其深度優化的、基于預留內存的動態調度機制,它打破了傳統核顯顯存固定分配的限制,實現了VRAM(顯存)的動態調節和高效利用。在搭載英特爾酷睿Ultra 200H處理器和32GB內存的AI PC上,用戶只需簡單操作,即可將系統內存的默認VRAM分配比例從57%提升到87%1。這意味著,一臺配備 32GB 內存的筆記本設備,可使用的VRAM能夠從目前市面通用的18GB提升到27GB。這一顯著提升,進一步拓寬了PC端運行大模型的能力邊界,讓超過20B參數的大模型和復雜的AI應用也能順暢運行,為用戶帶來更強大的AI體驗。
用戶可以在英特爾官網下載并安裝最新版的顯卡驅動程序( 32.0.101.6972 或以上版本),再通過 Intel Graphics Software 控制面板自定義設定顯存比例,實現VRAM的動態調節。同時,該技術還針對酷睿Ultra 200H平臺的硬件特性,對預留內存的讀寫路徑進行了深度優化,通過提升內存帶寬利用率和減少數據交換延遲,確保大模型在高占比預留內存調用時仍能保持流暢運行。
30B參數大模型輕松“裝進口袋”,Flowy率先適配
目前,英特爾生態合作伙伴 Flowy AI 已率先完成英特爾可變顯存技術的驗證,在其 Flowy AI PC 軟件中集成了 Qwen3-30B-2507 和 Qwen3-Coder-30B 兩款模型。得益于英特爾可變顯存技術,現在用戶僅憑一臺輕薄本,就能將 30B參數大模型 “裝進口袋”,隨時隨地享受高效的本地 AI 服務。實際測試結果顯示,在搭載英特爾酷睿Ultra 9 285H 處理器及 32GB 內存PC上,這兩款 30B 參數大模型均可流暢運行,不僅支持 Q4、Q5、Q6 等更高精度的量化版本,還能實現毫秒級響應的離線交互,讓用戶無需再依賴高性能獨顯或云端算力,即可實現隨時互聯的移動辦公和離線創作等豐富應用,以更低的成本部署成本,享受本地AI帶來的精彩體驗。
立刻體驗:
英特爾支持可變顯存的顯卡驅動,32.0.101.6972 或以上版本:https://www.intel.cn/content/www/cn/zh/download/785597/intel-arc-iris-xe-graphics-windows.html
Flowy AI PC version:https://www.flowyaipc.com/download
注釋:
1. 數據來源于英特爾支持可變顯存的顯卡驅動32.0.101.6972注釋https://downloadmirror.intel.com/861295/ReleaseNotes_101.6972.pdf
審核編輯 黃宇
-
英特爾
+關注
關注
61文章
10301瀏覽量
180412 -
大模型
+關注
關注
2文章
3648瀏覽量
5177
發布評論請先 登錄
【CIE全國RISC-V創新應用大賽】基于 K1 AI CPU 的大模型部署落地
大顯存突破!解鎖120B MoE大模型,英特爾酷睿Ultra 285H拓展AI新應用
京東方攜手英特爾推出首款AI驅動多頻顯示解決方案
基于米爾瑞芯微RK3576開發板的Qwen2-VL-3B模型NPU多模態部署評測
阿里通義千問發布小尺寸模型Qwen3-4B,手機也能跑
硬件與應用同頻共振,英特爾Day 0適配騰訊開源混元大模型
Intel OpenVINO? Day0 實現阿里通義 Qwen3 快速部署
壁仞科技完成阿里巴巴通義千問Qwen3全系列模型支持
筆記本聲音問題
利用英特爾OpenVINO在本地運行Qwen2.5-VL系列模型
英特爾可變顯存技術讓32GB內存筆記本流暢運行Qwen 30B大模型
評論