來(lái)源:
OpenVINO 中文社區(qū)
作者:
吳珊珊 OpenVINO 開(kāi)發(fā)者社區(qū)經(jīng)理
武卓英特爾 OpenVINO 布道師
引言
DeepSeek 的突破性進(jìn)展,引發(fā) AI 領(lǐng)域震動(dòng)。
最近,DeepSeek 的重大更新再次震撼全球 AI 領(lǐng)域。作為生成式 AI 領(lǐng)域的佼佼者,DeepSeek 近期發(fā)布的新模型展現(xiàn)了驚人的推理速度與卓越的語(yǔ)言理解能力,使其成為大模型競(jìng)爭(zhēng)中的新焦點(diǎn)。尤其是 DeepSeek-R1-Distill-Llama-8B 和 DeepSeek-R1-Distill-Qwen-7B,憑借高效的知識(shí)蒸餾技術(shù),大幅降低了計(jì)算成本,同時(shí)提升了推理效率,使得更強(qiáng)大的 AI 推理能力觸手可及。
本地部署 DeepSeek 獲得穩(wěn)定輸出!
相信大家在使用 DeepSeek 的過(guò)程中,肯定遇到過(guò)以下情況:
DeepSeek 真的非常好用,只是時(shí)常會(huì)出現(xiàn)“服務(wù)器繁忙,請(qǐng)稍后再試”的情況,遇到這種情況,真的是急得抓狂,一點(diǎn)辦法也沒(méi)有呀~
真的一點(diǎn)辦法都沒(méi)有嗎?
別忘了 DeepSeek 有開(kāi)源版本!可以通過(guò)本地部署,無(wú)需聯(lián)網(wǎng)即可使用,完美“解決服務(wù)器繁忙”的問(wèn)題,達(dá)到高頻穩(wěn)定的輸出效果。當(dāng)然!除了這一優(yōu)點(diǎn),本地部署 DeepSeek 還具備以下優(yōu)點(diǎn):
數(shù)據(jù)保存在本地,無(wú)需擔(dān)心數(shù)據(jù)和信息泄露的風(fēng)險(xiǎn)
可以掛載本地知識(shí)庫(kù),更精準(zhǔn)地輸出
英特爾最新發(fā)布的 OpenVINO 2025.0 已全面支持 DeepSeek 本地部署,幫助開(kāi)發(fā)者充分釋放 DeepSeek 等大模型的潛能!
OpenVINO 2025.0 震撼發(fā)布:
全面支持 DeepSeek,AI 推理性能飆升!
為了讓開(kāi)發(fā)者能夠輕松部署和優(yōu)化最新的 DeepSeek 及其他主流生成式 AI 模型,英特爾正式發(fā)布 OpenVINO 2025.0,為 AI 開(kāi)發(fā)者帶來(lái)一系列令人振奮的升級(jí)。
1. 生成式 AI 全面升級(jí),支持更多前沿模型
OpenVINO 2025.0 進(jìn)一步擴(kuò)展了對(duì) DeepSeek 等熱門生成式 AI 模型的支持,包括:
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-7B
DeepSeek-R1-Distill-Qwen-1.5B
FLUX.1 Schnell and FLUX.1 Dev
Qwen 2.5 等多款業(yè)界領(lǐng)先的大語(yǔ)言模型
在英特爾 酷睿 Ultra 200V GPU上本地部署DeepSeek-R1-Llama-8b的效果展示
此外,新版本 OpenVINO 通過(guò) Gen AI API 顯著提升了 Whisper 模型在 CPU、集成顯卡和獨(dú)立顯卡上的推理性能,為語(yǔ)音轉(zhuǎn)文本任務(wù)提供更強(qiáng)的計(jì)算能力。
(預(yù)發(fā)布)更令人振奮的是,開(kāi)發(fā)者可以通過(guò) torch.compile 直接在 NPU 上運(yùn)行 PyTorch API,并輕松調(diào)用 300+ 深度學(xué)習(xí)模型,大幅減少代碼改動(dòng),提升推理效率。使用起來(lái)非常簡(jiǎn)單,如下所示:
2. 大語(yǔ)言模型優(yōu)化,推理速度再創(chuàng)新高
OpenVINO 2025.0 還帶來(lái)了針對(duì)大語(yǔ)言模型(LLM)的重要優(yōu)化,包括:
(預(yù)發(fā)布功能)GenAI API支持 Prompt Lookup 技術(shù) —— 通過(guò)預(yù)定義提示詞,在特定場(chǎng)景優(yōu)化第二 Token 延遲,大幅提升推理效率。
(預(yù)發(fā)布功能)GenAI API支持圖像到圖像修復(fù)(Image-to-Image Inpainting)功能 —— 通過(guò)生成圖像上特定部分內(nèi)容,無(wú)縫結(jié)合原畫,讓 AI 生成的圖像更加逼真。
非對(duì)稱 KV Cache 壓縮技術(shù)——默認(rèn)在INT8推理CPU模式下啟用,優(yōu)化內(nèi)存消耗,與第二Token延遲,特別是在處理長(zhǎng)提示詞的情況下,可顯著降低內(nèi)存開(kāi)銷。
3. 硬件兼容性提升,充分釋放 AI 計(jì)算力
支持最新英特爾 酷睿 Ultra 200H 處理器(Arrow Lake-H),高性能計(jì)算再升級(jí)。
深度集成 Triton 推理服務(wù)器,在英特爾 CPU 上獲得更高效的模型推理能力。
(預(yù)發(fā)布)無(wú)縫集成 Keras 3 工作流,在 Keras 3工作流中即可直接調(diào)用 OpenVINO 的模型性能優(yōu)化,實(shí)現(xiàn) CPU、GPU、NPU 的高效推理。該功能支持最新的Keras 3.8發(fā)布版本。
更靈活的 AI 部署方案,支持原生 Windows Server:對(duì)于 Windows 生態(tài)的 AI 開(kāi)發(fā)者,OpenVINO 2025.0 帶來(lái)了“OpenVINO Server對(duì)原生 Windows Server的支持”,這一更新消除了容器開(kāi)銷,并優(yōu)化了 GPU 部署流程,讓 Windows 服務(wù)器環(huán)境下的 AI 應(yīng)用部署變得更加輕松高效。
無(wú)論是云端、邊緣還是本地環(huán)境,開(kāi)發(fā)者都能以更低的成本、更高的性能運(yùn)行 AI 任務(wù)。
為什么開(kāi)發(fā)者需要關(guān)注
OpenVINO 2025.0?
更少的代碼改動(dòng),更高的開(kāi)發(fā)效率:通過(guò)新增的模型支持和框架集成,開(kāi)發(fā)者可以快速適配最新 AI 技術(shù),無(wú)需大量修改代碼。
更強(qiáng)的性能,更低的成本:從 Prompt Lookup 到非對(duì)稱 KV Cache 壓縮,OpenVINO 2025.0 在性能和資源利用上實(shí)現(xiàn)了雙重優(yōu)化。
更廣泛的硬件支持:無(wú)論是 CPU、GPU 還是 NPU,OpenVINO 都能為你提供最佳的性能表現(xiàn)。
更靈活的部署選項(xiàng):從邊緣到云端,從 Linux 到 Windows,OpenVINO 2025.0 都能滿足你的需求。
結(jié)語(yǔ)
AI 開(kāi)發(fā)者的最佳伙伴,立即體驗(yàn) OpenVINO 2025.0!
DeepSeek 的最新突破讓 AI 技術(shù)邁向新高度,而 OpenVINO 2025.0 正是助力開(kāi)發(fā)者高效部署和優(yōu)化這些前沿模型的關(guān)鍵工具。無(wú)論你是從事大語(yǔ)言模型優(yōu)化、生成式 AI 應(yīng)用開(kāi)發(fā),還是希望在本地或云端環(huán)境中加速 AI 推理,OpenVINO 2025.0 都將是你的理想選擇。
在 AI 時(shí)代,每一次技術(shù)革新都意味著更強(qiáng)的競(jìng)爭(zhēng)力!
-
英特爾
+關(guān)注
關(guān)注
61文章
10279瀏覽量
179492 -
AI
+關(guān)注
關(guān)注
90文章
38413瀏覽量
297693 -
OpenVINO
+關(guān)注
關(guān)注
0文章
117瀏覽量
723 -
DeepSeek
+關(guān)注
關(guān)注
2文章
826瀏覽量
2858
原文標(biāo)題:開(kāi)發(fā)者實(shí)戰(zhàn)|DeepSeek 再次震撼 AI 領(lǐng)域,OpenVINO? 2025.0 全力加持,性能全面升級(jí)!
文章出處:【微信號(hào):英特爾物聯(lián)網(wǎng),微信公眾號(hào):英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
吉方工控獲評(píng)英特爾首批尊享級(jí)合作伙伴
硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開(kāi)源混元大模型
使用英特爾? NPU 插件C++運(yùn)行應(yīng)用程序時(shí)出現(xiàn)錯(cuò)誤:“std::Runtime_error at memory location”怎么解決?
無(wú)法將Openvino? 2025.0與onnx運(yùn)行時(shí)Openvino? 執(zhí)行提供程序 1.16.2 結(jié)合使用,怎么處理?
為什么無(wú)法通過(guò)“pip install openvino-dev==2025.0.0”安裝 2025.0 OpenVINO??
在Windows中安裝OpenVINO?后,無(wú)法找到OpenCL編譯器二進(jìn)制文件是怎么回事?
為什么無(wú)法檢測(cè)到OpenVINO?工具套件中的英特爾?集成圖形處理單元?
請(qǐng)問(wèn)OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯(lián)網(wǎng)企業(yè)版兼容?
安裝OpenVINO?適用于Raspberry Pi64位操作系統(tǒng)的工具套件2022.3.1,配置英特爾?NCS2時(shí)出錯(cuò)怎么解決?
將英特爾?獨(dú)立顯卡與OpenVINO?工具套件結(jié)合使用時(shí),無(wú)法運(yùn)行推理怎么解決?
為什么在Ubuntu20.04上使用YOLOv3比Yocto操作系統(tǒng)上的推理快?
為什么Caffe模型可以直接與OpenVINO?工具套件推斷引擎API一起使用,而無(wú)法轉(zhuǎn)換為中間表示 (IR)?
英特爾任命王稚聰擔(dān)任中國(guó)區(qū)副董事長(zhǎng)
英特爾OpenVINO 2025.0正式發(fā)布
英特爾的開(kāi)發(fā)板評(píng)測(cè)

英特爾OpenVINO 2025.0性能全面升級(jí)
評(píng)論