国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

顯存也能疊疊樂,雙 Intel Arc A770 顯卡低成本部署 DeepSeek R1 32B 蒸餾模型體驗

looger123 ? 來源:looger123 ? 作者:looger123 ? 2025-03-18 12:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年春節后,DeepSeek R1 風暴般地席卷全國,小到手機 App,大到新能源汽車,似乎一夜間所有產品都接入了 DeepSeek R1。不得不說 DeepSeek R1 確實好用,對筆者這種編輯來說,從大綱到審閱,效率有著極大的提升。不過,官方滿血版的 DeepSeek R1 雖然好用,但會經?!暗艟€”,平均一個小時只能使用一次。第三方的滿血 DeepSeek R1 很少掉線,但涉及隱私或保密數據時,大家并不放心上傳云端。

于是,很多人萌生自己搭建 DeepSeek R1 的想法。然而滿血版的 DeepSeek R1 模型體積足足有 404GB,遠超一般消費級顯卡的顯存。即使 32B 的蒸餾模型體積也有 20GB。這就對顯卡的性能提出了較高的要求。例如,32GB 顯存的英偉達 RTX 5090 D 公版官方售價為 16999 元,但實際上要多花一萬多元才能買到。

一、配置與部署

那么,有沒有什么經濟實惠且效果不錯的方案呢?聰明的你想到讓多張顯卡協同工作,不過 AMD 目前的新顯卡已經不支持交火了,英偉達的 SLI 技術也不支持顯存疊加,而 Intel 的 Arc 顯卡不僅支持交火,并且顯存也可以疊加,價格也很實惠,兩張 Arc A770 16GB 價格 3600 元左右,就可獲得 32GB 的大現存。IT之家這次嘗試使用兩張藍戟 Intel Arc A770 Photon 16G OC 進行交火,來配置 DeepSeek R1 32B 的蒸餾模型。其具體配置如下圖:

wKgZPGfY8SqASvLfAABwDQSsQ1c41.jpeg

Intel Arc A770 有 8G 和 16GB 兩個版本,我們選擇的藍戟 Intel Arc A770 Photon 16G OC 配備 16GB GDDR6 顯存,顯存帶寬可達 512GB/s,其擁有 32 個 Xe 核心,最高頻率 2400Mhz。

wKgZO2fY8SqAdRY8AABqVPLigOo29.jpeg

因為是雙卡方案,所以需要留意主板與電源的配置,主板至少需要有兩個 PCIe 顯卡插槽,并且每個插槽必須支持 PCIe 4.0 x8 的傳輸速率。電源方面,單張藍戟 Intel Arc A770 Photon 16G OC 的 TBP 為 285W,兩張顯卡的功耗就要接近 600W。為了保證系統的穩定,我們選擇了海韻的 1300W 電源進行測試,這款電源不僅能滿足功率需求,還能滿足兩張顯卡所需的 4 個 PCIe 8Pin 接口。模型我們選擇通過使用 IPEX-LLM 部署在 Linux 上,相比 Window 系統效率會更高一些。

wKgZPGfY8SqAWrdgAABdO7eJe3E40.jpeg

搭建結束后,我們用另一臺電腦局域網訪問后端,在操作時盡量不使用測試電腦進行截圖錄屏,避免無關操作對 GPU 的占用。

wKgZO2fY8SuAXfFPAABFDw2JMvQ10.jpeg

二、性能與效果

因為是 32B 的模型,所以我們直接上強度,讓模型幫我們寫一個 HTML 小游戲。我們首先對模型進行提問:

請用 html 寫個貪吃蛇游戲的代碼,需要包含以下功能:

?使用鍵盤上的上下左右箭頭鍵控制蛇的移動方向。

?蛇會自動向前移動,并在吃到紅色的食物時增長并增加得分。

?當蛇碰到墻壁或自己時,游戲結束并顯示得分。

?點擊“重新開始”按鈕可以重置游戲并重新開始。

游戲規則:

?蛇不能碰到墻壁或自己,否則游戲結束。

?每吃一個食物,得分增加 10 分。

?食物不會出現在蛇的身體上。

DeepSeek R1 開始分析問題并生成代碼,此時兩張 Arc A770 顯卡的風扇全力運轉,后端顯示 Avg Generation Throughput 可以穩定在 26 tokens / s 以上。對比之下,單張 RTX 5090 D 運行 32B 模型的性能大約為 46 tokens / s,而官方不到兩成的價格卻得到了五成以上的性能,這個表現還是很讓人驚喜的。

wKgZPGfY8SuAKM97AADOEl3IYJo88.jpeg

生成后的 HTML 小游戲可以直接預覽運行,我發現操作有沖突,按上下方向鍵會滾動網頁。

wKgZO2fY8SuAHQrhAAN5HM-_qI8714.gif

于是我提出對代碼進行修改,要求用 A、S、D、W 來代替方向鍵。DeepSeek R1 很精準的理解了我的需求,并完成了修改。

wKgZPGfY8SyAOvnbAABPpDqY6DA41.jpeg

隨后,我要求生成更為復雜的俄羅斯方塊 HTML 代碼,雖說參數量只有 32B,但 DeepSeek R1 所生成的游戲同樣很完善,幾乎沒有什么 Bug。

wKgZO2fY8SyAYhfxAASrughOLYg746.gif

說到 AI 大模型的邏輯能力測試,那肯定繞不開弱智吧經典問答。我們選擇了兩個問題對雙 A770 搭建的 DeepSeek R1 進行測試:

1、神父去世是離職還是升職?

這種讓人一愣的問題 32B 的 DeepSeek R1 也能從現實與信仰兩種角度出發給出分析與解釋。可以看出 32B 模型的邏輯能力還是很強的,有著極高的可用性。

wKgZPGfY8SyALvFxAABxxNwJIBo96.jpeg

2、變形金剛應該交車險還是人險?

面對二選一的提問,32B 的 DeepSeek R1 并沒有死板的做出選擇,其理解了變形金剛不同形態的特征給出了兩種保險都買的絕佳選擇。

wKgZO2fY8S2APLXAAAB7QebVhAY92.jpeg

總結:

從測試結果來看,兩張 Intel Arc A770 16GB 顯卡(總計 3600 元)組成的雙卡部署 DeepSeek R1 蒸餾模型的方案確實經濟實惠。通過 IPEX-LLM 工具在 Linux 系統上部署,測試顯示雙 A770 顯卡能穩定運行 32B 模型,生成 HTML 小游戲和處理復雜問題時表現優異,平均吞吐量達 26 tokens / s,有著不錯的性價比。總體而言,A770 雙卡低成本部署 DeepSeek 32B 兼具成本、性能和數據隱私優勢,適合中小企業和個人開發者。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10296

    瀏覽量

    180197
  • 顯卡
    +關注

    關注

    16

    文章

    2520

    瀏覽量

    71401
  • 顯存
    +關注

    關注

    0

    文章

    112

    瀏覽量

    14092
  • DeepSeek
    +關注

    關注

    2

    文章

    833

    瀏覽量

    3209
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    速看!EASY-EAI教你離線部署Deepseek R1模型

    1.Deepseek簡介DeepSeek-R1,是幻方量化旗下AI公司深度求索(DeepSeek)研發的推理模型。DeepSeek-R1采用
    的頭像 發表于 07-25 15:22 ?1328次閱讀
    速看!EASY-EAI教你離線<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>

    DeepSeek開源新版R1 媲美OpenAI o3

    ;還有一些網友的實測評價都顯示,?DeepSeek新版R1 的性能可以媲美OpenAI最新的o3模型高版本。妥妥的超高性價比的平替。 此外,關于DeepSeek
    的頭像 發表于 05-29 11:23 ?1029次閱讀

    瑞薩RZ/V2H平臺支持部署離線版DeepSeek -R1大語言模型

    瑞薩RZ/V2H平臺支持部署離線版DeepSeek -R1大語言模型
    的頭像 發表于 05-13 17:07 ?1597次閱讀
    瑞薩RZ/V2H平臺支持<b class='flag-5'>部署</b>離線版<b class='flag-5'>DeepSeek</b> -<b class='flag-5'>R1</b>大語言<b class='flag-5'>模型</b>

    【幸狐Omni3576邊緣計算套件試用體驗】CPU部署DeekSeek-R1模型1B和7B

    一、DeepSeek簡介 DeepSeek是由中國深度求索公司開發的開源大語言模型系列,其研發始于2023年,目標是為學術界和產業界提供高效可控的AI基礎設施。R1系列作為其里程碑版本
    發表于 04-21 00:39

    DeepSeek R1模型本地部署與產品接入實操

    針對VS680/SL1680系列大算力芯片,我們的研發團隊正在研究將蒸餾后的輕量級DeepSeek模型DeepSeek-R1-Distill-Qwen-1.5B
    的頭像 發表于 04-19 16:32 ?729次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b><b class='flag-5'>模型</b>本地<b class='flag-5'>部署</b>與產品接入實操

    SL1680 SoC本地運行DeepSeek R1 1.5B模型

    深蕾半導體SL1680 SoC本地成功運行DeepSeek R1 Distill Qwen2.5 1.5B模型,展示了執行過程及本地小參數大模型
    的頭像 發表于 04-17 17:09 ?906次閱讀
    SL1680 SoC本地運行<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 1.5<b class='flag-5'>B</b>大<b class='flag-5'>模型</b>

    ORinNano離線部署Deepseek R1模型教程

    ORinNano離線部署Deepseek R1模型教程
    的頭像 發表于 04-10 15:32 ?1304次閱讀
    ORinNano離線<b class='flag-5'>部署</b><b class='flag-5'>Deepseek</b> <b class='flag-5'>R1</b>大<b class='flag-5'>模型</b>教程

    【幸狐Omni3576邊緣計算套件試用體驗】DeepSeek 部署及測試

    直接拖拽復制; 同理,將 DeepSeek 模型文件 DeepSeek-R1-Distill-Qwen-1.5B_W4A16_RK3576.rkllm 傳輸至板端; 開發板端運行程序 cd
    發表于 03-21 19:31

    博實結完成DeepSeek模型本地化部署

    近日,公司完成DeepSeek R1 671B模型本地化部署。通過構建自主可控的AI基礎設施,公司同步實現研發智能升級、研發
    的頭像 發表于 03-19 16:31 ?1289次閱讀

    NVIDIA RTX 5880 Ada顯卡部署DeepSeek-R1模型實測報告

    DeepSeek-R1 模型在 4 張 NVIDIA RTX 5880 Ada 顯卡配置下,面對短文本生成、長文本生成、總結概括三大實戰場景,會碰撞出怎樣的性能火花?參數規模差異懸殊的 70B
    的頭像 發表于 03-17 11:12 ?3007次閱讀
    NVIDIA RTX 5880 Ada<b class='flag-5'>顯卡</b><b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>模型</b>實測報告

    如何使用OpenVINO運行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節期間引發了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發的開源推理模型,用于解決需要邏輯推理、數學問題解決和實時決策的任務。
    的頭像 發表于 03-12 13:45 ?2321次閱讀
    如何使用OpenVINO運行<b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>

    RK3588開發板上部署DeepSeek-R1模型的完整指南

    下載DeepSeek-R1-Distill-Qwen-1.5B權重文件。 (2)安裝轉換工具 在Ubuntu創建虛擬環境并安裝RKLLM-Toolkit,以便將DeepSeek-R1大語言模型轉換
    發表于 02-27 16:45

    9.9萬元用上“滿血”DeepSeek R1一體機,本地部署成新商機?引發外媒熱議

    與本地部署的熱潮 DeepSeek R1作為一款強大的AI大模型,其本地部署能夠帶來諸多優勢,如保護數據安全和隱私、避免核心數據傳輸至第三方
    的頭像 發表于 02-27 09:20 ?2939次閱讀

    兆芯全面部署DeepSeek R1模型

    近日,基于兆芯高性能通用處理器的PC終端、工作站以及服務器成功實現DeepSeek-R1-Distill模型(1.5B/7B/32B/70
    的頭像 發表于 02-25 13:45 ?999次閱讀

    摩爾線程圖形顯卡MTT S80實現DeepSeek模型部署

    摩爾線程“全功能”圖形顯卡MTT S80,不僅游戲渲染性能強大,能玩《黑神話:悟空》,現在還能本地部署DeepSeek R1蒸餾
    的頭像 發表于 02-21 15:46 ?4392次閱讀
    摩爾線程圖形<b class='flag-5'>顯卡</b>MTT S80實現<b class='flag-5'>DeepSeek</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>