国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU虛擬化的4個主要指標和4種實現策略

汽車玩家 ? 來源:CSDN ? 作者:YuanruiZJU ? 2020-05-03 12:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU虛擬化的評價標準

4個主要指標用于評價GPU虛擬化的方法:

性能(performance)

保真度(fidelity)

資源復用(multiplexing)

是否支持虛擬化的特性(interposition)

其中性能和保真度強調減小GPU虛擬化的代價,性能是指執行操作的速度,保真度是指支持多少GPU提供的特性,以及對這些特性的支持的質量。資源復用以及是否支持虛擬化的特性則強調虛擬化為我們帶來價值。資源復用是指能夠使多臺虛擬機共享同一個物理GPU的能力,資源復用要求虛擬機之間的安全隔離,GPU資源復用提高了GPU資源利用率,在保持虛擬機內GPU性能不下降的情況下,復用一個GPU的虛擬機越多,對應的GPU虛擬化方案越符合資源復用的要求。是否支持虛擬化的特性是指GPU虛擬化的方案是否能支持虛擬化技術提供的虛擬機與物理機之間的中介過程,如要求虛擬機創建系統還原點,或者掛起,以及更加高級的特性,如熱遷移、可容錯執行等。這些標準經常是相對的,比如要提升性能,就需要犧牲虛擬化的其他特性。

GPU虛擬化技術的實現策略分類

GPU虛擬化的目標是為虛擬機提供虛擬GPU設備的支持,使得虛擬機內部調用的與GPU相關的指令或者與GPU相關的API(比如OpenCL或者CUDA)能夠正常得執行。

為了提升GPU虛擬化的性能,虛擬機需要利用GPU硬件來實現加速,也就是說虛擬機內部調用的GPU相關的命令或者GPU相關的API,能夠在硬件GPU上運行。所有GPU虛擬化技術的實現策略以及GPU虛擬化技術的發展都圍繞著這一目標。

下面列舉了四種GPU虛擬化技術的實現策略,按照利用GPU硬件加速的程度從小到大分別為分為設備模擬(Device Emulation)、API轉發(API Forwarding)、中介傳遞(Mediated Pass-through)和直接傳遞(Direct Pass-through也被稱為Fixed Pass-through),如圖所示。

下面對這四種實現策略分別介紹:

設備模擬(Device Emulation)

設備模擬是指通過軟件的方法來為虛擬機模擬GPU設備,這種方法的好處是虛擬機內部都可以調用GPU命令,可以完全記錄GPU設備的狀態,保證虛擬化技術的全部特性,滿足四個標準中的資源復用和支持虛擬化特性的標準。QEMU 通過軟件模擬實現了傳統的VGA設備,但是該設備的性能很低,只能支持基礎的功能。軟件模擬設備的方法幾乎不會使用硬件加速,因此其實現的GPU性能已經無法滿足現在虛擬機的圖形圖像處理和高性能計算的需求。而且正如前文提到的,現代GPU架構具有很高的復雜性,而且缺少文檔,因此很難實現對一個真實的物理GPU進行軟件模擬。這意味著設備模擬方法只能模擬少量的API,只能保證少量的GPU特性提供給虛擬機。由于設備模擬的方法在性能和支持的GPU特性上和真實的GPU相差過大,設備模擬的技術已經不再應用到GPU虛擬化技術中。

API轉發(API Forwarding)

API轉發是指通過實現包裹圖形API的庫,這些庫在虛擬機調用相關的API時,將這些圖形API通過遠程過程調用的方法轉發到主機上,然后調用主機上的圖形驅動提供的API支持完成調用。通過給高層的API實現包裹庫,客戶機就能支持高層的API如CUDA。vCUDA、vGRIS等虛擬化方案都是利用API轉發的方法。這種方法的優點是利于實現,而且一定程度上利用了GPU硬件實現加速,同時可以使多個虛擬機調用的GPU相關指令與API在物理GPU上執行。但是API轉發的主要問題在于這種方法失去了語言和庫的靈活性選擇,包裹庫和支持的API的不匹配會造成GPU虛擬化不成功。而如果在遷移的過程中,目標主機與源主機的包裹庫版本不一致,可能會造成遷移之后GPU虛擬化不成功,因此API轉發會影響虛擬化提供的特性。

中介傳遞(Mediated Pass-through)

GPU已經可以支持多個獨立的上下文,中介傳遞的方法使虛擬機只占用這些上下文的一個或者子集。高帶寬操作(指令緩存提交、幀緩存提交)需要使用映射到物理GPU的內存或者MMIO資源,低帶寬操作(資源分配、傳統的特性)可能會通過使用全虛擬化的資源來實現。

直接傳遞(Direct Pass-through)

直接傳遞是指給一臺虛擬機使用一個物理GPU的全部訪問權限。Intel提供了Intel VT-d硬件輔助技術,使研究者不需要去了解GPU的編程接口就可以直接實現一臺虛擬機占用物理GPU的全部訪問權限。這種方法的好處在于可以提供與真實機器相近的性能以及保真度,亞馬遜的Amazon EC2提供的GPU資源就是使用這種虛擬化策略。但是這種方法問題在于一個物理GPU只能被一臺虛擬機使用,犧牲了GPU資源在多臺機器之間共享的條件。而且虛擬化的遷移功能也會受到影響,因為不同體系架構的GPU之間可能存在不兼容。

全虛擬化與半虛擬化

GPU虛擬化實現策略按照是否需要修改客戶機操作系統內部的驅動代碼分為GPU全虛擬化和GPU半虛擬化。GPU全虛擬化是指實現在多個虛擬機之間共享GPu資源的同時不需要修改虛擬機內部的圖形驅動。GPU半虛擬化是指向虛擬機提供軟件實現的理想設備模型,對客戶機的圖形驅動進行底層的控制。使用GPU半虛擬化的方法,比API轉發的性能消耗更小,但是客戶機的設備驅動必須要改寫。主流的GPU虛擬化方案GPUvm使用半虛擬化的實現策略對虛擬機GPU的性能有明顯的改善。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • 虛擬機
    +關注

    關注

    1

    文章

    972

    瀏覽量

    30479
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI大算力的存儲技術, HBM 4E轉向定制

    電子發燒友網報道(文/黃晶晶)如今英偉達GPU迭代速度加快至每年一次,HBM存儲速率如何跟上GPU發展節奏。越來越多的超大規模云廠商、GPU廠商開始轉向定制HBM。而HBM存儲廠商以
    的頭像 發表于 11-30 00:31 ?8478次閱讀
    AI大算力的存儲技術, HBM <b class='flag-5'>4</b>E轉向定制<b class='flag-5'>化</b>

    結構布線中使用電纜標簽的4主要優勢

    帶來諸多顯著的優勢。本文將深入探討在結構布線中使用電纜標簽的4主要優勢,幫助讀者更好地理解這一細節的重要性。 提高布線系統的可管理性 清晰標識電纜用途 在復雜的布線系統中,各種電纜
    的頭像 發表于 11-24 10:34 ?329次閱讀

    車載軟件vECU虛擬測試解決方案

    虛擬測試:利用虛擬技術,實現將真實域控制器轉化為虛擬域控制器,運行在PC或服務器環境中運行,
    的頭像 發表于 10-30 09:34 ?1698次閱讀
    車載軟件vECU<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>測試解決方案

    多網融合時代:4G/Wi-Fi/以太網/虛擬網卡配置實戰!

    在物聯網與邊緣計算快速發展的今天,掌握多種網絡接口的配置至關重要。本文以實戰為導向,詳解4G、Wi-Fi、以太網和虛擬網卡的接入與協同策略。 網絡適配器,它的一更廣為人知的名字是——
    的頭像 發表于 10-09 18:25 ?306次閱讀
    多網融合時代:<b class='flag-5'>4</b>G/Wi-Fi/以太網/<b class='flag-5'>虛擬</b>網卡配置實戰!

    如何看懂GPU架構?一分鐘帶你了解GPU參數指標

    分析GPU核心參數體系:算力、顯存大小、顯存帶寬、熱門架構特性等關鍵指標,旨在幫您理解不同應用場景下,如何選擇最合適的GPU算力解決方案。1、算力GPU執行浮點運算
    的頭像 發表于 10-09 09:28 ?1137次閱讀
    如何看懂<b class='flag-5'>GPU</b>架構?一分鐘帶你了解<b class='flag-5'>GPU</b>參數<b class='flag-5'>指標</b>

    為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運行推理。 沒有可用的輸出。
    發表于 06-23 07:11

    電壓放大器的主要指標是什么意思

    是一需要重點考慮的指標。 電壓放大器的主要指標包括增益、帶寬、輸入阻抗、輸出阻抗、噪聲系數、失真度、功率輸出、頻率響應、動態范圍、電源電壓和功耗等。這些指標共同決定了放大器的性能和適
    發表于 06-12 14:33

    提供4觸摸輸入端口及4直接輸出端口的4鍵觸摸檢測IC-CT8224C

    CT8224C是一款使用電容式感應原理設計的觸摸IC,此款IC內建穩壓電路給觸摸感測器使用,穩定的感應方式可以應用到各種不同電子類產品。面板介質可以是完全絕源的材料,專為取代傳統的機械結構開關或普通按鍵而設計,提供4觸摸輸入端口及4
    的頭像 發表于 06-05 09:38 ?783次閱讀
    提供<b class='flag-5'>4</b><b class='flag-5'>個</b>觸摸輸入端口及<b class='flag-5'>4</b><b class='flag-5'>個</b>直接輸出端口的<b class='flag-5'>4</b>鍵觸摸檢測IC-CT8224C

    虛擬數據恢復—XenServer虛擬平臺上VPS不可用的數據恢復案例

    虛擬環境: 某品牌720服務器中有一組通過型號為H710P的RAID卡+4塊STAT硬盤組建的RAID10,上層部署Xen Server服務器虛擬
    的頭像 發表于 05-30 11:35 ?694次閱讀
    <b class='flag-5'>虛擬</b><b class='flag-5'>化</b>數據恢復—XenServer<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>平臺上VPS不可用的數據恢復案例

    六類非屏蔽雙絞線主要指標有哪些

    六類非屏蔽雙絞線(CAT6 UTP)是綜合布線系統中常用的高性能傳輸介質,其核心指標直接決定了網絡傳輸的穩定性、速度和抗干擾能力。以下是其主要技術指標及分析: 1. 傳輸性能 帶寬:250MHz
    的頭像 發表于 05-08 10:09 ?3696次閱讀

    基于Infineon TC4D9+TLF4D985的Aurix StartKit

    狀態預測,提升續航里程、充電速度和電池壽命;牽引逆變器領域,其創新cDSP與虛擬傳感技術優化能量回收與控制策略;在電源轉換方面,TC4xx支持SiC和GaN材料,集成高效控制功能,提升系統效率。
    的頭像 發表于 04-16 14:16 ?1260次閱讀
    基于Infineon TC<b class='flag-5'>4D9+TLF4</b>D985的Aurix StartKit

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術可在虛擬桌面基礎設施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬
    的頭像 發表于 04-07 11:28 ?1435次閱讀

    數字萬用表的主要指標及相互關系

    隨著電子技術的進步,科研和生產中,對數字多用表(以下簡稱數字表)的顯示位數、分辨力、測試精度和測試功能的要求不斷提高。這里給大家詳細講講數字萬用表的主要指標和相互關系。一、數字萬用表的主要指標1
    的頭像 發表于 04-03 17:21 ?1613次閱讀
    數字萬用表的<b class='flag-5'>主要指標</b>及相互關系

    RT-Thread虛擬部署DeepSeek大模型實踐

    Cortex-A55,8GBLPDDR4),通過虛擬技術實現虛擬Linux+RTOS混合部署
    的頭像 發表于 03-12 18:38 ?1290次閱讀
    RT-Thread<b class='flag-5'>虛擬</b><b class='flag-5'>化</b>部署DeepSeek大模型實踐

    4芯光纜是不是代表可以走4路網絡

    4芯光纜并不意味著可以直接走4路網絡。光纜的芯數主要指的是光纜內部光纖的數量,而光纖則是用來傳輸光信號的媒介。在光纜中,每一根光纖都可以獨立地傳輸一路光信號,因此理論上4芯光纜可以支持
    的頭像 發表于 03-12 11:01 ?1289次閱讀