国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過GPU加速機器學習

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2022-02-10 17:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

早期的機器學習以搜索為基礎,主要依靠進行過一定優化的暴力方法。但是隨著機器學習逐漸成熟,它開始專注于加速技術已經很成熟的統計方法和優化問題。同時深度學習的問世更是帶來原本可能無法實現的優化方法。本文將介紹現代機器學習如何找到兼顧規模和速度的新方法。

AI領域的轉變

在本系列的第1部分中,我們探討了AI的一些歷史,以及從Lisp到現代編程語言以及深度學習等新型計算智能范式的歷程。我們還討論了人工智能的早期應用,它們依賴于經過優化的搜索形式、在海量數據集上進行訓練的現代神經網絡架構,同時解決了十年前還被認為不可能的難題。然而目前仍有兩大難題有待解決,即:如何進一步加速這些應用,以及將它們限制在智能手機這樣的功耗優化環境中。

今天,深度學習成為了多數加速技術的重點研究對象。深度學習是一種神經網絡架構,它依賴于多層神經網絡,其中的每一層都可以支持不同的功能以進行特征檢測。這些深層神經網絡依賴于可方便運用并行計算的矢量運算, 并為神經網絡層分布式計算以及同層諸多神經元并行計算創造了條件。

通過GPU加速機器學習

圖形處理單元(GPU)最初并不是用于加速深度學習應用。GPU是一種特殊的設備,用于加速輸出到顯示設備的幀緩沖區(內存)的構建。它將渲染后的圖像存入幀緩沖區,而不是依靠處理器來完成。GPU由數以千計的獨立內核組成,它們并行運行并執行矢量運算等特定類型的計算。盡管最初GPU專為視頻應用而設計,但人們發現它們也可以加速矩陣乘法等科學計算。

開發人員既可以借助于GPU供應商提供的API將GPU處理功能集成到應用中,也可以采用適用于諸多不同環境的標準軟件包方式。R編程語言和編程環境包含與GPU協同工作來加快處理速度的軟件包,例如gputools、gmatrix和gpuR。GPU也可以通過numba軟件包或Theano等各種庫借助于Python進行編程。

通過這些軟件包,任何有意將GPU加速應用于機器學習的人都可以達成愿望。但是工程師們還在研究更專門的方法。2019年,英特爾?以20億美元的價格收購了Habana Labs, 一家致力于為服務器中的機器學習加速器開發定制芯片的公司。此外,英特爾還于2017年以150億美元收購了自動駕駛芯片技術企業Mobileye。

定制芯片和指令

除了服務器和臺式機中的GPU加速之外,用于機器學習的加速器正在試圖超越傳統平臺,進軍功耗受限的嵌入式設備和智能手機。這些加速器形式多樣,包括U盤、API、智能手機神經網絡加速器以及用于深度學習加速的矢量指令等。

適用于智能手機的深度學習

深度學習工具包已經從PC端延伸到智能手機,可為存在更多限制的網絡提供支持。TensorFlow Lite和Core ML等框架已經部署在用于機器學習應用的移動設備上。Apple?最近發布了A12 Bionic芯片,這款芯片包括一個8核神經網絡引擎,用于開發更加節能的神經網絡應用, 從而擴展Apple智能手機上的深度學習應用。

Google發布了適用于Android? 8.1并具有機器學習功能的神經網絡API (NNAPI), 目前已應用于Google Lens自然語言處理和圖像識別背景下的Google Assistant。NNAPI與其他深度學習工具包相似,但它是針對Android智能手機環境及其資源限制而構建的。

深度學習USB

英特爾發布了其新版神經計算棒,以U盤的形式加速深度學習應用。TensorFlow、Caffe和PyTorch等眾多機器學習框架都可以使用它。當沒有GPU可用時,這將是一個不錯的選擇,同時還可以快速構建深度學習應用原型。

深度學習指令

最后,在機器學習計算從CPU轉移到GPU的同時,英特爾使用新的指令優化了其Xeon指令集,來加速深度學習。這些被稱為AVX-512擴展的新指令(所謂的矢量神經網絡指令或VNNi)提高了卷積神經網絡運算的處理量。

總結

GPU在機器學習中的應用實現了在眾多應用中構建和部署大規模深度神經網絡的能力。機器學習框架使構建深度學習應用變得簡單。智能手機供應商也不甘人后,為受到諸多限制的應用集成了高能效的神經網絡加速器(以及用于定制應用的API現在市面上還有其他可轉移到USB硬件上的加速器,許多新的初創公司也在加大加速器領域的投入,為未來機器學習應用做準備。

審核編輯:何安

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135453
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RSoft GPU加速技術重塑光子元件設計效率革命

    設計效率。為了解決這個問題,RSoft 光子器件工具的 FullWAVE FDTD 模組中引入 GPU 加速,通過 NVIDIA GPU 的平行運算能力,使得模擬速度相比 CPU 計算
    的頭像 發表于 01-12 14:09 ?256次閱讀
    RSoft <b class='flag-5'>GPU</b><b class='flag-5'>加速</b>技術重塑光子元件設計效率革命

    沐曦股份GPU加速技術助力藥物研發降本增效

    沐曦股份科學計算團隊近期取得突破性進展,成功將主流分子動力學模擬引擎GROMACS中的FEP計算全流程部署于GPU執行,并實現2.5倍性能提升,相關成果獲得GROMACS官方團隊的高度認可,該GPU
    的頭像 發表于 12-02 15:58 ?748次閱讀

    如何通過交替式幾何處理實現更優的多核?GPU?擴展

    在理論上,通過增加更多GPU核心來提升性能似乎很簡單:核心越多,性能越強。但在實踐中,這是圖形架構領域最棘手的挑戰之一。雖然某些工作負載因其獨立特性能實現良好擴展,但另一些工作負載(尤其是幾何
    的頭像 發表于 12-01 10:12 ?647次閱讀
    如何<b class='flag-5'>通過</b>交替式幾何處理實現更優的多核?<b class='flag-5'>GPU</b>?擴展

    FPGA和GPU加速的視覺SLAM系統中特征檢測器研究

    特征檢測是SLAM系統中常見但耗時的模塊,隨著SLAM技術日益廣泛應用于無人機等功耗受限平臺,其效率優化尤為重要。本文首次針對視覺SLAM流程開展硬件加速特征檢測器的對比研究,通過對比現代SoC平臺
    的頭像 發表于 10-31 09:30 ?666次閱讀
    FPGA和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>的視覺SLAM系統中特征檢測器研究

    NVIDIA Isaac Lab推動機器人技術突破

    Isaac Lab 是 Isaac Gym 的替代版本,該框架已將 GPU 原生機器人仿真擴展至大規模多模態學習的全新領域。Isaac Lab 整合了 GPU 并行的物理真實的仿真、逼
    的頭像 發表于 10-21 11:20 ?1184次閱讀

    Imagination GPU 驅動更新:新增多項 Vulkan 與 OpenCL 擴展支持

    整理了本次更新的重點內容。Vulkan協作矩陣(CooperativeMatrix)支持為加速圖形后處理、神經著色器、物理仿真以及GPU上的機器學習推理,DDK25
    的頭像 發表于 10-13 09:21 ?873次閱讀
    Imagination <b class='flag-5'>GPU</b> 驅動更新:新增多項 Vulkan 與 OpenCL 擴展支持

    NVIDIA Isaac Lab多GPU多節點訓練指南

    NVIDIA Isaac Lab 是一個適用于機器人學習的開源統一框架,基于 NVIDIA Isaac Sim 開發,其模塊化高保真仿真適用于各種訓練環境,可提供各種物理 AI 功能和由 GPU 驅動的物理仿真,縮小仿真與現實世界之間的差距。
    的頭像 發表于 09-23 17:15 ?2409次閱讀
    NVIDIA Isaac Lab多<b class='flag-5'>GPU</b>多節點訓練指南

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經安裝了cuda和cudnn,在全局的py里添加了torch,能夠調用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發表于 07-25 08:18

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件
    的頭像 發表于 07-16 15:34 ?2890次閱讀

    通過NVIDIA Cosmos模型增強機器人學習

    通用機器人的時代已經到來,這得益于機械電子技術和機器人 AI 基礎模型的進步。但目前機器人技術的發展仍面臨一個關鍵挑戰:機器人需要大量的訓練數據來掌握諸如組裝和檢查之類的技能,而手動演
    的頭像 發表于 07-14 11:49 ?1085次閱讀
    <b class='flag-5'>通過</b>NVIDIA Cosmos模型增強<b class='flag-5'>機器人學習</b>

    硅谷GPU云服務器是什么意思?使用指南詳解

    硅谷GPU云服務器本質上是一種IaaS(基礎設施即服務)產品,它將物理服務器上的GPU資源通過虛擬化技術分割成可彈性調配的云服務。與普通CPU云服務器相比,GPU服務器最大的特點是搭載
    的頭像 發表于 06-16 09:41 ?593次閱讀

    智算加速卡是什么東西?它真能在AI戰場上干掉GPU和TPU!

    隨著AI技術火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計算",可真到了落地環節,算力才是硬通貨。你有沒有發現,現在越來越多的AI企業不光用GPU,也不怎么迷信TPU了?他們嘴里多了一個新詞兒——智算加速卡。
    的頭像 發表于 06-05 13:39 ?1647次閱讀
    智算<b class='flag-5'>加速</b>卡是什么東西?它真能在AI戰場上干掉<b class='flag-5'>GPU</b>和TPU!

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    閱讀心得體會:ROS2機器人視覺與地圖構建技術 通過對本書第7章(ROS2視覺應用)和第8章(ROS2地圖構建)的學習,我對機器人視覺感知和自主導航的核心技術有了更深入的理解。以下是我
    發表于 05-03 19:41

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    和更多外設接口。無論是運行還是休眠狀態,功耗表現都非常出色! 3. 在傳感器數據采集與AI機器學習中的優勢? 答:主頻高、功耗低,內置專用核處理數據采集,還配備AI加速器,讓AI算法運行更高效! 4.
    發表于 04-01 00:00