国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU深度學習面臨的挑戰分析

我快閉嘴 ? 來源:AI前線 ? 作者:Ben Dickson ? 2020-12-11 15:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能的興起觸發了市場對 GPU 的大量需求,但 GPU 在 AI 場景中的應用面臨使用壽命短、使用成本高等問題。現場可編程門陣列 (FPGA) 這一可以定制化硬件處理器反倒是更好的解決方案。隨著可編程性等問題在 FPGA 上的解決,FPGA 將成為市場人工智能應用的選擇。

在過去的十年里,人工智能的再一次興起使顯卡行業受益匪淺。英偉達 (Nvidia) 和 AMD 等公司的股價也大幅上漲,因為事實表明,它們的 GPU 在訓練和運行 深度學習模型 方面效果明顯。實際上,英偉達也已經對自己的業務進行了轉型,之前它是一家純粹做 GPU 和游戲的公司,現在除了作為一家云 GPU 服務提供商外,英偉達還成立了專業的人工智能研究實驗室。

不過,機器學習軟件公司 Mipsology 的首席執行官兼聯合創始人盧多維奇?拉祖爾 (Ludovic Larzul) 表示,GPU 還存在著一些缺陷,這使其在 AI 應用中面臨著一些挑戰。

Larzul 表示,想要解決這些問題的解決方案便是實現現場可編程門陣列 (FPGA),這也是他們公司的研究領域。FPGA 是一種處理器,可以在制造后定制,這使得它比一般處理器更高效。但是,很難對 FPGA 進行編程,Larzul 希望通過自己公司開發的新平臺解決這個問題。

專業的人工智能硬件已經成為了一個獨立的產業,但對于什么是深度學習算法的最佳基礎設施,人們仍然沒有定論。如果 Mipsology 成功完成了研究實驗,許多正受 GPU 折磨的 AI 開發者將從中受益。

GPU 深度學習面臨的挑戰

三維圖形是 GPU 擁有如此大的內存和計算能力的根本原因,它與 深度神經網絡 有一個共同之處:都需要進行大量矩陣運算。

顯卡可以并行執行矩陣運算,極大地加快計算速度。圖形處理器可以把訓練神經網絡的時間從幾天、幾周縮短到幾小時、幾分鐘。

隨著圖形硬件公司供貨的不斷增加,GPU 在深度學習中的市場需求還催生了大量公共云服務,這些服務為深度學習項目提供強大的 GPU 虛擬機。

但是顯卡也受硬件和環境的限制。Larzul 解釋說:“神經網絡訓練通常是在一個確定的環境中進行的,運行神經網絡的系統會在部署中遇到各種限制——這可能會對 GPU 的實際使用造成壓力。”

GPU 需要大量的電力,會產生大量的熱量,并需要使用風扇冷卻。當你在臺式工作站、筆記本電腦或機架式服務器上訓練神經網絡時,這不是什么大問題。但是,許多部署深度學習模型的環境對 GPU 并不友好,比如自動駕駛汽車、工廠、機器人和許多智慧城市環境,在這些環境中硬件必須忍受熱、灰塵、濕度、運動和電力限制等環境因素。

Larzul 說:“在一些關鍵的應用場景中,比如智慧城市的視頻監控,要求硬件暴露在對 GPU 有不利影響的環境因素 (比如太陽) 下。“ GPU 受晶體管技術的限制,導致它們在高溫下運行時需要及時冷卻,而這并不總是可以實現的。要做到這點需要更多的電力、維護成本等。”

使用壽命也是一個問題。一般來說,GPU 的使用 壽命約為 2-5 年,這對那些每隔幾年就換一次電腦的玩家來說不是什么大問題。但在其他領域,如汽車行業,需要硬件有更高的耐用性,這就帶來了問題。特別是過多的暴露在惡劣的環境中,再加上高強度的使用,GPU 的使用壽命將會更短。

Larzul 說:“從商業可行性方面考慮,自動駕駛汽車等應用可能需要多達 7-10 個 GPU(其中大多數會在不到四年的時間內失效),對于大多數購車者來說,智能或自動駕駛汽車的成本將變得不切實際。”

機器人、醫療保健和安全系統等其他行業也面臨著類似的挑戰。

FPGA 和深度學習

FPGA 是可定制的硬件設備,可對其組件進行調節,因此可以針對特定類型的架構 (如 卷積神經網絡) 進行優化。其可定制性特征降低了對電力的需求,并在運算速度和吞吐量方面提供了更高的性能。它們的使用壽命也更長,大約是 GPU 的 2-5 倍,并且對惡劣環境和其它特殊環境因素有更強的適應性。

有一些公司已經在他們的人工智能產品中使用了 FPGA。微軟 就是其中一家,它將基于 FPGA 的機器學習技術作為其 Azure 云服務產品的一部分來提供。

不過 FPGA 的缺陷是難于編程。配置 FPGA 需要具備硬件描述語言 (如 Verilog 或 VHDL) 的知識和專業技能。機器學習程序是用 Python 或 C 等高級語言編寫的,將其邏輯轉換為 FPGA 指令非常困難。在 FPGA 上運行 TensorFlow、PyTorch、Caffe 和其他框架建模的神經網絡通常需要消耗大量的人力時間和精力。

“要對 FPGA 進行編程,你需要組建一支懂得如何開發 FPGA 的硬件工程師團隊,并聘請一位了解神經網絡的優秀架構師,花費幾年時間去開發一個硬件模型,最終編譯運行在 FPGA 上,與此同時你還需要處理 FPGA 使用效率和使用頻率的問題。“Larzul 說。此外你還需要具備廣泛的數學技能,以較低的精度準確地計算模型,并需要一個軟件團隊將 AI 框架模型映射到硬件架構。

Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這一差距。Zebra 是一種軟件平臺,開發者可以輕松地將深度學習代碼移植到 FPGA 硬件上。

Larzul 說:“我們提供了一個軟件抽象層,它隱藏了通常需要高級 FPGA 專業知識的復雜性。”“只需加載 Zebra,輸入一個 Linux 命令,Zebra 就可以工作了——它不需要編譯,不需要對神經網絡進行任何更改,也不需要學習任何新工具。不過你可以保留你的 GPU 用于訓練。”

AI 硬件前景

Mipsology 的 Zebra 平臺是開發者探索在 AI 項目中使用 FPGA 的 眾多方案之一。Xilinx 是 FPGA 領域的領導者,已經開發了 Zebra 并將其集成到了電路板中。其他公司,如谷歌和特斯拉,也正積極的為其開發專用的 AI 硬件,用于自己的云產品和邊緣計算產品環境中。

神經形態芯片 方面也有著一些發展,這是一種專門為神經網絡設計的計算機架構。英特爾在神經形態計算領域處于領先地位,已經開發了幾種模型架構,不過該領域仍處于早期發展階段。

還有專門用于特定應用的集成電路ASIC),即專為某一特定人工智能需求制造的芯片。但 ASIC 缺乏 FPGA 的靈活性,無法重新編程。

Larzul 最后說,“我們決定專注于軟件業務,探索研究提升神經網絡性能和降低延遲的方案。Zebra 運行在 FPGA 上,因此無需更換硬件就可以支持 AI 推理。FPGA 固件的每次刷新都能給我們帶來更高的性能提升,這得益于其高效性和較短的開發周期。另外,FPGA 的可選擇方案很多,具有很好的市場適應性。”
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22412

    瀏覽量

    636303
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135449
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265363
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課(11大系列課程,共5000+分鐘)

    GPU加速訓練(可選) 雙軌教學:傳統視覺算法+深度學習方案全覆蓋 輕量化部署:8.6M超輕OCR模型,適合嵌入式設備集成 無監督學習:無需缺陷樣本即可訓練高精度檢測模型 持續更新:
    發表于 12-04 09:28

    【團購】獨家全套珍藏!龍哥LabVIEW視覺深度學習實戰課程(11大系列課程,共5000+分鐘)

    GPU加速訓練(可選) 雙軌教學:傳統視覺算法+深度學習方案全覆蓋 輕量化部署:8.6M超輕OCR模型,適合嵌入式設備集成 無監督學習:無需缺陷樣本即可訓練高精度檢測模型 持續更新:
    發表于 12-03 13:50

    如何深度學習機器視覺的應用場景

    檢測應用 微細缺陷識別:檢測肉眼難以發現的微小缺陷和異常 紋理分析:對材料表面紋理進行智能分析和缺陷識別 3D表面重建:通過深度學習進行高精度3D建模和檢測 電子行業應用 PCB板復雜
    的頭像 發表于 11-27 10:19 ?220次閱讀

    AI芯片市場鏖戰,GPU與ASIC誰將占據主動?

    ,正圍繞性能、成本、靈活性等核心維度展開激烈角逐,各自憑借獨特優勢占據細分市場,同時也面臨著技術迭代與市場需求變革帶來的挑戰GPU憑借其與生俱來的并行計算基因,成
    的頭像 發表于 10-30 12:06 ?768次閱讀
    AI芯片市場鏖戰,<b class='flag-5'>GPU</b>與ASIC誰將占據主動?

    Omdia高級首席分析師暢談運營商面臨的網絡挑戰

    Omdia高級首席分析師Sameer Ashfaq Malik指出,運營商面臨三大核心網絡挑戰:傳統服務收入低迷、新興服務(如人工智能)規模化進程緩慢,以及運營成本(OPEX)持續攀升。“AI
    的頭像 發表于 10-13 09:19 ?1117次閱讀

    深度學習對工業物聯網有哪些幫助

    、實施路徑三個維度展開分析: 一、深度學習如何突破工業物聯網的技術瓶頸? 1. 非結構化數據處理:解鎖“沉睡數據”價值 傳統困境 :工業物聯網中70%以上的數據為非結構化數據(如設備振動波形、紅外圖像、日志文本),傳統方法難以
    的頭像 發表于 08-20 14:56 ?1025次閱讀

    如何在Ray分布式計算框架下集成NVIDIA Nsight Systems進行GPU性能分析

    在大語言模型的強化學習訓練過程中,GPU 性能優化至關重要。隨著模型規模不斷擴大,如何高效地分析和優化 GPU 性能成為開發者面臨的主要
    的頭像 發表于 07-23 10:34 ?2400次閱讀
    如何在Ray分布式計算框架下集成NVIDIA Nsight Systems進行<b class='flag-5'>GPU</b>性能<b class='flag-5'>分析</b>

    FOPLP工藝面臨挑戰

    FOPLP 技術目前仍面臨諸多挑戰,包括:芯片偏移、面板翹曲、RDL工藝能力、配套設備和材料、市場應用等方面。
    的頭像 發表于 07-21 10:19 ?1535次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰</b>

    別讓 GPU 故障拖后腿,捷智算GPU維修室來救場!

    在AI浪潮洶涌的當下,GPU已然成為眾多企業與科研機構的核心生產力。從深度學習模型訓練,到影視渲染、復雜科學計算,GPU憑借強大并行計算能力,極大提升運算效率。然而,就像高速運轉的精密
    的頭像 發表于 07-17 18:56 ?1148次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來救場!

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】+NVlink技術從應用到原理

    自家GPU 提出的多卡算力互連技術,是早期為了應對深度學習對超高算力需求而單卡算力不足的局面的解決方案,當然這都是官方用來吹牛的話術。我自己在2019年左右第一次接觸到多卡交火的GIY玩法(從學生到
    發表于 06-18 19:31

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現代計算機中不可或缺的一部分,已經從最初的圖形渲染專用處理器,發展成為強大的并行計算引擎,廣泛應用于人工智能、科學計算
    的頭像 發表于 05-30 10:36 ?1855次閱讀
    <b class='flag-5'>GPU</b>架構<b class='flag-5'>深度</b>解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設備、嵌入式系統和基礎設施市場設計的圖形處理器(GPU)IP 核,憑借其異構計算架構、能效優化和生態協同,成為全球移動
    的頭像 發表于 05-29 10:12 ?4326次閱讀

    存儲示波器的存儲深度對信號分析有什么影響?

    存儲深度(Memory Depth)是數字示波器的核心參數之一,它直接決定了示波器在單次采集過程中能夠記錄的采樣點數量。存儲深度對信號分析的影響貫穿時域細節捕捉、頻域分析精度、觸發穩定
    發表于 05-27 14:39

    智慧路燈的推廣面臨哪些挑戰

    引言 在智慧城市建設的宏偉藍圖中,叁仟智慧路燈的推廣面臨哪些挑戰?叁仟智慧路燈作為重要的基礎設施,承載著提升城市照明智能化水平、實現多功能集成服務的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發表于 03-27 17:02 ?706次閱讀

    智慧路燈在數據采集與分析方面面臨挑戰

    叁仟智慧路燈作為現代城市基礎設施的重要組成部分,通過集成多種傳感器、通信模塊和智能控制算法,實現了高效節能、多功能集成和智能化管理。然而,在數據采集與分析方面,智慧路燈仍面臨諸多挑戰。 一、技術
    的頭像 發表于 03-11 21:22 ?585次閱讀
    智慧路燈在數據采集與<b class='flag-5'>分析</b>方面<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰</b>