国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU如何加速人工智能或機(jī)器學(xué)習(xí)的計(jì)算速度

Dbwd_Imgtec ? 來(lái)源:cg ? 2019-01-08 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、Why GPU

其實(shí)GPU計(jì)算比CPU并不是“效果好”,而是“速度快”。

計(jì)算就是計(jì)算,數(shù)學(xué)上都是一樣的,1+1用什么算都是2,CPU算神經(jīng)網(wǎng)絡(luò)也是可以的,算出來(lái)的神經(jīng)網(wǎng)絡(luò)放到實(shí)際應(yīng)用中效果也很好,只不過(guò)速度會(huì)很慢罷了。

GPU的起源

GPU全稱(chēng)叫做graphics processing unit,圖形處理器,顧名思義就是處理圖形的。

電腦顯示器上顯示的圖像,在顯示在顯示器上之前,要經(jīng)過(guò)一些列處理,這個(gè)過(guò)程有個(gè)專(zhuān)有的名詞叫“渲染”。以前的計(jì)算機(jī)上沒(méi)有GPU,渲染就是CPU負(fù)責(zé)的。渲染是個(gè)什么操作呢,其實(shí)就是做了一系列圖形的計(jì)算,但這些計(jì)算往往非常耗時(shí),占用了CPU的一大部分時(shí)間。而CPU還要處理計(jì)算機(jī)器許多其他任務(wù)。因此就專(zhuān)門(mén)針對(duì)圖形處理的這些操作設(shè)計(jì)了一種處理器,也就是GPU。這樣CPU就可以從繁重的圖形計(jì)算中解脫出來(lái)。

由于GPU是專(zhuān)門(mén)為了渲染設(shè)計(jì)的,那么他也就只能做渲染的那些事情。

渲染這個(gè)過(guò)程具體來(lái)說(shuō)就是幾何點(diǎn)位置和顏色的計(jì)算,這兩者的計(jì)算在數(shù)學(xué)上都是用四維向量和變換矩陣的乘法,因此GPU也就被設(shè)計(jì)為專(zhuān)門(mén)適合做類(lèi)似運(yùn)算的專(zhuān)用處理器了。為什么說(shuō)專(zhuān)用呢,因?yàn)楹芏嗍虑樗霾涣恕?/p>

CPU通用性強(qiáng),但是專(zhuān)用領(lǐng)域性能低。工程就是折衷,這項(xiàng)強(qiáng)了,別的就弱了。再后來(lái)游戲、3D設(shè)計(jì)對(duì)渲染的要求越來(lái)越高,GPU的性能越做越強(qiáng)。論純理論計(jì)算性能,要比CPU高出幾十上百倍。

人們就想了,既然GPU這么強(qiáng),那用GPU做計(jì)算是不是相比CPU速度能大大提升呢?于是就有了GPGPU(general purpose GPU,通用計(jì)算GPU)這個(gè)概念。但我們前面提到了,GPU是專(zhuān)門(mén)為了圖像渲染設(shè)計(jì)的,他只適用于那些操作。但幸運(yùn)的是有些操作和GPU本職能做的那些東西非常像,那就可以通過(guò)GPU提高速度,比如深度學(xué)習(xí)

深度學(xué)習(xí)中一類(lèi)成功應(yīng)用的技術(shù)叫做卷積神經(jīng)網(wǎng)絡(luò)CNN,這種網(wǎng)絡(luò)數(shù)學(xué)上就是許多卷積運(yùn)算和矩陣運(yùn)算的組合,而卷積運(yùn)算通過(guò)一定的數(shù)學(xué)手段也可以通過(guò)矩陣運(yùn)算完成。這些操作和GPU本來(lái)能做的那些圖形點(diǎn)的矩陣運(yùn)算是一樣的。因此深度學(xué)習(xí)就可以非常恰當(dāng)?shù)赜肎PU進(jìn)行加速了。

以前GPGPU(通用GPU)概念不是很火熱,GPU設(shè)計(jì)出來(lái)就是為了圖形渲染。想要利用GPU輔助計(jì)算,就要完全遵循GPU的硬件架構(gòu)。而現(xiàn)在GPGPU越來(lái)越流行,廠家在設(shè)計(jì)和生產(chǎn)GPU的時(shí)候也會(huì)照顧到計(jì)算領(lǐng)域的需求了。

二、GPGPU與GPU的區(qū)別

GPU的產(chǎn)生是為了解決圖形渲染效率的問(wèn)題,但隨著技術(shù)進(jìn)步,GPU越來(lái)越強(qiáng)大,尤其是shader出現(xiàn)之后(這個(gè)允許我們?cè)贕PU上編程),GPU能做的事越來(lái)越多,不再局限于圖形領(lǐng)域,也就有人動(dòng)手將其能力擴(kuò)展到其他計(jì)算密集的領(lǐng)域,這就是GP(General Purpose)GPU。

三、為什么快

比如說(shuō)你用美圖xx軟件,給一張圖片加上模糊效果的時(shí)候,CPU會(huì)這么做:

使用一個(gè)模糊濾鏡算子的小窗口,從圖片的左上角開(kāi)始處理,并從左往右,再?gòu)淖笸疫M(jìn)行游走處理,直到整個(gè)圖片被處理完成。因?yàn)镃PU只有一個(gè)或者少數(shù)幾個(gè)核,所以執(zhí)行這種運(yùn)算的時(shí)候,只能老老實(shí)實(shí)從頭遍歷到最后。

但是有一些聰明的讀者會(huì)發(fā)現(xiàn),每個(gè)窗口在處理圖片的過(guò)程中,都是獨(dú)立的,相互沒(méi)有關(guān)系的。那么同時(shí)用幾個(gè)濾鏡窗口來(lái)處理是不是更快一些? 于是我們有了GPU, 一般的GPU都有幾百個(gè)核心,意味著,我們可以同時(shí)有好幾百個(gè)濾鏡窗口來(lái)處理這張圖片。

所以說(shuō),GPU起初的設(shè)計(jì)目標(biāo)就是為了處理這種圖形圖像的渲染工作,而這種工作的特性就是可以分布式、每個(gè)處理單元之間較為獨(dú)立,沒(méi)有太多的關(guān)聯(lián)。而一部分機(jī)器學(xué)習(xí)算法,比如遺傳算法,神經(jīng)網(wǎng)絡(luò)等,也具有這種分布式及局部獨(dú)立的特性(e.g.比如說(shuō)一條神經(jīng)網(wǎng)絡(luò)中的鏈路跟另一條鏈路之間是同時(shí)進(jìn)行計(jì)算,而且相互之間沒(méi)有依賴(lài)的),這種情況下可以采用大量小核心同時(shí)運(yùn)算的方式來(lái)加快運(yùn)算速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135467
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265413
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136956

原文標(biāo)題:為何GPU可以用于加速人工智能或者機(jī)器學(xué)習(xí)的計(jì)算速度?

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    。 強(qiáng)人工智能(Strong AI),又稱(chēng)通用人工智能(Artificial General Intelligence)完全人工智能,指的是可以勝任人類(lèi)所有工作的
    的頭像 發(fā)表于 02-22 08:24 ?125次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    人工智能機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    人工智能機(jī)器學(xué)習(xí)問(wèn)世以來(lái),多個(gè)在線領(lǐng)域的數(shù)字化格局迎來(lái)了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與
    的頭像 發(fā)表于 02-04 14:44 ?478次閱讀

    神經(jīng)網(wǎng)絡(luò)的并行計(jì)算加速技術(shù)

    隨著人工智能技術(shù)的飛速發(fā)展,神經(jīng)網(wǎng)絡(luò)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和廣泛的應(yīng)用前景。然而,神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度和規(guī)模也在不斷增加,這使得傳統(tǒng)的串行計(jì)算方式面臨著巨大的挑戰(zhàn),如計(jì)算速度慢、訓(xùn)練時(shí)間長(zhǎng)等
    的頭像 發(fā)表于 09-17 13:31 ?1129次閱讀
    神經(jīng)網(wǎng)絡(luò)的并行<b class='flag-5'>計(jì)算</b>與<b class='flag-5'>加速</b>技術(shù)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開(kāi)發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開(kāi)發(fā)和終端
    發(fā)表于 08-31 20:54

    Lambda采用Supermicro NVIDIA Blackwell GPU服務(wù)器集群構(gòu)建人工智能工廠

    人工智能/機(jī)器學(xué)習(xí)、HPC、云、存儲(chǔ)和 5G/邊緣的整體 IT 解決方案提供商 Super Micro Computer, Inc. (SMCI)今天宣布,超級(jí)智能云提供商 Lambd
    的頭像 發(fā)表于 08-30 16:55 ?780次閱讀

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類(lèi)AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。 三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程 它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類(lèi)AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    本文轉(zhuǎn)自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速器和處理器整合到各類(lèi)應(yīng)用中也變得愈發(fā)普遍。然而,圍繞它們是什么、如何運(yùn)作、能如何增強(qiáng)
    的頭像 發(fā)表于 08-07 13:21 ?1071次閱讀
    關(guān)于<b class='flag-5'>人工智能</b>處理器的11個(gè)誤解

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿(mǎn)足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)作為一種靈活且高效
    的頭像 發(fā)表于 07-16 15:34 ?2898次閱讀

    AI芯片:加速人工智能計(jì)算的專(zhuān)用硬件引擎

    人工智能(AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專(zhuān)為AI優(yōu)化的芯片應(yīng)運(yùn)而生,成為推動(dòng)深度學(xué)習(xí)
    的頭像 發(fā)表于 07-09 15:59 ?1585次閱讀

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    大模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型推理顯存和計(jì)算
    發(fā)表于 07-03 19:43

    開(kāi)售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺(tái),加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長(zhǎng)領(lǐng)域提供解決方案,包括企業(yè)級(jí)AI智能體、定制化行業(yè)大型語(yǔ)言模型及搭載N
    的頭像 發(fā)表于 03-26 14:42 ?745次閱讀
    Cognizant將與NVIDIA合作部署神經(jīng)<b class='flag-5'>人工智能</b>平臺(tái),<b class='flag-5'>加速</b>企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用