国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能資源利用率的問題如何解決?

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-10-26 10:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

華為發(fā)明的卷積運算芯片,能夠在提高陣列資源利用率的同時降低RAM訪問次數(shù),進而減小RAM的訪問壓力。

目前,深度神經(jīng)網(wǎng)絡技術已經(jīng)成為人工智能領域的代表性算法,基于深度神經(jīng)網(wǎng)絡技術的字符識別、圖像分類或語音識別等關鍵技術,已經(jīng)廣泛應用于搜索引擎和智能手機等產(chǎn)品中。

其中,當前最為有效且應用最為廣泛的神經(jīng)網(wǎng)絡算法是卷積神經(jīng)網(wǎng)絡算法,簡稱“卷積運算”。在現(xiàn)有技術中,CNN算法的核心計算單元是乘加運算,乘法累加器陣列常用于矩陣乘法運算,而卷積運算可以轉換為矩陣乘法運算。因此業(yè)界廣泛采用MAC(乘累加器)陣列為計算核心的專用加速硬件,例如:現(xiàn)場可編程門陣列(FPGA)、專用集成電路ASIC)等,以加速卷積運算的運算速度。

但是目前卷積計算也存在著一些問題,一方面,當MAC陣列中存在多個卷積窗口同時進行卷積運算時,這些卷積窗口分布在MAC陣列中的不同位置,使得MAC陣列的利用率非常低。另一方面,存在大量重復數(shù)據(jù)被從RAM輸入到MAC陣列,這樣會增加RAM的訪問次數(shù)。

為了解決這樣的問題,華為發(fā)明了將CPU、RAM和卷積運算芯片集成在同一數(shù)據(jù)總線上的AI芯片,2016年12月29日,華為發(fā)明了一項名為“卷積運算芯片和通信設備”的發(fā)明專利(申請?zhí)枺?01611243272.X),申請人為華為機器有限公司。

根據(jù)該專利目前公開的資料,讓我們一起來看看華為的這項新架構AI芯片吧。


人工智能資源利用率的問題如何解決?

如上圖,為該專利中發(fā)明的硬件設備的示意性框架圖,硬件架構中包括中央處理器100、雙倍速率同步動態(tài)隨機存儲器(DDR SDRAM)200以及卷積運算芯片300。CPU用來控制卷積運算芯片啟動卷積運算,DDR SDRAM用于向卷積運算芯片的數(shù)據(jù)緩存模塊輸入多個卷積數(shù)據(jù)和多個卷積參數(shù),然后卷積運算芯片根據(jù)這些數(shù)據(jù)來完成卷積運算。

當?shù)玫竭\算結果后,就會將運算結果寫回到DDR SDRAM事先設定好的內(nèi)存地址中,并同時通知CPU完成運算,以從內(nèi)存地址中提取結果數(shù)據(jù)。

人工智能資源利用率的問題如何解決?

如上圖,為上面框架中的卷積運算芯片的結構示意圖,這種卷積運算芯片包括數(shù)據(jù)緩存模塊310、M*N乘法累加器陣列320、輸出控制模塊330和陣列控制模塊340。

數(shù)據(jù)緩存模塊用于向乘法累加器中的第一乘法累加窗口傳輸用于卷積運算的多個卷積數(shù)據(jù)和卷積參數(shù),卷積參數(shù)由數(shù)據(jù)緩存模塊根據(jù)第一卷積參數(shù)矩陣確定,而該控制器也是通過在運算器內(nèi)集成這樣的數(shù)據(jù)緩存器,從而減少了RAM的訪問次數(shù),進而減少了RAM的訪問壓力。

其中M*N乘法累加器是該運算芯片的核心運算部件,而這種M*N的結構設計方式也是為了進行卷積運算而特意設計的,其具體結構如下圖所示。


可以看到,這種乘法累加器包括M*N個處理單元,并且每兩行的處理單元之間還存在斜向的數(shù)據(jù)傳輸通道,這相比于傳統(tǒng)的矩陣式數(shù)據(jù)傳輸通道,具有更加靈活的數(shù)據(jù)傳輸方式,可以更好的適用于AI芯片進行多種類型的運算。

第一乘法累加窗口可以將數(shù)據(jù)進行乘法運算,并接著進行加法運算以獲得卷積結果,最后由輸出控制模塊輸出卷積神經(jīng)網(wǎng)絡的運算結果,進而完成AI芯片中的任務。

值得一提的是,在該專利中,為了盡可能地提高MAC陣列的利用率以及卷積運算效率,陣列控制模塊會根據(jù)第一卷積參數(shù)矩陣的行數(shù)和第一卷積數(shù)據(jù)陣列的行數(shù)來確定第一乘法累加窗口的列數(shù)。

以上就是華為發(fā)明的卷積運算芯片,這種卷積運算芯片能夠在提高陣列資源利用率的同時降低RAM訪問次數(shù),進而減小RAM的訪問壓力。而例如華為發(fā)明的昇騰AI芯片也正是基于這樣的技術之上,才能實現(xiàn)極高的算力,不管多么復雜的模型都可以輕松訓練,且實現(xiàn)極低的功耗。

關于嘉德


深圳市嘉德知識產(chǎn)權服務有限公司由曾在華為等世界500強企業(yè)工作多年的知識產(chǎn)權專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權法律理論和實務,在全球知識產(chǎn)權申請、布局、訴訟、許可談判、交易、運營、標準專利協(xié)同創(chuàng)造、專利池建設、展會知識產(chǎn)權、跨境電商知識產(chǎn)權、知識產(chǎn)權海關保護等方面擁有豐富的經(jīng)驗。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54024

    瀏覽量

    466353
  • AI
    AI
    +關注

    關注

    91

    文章

    39866

    瀏覽量

    301509
  • 人工智能
    +關注

    關注

    1817

    文章

    50105

    瀏覽量

    265533
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領域
    的頭像 發(fā)表于 02-22 08:24 ?142次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    GPU 利用率<30%?這款開源智算云平臺讓算力不浪費 1%

    作為 AI 開發(fā)者,你是否早已受夠這些困境:花數(shù)百萬采購的 GPU 集群,利用率常年低于 30%,算力閑置如同燒錢;跨 CPU/GPU/NPU 異構資源調(diào)度難如登天,模型訓練卡在資源分配環(huán)節(jié);部署
    的頭像 發(fā)表于 01-26 14:20 ?190次閱讀

    華為發(fā)布AI容器技術Flex:ai,算力平均利用率提升30%

    決方案。 ? 當前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時期,海量算力需求如潮水般涌來。然而,算力資源利用率偏低的問題卻成為了產(chǎn)業(yè)發(fā)展的關鍵桎梏。具體表現(xiàn)為,小模型任務常常獨占整卡,導致大量資源閑置;大模型任務又因單機算力不足而難以支撐
    的頭像 發(fā)表于 11-26 08:31 ?7609次閱讀

    【艾為視角】保證大方向正確!利用人工智能解決一線實際問題

    保證大方向正確,加快迭代,小步快跑。聚焦內(nèi)部效率提升,利用人工智能改變作業(yè)模式、簡化管理,結合業(yè)務場景解決一線實際問題。——任總在GTS人工智能實踐進展匯報會上的講話1聚焦內(nèi)部效率提升,利用人工智能
    的頭像 發(fā)表于 09-26 19:03 ?698次閱讀
    【艾為視角】保證大方向正確!<b class='flag-5'>利用人工智能</b>解決一線實際問題

    從 “被動維修” 到 “主動管理”:這套系統(tǒng)讓設備利用率提升 30%

    從 “被動維修” 到 “主動管理”,是設備管理模式的轉變,更是數(shù)字化轉型的關鍵一步。在激烈的市場競爭中,能讓設備穩(wěn)定高效運行的企業(yè),才能在效率與成本上占據(jù)優(yōu)勢。這套提升設備利用率 30% 的系統(tǒng),為企業(yè)高質(zhì)量發(fā)展提供了有效路徑。
    的頭像 發(fā)表于 09-04 10:04 ?857次閱讀
    從 “被動維修” 到 “主動管理”:這套系統(tǒng)讓設備<b class='flag-5'>利用率</b>提升 30%

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:23

    海光DCU率先展開文心系列模型的深度技術合作 FLOPs利用率(MFU)達47%

    海光DCU實現(xiàn)文心4.5模型高效適配; FLOPs利用率突破47%。 2025年6月30日,在百度文心4.5系列大模型正式開源當日,海光信息技術股份有限公司宣布其深度計算單元(DCU)率先完成對該系
    的頭像 發(fā)表于 07-01 14:35 ?2311次閱讀

    拼版怎么拼好,板廠經(jīng)常說利用率太低,多收費用?

    做板的時候,板廠經(jīng)常說我拼版利用率太低,要多收取費用,哪位大神知道怎么算利用率
    發(fā)表于 05-14 13:42

    mes工廠管理系統(tǒng):如何讓設備利用率提升50%?

    在制造業(yè)競爭日益激烈的今天,設備利用率直接決定了企業(yè)的盈利能力。許多工廠管理者都在思考同一個問題:如何在不增加設備投資的情況下,讓現(xiàn)有產(chǎn)能發(fā)揮出最大價值?MES工廠管理系統(tǒng)正是解決這一難題的金鑰匙
    的頭像 發(fā)表于 05-09 15:55 ?819次閱讀
    mes工廠管理系統(tǒng):如何讓設備<b class='flag-5'>利用率</b>提升50%?

    提升AI訓練性能:GPU資源優(yōu)化的12個實戰(zhàn)技巧

    人工智能與機器學習技術迅速發(fā)展的背景下,GPU計算資源的高效利用已成為關鍵技術指標。優(yōu)化的GPU資源分配不僅能顯著提升模型訓練速度,還能實現(xiàn)計算成本的有效控制。根據(jù)AI基礎設施聯(lián)盟2
    的頭像 發(fā)表于 05-06 11:17 ?1556次閱讀
    提升AI訓練性能:GPU<b class='flag-5'>資源</b>優(yōu)化的12個實戰(zhàn)技巧

    DeepSeek MoE架構下的網(wǎng)絡負載如何優(yōu)化?解鎖90%網(wǎng)絡利用率的關鍵策略

    、All-to-All等),網(wǎng)絡面臨高并發(fā)、低延遲、無損傳輸?shù)膰揽列枨蟆H欢瑐鹘y(tǒng)以太網(wǎng)的網(wǎng)絡利用率長期徘徊在35%~40%,成為制約AI算力釋放的關鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?905次閱讀
    DeepSeek MoE架構下的網(wǎng)絡負載如何優(yōu)化?解鎖90%網(wǎng)絡<b class='flag-5'>利用率</b>的關鍵策略

    梯度科技助力客戶破解算力調(diào)度難題

    在數(shù)字經(jīng)濟與人工智能深度融合的新階段,算力已成為支撐人工智能發(fā)展的核心生產(chǎn)力。梯度科技基于云原生技術架構研發(fā)的算力調(diào)度平臺,以“算力彈性調(diào)度、異構資源兼容、業(yè)務智能運維”為核心能力,為
    的頭像 發(fā)表于 04-27 16:32 ?1326次閱讀