国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大規模人工智能(AI)處理器的功耗分析方法

天數智芯 ? 來源:天數智芯 ? 作者:天數智芯 ? 2022-01-17 16:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,來自天數智芯公司Power團隊的三位工程師闕詩璇、孫凌、甘振華合作發表的技術論文《左移:大規模人工智能(AI)處理器的功耗分析方法》順利入選第58屆(國際設計自動化會議,Design Automation Conference),并做poster presentation。

文章主要內容如下:

AI芯片最重要的設計指標之一就是單位功耗每瓦算力(TOPS/W),因此低功耗設計對于AI芯片的設計實現,在市場中具備競爭力都十分重要。然而原有的功耗分析方法存在一定的不足,對新的需求也無法滿足:

1.原有方法只是對功能驗證的場景,而缺乏真實的應用場景,跟真實的軟件應用有一定的差距;

2.傳統的功耗分析需要綜合后的網表和門級的向量,這在項目早期很難獲取,太晚介入會讓功耗優化受限;

3.對于仿真時間長的向量,尤其是要按時間分析功耗時,所需的運行時間和資源都是巨大的;

4.自適應電壓頻率縮放等需要有實時的功耗才能進行軟硬件控制,這是原有方法無法實現的;

5.為了搶占市場,需要更快的迭代設計,因此設計人員希望每周甚至每天都可以對低功耗功能進行驗證,原有方法很難趕上驗證迭代的速度;

為了解決這些挑戰跟需求,天數智芯提出了一種創新的功耗分析方案:利用一種功耗分析工具對所給的仿真向量進行高性能的按時間分析功耗的分布,從而得到平均功耗和峰值功耗等參數。這種方法在RTL階段就進行分析,有利于對AI處理器進行優化功耗的迭代,最終實現項目功耗目標。與之前的方法相比較,它在某些實驗中,可以達到100甚至1000倍的加速。

接下來將展開描述該方案在實際工作中的一個應用:通過機器學習的訓練得到實時功耗預測模型。

現在所用的新的功耗分析方法和原有的按時間分析網表的功耗分析方法,具有很好的相關一致性。所以利用它超高倍加速的分析能力,可以用于各種應用場景激勵產生訓練模型所需要的充足的數據集。當訓練數據集達到百萬甚至是上億級別,通過機器學習算法得到的模型就比較準確。這是依賴新的分析方法才能得到的,傳統的分析方法無法產生這么大的數據量。

我們用機器學習的算法對各個模塊進行參數訓練,從而得到最佳的預測模型,這樣就可以用于預測實時功耗,從而實現軟硬件的控制。

經過幾天的訓練,我們最終得到的預測模型與真實的功耗之間的誤差只有不到5%。

總的來看,創新的功耗分析方法與傳統流程相比,能在項目早期介入,所需要的運行時間跟內存消耗大大減少,可以在設計階段進行快速的迭代。它不僅僅可以對原有的功能驗證激勵進行分析,對于原型驗證的真實的應用場景向量也可以進行分析,從而得到更真實的功耗相關指標,且與項目最終簽核時的數據具有一致性。利用它的快速和節省資源特性,能夠為實時功耗的預測模型提供大量充足的數據樣本,最終得到誤差5%以內的預測模型。

關于DAC

DAC(國際設計自動化會議,Design Automation Conference)與ICCAD(國際計算機輔助設計會議,International Conference on Computer Aided Design)、DATE(歐洲設計自動化與測試學術會議,Design, Automation and Test in Europe)、ASP-DAC(亞太地區設計自動化會議,Asia and South Pacific Design Automation Conference)一起被公認為電子設計自動化領域水平最高的四大國際會議。

關于天數智芯

上海天數智芯半導體有限公司(簡稱“天數智芯”)于2018年正式啟動7納米通用并行(GPGPU)云端計算芯片設計,是中國第一家通用并行(GPGPU)云端計算芯片及高性能算力系統提供商。公司以“成為智能社會的賦能者”為使命,專注于云端服務器級的通用并行高性能云端計算芯片,瞄準以云計算、人工智能、數字化轉型為代表的數據驅動技術市場,解決核心算力瓶頸問題。重點打造自主可控、國際一流的通用、標準、高性能云端計算GPGPU芯片,從芯片端解決算力問題。

原文標題:天數智芯技術論文入選第58屆DAC

文章出處:【微信公眾號:天數智芯】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 參數
    +關注

    關注

    11

    文章

    1869

    瀏覽量

    33947
  • 自動化
    +關注

    關注

    31

    文章

    5933

    瀏覽量

    90259
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265393

原文標題:天數智芯技術論文入選第58屆DAC

文章出處:【微信號:IluvatarCoreX,微信公眾號:天數智芯】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Magna AI加入NVIDIA Inception計劃,推動生產級人工智能規模化發展

    智能交付的頂尖人工智能機構行列。 Magna AI的加入,體現了其與NVIDIA人工智能平臺之間高度契合的技術協同關系。這一合作基于Magna A
    的頭像 發表于 01-12 15:46 ?172次閱讀

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設的產品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI
    發表于 12-19 13:44

    瑞薩電子RZ/V系列微處理器助力邊緣AI開發

    邊緣AI越來越多地應用于諸如工業攝像頭和公共設施攝像頭等嵌入式設備中,并要求嵌入式產品小型化且具有低功耗。瑞薩電子RZ/V系列微處理器(MPU)內置AI加速
    的頭像 發表于 09-23 10:31 ?890次閱讀
    瑞薩電子RZ/V系列微<b class='flag-5'>處理器</b>助力邊緣<b class='flag-5'>AI</b>開發

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    nRF52805),只占用幾千字節的非易失性存儲(NVM)。這使得以前被認為不可能的應用也能增加 ML 功能。例如,您現在可以在廣泛的傳感網絡的每個節點上進行人工智能處理,而在這
    發表于 08-31 20:54

    AI 芯片浪潮下,職場晉升新契機?

    方向,就明確涵蓋了人工智能芯片的研發、部署與優化技術崗位 。如果你從事 GPU 相關研發工作,在申報職稱時,就需著重突出在圖形處理加速、大規模并行計算等方面的成果,因為 GPU 的高并行結構及強大浮點
    發表于 08-19 08:58

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態體系帶到使用者身邊 ,讓我們在技術學習和使用上不再受制于人。 三、多模態實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感等多種類AI模塊,涵蓋人工智能
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態體系帶到使用者身邊 ,讓我們在技術學習和使用上不再受制于人。 三、多模態實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感等多種類AI模塊,涵蓋人工智能
    發表于 08-07 14:23

    關于人工智能處理器的11個誤解

    本文轉自:TechSugar編譯自ElectronicDesign人工智能浪潮已然席卷全球,將人工智能加速處理器整合到各類應用中也變得愈發普遍。然而,圍繞它們是什么、如何運作、能如
    的頭像 發表于 08-07 13:21 ?1071次閱讀
    關于<b class='flag-5'>人工智能</b><b class='flag-5'>處理器</b>的11個誤解

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能
    發表于 07-14 11:23

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為
    的頭像 發表于 07-09 15:59 ?1584次閱讀

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經網絡處理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    發表于 04-23 10:55

    光子 AI 處理器的核心原理及突破性進展

    電子發燒友網(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執行信息處理人工智能AI)計算的新型硬件設備,正逐漸嶄露頭角。與傳統基
    的頭像 發表于 04-19 00:40 ?4167次閱讀

    支持實時物體識別的視覺人工智能處理器RZ/V2MA數據手冊

    DRP-AI 采用了一種由動態可重構處理器(DRP)和 AI-MAC組成的人工智能加速,該加速
    的頭像 發表于 03-18 18:12 ?920次閱讀
    支持實時物體識別的視覺<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2MA數據手冊

    用于實時人類和物體識別的視覺-AI ASSP人工智能處理器RZ/V2M數據手冊

    配置了DRP和AI-MAC的人工智能硬件IP DRP-AI將高速人工智能推理和低功耗結合起來,實現了1TOPS/W級別的功率性能。此外,圖像
    的頭像 發表于 03-14 17:41 ?938次閱讀
    用于實時人類和物體識別的視覺-<b class='flag-5'>AI</b> ASSP<b class='flag-5'>人工智能</b>微<b class='flag-5'>處理器</b>RZ/V2M數據手冊

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數據手冊

    和特征提取,與ARM?Cortex?A9 CPU緊密結合,用于人工智能推理。 *附件:基于嵌入式人工智能的高速圖像處理的微處理器RZA2M數據手冊.pdf 特性 中央
    的頭像 發表于 03-11 15:54 ?1022次閱讀
    基于嵌入式<b class='flag-5'>人工智能</b>的高速圖像<b class='flag-5'>處理</b>的微<b class='flag-5'>處理器</b>RZ/A2M數據手冊