国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Nature:人工智能芯片!

旺材芯片 ? 來源:納米人 ? 2023-09-05 16:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

具有數十億參數的人工智能AI)模型可以在一系列任務中實現高精度,但它們加劇了傳統通用處理器(例如圖形處理單元或中央處理單元)的低能效。模擬內存計算(模擬 AI)可以通過在“內存塊”上并行執行矩陣向量乘法來提供更好的能源效率。然而,模擬人工智能尚未在需要許多此類圖塊以及圖塊之間神經網絡激活的有效通信的模型上證明軟件等效(SWeq)準確性。

有鑒于此,美國IBM 研究中心S. Ambrogio(一作兼通訊)等人展示了一款14 nm的模擬 AI 芯片,該芯片結合了跨 34 個區塊的 3500 萬個相變存儲器件、大規模并行區塊間通信和模擬低功耗外圍電路,可實現12.4 萬億次 / 秒 / 瓦運算性能,能效是傳統數字計算機芯片的14倍。作者展示了小型關鍵字識別網絡的完全端到端 SWeq 精度,以及更大的 MLPerf 循環神經網絡傳感器 (RNNT) 上接近 SWeq 的精度,其中超過4500萬個權重映射到跨越5個芯片的1.4億個相變存儲器件上。

芯片架構

作者展示了芯片的顯微照片,突出顯示了34個模擬塊的 2D 網格,每個塊都有512×2048PCM 交叉陣列。當持續時間向量從模擬快發送到OLP時,芯片有效地實現了基于斜坡的模數轉換器ADC)。所有權重配置、MAC操作和路由方案均由每個圖塊上可用的用戶可配置本地控制器(LC) 定義。本地SRAM存儲定義數百個控制信號的時間序列的所有指令,從而實現高度靈活的測試并簡化設計驗證,與預定義狀態機相比,面積損失較小。作者驗證了持續時間可以在整個芯片上可靠地傳輸,最大誤差等于5ns(較短持續時間為 3ns)。

d0bbf1c2-4bba-11ee-a25d-92fbcf53809c.png

圖 芯片架構

d10ba60e-4bba-11ee-a25d-92fbcf53809c.png

圖 可重構架構和路由

KWS任務

為了演示芯片在端到端網絡中的性能,實現了多類KWS任務。作者采用了 FC網絡,實現了 86.75% 的分類準確度。為了在芯片上實現完全端到端的傳輸,作者進行了一系列修改,最終端到端實現總共使用四個圖塊。為了提高MAC精度并補償外圍電路的不對稱性,引入了MAC不對稱平衡(AB)方法,測得的KWS精度為86.14%,完全在 MLPerf SWeq“等精度”極限 85.88%之內。

d15d399c-4bba-11ee-a25d-92fbcf53809c.png

圖 端到端 KWS 任務

芯片上的 RNNT 映射

作者實施了MLPerf數據中心網絡RNNT作為行業相關的工作負載演示。當 RNNT等大型DNN以降低的數字精度實現時,整個網絡的最佳精度選擇可能會有所不同。研究表明即使使用激進的量化,不易受影響的層或整個網絡塊仍將提供較低的 WER,而高度敏感的塊即使對于少量的權重量化也將表現出較高的 WER。對每個單獨的層重復此過程以識別最敏感的層,接著將 MLPerf 權重映射到分布在5個芯片上的142個圖塊上。在總共 45,321,309 個網絡權重和偏差參數中,45,261,568 個被映射到模擬存儲器(權重的 99.9%)。

d1a90020-4bba-11ee-a25d-92fbcf53809c.png

圖 用于語音轉錄的 MLPerf RNNT 網絡

準確度結果

作者展示了2513個音頻查詢的完整 Librispeech 驗證數據集的權重映射和編程后的實驗WER。總WER為9.475%,與SW 基線相比總體下降了 2.02%。在本實驗中,通過芯片推斷完整的Librispeech驗證數據集并保存輸出結果。然后將這些輸入到芯片 2 中,依此類推,輸入到所有 5 個芯片中。即使在PCM漂移超過1周后重復進行,且沒有任何重新校準或重量重新編程,RNNT WER 也僅下降了 0.4%。

d1eebab6-4bba-11ee-a25d-92fbcf53809c.png

圖 在 MLPerf RNNT上使用Librispeech進行WER實驗

電源和系統性能

作者還測量了推理操作期間每個芯片的全部功耗。所有控制和通信電路均以 0.8V 驅動。芯片最佳功率性能 為12.40 TOPS/W。通過將積分時間減半,芯片的 TOPS/W 可以再提高 25%,但 WER 會額外降低1%。隨著重量的增加,使用本文報道的芯片的模擬人工智能系統可以在3.57W的功率下實現6.704TOPS/W,比MLPerf的最佳能效提高了14 倍,WER 為 9.258%。

d1f4fde0-4bba-11ee-a25d-92fbcf53809c.png

圖 MLPerf RNNT功率和系統性能

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54010

    瀏覽量

    466094
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265389
  • 存儲器件
    +關注

    關注

    1

    文章

    33

    瀏覽量

    10006

原文標題:Nature:人工智能芯片!

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領域
    的頭像 發表于 02-22 08:24 ?122次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    維信諾與清華北大合作成果亮相國際頂級期刊Nature

    1月28日,清華大學聯合北京大學與維信諾合作開發的世界首款柔性存算芯片——FLEXI,在國際頂級期刊《自然》(Nature)上發表。這標志著我國在柔性電子與邊緣人工智能硬件領域取得重要突破,填補了高性能柔性AI計算
    的頭像 發表于 02-11 14:31 ?474次閱讀

    開發智能體配置-內容合規

    智能體上架前,需完成“人工智能生成合成內容標識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內容合規】中填寫。 人工智能生成合成內容標識 “
    發表于 02-07 11:44

    自然智能與人工智能融合如何重塑芯片設計

    人類大腦是所有處理器中最復雜的,能夠構思出不可思議的創意,解決復雜、微妙的問題。相比之下,人工智能擅長快速分析海量數據并高效執行任務。當自然智能人工智能融合的結果,就是芯片設計領域正
    的頭像 發表于 01-15 13:58 ?511次閱讀

    人工智能+消費:技術賦能與芯片驅動未來

    電子發燒友網站提供《人工智能+消費:技術賦能與芯片驅動未來.pptx》資料免費下載
    發表于 11-26 14:50 ?34次下載

    墨芯人工智能亮相2025外灘大會

    9月10日至13日,墨芯人工智能在2025外灘大會盛大亮相,成為"數據與計算展區"備受矚目的焦點之一。作為深耕稀疏計算的AI芯片企業,墨芯在此次展會上全方位展示了其人工智能芯片、高性能
    的頭像 發表于 09-11 14:04 ?800次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹這對開發人員意味著什么,以及使用 Neuton 模型如何改進您的開發和終端
    發表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對“人工智能+”這個名稱定性吧?今年年初到現在,涌現出了一大批基于人工智能的創業者,這已經算是AI2.0時代的第三波創業潮了,第一波是基礎大模型,第二波
    的頭像 發表于 08-27 13:21 ?725次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發表于 08-07 14:23

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文中,我們將介紹
    發表于 07-31 11:38

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能

    迅為RK3588開發板Linux安卓麒麟瑞芯微國產工業AI人工智能
    發表于 07-14 11:23

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型正在工作生活
    發表于 07-04 11:10

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網,WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發表于 04-23 10:55

    AI人工智能隱私保護怎么樣

    在當今科技飛速發展的時代,AI人工智能已經深入到我們生活的方方面面,從醫療診斷到交通調度,從教育輔助到娛樂互動,其影響力無處不在。然而,隨著AI人工智能的廣泛應用,其安全性問題也備受關注。那么,AI
    的頭像 發表于 03-11 09:46 ?1203次閱讀
    AI<b class='flag-5'>人工智能</b>隱私保護怎么樣