国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

傳統用于數字設計的CPU是否已經達到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自Synopsys的官方文章:

在數字設計的Implementation過程中,從RTL到GDSII的每一步都是高度計算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評估數百個partition的各種布局方案。一旦確定了布局方案,接下來就是進行每個partition內的其余步驟,以實現全芯片的implementation和signoff。由于每一步的計算需求已經很高,并且還要乘以partition的數量,這就引發了一個問題:傳統用于數字設計的CPU是否已經達到了容量極限?GPU是否能夠滿足計算需求?

如今,GPU以其處理人工智能機器學習、游戲和高性能計算等要求最為苛刻的工作負載而聞名。隨著芯片越來越大、越來越復雜,也許也是時候考慮用GPU來完成數字芯片設計的Implementation了。

CPU在EDA工作負載中的容量挑戰

CPU長期以來被認為是計算機的“大腦”。擁有數十億個晶體管和多個處理核心,如今的CPU非常適合完成廣泛的任務,并且能夠快速完成。另一方面,GPU最初是為特定目的設計的,但隨著時間的推移,它們也轉變為通用的并行處理器

一般來講,EDA工具都是在基于x86處理器的CPU上運行的。然而,隨著多芯片設計等復雜架構變得越來越普遍,我們正在接近CPU計算容量的限制。考慮到芯片設計團隊始終面臨的上市時間壓力,利用額外的工具和技術來加速芯片設計過程的任何方面都是有意義的。在驗證和分析方面,新思科技的PrimeSim和VCS仿真流程已經從GPU加速中受益。雖然數字設計流程中的每個任務并不是都非常適合GPU,但有些任務確實可以加速。

最先進的高性能數據中心x86 CPU核心平均有64到128個核心,每個box最多約有200個核心。需要更多核心的任務需要分布在許多box上;如果網絡不夠快,這會產生一些開銷。RTL到GDSII流程和優化技術包含許多相互依賴性。為了使流程中的每個任務能夠成功并行執行,作業分布在CPU box之間的數據共享必須非常快速,延遲要小。然而,實際上,網絡延遲會妨礙周轉時間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴展。每個核心執行的操作更少,而且非常微小,以至于你可以在一個插座中擁有數萬個核心,以提供巨大的處理能力,同時保持可管理的占用空間。能夠從大規模并行性中受益的任務非常適合GPU。然而,這樣的任務也必須是主要單向的,因為任何決策和迭代都會減慢進程和/或需要回到CPU進行“如果那么”決策。這排除了許多RTL到GDSII數字implementation流程中的任務,盡管并非所有任務都不適合。

使用GPU加速加快布局過程

在數字設計流程中,自動布局是已經展示出在GPU上運行前景的一項任務。在商業環境中運行的原型中,新思科技的Fusion Compiler GPU加速布局技術相比CPU,已經展示出顯著的周轉時間優勢:

使用GPU放置一個3nm GPU流處理器設計,包含1.4M個可放置的標準單元和20個可放置的硬宏,僅需38秒,相比之下,CPU驅動的布局需要13分鐘

使用GPU放置一個12nm汽車CPU設計,包含2.9M個可放置的標準單元和200個可放置的硬宏,僅需82秒,相比之下,CPU驅動的布局需要19分鐘

結合新思科技DSO.ai的AI驅動自動設計空間優化,我們預計將在相同的完成時間線上將AI驅動的搜索空間擴大15倍到20倍。這樣做可以使設計團隊實現更好的功耗、性能和面積(PPA)結果。

在許多方面,由于對最終設計PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計算資源通常與強大的CPU計算集群分開,單個designer使用基于GPU的布局技術也能具有很高的生產力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動設計數據引入的延遲可能會限制吞吐量優勢。

新的數據中心SoC正在設計中,CPU和GPU資源之間具有統一內存,用于TB級工作負載。這些新興架構消除了利用GPU加速所需的設計數據移動,并將允許我們考慮在數字設計流程中應用GPU加速的其他位置,特別是當設計師可以將GPU與AI驅動的implementation工具配對時,可以進行更快、更廣泛的探索和更好的結果。隨著像新思科技.ai這樣的AI驅動的全棧EDA流程解決方案產生更好的PPA結果、更快的達到目標時間和更高的工程生產力,人們只能想象GPU加速的加入將如何進一步改變芯片設計。

總結

雖然芯片設計過程中的仿真部分對于在GPU上運行并不陌生,但很快數字設計流程的各個方面也將有機會利用GPU加速。對于大型芯片或復雜架構(如多芯片設計),CPU在運行RTL到GDSII流程時所需的計算容量正在耗盡,無法達到期望的速度。憑借其可擴展性和處理能力,GPU有可能提供更快的周轉時間和更好的芯片結果。使用GPU驅動的放置器進行的原型實驗已經將布局速度提高了多達20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個強大的組合,以提高PPA(功耗、性能和面積)和上市時間。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片設計
    +關注

    關注

    15

    文章

    1155

    瀏覽量

    56676
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265291
  • RTL
    RTL
    +關注

    關注

    1

    文章

    394

    瀏覽量

    62647
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136929
  • GPU芯片
    +關注

    關注

    1

    文章

    307

    瀏覽量

    6516

原文標題:GPU可以加速芯片設計的Implementaion嗎?

文章出處:【微信號:傅里葉的貓,微信公眾號:傅里葉的貓】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    吉時利數字源表2602B在電池容量測試中的應用解析

    鋰離子電池作為現代電子設備核心動力源,其容量衰減直接影響設備續航能力。吉時利數字源表2602B憑借其高精度測量與多通道并行測試能力,為電池性能評估提供了全新技術路徑。本文從測試原理、操作步驟及數據分析維度,系統闡述2602B在電池容量
    的頭像 發表于 01-08 17:47 ?1091次閱讀
    吉時利<b class='flag-5'>數字</b>源表2602B在電池<b class='flag-5'>容量</b>測試中的應用解析

    華為數字能源圓滿完成智能組串式構網型儲能極限耐火試驗

    華為數字能源在國際權威的獨立保障和風險管理機構DNV和第三方認證機構TüV南德的全程見證下,圓滿完成基于最新版UL9540A的華為智能組串式構網型儲能大規模極限耐火試驗。
    的頭像 發表于 01-07 09:49 ?291次閱讀

    備用電池的容量和環境兼容性對電能質量在線監測裝置的精度有何影響?

    備用電池的 容量 和 環境兼容性 均通過 影響供電穩定性 間接作用于電能質量在線監測裝置的精度 —— 容量決定供電 “持續穩定性”,環境兼容性決定供電 “動態穩定性”,兩者共同保障裝置核心元件
    的頭像 發表于 11-27 18:00 ?1342次閱讀
    備用電池的<b class='flag-5'>容量</b>和環境兼容性對電能質量在線監測裝置的精度有何影響?

    【「高速數字設計(基礎篇)」閱讀體驗】第六章 去耦電容的容量需求分析

    去耦電容容量別瞎猜!《高速數字設計》第6章教你量化計算,精準選型 在高速數字電路設計中,去耦電容選多大容量是個難點。《高速數字設計》第6章“
    發表于 11-19 20:48

    串聯諧振試驗裝置的核心工作邏輯是什么?和傳統耐壓設備比優勢在哪?

    ,通常 50-100 倍)。? 對比傳統工頻耐壓設備,優勢堪稱 “降維打擊”:傳統設備需大電源容量(如測 3km 10kV 電纜需 500kVA 以上),體積堪比冰箱且重量超 200kg;而武漢特高壓串聯
    發表于 10-11 15:40

    如何判斷電能質量在線監測裝置的測量精度是否達到標準?

    判斷電能質量在線監測裝置的測量精度是否達到標準,需圍繞 “ 標準限值明確→實驗室精準校準→現場工況驗證→數據溯源閉環 ” 的邏輯,結合國家 / 國際標準(如 GB/T 19862-2016、IEC
    的頭像 發表于 09-26 14:11 ?737次閱讀

    高壓二極管應用中,是否有足夠銅箔/散熱片,結溫是否接近極限

    MDD辰達半導體FAE,我們往往會追溯到一個核心問題——是否有足夠銅箔/散熱片支撐散熱,器件結溫是否已經接近極限。一、結溫與器件可靠性的關系結溫(Tj)是指二極管P
    的頭像 發表于 09-17 11:42 ?839次閱讀
    高壓二極管應用中,<b class='flag-5'>是否</b>有足夠銅箔/散熱片,結溫<b class='flag-5'>是否</b>接近<b class='flag-5'>極限</b>?

    github 上的 nano版本已經更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會方便很多
    發表于 09-17 06:36

    CCG3PA是否支持發起BIST 共享容量消息?

    我正在使用CCG3PA ,我想發起BIST 共享容量消息。我檢查了 CCG3PA 的 API 文檔和 PD 堆棧,但找不到任何與啟動BIST 共享容量模式相關的枚舉或 API。 CCG3PA是否支持發起BIST 共享
    發表于 07-23 07:07

    極限電流與氧分壓傳感器區別解析

    極限電流型氧傳感器與氧分壓型氧傳感器在原理、結構及應用上存在顯著差異,具體區別如下:工作原理01極限電流型氧傳感器:基于電化學泵原理,施加外部電壓使氧氣在電極間遷移,當電壓足夠高時,電流達到
    的頭像 發表于 05-19 13:26 ?758次閱讀
    <b class='flag-5'>極限</b>電流與氧分壓傳感器區別解析

    SMA 連接器功率容量的演進:從傳統設計到新型材料的突破

    SMA連接器功率容量傳統設計的艱難摸索到新型材料驅動下的突破發展,是一部不斷創新、持續進取的科技進步史。伴隨材料科學與制造技術的持續革新,德索的SMA連接器功率容量也將不斷躍上新臺階,為微波、射頻等前沿領域注入源源不斷的發展動
    的頭像 發表于 05-14 09:10 ?611次閱讀
    SMA 連接器功率<b class='flag-5'>容量</b>的演進:從<b class='flag-5'>傳統</b>設計到新型材料的突破

    自動駕駛安全程度達到99%是否就足夠了?

    [首發于智駕最前沿微信公眾號]五一假期,閑來無事,想到一個問題,現在監管部門對于自動駕駛的要求已經非常嚴苛,那自動駕駛要達到什么程度才算足夠安全?如果達到99%,是否就可以商用了?抑或
    的頭像 發表于 05-03 08:42 ?712次閱讀

    從RF到HDMI:傳統接口的現代優化

    射頻(RF)、復合視頻(RCA)、S-Video和視頻色差是幾種傳統的視頻接口。盡管這些接口在一些舊設備或特定應用場景中仍然被使用,但隨著數字技術的發展,它們的使用頻率已經顯著下降。現代顯示設備
    的頭像 發表于 04-15 11:50 ?1596次閱讀
    從RF到HDMI:<b class='flag-5'>傳統</b>接口的現代優化

    多芯光纖MCF(Multicore Fiber)互聯

    隨著人工智能AI技術的迅猛發展,數據處理需求和通信容量的增長達到了前所未有的規模。特別是在大數據分析、深度學習和云計算等領域,通信系統對高速、高帶寬的要求越來越高。傳統單模光纖
    發表于 04-01 11:33

    多芯光纖MCF(Multicore Fiber)互聯

    隨著人工智能AI技術的迅猛發展,數據處理需求和通信容量的增長達到了前所未有的規模。特別是在大數據分析、深度學習和云計算等領域,通信系統對高速、高帶寬的要求越來越高。傳統單模光纖
    的頭像 發表于 04-01 11:14 ?1266次閱讀
    多芯光纖MCF(Multicore Fiber)互聯