国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

優化的關鍵,RISC-V中的性能監控

E4Life ? 來源:電子發燒友原創 ? 作者:Leland ? 2021-12-16 09:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RISC-V在云端、數據中心、汽車與網絡技術中的頻繁創新和亮相,已經讓這一成長中的ISA一只腳邁入了高性能計算場景。然而缺少強大的性能監測工具讓RISC-V的應用優化成了問題,尤其是在RISC-V如今不少軟件源于從非原生移植的情況下,運算性能不能發揮出百分百的實力成了令人頭疼的問題。

與此同時,英特爾ARM都擁有自己專用的性能監控方案,讓開發者可以發揮出其硬件的全部效力,但RISC-V仍然依靠定制或廠商特定的方案,而缺少通用性能監控軟件工具的完整支持。

Perf對RISC-V的支持

系統級的性能優化往往是靠性能剖析和代碼優化來實現的,前者是為了尋找性能瓶頸,后者則是為了改善軟件性能,因此這類性能分析/監控工具成了處理器開發時必不可少的軟件。盡管RISC-V的ISA規范已經定義了硬件性能監控(HPM),但總體支持程度上仍未完善。

就以Linux上的性能分析工具Perf為例,該工具可以借助PMU(性能監控單元)、tracepoint和內核計數器來分析程序中的硬件事件,比如處理器時鐘周期、指令計數器等,也可以分析一些軟件事件,比如Page Fault等。

Perf分為兩種模式,一種是perf stat,一種是perf record。如今上游Linux的perf雖然已經對RISC-V有了支持,但僅對perf stat有一些基本的支持。比如mcycle這一CSR用于處理器運行的時鐘周期計數,而minstret這一CSR則用于退休指令計數。

目前RISC-V特權規范中的支持 / 西部數據

RISC-V privileged規范中,RISC-V定義了幾種特權模式,分別是U-mode(用戶模式)、S-mode(管理員模式)和M-mode(機器模式)。但目前只有在機器模式下才能對這些寄存器進行讀寫,管理員模式下缺乏可寫入的寄存器。

計數器卻又是每時每刻運行中的,所以現在可以做到周期和指令計數,卻無法啟用、禁用和暫停計數器,無法使用任何可編程計數器和事件采樣。不僅如此,RISC-V的perf不僅無法處理計數器溢出,也不支持溢出中斷。雖然市面上很多RISC-V處理器已經考慮到了這一點,采用定制的形式來完成部分任務,比如Esperanto就為自己的ET-SoC-1千核RISC-V處理器加入了商業級的芯片除錯與性能監控能力,但RISC-V規范本身缺少這些支持,這也就不利于當下RISC-V的開源生態。

完整的Perf支持缺少了什么?

于是我們現在發現管理員模式下無法寫入計數器,也無法改變mcountinhibit來直接開啟或停止計數器,也無法改變mhpmcountern來開啟或禁用直接讀取。接著就是沒有中斷指示器,我們不知道哪一個計數器出現了數值溢出,也沒有事件篩選功能。那么針對這些問題的解決方案是什么,哪些措施才能實現完整的Perf支持呢?來自西部數據的Atish Patra在近期的RISC-V峰會上提出了他以及開發社區所青睞的答案——SBI PMU擴展和sscofpmf ISA擴展。

SBI PMU擴展將作為一個接口,讓管理員模式下的軟件發現硬件計數器的細節,針對特定的perf事件來配置硬件計數器,在請求下開始或停止計數器。除此之外,SBI PMU擴展還引入了固件性能計數器來監控固件事件,比如未對齊的存取指令數、RFENCE和IPI數等等。如今在RISC-V的SBI 1.0版本中我們也可以看到,PMU擴展已經成了該規范的一部分。

接著是sscofpmf擴展,ss代表的是特權架構和管理員級的擴展,cofpmf代表的是溢出計數和特權模式篩選。該擴展新增了一個32位的scountovf只讀寄存器,該寄存器存儲的是29個mhpmcounter的第63位(OF),如此一來就能準確快速地判斷究竟是哪個事件的計數器溢出了。這一擴展已經凍結,目前處于審查狀態,預計不久的將來就會批準,來自Linux內核的支持工作也在推進中。

小結

RISC-V作為一個尚處于發展初期的架構,在某些方面確實還有不及其前輩x86和ARM的地方,我們這次從性能監控上就能看出一些端倪,但RISC-V自身的特性也為它帶來了不小的優勢。

首先,RISC-V是站在巨人的肩膀上發展的,它可以有效地規避以上那些架構走錯的老路。其次,開源開放讓RISC-V有了龐大的社區支持,像以上這些解決方案,其實已經被多次提及,來自社區的力量勢必可以讓RISC-V走得更遠。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20255

    瀏覽量

    252344
  • Linux
    +關注

    關注

    88

    文章

    11760

    瀏覽量

    219047
  • RISC-V
    +關注

    關注

    48

    文章

    2886

    瀏覽量

    53034
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    重磅合作!Quintauris 聯手 SiFive,加速 RISC-V 在嵌入式與 AI 領域落地

    多個關鍵領域的落地采用,這波操作真的太讓人期待了~ 這次合作可不是簡單聯手,核心是優勢互補:Quintauris 擅長硬件與軟件 IP,SiFive 則有高性能RISC-V 內核和成熟平臺,兩者結合
    發表于 12-18 12:01

    新思科技全棧工具鏈助力RISC-V設計高效進階

    RISC-V 架構席卷全球的當下,新思科技(Synopsys)通過在整個硅生命周期開發工具、驗證平臺與定制 IP 方面的深厚積累,成為 RISC-V 生態中最為關鍵的“隱形推手”,在整個 R
    的頭像 發表于 12-17 10:29 ?743次閱讀
    新思科技全棧工具鏈助力<b class='flag-5'>RISC-V</b>設計高效進階

    探索RISC-V在機器人領域的潛力

    探索RISC-V在機器人領域的潛力 測評人:洄溯 測評時間: 2025年11月 測評對象: MUSE Pi Pro開發板(基于進迭時空K1系列高性能RISC-V CPU) 一、 開篇引言
    發表于 12-03 14:40

    為什么RISC-V是嵌入式應用的最佳選擇

    最近RISC-V基金會在社交媒體上發文,文章說物聯網和嵌入式系統正在迅速發展,需要更高的計算性能、更低的功耗和人工智能。RISC-V是為未來而建的,包括超高效的MCU到高性能應用處理器
    的頭像 發表于 11-07 10:09 ?1609次閱讀

    risc-v浮點運算單元的使用及其設計考慮

    的應用。 在RISC-V,浮點運算單元分為單精度浮點數(32位)和雙精度浮點數(64位),通常包括以下幾種基本功能: 加法器/減法器:用于執行浮點數的加減運算。 乘法器:用于執行浮點數的乘法運算。 除法
    發表于 10-21 14:46

    提高RISC-V在Drystone測試得分的方法

    :編譯器如何優化生成的機器代碼也會影響Drystone的得分。優化的編譯器能夠生成更高效的機器代碼,從而提高性能。 提高 RISC-V 在 Drystone 測試
    發表于 10-21 13:58

    RISC-V B擴展介紹及實現

    某個方向移位并將結果存儲在目標寄存器;后者則用于為一個值生成一個位掩碼。 此外,B擴展還增加了一組壓縮指令,可以使指令占用更少的內存空間,從而提高系統性能。這些壓縮指令兼容于RISC-V ISR
    發表于 10-21 13:01

    時擎科技亮相2025 RISC-V中國峰會,深度解析高性能RISC-V SoC技術挑戰與創新

    2025年7月16-18日,第五屆RISC-V中國峰會在上海張江科學會堂成功舉辦,作為全球RISC-V領域頂級盛會之一,本屆峰會匯聚了數百家企業、研究機構及開源社區,共同探討RISC-V生態
    的頭像 發表于 07-21 17:37 ?1658次閱讀
    時擎科技亮相2025 <b class='flag-5'>RISC-V</b>中國峰會,深度解析高<b class='flag-5'>性能</b><b class='flag-5'>RISC-V</b> SoC技術挑戰與創新

    知合計算:RISC-V架構創新,阿基米德系列劍指高性能計算

    在于更高的能效性能。這主要取決于單位性能的提升,以及先進工藝帶來的PPA優化。只有出現標桿性的產品才能真正引領整個RISC-V性能計算軟硬
    的頭像 發表于 07-18 14:17 ?2746次閱讀
    知合計算:<b class='flag-5'>RISC-V</b>架構創新,阿基米德系列劍指高<b class='flag-5'>性能</b>計算

    x264 的 RISC-V 生態構建與優化探索

    性能優化水平的重要標桿。 ? 2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態系統分論壇上,字節跳動軟件工程師錢佳炎分享了關于 x264 在 RISC-V
    發表于 07-18 11:42 ?4952次閱讀

    孟建熠:攀登 RISC-V性能高峰,打造標桿產品

    RISC-V 在高性能計算領域的崛起,是近年來全球芯片架構競爭的重要趨勢之一。其開源、靈活、可擴展的特性,使其在高性能處理器設計、人工智能算力優化、服務器芯片等領域展現出強勁的發展勢頭
    發表于 07-17 15:56 ?4947次閱讀

    兆松科技發布高性能RISC-V編譯器ZCC 4.0.0版本

    近日,兆松科技(武漢)有限公司(以下簡稱“兆松科技”)宣布正式發布高性能 RISC-V 編譯器 ZCC 4.0.0 版本。新版本在性能優化、廠商自定義指令支持和軟件庫等方面實現全面升級
    的頭像 發表于 06-27 14:48 ?3058次閱讀
    兆松科技發布高<b class='flag-5'>性能</b><b class='flag-5'>RISC-V</b>編譯器ZCC 4.0.0版本

    智芯公司RISC-V性能CPU芯片獲得權威認可

    近日,智芯公司自主研發的RISC-V性能CPU芯片通過工信部直屬中國電子技術標準化研究院賽西實驗室檢測,標志著智芯公司在RISC-V性能CPU芯片領域取得
    的頭像 發表于 06-16 17:32 ?1587次閱讀

    RISC-V架構下的編譯器自動向量化

    性能算力生態的建設,正投入編譯器自動向量化優化等多項關鍵技術,全面助力RISC-V的高性能發展。RIS
    的頭像 發表于 06-06 16:59 ?1236次閱讀
    <b class='flag-5'>RISC-V</b>架構下的編譯器自動向量化

    FPGA與RISC-V淺談

    。 Semico Research預測2025年 RISC-V 芯片市場規模將突破 450 億美元,年復合增長率達 58%,國家戰略采購占比超 35%。RISC-V International在報告預測,搭載
    發表于 04-11 13:53 ?677次閱讀
    FPGA與<b class='flag-5'>RISC-V</b>淺談