国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

性能突破 | SpacemiT-X60 在 LLVM 編譯器上實現 16% 顯著提升

進迭時空 ? 2025-11-21 18:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2025年10月,在北美RISC-V峰會上,Igalia編譯器工程師Mikhail發表專題演講《Unlocking 15% More Performance: A Case Study in LLVM Optimization for RISC-V》。演講基于在進迭時空 SpacemiT-X60 RISC-V 處理器上開展的十個月優化實踐,系統闡述如何通過上游 LLVM 的多項改進,顯著提升 RISC-V 處理器性能,并在 SPEC CPU 2017 基準測試中實現最高達 16% 的性能提升。

本次優化的重點涵蓋三大方面:

為 SpacemiT-X60 引入定制調度模型

增強向量化在跨函數調用場景下的分析能力

支持過程間寄存器分配(IPRA)以優化寄存器使用

SPEC 測試

SPEC CPU 2017 是業界公認的 CPU 性能評估標準,通過運行一系列計算密集型任務(如代碼編譯、科學計算、AI 推理等),全面測量處理器的整數與浮點運算性能。其測試結果能夠客觀反映 CPU 在實際應用中的執行效率,是衡量服務器、工作站及高端 PC 處理器性能的關鍵基準。

調度模型:性能提升的關鍵


調度模型的引入是本次性能提升的關鍵。SpacemiT-X60作為一款按序雙發射CPU核心,其執行效率高度依賴于編譯器生成的指令序列能否充分適配硬件特性。以LOAD指令為例,在等待數據就緒的周期內,通過智能調度插入其他可執行指令,可有效避免流水線空等——這正如點外賣后,在送達前處理其他事務,而非一味守在門口。


通過引入針對 X60 的調度模型,多個 SPEC 2017 子項目均實現性能提升,其中最高達 16.8%,整體性能平均提升 4.75%。由于該調度優化作用于指令序列層面,不依賴特定程序邏輯,因此大多數軟件均可受益于該項改進。


6767517e-c6c1-11f0-8ce9-92fbcf53809c.png


目前,LLVM 中的 RISC-V 后端尚缺乏一個默認的調度模型。此次為 SpacemiT-X60 開發的模型,有望成為LLVM RISC-V 目標默認的調度模型,為更多RISC-V場景提供優化支持。

突破難點:跨函數調用的向量化優化


SpacemiT-X60 支持 256 位寬的 RISC-V Vector (RVV) 1.0 擴展。在數據并行度高的任務中,正確使用向量指令可大幅提升程序性能,因此自動向量化始終是編譯器優化的重點之一。然而,自動向量化的關鍵難點在于代價評估:編譯器需準確判斷在何種場景下向量化能帶來性能提升,又在哪些情況下可能帶來性能回退。


Mikhail 在報告中重點分析了跨函數調用這一典型場景。最終落地的 SLP fix 方案取得了顯著優化效果,在測試中實現單個用例最高11.9%的性能提升,整體平均提升幅度也接近 1%。


67762582-c6c1-11f0-8ce9-92fbcf53809c.png


減少冗余:過程間寄存器分配(IPRA)


報告同時介紹了對過程間寄存器分配(IPRA,Inter-Procedural Register Allocation)的技術支持。在函數調用過程中,為確保程序正確執行,需對寄存器進行保存與恢復。傳統編譯方式下,由于編譯器無法預知被調用函數的具體寄存器使用情況,往往采取保守策略,對所有可能涉及的寄存器執行保存與恢復操作,造成不必要的性能開銷。


而 IPRA 技術通過過程間分析,使編譯器能夠精確掌握被調用函數的寄存器使用情況。當確認某些寄存器不會被破壞時,即可省略相應的保存與恢復指令,從而減少內存訪問、提升執行效率。目前IPRA還有bug尚在修復,暫未默認啟用,但在Spec上的測試已經顯示出0.5%的穩定性能提升,其優化效果已經得到驗證。


67834d16-c6c1-11f0-8ce9-92fbcf53809c.png


結語


從報告展示的最終數據來看,當前 GCC 與 LLVM 兩大開源編譯器在 RISC-V 平臺上的表現各有優勢,在不同測試項目中互有領先,這也表明未來仍有廣闊的協同優化空間。


678f5624-c6c1-11f0-8ce9-92fbcf53809c.png


6799fd86-c6c1-11f0-8ce9-92fbcf53809c.png


本次優化工作獲RISE(RISC-V Software Ecosystem)項目RP009課題支持。RISE是由Linux基金會托管的全球合作計劃,匯聚行業領導者共同推動RISC-V開源軟件發展。作為RISE成員,進迭時空榮幸見證 SpacemiT-X60被選用于 RISC-V 的編譯器性能優化研究并取得顯著成果,特此感謝 Mikhail 及所有開發者的貢獻。


截至目前,進迭時空 8 核 RISC-V AI CPU 芯片 K1 累計量產交付量突破 13 萬顆,已成為量產速度最快的 RISC-V 高算力芯片。同時,公司通過 Bianbu Cloud 等云服務方式,為開發者提供便捷、即時的 RISC-V 算力服務。我們堅信,隨著更多行業伙伴與開發者的加入,RISC-V 生態將加速邁向成熟。


附錄


1.RISC-V Summit 2025:

https://riscvsummit2025.sched.com/event/28OTp/unlocking-15-more-performance-a-case-study-in-llvm-optimization-for-risc-v-mikhail-r-gadelha-igalia

2.RISE RP009:

https://blogs.igalia.com/compilers/2025/05/05/boosting-risc-v-application-performance-an-8-month-llvm-journey/

3.RISE BLOG :

https://riseproject.dev/2025/05/08/project-rp009-llvm-spec-optimization/

4.Igalia BLOG :

https://blogs.igalia.com/compilers/2025/05/05/boosting-risc-v-application-performance-an-8-month-llvm-journey/

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編譯器
    +關注

    關注

    1

    文章

    1670

    瀏覽量

    51138
  • RISC-V處理器
    +關注

    關注

    0

    文章

    86

    瀏覽量

    10939
  • 進迭時空
    +關注

    關注

    0

    文章

    51

    瀏覽量

    308
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    邊緣設備AI部署:編譯器如何實現輕量化與高性能

    、ASIC等)上高效執行的機器代碼。AI編譯器AI模型的部署和優化中扮演著關鍵角色,能夠顯著提升模型的運行效率和性能。 ? AI
    的頭像 發表于 07-06 05:49 ?6182次閱讀

    RISC-V架構下的編譯器自動向量化

    性能算力生態的建設,正投入編譯器自動向量化優化等多項關鍵技術,全面助力RISC-V的高性能發展。RISC-V向量設計SpacemiT現代
    的頭像 發表于 06-06 16:59 ?989次閱讀
    RISC-V架構下的<b class='flag-5'>編譯器</b>自動向量化

    請問基于GCC編譯器的initcallSTM32如何實現

    請問各位基于GCC編譯器的initcallSTM32如何實現?有哪位實現了嗎?
    發表于 03-13 06:24

    什么樣的代碼會被編譯器優化

    現在的編譯器有多智能,可能你辛辛苦苦寫的代碼,在編譯器看來就是幾句廢話,直接被刪除掉。
    的頭像 發表于 01-16 16:38 ?949次閱讀

    Triton編譯器與GPU編程的結合應用

    Triton編譯器簡介 Triton編譯器是一種針對并行計算優化的編譯器,它能夠自動將高級語言代碼轉換為針對特定硬件優化的低級代碼。Triton編譯器的核心優勢在于其能夠識別并行模式,
    的頭像 發表于 12-25 09:13 ?1354次閱讀

    Triton編譯器如何提升編程效率

    現代軟件開發中,編譯器扮演著至關重要的角色。它們不僅將高級語言代碼轉換為機器可執行的代碼,還通過各種優化技術提升程序的性能。Triton 編譯器
    的頭像 發表于 12-25 09:12 ?1246次閱讀

    Triton編譯器性能計算中的應用

    先進的編譯技術,為高性能計算提供了強大的支持。 Triton編譯器簡介 Triton編譯器是一種開源的編譯器框架,旨在為異構計算環境提供高效
    的頭像 發表于 12-25 09:11 ?1623次閱讀

    Triton編譯器的優化技巧

    現代計算環境中,編譯器性能對于軟件的運行效率至關重要。Triton 編譯器作為一個先進的編譯器框架,提供了一系列的優化技術,以確保生成的
    的頭像 發表于 12-25 09:09 ?1932次閱讀

    Triton編譯器的優勢與劣勢分析

    Triton編譯器作為一種新興的深度學習編譯器,具有一系列顯著的優勢,同時也存在一些潛在的劣勢。以下是對Triton編譯器優勢與劣勢的分析: 優勢 高效
    的頭像 發表于 12-25 09:07 ?1922次閱讀

    Triton編譯器機器學習中的應用

    多種深度學習框架,如TensorFlow、PyTorch、ONNX等,使得開發者能夠輕松地將不同框架下訓練的模型部署到GPU。 2. Triton編譯器的工作原理 Triton編譯器通過以下幾個步驟
    的頭像 發表于 12-24 18:13 ?1696次閱讀

    Triton編譯器的常見問題解決方案

    Triton編譯器作為一款專注于深度學習的高性能GPU編程工具,使用過程中可能會遇到一些常見問題。以下是一些常見問題的解決方案: 一、安裝與依賴問題 檢查Python版本 Triton編譯器
    的頭像 發表于 12-24 18:04 ?6532次閱讀

    Triton編譯器支持的編程語言

    Triton編譯器支持的編程語言主要包括以下幾種: 一、主要編程語言 Python :Triton編譯器通過Python接口提供了對Triton語言和編譯器的訪問,使得用戶可以Pyt
    的頭像 發表于 12-24 17:33 ?1516次閱讀

    Triton編譯器與其他編譯器的比較

    的GPU編程框架,使開發者能夠編寫出接近手工優化的高性能GPU內核。 其他編譯器 (如GCC、Clang、MSVC等): 定位:通用編譯器,支持多種編程語言,廣泛應用于各種軟件開發場景。 目標:提供穩定、高效的
    的頭像 發表于 12-24 17:25 ?1647次閱讀

    Triton編譯器功能介紹 Triton編譯器使用教程

    。以下是 Triton 編譯器的一些功能介紹和使用教程。 Triton 編譯器功能介紹 多語言支持 :Triton 支持多種編程語言,使得開發者可以同一個編譯器框架下處理不同的語言。
    的頭像 發表于 12-24 17:23 ?2795次閱讀

    HighTec C/C++編譯器套件全面支持芯來RISC-V IP

    是基于LLVM開源汽車級C/C++編譯器工具,已通過ISO 26262 ASIL D的安全認證。從事RISC-V架構開發的汽車軟件開發者受益于這些工具來無縫支持芯來經過功能安全認證的RISC-V內核,進而
    的頭像 發表于 12-23 09:04 ?2041次閱讀
    HighTec C/C++<b class='flag-5'>編譯器</b>套件全面支持芯來RISC-V IP