国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

研究人員開發了一種新穎的機器學習管道

倩倩 ? 來源:量子認知 ? 2020-04-15 16:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,麻省理工學院的研究人員發明了一種機器學習工具,該工具可以預測計算機芯片執行來自各種應用程序的代碼的運行速度。

為了使代碼盡可能快地運行,開發人員和編譯器將編程語言轉換為機器可讀代碼的程序,通常使用通過模擬給定芯片體系結構運行代碼的性能模型。

編譯器使用該信息來自動優化代碼,而開發人員使用該信息來解決將運行該代碼的微處理器的性能瓶頸。但是,機器代碼的性能模型是由相對較少的專家小組手寫的,并且未經適當驗證。結果,模擬的性能測量通常會偏離實際結果。

研究人員開發了一種新穎的機器學習管道,該管道可自動執行此過程,從而使其變得更輕松、更快、更準確。這項研究成果在國際機器學習大會上發表。

研究人員通過一種特殊的神經網絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數據,以自動預測其持續時間使用給定的芯片執行以前看不見的基本塊。結果表明,這種神經網絡模型的性能要比傳統的手動調整模型精確得多。

這個基準測試套件涉及多個領域,包括機器學習、編譯器、密碼學和可用于驗證性能模型的圖形。研究人員將超過30萬已分析的塊合并到一個開源數據集中。在評估過程中,這種神經網絡模型預測了英特爾芯片運行代碼的速度要比英特爾自身構建的性能模型還要好。

最終,開發人員和編譯器可以使用該工具來生成代碼,這些代碼可以在越來越多的多樣化“黑匣子”芯片設計上更快、更高效地運行?,F代計算機處理器不透明,極其復雜且難以理解。編寫對這些處理器執行得盡可能快的計算機代碼也極具挑戰性,該工具是朝著對這些芯片的性能進行完全建模以提高效率的重要一步。

最近,該團隊又提出了一種自動生成編譯器優化的新技術。具體來說,它們會自動生成一種算法,該算法將某些代碼轉換為向量,可用于并行計算。 這種算法優于LLVM編譯器中使用的手工矢量化算法。

LLVM是業界常用的編譯器,一個自由軟件項目,它是一種編譯器基礎設施,以C++寫成,包含一系列模塊化的編譯器組件和工具鏈,用來開發編譯器前端和后端。它是為了任意一種編程語言而寫成的程序,利用虛擬技術創造出編譯時期、鏈接時期、運行時期以及“閑置時期”的最優化。它最早以C/C++為實現對象,而當前它已支持許多種程序語言。

研究人員說,手工設計性能模型可能是“一門妖術”。英特爾提供了超過3000頁的詳盡文檔,描述了其芯片的體系結構。但是目前只有一小部分專家將構建性能模型,以模擬這些架構上代碼的執行。

研究人員指出:“英特爾的文檔既沒有錯誤,也沒有完整,并且英特爾會省略某些事情,因為它是專有的?!?“但是,當使用數據時,不需要了解文檔。如果有隱藏的內容,可以直接從數據中學習?!?/p>

為此,研究人員記錄了給定微處理器用于計算基本塊指令的平均周期數,基本上是啟動,執行和關閉的順序,而無需人工干預。使過程自動化可以快速分析成千上萬個塊。

在培訓學習中,這種神經網絡模型分析了數百萬個自動剖析的基本塊,以準確了解不同的芯片體系結構將如何執行計算。重要的是,該模型將原始文本作為輸入,不需要手動向輸入數據添加功能。在測試中,可以將以前看不見的基本塊和給定的芯片提供給模型,模型將生成一個數字,指示芯片將以多快的速度執行該代碼。

研究人員發現,該模型的準確性降低了錯誤率,這意味著預測速度與實際速度之間的差異比傳統的手工模型降低了50%。此外,他們表明該模型的錯誤率為10%,而Intel性能預測模型在多個不同領域的各種基本塊上的錯誤率為20%。

該工具現在使人們可以更輕松地快速了解任何新芯片架構的性能速度。例如,特定領域的體系結構,例如Google專門用于神經網絡的新型Tensor處理單元,目前正在構建中,但并未得到廣泛理解。 如果要在某種新架構上訓練模型,只需從該架構收集更多數據,通過探查器運行它,使用該信息來訓練模型,從而就有了一個預測性能的模型。

接下來,研究人員將通過這樣的神經網絡模型研究使人工智能模型可解釋的方法。人工智能機器學習在很大程度上是一個黑匣子,因此尚不清楚為什么特定的模型會做出某種預測。這樣的模型指示一個處理器要執行一個基本塊需要10個周期,從而有可能設法找出其原因。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編程語言
    +關注

    關注

    10

    文章

    1964

    瀏覽量

    39558
  • 編譯器
    +關注

    關注

    1

    文章

    1672

    瀏覽量

    51591
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136928
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    高壓放大器在介電彈性體制成的軟機器研究中的應用

    進行兩棲運動、攀爬和負重爬行。開發了一種高性能的摩擦電仿生機器人系統,用于驅動和控制電響應軟體機器人。爬行機器人因其對不同環境的特殊適應性而
    的頭像 發表于 11-25 10:49 ?219次閱讀
    高壓放大器在介電彈性體制成的軟<b class='flag-5'>機器</b>人<b class='flag-5'>研究</b>中的應用

    研究人員復興針孔相機技術以推動下代紅外成像發展

    研究人員運用具有數百年歷史的針孔成像原理,開發一種無需透鏡的高性能中紅外成像系統。這種新型相機能夠在大范圍距離內和弱光條件下拍攝極其清晰的照片,使其在傳統相機難以應對的場景中發揮重要作用。
    的頭像 發表于 11-17 07:40 ?212次閱讀

    萬字長文AI智能體:17體架構詳細實現

    數據科學AI智能體領域發展迅猛,但許多資源仍然過于抽象和理論化。創建此項目的目的是為開發者、研究人員和AI愛好者提供條結構化、實用且深入的學習路徑,以掌握構建智能系統的藝術。
    的頭像 發表于 11-07 13:16 ?550次閱讀
    萬字長文AI智能體:17<b class='flag-5'>種</b>體架構詳細實現

    利用 Banana Pi BPI-CM5 Pro(ARMSoM CM5 SoM) 加速保護科學

    政府、大學和非政府組織的研究人員。通過使用開源計算硬件,實時聲學監測的構建成本可以低于使用專用微控制器的系統。 實施過程 為了展示開源硬件在生物聲學邊緣處理方面的優勢,我們需要個演示浮標。我們專注于開發
    發表于 10-27 09:18

    如何在NVIDIA Isaac Lab中使用Newton訓練四足機器

    物理在機器人仿真中發揮著至關重要的作用,它為機器人在真實環境中的行為及交互提供了精準的虛擬呈現基礎。借助仿真器,研究人員和工程師能夠以安全、高效且經濟的方式訓練、開發、測試和驗證
    的頭像 發表于 10-13 11:10 ?1974次閱讀
    如何在NVIDIA Isaac Lab中使用Newton訓練四足<b class='flag-5'>機器</b>人

    功率放大器賦能:基于正則模態展開的管道彎曲處導波散射研究

    的散射特性對于優化無損檢測技術和提高結構健康監測的準確性至關重要?;谡齽t模態展開(normalmodeexpansion)的方法是研究管道彎曲處導波散射的一種有效手段。該方法通過將導波在管道
    的頭像 發表于 08-28 11:29 ?502次閱讀
    功率放大器賦能:基于正則模態展開的<b class='flag-5'>管道</b>彎曲處導波散射<b class='flag-5'>研究</b>

    如何基于翼輝信息SylixOS開發ROS 2應用

    算法的站式解決方案,同時輔以功能強大的開發工具,助力工程師與研究人員高效完成項目開發。ROS 2 在實時性、安全性、靈活性和跨平臺支持等方面進行了顯著的改進,為現代
    的頭像 發表于 08-14 15:44 ?1989次閱讀
    如何基于翼輝信息SylixOS<b class='flag-5'>開發</b>ROS 2應用

    介電彈性體軟機器研究:高壓放大器的應用實踐

    進行兩棲運動、攀爬和負重爬行。開發了一種高性能的摩擦電仿生機器人系統,用于驅動和控制電響應軟體機器人。爬行機器人因其對不同環境的特殊適應性而
    的頭像 發表于 08-14 11:20 ?660次閱讀
    介電彈性體軟<b class='flag-5'>機器</b>人<b class='flag-5'>研究</b>:高壓放大器的應用實踐

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2884次閱讀

    無刷直流電機雙閉環串級控制系統仿真研究

    Madlab進行BLDC建模仿真的方法,并且也提出了很多的建模仿真方案。例如有研究人員提出采用節點電流法對電機控制系統進行分析,通過列寫m函數,建立BLDC控制系統真模型,這種方法實質上是一種整體建模
    發表于 07-07 18:36

    輪式移動機器人電機驅動系統的研究開發

    系統,開發了套二輪差速驅動轉向移動機器人電機驅動系統,完成了系統各部件的整體裝配和調試。試驗結果表明,該設計方案可行、系統運行穩定可靠、成本低廉、所用元件易于購置,具有較好的實用的價值和應用前景。 純
    發表于 06-11 14:30

    研究人員開發出基于NVIDIA技術的AI模型用于檢測瘧疾

    瘧疾曾度在委內瑞拉銷聲匿跡,但如今正卷土重來。研究人員已經訓練出個模型來幫助檢測這種傳染病。
    的頭像 發表于 04-25 09:58 ?1012次閱讀

    NanoEdge AI Studio 面向STM32開發人員機器學習(ML)技術

    NanoEdge? AI Studio*(NanoEdgeAIStudio)是一種新型機器學習(ML)技術,可以讓終端用戶輕松享有真正的創新成果。只需幾步,開發人員便可基于最少量的數據
    的頭像 發表于 04-22 11:09 ?1342次閱讀
    NanoEdge AI Studio 面向STM32<b class='flag-5'>開發人員</b><b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)技術

    一種分段氣隙的CLLC變換器平面變壓器設計

    一種路徑,采用磁集成方法,對1MHz雙向CLLC變換器的變壓器進行研究、設計與測試,通過優化PCB繞線方法、進行仿真優化,提出了一種分段氣隙的變壓器結構,通過Maxwell瞬態場、渦流場求解器仿真
    發表于 03-27 13:57

    Raspberry Pi Pico 2 上實現:實時機器學習(ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應用于麥克風輸入。機器學習(ML)技術徹底改變了許多軟件應用
    的頭像 發表于 03-25 09:46 ?1219次閱讀
    Raspberry Pi Pico 2 上實現:實時<b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)音頻噪音抑制功能