国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Hot Chips 2017——人工智能近期的發展及其對計算機系統設計的影響(附PPT資料下載)

m3Fp_almosthuma ? 來源:機器之心 ? 作者:機器之心 ? 2017-08-24 17:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在剛剛結束的 2017 年國際高性能微處理器研討會(Hot Chips 2017)上,微軟、百度、英特爾等公司都發布了一系列硬件方面的新信息,比如微軟的 Project Brainwave、百度的 XPU、英特爾的 14nm FPGA 解決方案等。谷歌也不例外,在大會 keynote 中 Jeff Dean 介紹了人工智能近期的發展及其對計算機系統設計的影響,同時他也對 TPU、TensorFlow 進行了詳細介紹。文末提供了該演講資料的下載地址。

在演講中,Jeff Dean 首先介紹了深度學習的崛起(及其原因),谷歌在自動駕駛、醫療健康等領域取得的最新進展。

Jeff Dean 表示,隨著深度學習的發展,我們需要更多的計算能力,而深度學習也正在改變我們設計計算機的能力。

我們知道,谷歌設計了 TPU 專門進行神經網絡推斷。Jeff Dean 表示,TPU 在谷歌產品中的應用已經超過了 30 個月,用于搜索、神經機器翻譯、DeepMind 的 AlphaGo 系統等。

但部署人工智能不只是推斷,還有訓練階段。TPU 能夠助力推斷,我們又該如何加速訓練?訓練的加速非常的重要:無論是對產品化還是對解決大量的難題。

為了同時加速神經網絡的推斷與訓練,谷歌設計了 TPU 二代。TPU 二代芯片的性能如下圖所示:

除了上圖所述意外,TPU 二代的特點還有:

  • 每秒的浮點運算是 180 teraflops,64 GB 的 HBM 存儲,2400 GB/S 的存儲帶寬

  • 設計上,TPU 二代可以組合連接成大型配置

下圖是 TPU 組成的大型配置:由 64 塊 TPU 二代組成,每秒 11.5 千萬億次浮點運算,4 太字節的 HBM 存儲。

在擁有強大的硬件之后,我們需要更強大的深度學習框架來支持這些硬件和編程語言,因為快速增長的機器學習和深度學習需要硬件和軟件都能具備強大的擴展能力。因此,Jeff Dean 還詳細介紹了最開始由谷歌開發的深度學習框架 TensorFlow。

深度學習框架 TensorFlow

TensorFlow 是一種采用數據流圖(data flow graphs),用于數值計算的開源軟件庫。其中 Tensor 代表傳遞的數據為張量(多維數組),Flow 代表使用計算圖進行運算。數據流圖用「節點」(nodes)和「邊」(edges)組成的有向圖來描述數學運算。

TensorFlow 的目標是建立一個可以表達和分享機器學習觀點與系統的公共平臺。該平臺是開源的,所以它不僅是谷歌的平臺,同時是所有機器學習開發者和研究人員的平臺,谷歌和所有機器學習開源社區的研究者都在努力使 TensorFlow 成為研究和產品上最好的機器學習平臺。

下面是 TensorFlow 項目近年來在 Github 上的關注度,我們可以看到 TensorFlow 是所有同類深度學習框架中關注度最大的項目。

TensorFlow:一個充滿活力的開源社區

TensorFlow 發展迅速,有很多谷歌外部的開發人員

  • 超過 800 多位 TensorFlow 開發人員(非谷歌人員)。

  • 21 個月內 Github 上有超過 21000 多條貢獻和修改。

  • 許多社區編寫了 TensorFlow 的教程、模型、翻譯和項目

  • 超過 16000 個 Github 項目在項目名中包含了「TensorFlow」字段

社區與 TensorFlow 團隊之間的直接聯合

  • 5000+已回答的 Stack Overflow 問題

  • 80+ 每周解答的社區提交的 GitHub 問題

通過 TensorFlow 編程

在 TensorFlow 中,一個模型可能只需要一點點修改就能在 CPUGPU 或 TPU 上運行。前面我們已經看到 TPU 的強大之處,Jeff Dean 表明,對于從事開放性機器學習研究的科學家,谷歌可以免費提供 1000 塊云 TPU 來支持他們的研究。Jeff Dean 說:「我們很高興研究者能在更強勁的計算力下進行更杰出的研究」

TensorFlow Research Cloud 申請地址:https://services.google.com/fb/forms/tpusignup/

機器學習需要在各種環境中運行,我們可以在下面看到 TensorFlow 所支持的各種平臺和編程語言。

除此之外,TensorFlow 還支持各種編程語言,如 PythonC++JavaC#、R、Go 等。

TensorFlow 非常重要的一點就是計算圖,我們一般需要先定義整個模型需要的計算圖,然后再執行計算圖進行運算。在計算圖中,「節點」一般用來表示施加的數學操作,但也可以表示數據輸入的起點和輸出的終點,或者是讀取/寫入持久變量(persistent variable)的終點。邊表示節點之間的輸入/輸出關系。這些數據邊可以傳送維度可動態調整的多維數據數組,即張量(tensor)。

如下是使用 TensorFlow 和 Python 代碼定義一個計算圖:

在 Tensorflow 中,所有不同的變量和運算都儲存在計算圖。所以在我們構建完模型所需要的圖之后,還需要打開一個會話(Session)來運行整個計算圖。在會話中,我們可以將所有計算分配到可用的 CPU 和 GPU 資源中。

如下所示代碼,我們聲明兩個常量 a 和 b,并且定義一個加法運算。但它并不會輸出計算結果,因為我們只是定義了一張圖,而沒有運行它:

a=tf.constant([1,2],name="a")
b=tf.constant([2,4],name="b")
result = a+b
print(result)

#輸出:Tensor("add:0", shape=(2,), dtype=int32)

下面的代碼才會輸出計算結果,因為我們需要創建一個會話才能管理 TensorFlow 運行時的所有資源。但計算完畢后需要關閉會話來幫助系統回收資源,不然就會出現資源泄漏的問題。下面提供了使用會話的兩種方式:

a=tf.constant([1,2,3,4])
b=tf.constant([1,2,3,4])
result=a+b
sess=tf.Session()
print(sess.run(result))
sess.close

#輸出 [2 4 6 8]

with tf.Session() as sess:
  a=tf.constant([1,2,3,4])
  b=tf.constant([1,2,3,4])
  result=a+b
  print(sess.run(result))
  
#輸出 [2 4 6 8]

TensorFlow + XLA 編譯器

XLA(Accelerated Linear Algebra)是一種特定領域的編譯器,它極好地支持線性代數,所以能很大程度地優化 TensorFlow 的計算。使用 XLA 編譯器,TensorFlow 的運算將在速度、內存使用和概率計算上得到大幅度提升。

  • XLA 編譯器詳細介紹: https://www.tensorflow.org/performance/xla/

  • XLA 編譯器開源代碼: https://github.com/tensorflow/tensorflow/tree/master/tensorflow/compiler

TensorFlow 的優勢

高性能機器學習模型

對于大型模型來說,模型并行化處理是極其重要的,因為單個模型的訓練時間太長以至于我們很難對這些模型進行反復的修改。因此,在多個計算設備中處理模型并取得優秀的性能就十分重要了。如下所示,我們可以將模型分割為四部分,運行在四個 GPU 上。

高性能強化學習模型

通過強化學習訓練的 Placement 模型將圖(graph)作為輸入,并且將一組設備、輸出設備作為圖中的節點。在 Runtime 中,給定強化學習的獎勵信號而度量每一步的時間,然后再更新 Placement。

通過強化學習優化設備部署(Device Placement Optimization with Reinforcement Learning,ICML 2017)

  • 論文地址:https://arxiv.org/abs/1706.04972

通過強化學習優化設備部署

降低推斷成本

開發人員最怕的就是「我們有十分優秀的模型,但它卻需要太多的計算資源而不能部署到邊緣設備中!」

Geoffrey Hinton 和 Jeff Dean 等人曾發表過論文 Distilling the Knowledge in a Neural Network。在該篇論文中,他們詳細探討了將知識壓縮到一個集成的單一模型中,因此能使用不同的壓縮方法將復雜模型部署到低計算能力的設備中。他們表示這種方法顯著地提升了商業聲學模型部署的性能。

  • 論文地址:https://arxiv.org/abs/1503.02531

這種集成方法實現成一個從輸入到輸出的映射函數。我們會忽略集成中的模型和參數化的方式而只關注于這個函數。以下是 Jeff Dean 介紹這種集成。

訓練模型的幾個趨勢

1. 大型、稀疏激活式模型

之所以想要訓練這種模型是想要面向大型數據集的大型模型容量,但同時也想要單個樣本只激活大型模型的一小部分。

逐個樣本路徑選擇圖

這里,可參考谷歌 Google Brain ICLR 2017 論文《OUTRAGEOUSLY LARGE NEURAL NETWORKS: THE SPARSELY-GATED MIXTURE-OF-EXPERTS LAYER》。

2. 自動機器學習

Jeff Dean 介紹說,目前的解決方式是:機器學習專家+數據+計算。這種解決方案人力的介入非常大。我們能不能把解決方案變成:數據+100 倍的計算。

有多個信號讓我們看到,這種方式是可行的:

  • 基于強化學習的架構搜索

  • 學習如何優化

如 Google Brain ICLR 2017 論文《Neural Architecture Search with Reinforcement Learning》,其思路是通過強化學習訓練的模型能夠生成模型。

在此論文中,作者們生成了 10 個模型,對它們進行訓練(數個小時),使用生成模型的損失函數作為強化學習的信號。

在 CIFAR-10 圖像識別任務上,神經架構搜索的表現與其他頂級成果的表現對比如上圖所示。

上圖是正常的 LSTM 單元與架構搜索所發現的單元圖。

此外,學習優化更新規則也是自動機器學習趨勢中的一個信號。通常我們使用的都是手動設計的優化器,如下圖所示。

而 Google Brain 在 ICML 2017 的論文《Neural Optimizer Search with Reinforcement Learning》中,就講到了一種學習優化更新規則的技術。神經優化器搜索如下圖所示:

總結

最后,Jeff Dean 總結說,未來人工智能的發展可能需要結合以上介紹的所有思路:需要大型、但稀疏激活的模型;需要解決多種任務的單個模型;大型模型的動態學習和成長路徑;面向機器學習超級計算的特定硬件,以及高效匹配這種硬件的機器學習方法。

當然,目前在機器學習與系統/計算機架構的交叉領域還存在一些開放問題,例如:

  • 極為不同的數值是否合理(例如,1-2 位的激勵值/參數)?

  • 我們如何高效的處理非常動態的模型(每個輸入樣本都有不同的圖)?特別是在特大型機器上。

  • 有沒有方法能夠幫助我們解決當 batch size 更大時,回報變小的難題?

  • 接下來 3-4 年中,重要的機器學習算法、方法是什么?

如今,神經網絡與其他方法隨數據、模型大小變化的準確率對比圖如下:

未來,可能又是一番境況。

演講PPT地址:http://pan.baidu.com/s/1kVyxeB1

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1660

    文章

    22415

    瀏覽量

    636491
  • 微處理器
    +關注

    關注

    11

    文章

    2431

    瀏覽量

    85873
  • AI
    AI
    +關注

    關注

    91

    文章

    39805

    瀏覽量

    301479
  • 人工智能
    +關注

    關注

    1817

    文章

    50100

    瀏覽量

    265495

原文標題:Jeff Dean「Hot Chips 2017」演講:AI對計算機系統設計的影響

文章出處:【微信號:almosthuman2014,微信公眾號:機器之心】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    。 強人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的人工智能。 超
    的頭像 發表于 02-22 08:24 ?134次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    樂高?教育宣布推出專注于計算機科學與人工智能的動手實踐式學習解決方案

    ? 一項名為《構建未來:全球計算機科學與人工智能教育報告》的研究新近指出,雖然基礎教育階段的教師充分認可動手實踐式的計算機科學與人工智能教育的優勢,但普遍缺乏能有效提升學生參與度的合適
    的頭像 發表于 01-12 19:52 ?337次閱讀
    樂高?教育宣布推出專注于<b class='flag-5'>計算機</b>科學與<b class='flag-5'>人工智能</b>的動手實踐式學習解決方案

    光合組織2025人工智能創新大會,高能計算機展現工業智能新圖景

    人工智能成為驅動產業變革的核心引擎,自主可控的算力基礎設施便成為產業高質量發展的關鍵基石。12月17日-19日,光合組織2025人工智能創新大會在昆山隆重舉辦,作為國內首個聚焦“AI計算
    的頭像 發表于 12-23 10:33 ?329次閱讀
    光合組織2025<b class='flag-5'>人工智能</b>創新大會,高能<b class='flag-5'>計算機</b>展現工業<b class='flag-5'>智能</b>新圖景

    Neousys宸曜發布適用于狹小空間的經濟型邊緣人工智能計算機

    強固型嵌入式計算機廠商Neousys宸曜科技發布了NRU-160-FT系列,一款緊湊型無風扇人工智能邊緣計算機,搭載NVIDIA?JetsonOrin?NX/Nano系統模塊。NRU-
    的頭像 發表于 12-01 16:21 ?1021次閱讀
    Neousys宸曜發布適用于狹小空間的經濟型邊緣<b class='flag-5'>人工智能</b><b class='flag-5'>計算機</b>

    上海市計算機行業協會攜手深蘭科技推動人工智能高質量發展

    2025年11月13日,由上海市計算機行業協會主辦的“智啟未來·走進深蘭——人工智能賦能高質量發展參訪交流會”在位于張江的深蘭科技總部順利舉行。市經信委無線和電子信息產業處相關領導、協會理事單位及會員企業代表出席活動,共同探討具
    的頭像 發表于 11-17 16:08 ?681次閱讀

    龍架構計算機系統能力核心課程教學研討會圓滿舉行

    2025年11月8日,由教育部計算機類專業系統能力課程群虛擬教研室指導、北京航空航天大學計算機學院主辦的龍架構計算機系統能力核心課程教學研討會在京舉行。
    的頭像 發表于 11-14 13:52 ?650次閱讀

    2025中國高校計算機大賽人工智能創意賽圓滿落幕

    11月2日,2025中國高校計算機大賽-人工智能創意賽(C4-AI競賽)在海南大學海甸校區正式落下帷幕。
    的頭像 發表于 11-05 15:39 ?631次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關設備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發表于 08-07 14:30

    人工智能技術的現狀與未來發展趨勢

    人工智能技術的現狀與未來發展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發展,深刻影響著各行各業。從計算機視覺到自然語言處理,從自動駕駛到
    的頭像 發表于 07-16 15:01 ?1882次閱讀

    AI芯片:加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為AI優化的芯片應運而生,成為推動深度學習、
    的頭像 發表于 07-09 15:59 ?1595次閱讀

    利用邊緣計算和工業計算機實現智能視頻分析

    IVA的好處、實際部署應用程序以及工業計算機如何實現這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復雜的計算機視覺,通常與卷積神經網
    的頭像 發表于 05-16 14:37 ?843次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業<b class='flag-5'>計算機</b>實現<b class='flag-5'>智能</b>視頻分析

    一文帶你了解工業計算機尺寸

    工業計算機是現代自動化、人工智能(AI)和邊緣計算的支柱。這些堅固耐用的系統旨在承受惡劣的環境,同時為關鍵應用提供可靠的性能。然而,由于有這么多可用的外形尺寸,為您的工業
    的頭像 發表于 04-24 13:35 ?1052次閱讀
    一文帶你了解工業<b class='flag-5'>計算機</b>尺寸

    計算機網絡入門指南

    計算機網絡是指將地理位置不同且具有獨立功能的多臺計算機及其外部設備,通過通信線路連接起來,在網絡操作系統、網絡管理軟件及網絡通信協議的管理和協調下,實現資源共享和信息傳遞的
    的頭像 發表于 04-22 14:29 ?2264次閱讀
    <b class='flag-5'>計算機</b>網絡入門指南

    2025全國大學生計算機系統能力大賽啟幕,RT-Thread助力高校人才培養

    全國大學生計算機系統能力大賽是由系統能力培養研究專家組發起,全國高等學校計算機教育研究會、系統能力培養研究專家組、系統能力培養研究項目發起高
    的頭像 發表于 04-10 21:26 ?943次閱讀
    2025全國大學生<b class='flag-5'>計算機系統</b>能力大賽啟幕,RT-Thread助力高校人才培養

    【「芯片通識課:一本書讀懂芯片技術」閱讀體驗】從deepseek看今天芯片發展

    的: 神經網絡處理器(NPU)是一種模仿人腦神經網絡的電路系統,是實現人工智能中神經網絡計算的專用處理器,主要用于人工智能深度學習模型的加速訓練。
    發表于 04-02 17:25