国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

巨頭們的人工智能芯片研發得怎么樣了

0BFC_eet_china ? 來源:未知 ? 作者:鄧佳佳 ? 2018-03-04 16:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

根據百度(Baidu)深度學習(deep learning)資深研究人員針對最新加速器進行的測試結果顯示,現有的加速器芯片和軟件仍然存在一些美中不足之處,應該盡快迎頭趕上。

這些結果有一部份來自于使用DeepBench測試。DeepBench是使用32位浮點數學訓練神經網絡的開放來源基準。號稱“中國Google”的百度于2016年9月發布DeepBench,并在去年6月進行了更新,使其涵蓋推論工作以及使用16位數學運算。

DeepBench利用神經網絡庫測試不同硬件的基本運算效能(來源:Baidu)

百度硅谷人工智能實驗室(Silicon Valley AI Lab)資深研究員Greg Daimos解釋。在一些像矩陣乘法這樣的底層作業中,具有專用硬件的芯片(例如Nvidia Volta GPU的張量核心)能夠提供“數百TeraFlops (每秒1兆次浮點運算)。..比前一代的5-10TFLOPS更快幾個數量級。”

然而,他說:“在實際應用中所使用的一些底層作業并沒有足夠的(數據)區域性,讓這些專用處理器充份發揮效能,所以我們必須為其適度地加速,或者改變算法。”

百度研究小組目前正探索兩種方式使用新芯片獲得更大回報。一方面,研究人員在其算法中開啟控制功能,以便同時接收饋入數據,期望能提高10倍的資料平行性。

另一條途徑是讓所有的模型看起來更像一般用于成像應用的卷積神經網絡(CNN)。Daimos說,CNN比一般用于文本或音頻應用(app)等循序數據的遞歸神經網絡(RNN)具有更多區域性。

研究人員在從文本產生音頻的百度模型中,“以CNN層取代RNN層堆棧”,使得“運算密度提高了40倍”,從而帶來了更好的新硬件利用率。他強調,“我們必須透過編寫的所有應用程序來檢視是否可以普遍使用這種方法,或只是將其用于語音合成。”

目前尚不清楚這兩種方法的研究成果何時可用于生產系統。同時,Daimos也分享了硬件測試的其它觀察結果。

編程、內存與靈活性

雖然百度取得將近90%的Nvidia Volta最佳利用率,但編程GPU并非易事。Diamos說,該芯片“有著成千上萬個線程,你必須在一個問題上進行協調和同步。..。..編寫這樣的程序代碼并不容易,而當面對的是像張量核心這樣的對象時就更困難了。”

的確,Diamos表示,“讓這些任務變得更易于編程,正是我們面臨的最大挑戰。....而其中最大的問題就出在內存。我們想要執行更大的神經網絡,但內存比預期地更快耗盡,這并不是透過打造更好的處理器就能解決的問題。”

他補充說,該問題的一部份答案在于尋找能與新興內存搭配作業的技術,例如許多最新加速器所使用的高帶寬內存(HBM)芯片堆棧等。

在百度的測試中,英特爾Intel)多核心x86處理器Xeon Phi的利用率甚至高于Nvidia Volta。然而,英特爾的芯片還沒有任何張量專用核心,因此該芯片在神經網絡作業上的性能不若Volta。

Nvidia Volta配備640個Tensor核心,每秒提供超過100TFLOPS的深度學習效能(來源:Nvidia)

直接進行比較并不容易,因為不同的芯片通常使用不同的運算格式。例如,Xeon Phi采用定點數學,而Volta則混合使用16位和32位浮點運算。

Diamos說:“英特爾芯片的測試結果顯示,對于一些CNN來說,定點數學運算沒問題。然而Nvidia發布的結果顯示在影像和語音應用上表現良好,所以我們取得了一些數據,但還需要進行更多研究。”

他稱贊AMD最新的GPU及其新的機器學習開放軟件是正確的發展方向,但指出他們也缺乏張量核心。他表示,對于英特爾Nirvana和Graphcore Colossus等芯片“沒啥可分享的消息”,也許是因為百度可能還在測試其預先發布的樣片。

擁有大量的矩陣乘法單元通常是一件好事。但是,Volta、Nervana和Colossus處理器則以充滿矩陣乘法數組的芯片將其性能指針推進到或接近其工藝節點所能實現的極限。

他說:“最終你的收益會遞減。..。..讓你不得不放棄靈活度,以便為更多不同的工作負載進行更精密的運算。因此,我們應該找到曲線的轉折點,讓芯片不僅在CNN上運作良好,在其它方面也表現出色。”

神經網絡軟件架構各執一端

除了底層數學之外,加速器還可能缺少優化,因為它們并不完全了解深度學習應用的所有范圍。

當今用于設計神經網絡的競爭軟件架構各執一端,可能會讓情況變得復雜。遺憾的是,跨不同架構建立標準規格的努力也是各自為政,Diamos指出他的團隊注意到目前有11種開發中規格分別處于不同的完善階段。

他說,由Facebook和微軟(Microsoft)發起的開放神經網絡交換格式(ONNX)“正朝著正確的方向發展,但仍缺乏一些像是如何表達控制流程和反向傳播的特性。”

最近有20多家廠商(主要是半導體供應商)宣布了神經網絡交換格式(Neural Network Exchange Format),他們認為該格式對芯片廠商來說更好。Diamos說:“要搞清這些格式中是否有些能成功實施可能還為時過早,但我們正踏上一條更好的發展道路,確實也需要其中某一種規格勝出。”

他補充說:“在2014年,我當時認為未來將會看到人工智能(AI)架構的融合,就像如今在繪圖API中所看到的,但人們仍然在發明新的神經網絡類型,有時還會創造新的原型,所以它可能會像編程語言的多樣性一樣不斷地與時俱進。”

也就是說,Daimos仍然看好深度學習。在今年稍早時,他的團隊發表研究指出,這一領域尚未成熟,預計接下來將會看到更多的突破。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265384
  • 人工智能芯片

    關注

    1

    文章

    124

    瀏覽量

    31025

原文標題:巨頭們的人工智能芯片研發得怎么樣了?

文章出處:【微信號:eet-china,微信公眾號:電子工程專輯】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領域
    的頭像 發表于 02-22 08:24 ?122次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    自然智能與人工智能融合如何重塑芯片設計

    人類大腦是所有處理器中最復雜的,能夠構思出不可思議的創意,解決復雜、微妙的問題。相比之下,人工智能擅長快速分析海量數據并高效執行任務。當自然智能人工智能融合的結果,就是芯片設計領域正
    的頭像 發表于 01-15 13:58 ?511次閱讀

    嵌入式系統中的人工智能

    本文編譯自ElectronicDesign人工智能(AI)正徹底變革嵌入式系統,改變技術融入日常生活的方式。如今的人工智能不再局限于執行基礎任務,它還被應用于智能汽車、工業自動化、醫療設備和
    的頭像 發表于 12-18 11:49 ?1037次閱讀
    嵌入式系統中<b class='flag-5'>的人工智能</b>

    微軟與新思科技分享智能人工智能技術的行業影響

    在2025年世界移動通信大會(MWC 2025)上,微軟(Microsoft)與新思科技(Synopsys)兩家科技巨頭攜手登臺,分享他們對人工智能(AI)發展的最新洞見、智能
    的頭像 發表于 11-30 09:48 ?405次閱讀

    人工智能+消費:技術賦能與芯片驅動未來

    電子發燒友網站提供《人工智能+消費:技術賦能與芯片驅動未來.pptx》資料免費下載
    發表于 11-26 14:50 ?32次下載

    AI 芯片浪潮下,職場晉升新契機?

    方向,就明確涵蓋了人工智能芯片研發、部署與優化技術崗位 。如果你從事 GPU 相關研發工作,在申報職稱時,就需著重突出在圖形處理加速、大規模并行計算等方面的成果,因為 GPU 的高并
    發表于 08-19 08:58

    挖到寶人工智能綜合實驗箱,高校新工科的寶藏神器

    的深度學習,構建起從基礎到前沿的完整知識體系,一門實驗箱就能滿足多門課程的學習實踐需求,既節省經費又不占地 。 五、代碼全開源,學習底層算法 所有實驗全部開源,這對于想要深入學習人工智能技術的人來說
    發表于 08-07 14:30

    挖到寶!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    的深度學習,構建起從基礎到前沿的完整知識體系,一門實驗箱就能滿足多門課程的學習實踐需求,既節省經費又不占地 。 五、代碼全開源,學習底層算法 所有實驗全部開源,這對于想要深入學習人工智能技術的人來說
    發表于 08-07 14:23

    關于人工智能處理器的11個誤解

    應用,以及哪些是真實情況而哪些只是炒作,仍存在諸多誤解。GPU是最佳的人工智能處理器盡管GPU在人工智能的實現過程中發揮了關鍵作用,而且如今它們的應用也極為廣泛,但將其推
    的頭像 發表于 08-07 13:21 ?1071次閱讀
    關于<b class='flag-5'>人工智能</b>處理器的11個誤解

    愛芯元智亮相2025世界人工智能大會

    近日,2025年世界人工智能大會(WAIC 2025)正式開幕,愛芯元智作為行業領先的人工智能感知與邊緣計算芯片創新研發企業,再次亮相展會。在這場為期3天的展會上,愛芯元智以“AI芯賦
    的頭像 發表于 08-01 10:41 ?1680次閱讀

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型正在工作生活
    發表于 07-04 11:10

    科大訊飛加速東南亞企業的人工智能應用

    日前,科大訊飛在新加坡成功舉辦合作伙伴峰會暨創新產品發布會。這場匯聚關鍵合作伙伴、行業先驅和技術領袖的盛會,不僅集中展示科大訊飛最新AI創新成果,更彰顯人工智能推動企業業務轉型的決心。 活動
    的頭像 發表于 05-06 09:39 ?909次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網,WiFi,USB 擴展/重力感應/RS232/RS485/IO 擴展/I2C 擴展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強性能的人工智能
    發表于 04-23 10:55

    AI人工智能隱私保護怎么

    在當今科技飛速發展的時代,AI人工智能已經深入到我們生活的方方面面,從醫療診斷到交通調度,從教育輔助到娛樂互動,其影響力無處不在。然而,隨著AI人工智能的廣泛應用,其安全性問題也備受關注。那么,AI
    的頭像 發表于 03-11 09:46 ?1203次閱讀
    AI<b class='flag-5'>人工智能</b>隱私保護怎么<b class='flag-5'>樣</b>