国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

對標英偉達勝算幾何?這家AI芯片獨角獸首次全面揭開神秘面紗……

張慧娟 ? 來源:電子發燒友網 ? 作者:張慧娟 ? 2020-06-19 10:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


AI訓練市場,不乏躍躍欲試想挑戰英偉達霸主地位的廠商。不過,英偉達GPU仍是當前全球大規模商用部署的頭號玩家。其次,Google的TPU通過內部應用及TensorFlow占據第二大生態規模。

要知道,一顆AI芯片從開發定義到落地部署,中間存在著巨大的鴻溝,特別是算法越來越復雜、模型越來越大,AI芯片面臨著算力的嚴峻考驗,最終要在數據中心批量部署,能夠成功的廠商鳳毛麟角。

不過,來自于底層的顛覆性創新正在悄然改變著格局。Graphcore,這家成立于2016年、來自于英國的AI芯片公司,通過創新的IPU處理器技術,已經開始在全球數據中心批量應用,躋身于該市場第三梯隊。

5月27日,在Intelligent Health峰會上,微軟機器學習科學家Sujeeth Bharadwaj分享了在攻克新冠病毒時的一項研究,在訓練CXR(胸部X射線檢查)模型時,用Graphcore IPU處理器和英偉達 V100同時運行微軟COVID-19影像分析算法SONIC,最終的結果可能令所有人大跌眼鏡:IPU在30分鐘內完成了V100需5個小時的訓練工作量!

這家年輕的公司,由此再次引起了業界的關注。日前,Graphcore面對<電子發燒友>等行業媒體,首次在中國市場全面揭開了其創新背后的核心技術及最新業務進展,以及在中國市場的布局等。

為什么傳統的處理器架構需要被顛覆?

Graphcore高級副總裁兼中國區總經理盧濤(Jason Lu)介紹稱,AI時代的機器智能代表的是全新的計算負載,不同于傳統計算的特點有:它是非常大規模的并行計算;數據結構非常稀疏;相較于傳統的科學計算或高性能計算(HPC),AI/機器智能是低精度計算;另外在訓練、推理過程中的數據參數復用、靜態圖結構等,都是AI應用全新計算負載的典型代表。
盧濤 Jason Lu
Graphcore高級副總裁兼中國區總經理

整個AI算法模型的演變,基本上從2016年1月份的ResNet50的2500萬個參數,發展到2018年10月份BERT-Large的3.3億個參數,而到了2019年發展到GPT2的15.5億個參數,增長幅度非常大。甚至,現在一些領先的科研機構和AI研究者在探索更大的算法模型,能夠訓練更復雜的算法,來提高精度。密集計算并不是可持續的方法,譬如算法模型參數要從15.5億規模擴展到一萬億,這種指數級的增長,需要成倍的算力提升。Graphcore認為,傳統處理器無法很好地應對這些變化,因此市場需要一種顛覆式的創新架構。
?
傳統的處理器架構,如CPU是針對應用和網絡進行設計的標量處理器,GPU是以向量處理為核心的、針對圖形和高性能計算的處理器。而AI是全新的應用架構,底層是以計算圖作為表征的,且從整個AI發展方向來看,大規模、稀疏化的數據會越來越多,因此,Graphcore針對這些發展趨勢設計了一種全新的處理器架構。

全世界最復雜的擁有236億個晶體管的芯片處理器

目前為止,機器學習的算力來源主要還是傳統的處理器,它們的算力提升也非常快。不過,峰值算力和有效算力是兩回事,這其中,內存帶寬成為掣肘

當處理器算力提高了10倍,內存如何相應提高10倍的性能呢?盧濤介紹,如果用傳統的DDR4、DDR5、HBM、HBM1、HBM2、HBM3等內存,基本上每一代能有30%或40%的提升,因此,這對傳統架構是一個非常大的挑戰。

相較于傳統CPU、GPU,IPU采用了大規模并行MIMD(多指令多數據)處理器核,通過緊密耦合的大型本地分布式SRAM,在片內能夠做到300MB SRAM。相對CPU的DDR2子系統或GPU的GDDR、HBM來說,IPU能夠實現10到320倍的性能提升。這樣帶來的好處是,能夠將模型和數據放在片內處理,從時延的角度來看,與訪問外存相比較,時延僅為1%。

通過采用大規模分布式的片上SRAM架構,IPU處理器將所有memory都放在片上,解決了當前機器學習中大量出現的內存帶寬所造成的瓶頸。

目前,基于這一創新架構的IPU處理器GC2已量產,采用TSMC 16nm工藝,號稱是世界上最復雜的擁有236億個晶體管的芯片處理器

GC2片內有1216個IPU-Tiles,每個Tile有獨立的IPU核心作為計算以及In-Processor-Memory(處理器之內的內存),總共有7296個線程,能夠支持7296個程序并行運行。對整片來說,In-Processor-Memory總共是300MB,PCIe是16個PCIe Gen 4。

而在各個核心之間,Graphcore通過BSP同步協議,能夠支持同一個IPU處理器內1216個核心之間的通信,以及跨不同的IPU之間進行通信。另外,在IPU和IPU之間,擁有80個IPU-Links,總共有320GB/s的chip to chip的帶寬。正因如此,IPU處理器可以同時支持訓練和推理。

從目前所公布的指標來看,在自然語言處理、圖像分類、金融模型訓練等方面,IPU在現有及下一代的模型上,性能均領先于GPU:在自然語言處理方面的速度能夠提升20%到50%;在圖像分類方面,能夠有6倍的吞吐量且時延更低;在金融模型方面,訓練速度能夠提高26倍以上。目前,IPU在云上、在一些客戶的自建數據中心的服務器上已經投產應用。

而在場景應用方面,IPU采用分組卷積的方式也體現出了獨有優勢,特別是針對更為稀疏化的數據時。

盧濤分享了眾多AI創新者、算法科學家、AI應用開發者日常工作中遇到的一大問題:當算法模型在GPU上運行速度非常慢的時候,通常被認為是算法或軟件問題。他指出,如果算法模型不是用稠密的卷積,而是用較為稀疏的卷積比如Fully depthwise做的,那么在GPU上運行得慢的根本原因是GPU架構不符合算法特點,因此采用IPU能夠提供更好的支持。

他解釋稱,Graphcore設計了一個分組卷積內核的micro-benchmark,將組維度(group dimension)分成從1到512來比較,這里512就是應用得較多的“Dense卷積網絡”,典型應用如ResNet。此時,IPU GC2性能甚至比英偉達V100要高近一倍。隨著稠密程度降低、稀疏化程度增加,在組維度為1或32時,針對EfficientNet或MobileNet,IPU對比GPU展現出巨大優勢,做到成倍的性能提升,同時時延大大降低。

創新架構需要軟硬協同設計

IPU所采用的片上存儲架構,確實是未來計算結構的發展方向之一,但從芯片設計和應用角度而言,這是一大挑戰。

片上存儲通常有兩種架構,一是在片上規劃單塊大規模的存儲,這種方式通常會導致良品率極低。另一種架構就是Graphcore這樣的分布式片上存儲架構。但這又帶來了新的挑戰:如何把分布式存儲架構有效利用起來?這對編譯器的要求非常高,可以說是軟件、硬件協同設計的過程。要做出能夠真正落地的產品,最核心的挑戰就是軟硬件兩方面的專業知識和經驗。

為了提升芯片的可用性,以及便于用戶和開發者更方便地在系統中進行開發、移植、優化,Graphcore將產品擴展到囊括龐大的部署軟件和基礎架構套件,通過Poplar SDK給用戶提供更好的體驗。而這通常是頭部廠商如英偉達在推進GPU大規模應用時才有的舉動。

Poplar SDK是架構在機器學習上的框架軟件(比如TensorFlow、ONNX、PyTorch和PaddlePaddle)和硬件之間的一個基于計算圖的整套工具鏈和庫。Poplar SDK支持容器化部署,能夠快速啟動并運行。在標準生態方面,Poplar SDK支持Docker、Kubernetes、以及微軟的Hyper-v等虛擬化技術和安全技術。在操作系統方面,Poplar SDK目前支持最主要的三個Linux發行版:ubuntu、RedHat Enterprise Linux、CentOS。

今年5月,Graphcore還推出了PopVision Graph Analyser分析工具,用戶可以通過這個可視化的圖形展示工具來分析軟件運行情況、調試效率。

目前基于IPU的一些應用已覆蓋到機器學習的各個應用領域,包括自然語言處理、圖像/視頻處理、時序分析、推薦/排名及概率模型。一些應用案例和模型已經在TensorFlow、ONNX和Graphcore的PopART上可用,所有源代碼都可以在GitHub處下載。

新冠疫情下“小兵”立大功

當前,全球都希望更高效地攻克新冠疫情中的難題。這時,AI在高清醫學影像領域就體現出了重要價值。

第一,疫情發展非常快,不斷有新的病例、影像和數據產生,這就要求現有的模型要不斷根據新的情況來提高精度。

第二,疫情造成全球醫療資源緊缺。放射影片往往需要富有經驗的醫生進行判斷,而在資源緊張的情況下,AI工具可以幫助更多醫生獲得更專業的判斷力。

第三,全球都迫切需要攻克病毒的研究成果,如何提高研究效率至關重要。

Graphcore中國銷售總監朱江,就本文開頭所提到的微軟訓練CXR(胸部X光射線檢查)的應用案例,詳細介紹了IPU與英偉達 V100的對比情況。
朱江
Graphcore中國銷售總監

微軟專門開發了SONIC CV模型進行訓練,IPU和GPU的訓練結果對比如下圖:左邊是訓練時間,IPU優勢明顯。右邊紅色曲線代表訓練時精度上升的情況,藍色曲線代表測試精度。可以看到測試精度和訓練精度較為接近甚至吻合,這也說明SONIC模型在泛化性能上更好,在針對未知的新數據方面,其處理能力比微軟傳統的EfficientNet模型更好。整體上,SONIC的模型通過30分鐘的訓練達到94%的訓練精度和測試精度,訓練速度方面,IPU需要30分鐘,而GPU差不多需要5個小時。

通過這一訓練,微軟認為能夠訓練到SOTA的精度的模型不一定是大模型,可以用小模型來達到這樣的精度要求。另外,IPU的MIMD架構非常適用于以分組卷積為代表的新模型。

據了解,目前微軟已采用IPU來進行計算機視覺中分類方面的訓練,能達到一個數量級的速度提升。未來,微軟期望把IPU在CV領域的應用擴展到更多方面,包括監測、分割以及配準。

創新帶給Graphcore的底氣

迄今為止,Graphcore獲得了AI領域多位重量級人物的背書。

英國半導體之父、Arm聯合創始人Hermann爵士認為:“在計算機歷史上只發生過三次革命,一次是70年代的CPU,第二次是90年代的GPU,而Graphcore就是第三次革命。”意指其率先提出了為AI計算而生的IPU。

AI教父Geoff Hinton教授在接受Wired采訪時,被問到 “我們應該如何構建功能更像大腦的機器學習系統”時,從錢包中掏出了一個又大又亮的硅片,并回答說:“我們需要轉向不同類型的計算機來處理新的機器學習系統。”他認為Graphcore的IPU正在滿足這樣的系統需求。


迄今為止,Graphcore總融資超過4.5億美金,其中包括全球知名的金融投資者和戰略投資者。

不論是技術本身所帶來的創新地位,還是大佬的站臺或融資歷程,Graphcore的履歷都堪稱漂亮。

不過,作為一家初創企業,Graphcore直面的都是業界巨擘。強如英偉達,也已經感受了種種威脅,正在加速創新。上個月,英偉達推出了基于Ampere架構的NVIDIA A100,將AI訓練和推理性能提高20倍,可以說是英偉達GPU迄今為止最大的性能飛躍。

對于未來的競爭,Graphcore方面信心滿滿。盧濤表示,雖然目前對比的都是與V100這樣的大量部署的旗艦級產品,但即使是第一代IPU產品也不會輸于A100,且下一代IPU處理器也將有重磅發布。

未來的推進策略,Graphcore還是會在訓練和推理兩方面并行,聚焦對高精度、低時延、高吞吐量要求更高的場景。另外還有一個趨勢是訓練和推理混布的需求,例如視頻平臺、電商網站等希望通過算法同時進行訓練和推理,能夠根據用戶數據實時更新算法模型;未來的汽車應用也是訓練和推理混布的場景,都將有一定的增長。

積極擁抱中國AI生態圈

在中國,Graphcore剛與兩大頭部客戶有了重大進展。

一是阿里巴巴新的開放式深度學習API ODLA(Open Deep Learning API)支持Graphcore IPU,某種程度上,這也反映了數據中心對IPU的計算需求正在增長。

二是成為百度飛槳(PaddlePaddle)硬件生態圈共建計劃伙伴之一,這一合作使Graphcore進入了中國深度學習開源框架的生態系統中,觸及百萬以上的AI開發者。

盧濤表示,Graphcore正在積極擁抱中國的AI生態圈,中國市場未來有望占據其全球市場的40%甚至50%

本文由電子發燒友網原創,未經授權禁止轉載。如需轉載,請添加微信號elecfans999.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135467
  • IPU
    IPU
    +關注

    關注

    0

    文章

    35

    瀏覽量

    15962
  • AI芯片
    +關注

    關注

    17

    文章

    2128

    瀏覽量

    36780
  • AI2020
    +關注

    關注

    1

    文章

    22

    瀏覽量

    6247
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    模力方舟榮登2025年度創新未來獨角獸榜單

    在新一輪科技與產業革新浪潮中,誰是最具爆發力的新生力量?由鉛筆道與真榜聯合發布的《2025年度創新未來獨角獸榜單》近日正式揭曉,模力方舟(開源中國)成功上榜,成為全國 174 家未來獨角獸企業之一。
    的頭像 發表于 02-03 17:07 ?1213次閱讀

    航盛集團受邀出席第三屆中國汽車獨角獸大會

    1月18日,由汽車評價研究院、北京隱形獨角獸信息科技院、中國汽車隱形獨角獸評委會聯合主辦,以“硬核創新?重構生態:‘十五五’汽車獨角獸攻堅科技制高點”為主題的第三屆中國汽車獨角獸大會在
    的頭像 發表于 01-23 15:42 ?364次閱讀

    潤芯微科技榮登2025中國潛在獨角獸企業榜單

    近日,長城戰略咨詢在2025企業科技創新發展論壇上重磅發布《GEI 中國潛在獨角獸企業研究報告 2025》。潤芯微科技(江蘇)有限公司憑借卓越的創新能力和快速的發展勢頭,繼去年上榜后再次入圍“中國潛在獨角獸企業”名單!
    的頭像 發表于 12-25 10:13 ?647次閱讀

    深蘭科技榮登2025全球獨角獸企業500強榜單

    近日,在青島舉辦的“2025全球獨角獸企業500強大會”上,深蘭科技憑借在人工智能特別是具身智能方向的技術創新與產業落地能力,成功入選“2025全球獨角獸企業500強”,并獲頒“全球獨角獸企業”證書。自2021年起,深蘭科技已連
    的頭像 發表于 12-24 16:13 ?508次閱讀

    奕斯偉計算榮登2025全球獨角獸企業500強榜單

    近日,由獨角獸工程院聯合中國人民大學中國民營企業研究中心、清華大學新質生產力研究院、北京隱形獨角獸信息科技院和浙江清華長三角研究院獨角獸企業研究中心共同發布的《2025全球獨角獸企業5
    的頭像 發表于 12-18 13:50 ?414次閱讀

    桐汭科技榮獲2025深圳市“種子獨角獸企業”

    近日,深圳桐汭科技有限公司(簡稱:桐汭科技)憑借卓越的創新實力與高速成長潛力,榮獲由深圳市瞪羚獨角獸企業評價委員會授予的【種子獨角獸企業】證書!
    的頭像 發表于 11-14 17:46 ?1908次閱讀

    左藍微電子入選2025年江蘇省潛在獨角獸企業

    2025年9月24日,江蘇省新質生產力促進中心在南京舉辦了“2025年江蘇獨角獸企業和瞪羚企業評估結果發布會”。會上,2025年江蘇獨角獸企業、潛在獨角獸企業和瞪羚企業名單正式揭曉。在這份重量級榜單
    的頭像 發表于 09-30 10:52 ?1326次閱讀

    宏景智駕榮登中國AI出海未來獨角獸企業TOP100榜單

    此前,2025年9月17日-21日,第22屆中國-東盟博覽會(以下簡稱“東博會”)在廣西南寧隆重召開。宏景智駕應邀參會,并憑借其技術優勢和行業影響力在東博會的主題活動AI出海獨角獸之夜活動中入選《中國AI出海未來
    的頭像 發表于 09-30 10:43 ?864次閱讀

    宏景智駕榮登2025中國隱形獨角獸500強榜單

    “2025中國隱形獨角獸大會”在廣州舉辦,會上發布《2025中國隱形獨角獸500強榜單》,宏景智駕(衢州)科技有限公司(以下簡稱:宏景智駕)榮登榜單。
    的頭像 發表于 08-28 11:19 ?1333次閱讀

    芯馳科技出席獨角獸企業融資對接會

    8月15日,由市科委中關村管委會創新創業服務處、中關村高科技產業促進中心聯合中關村獨角獸企業發展聯盟、中國銀行北京市分行主辦的“獨角獸企業融資對接會”在中關村特色園區——首鋼園成功舉辦。
    的頭像 發表于 08-19 13:46 ?1024次閱讀

    總估值1414億元,2025最新中國傳感器獨角獸名單出爐,有3家退出!(附全名單)

    ? ? 7月18日,長城戰略咨詢發布最新一期的2025《GEI中國獨角獸企業研究報告》,給出了最新一期中國獨角獸企業名單,該報告是我國獨角獸企業研究參考度較高的資料。 ? ? 報告顯示,2024年中
    的頭像 發表于 07-30 18:11 ?11.9w次閱讀
    總估值1414億元,2025最新中國傳感器<b class='flag-5'>獨角獸</b>名單出爐,有3家退出!(附全名單)

    隼眼科技榮獲2025年度南京市培育獨角獸企業

    近日,備受矚目的《2025年度南京市獨角獸、培育獨角獸、瞪羚企業榜單》正式揭曉,隼眼科技成功入選“2025年度南京市培育獨角獸企業”。這一榮譽不僅是對隼眼科技過往成績的高度認可,更是對其未來發展潛力的充分肯定。
    的頭像 發表于 06-05 17:49 ?1377次閱讀

    榮耀再續!洛微科技榮膺2025杭州準獨角獸企業榮譽

    4月24日,第九屆萬物生長大會于杭州圓滿落幕。會上,《2025杭州獨角獸與準獨角獸企業榜單》重磅揭曉,洛微科技憑借高速的成長態勢、強大的創新實力以及廣闊的發展前景,再度榮獲“2025杭州準獨角獸企業
    的頭像 發表于 04-27 10:59 ?1000次閱讀
    榮耀再續!洛微科技榮膺2025杭州準<b class='flag-5'>獨角獸</b>企業榮譽

    智行者科技獲評2025中國獨角獸企業

    近日,在第二屆全球獨角獸企業大會上,智行者憑借在輪形特種機器人領域的技術創新與規模化商業化成果,再度入選《中國獨角獸企業發展報告(2025)》,成功蟬聯“中國獨角獸企業”稱號,智行者董事長兼CEO張德兆受邀出席并參與授牌儀式。
    的頭像 發表于 04-02 16:46 ?1490次閱讀

    士模微電子上榜“中國潛在獨角獸企業”

    2024年10月下旬,長城戰略咨詢發布《中國潛在獨角獸企業研究報告2024》,北京士模微電子有限責任公司入選中國“潛在獨角獸”企業榜單。“獨角獸”指具有發展速度快、數量稀少、備受投資者青睞等屬性
    的頭像 發表于 03-11 14:55 ?1270次閱讀
    士模微電子上榜“中國潛在<b class='flag-5'>獨角獸</b>企業”