国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云天勵飛IPU成功流片,比特大陸第二代AI芯片曝光!

羅欣 ? 來源:芯智訊 ? 作者:佚名 ? 2018-08-22 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能市場的火爆,越來越多的芯片廠商開始推出AI芯片,與此同時很多AI算法廠商也開始紛紛推出自己的AI芯片。一時間AI芯片已成為當下最為市場最為關注的焦點。

早在去年11月,礦機芯片廠商比特大陸就推出了自己的首款人工智能芯片BM1680;今年年初,國內的聲紋識別廠商Speakin也曝光了自己的即將推出的聲紋識別模組;今年4月,國內的人臉識別廠商云天勵飛也確認將會在年內推出自己的AI芯片;5月16日,云知聲發布首款面向物聯網領域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,出門問問發布旗下首款AI語音芯片模組問芯Mobvoi A1;7月2日,Rokid發布旗下AI語音專用SoC芯片KAMINO18;而在同一時間,語音識別廠商思必馳CEO高始興也確認公司正在打造AI語音ASIC芯片,預計今年下半年流片。

近日,云天勵飛首款自主知識產權的AI芯片IPU已成功流片。與此同時,比特大陸的第二代AI芯片BM1682正式曝光。下面我們來看詳細介紹:

云天勵飛自主產權AI芯片IPU已于16日流片

今年4月25日,在云天勵飛召開的芯片專題媒體溝通會上,云天勵飛聯合創始人、CEO陳寧提到,云天勵飛正在研發的一款面向嵌入式端的邊緣人工智能芯片IPU (inteligence processor unit)已取得階段性成果,計劃今年年中流片,明年上半年正式商用。時隔僅不到4個月之后,8月16日,云天勵飛的IPU已成功流片。

云天勵飛IPU聚焦嵌入式視覺智能終端

據介紹,云天勵飛AI芯片的技術路線是通過設計一系列面向多層神經網絡的可編程處理器,應對人工智能算法的快速迭代。“我們首創的‘自適應云+端’AI系統架構,可通過云端邏輯控制終端芯片,自動更新終端芯片的算法和功能。”據云天勵飛聯合創始人、CEO陳寧介紹,云天勵飛自主研發的專用深度學習神經網絡處理器芯片,采用ASIP設計思路,提供ASIC級別高性能和低功耗,也能提供處理器級別的指令集靈活性。同時,采用異構計算多核SOC架構,集成多處理器單元,并行分布式處理與集中控制系統。

與傳統芯片迭代速度相比,AI芯片迭代更快。“目前來說,算法每半個月迭代一次,AI芯片則要同步迭代,而傳統芯片的迭代是按年計算。現有的CPUGPU無法滿足嵌入式端視覺AI應用。”據云天勵飛研發副總李愛軍表示,通用CPU在神經網絡加速上速度慢,性能上滿足不了對嵌入式端的需求;GPU性能是夠的,但功耗高、成本居高不下。“所以,我們覺得有必要去研究適應新型神經網絡的深度學習處理器架構芯片。”而云天勵飛研發的芯片是面向嵌入式端的邊緣計算人工智能芯片,專注智能視覺,聚焦在安防、智能商業等領域的場景應用。

擁有國內頂尖ASIP矢量處理器芯片設計團隊

“云天勵飛做芯片不是臨時起意,而是從公司創立之初就開始了芯片的布局。”據陳寧介紹,云天勵飛早在2014年就有了完整的“機器學習與視覺智能處理器”AI芯片解決方案,并獲得2015年深圳孔雀團隊第一名。

在當時,云天勵飛的芯片研發團隊是國內AI芯片界唯一有芯片商用經驗的團隊,陳寧本人是中國第一款商用矢量處理器芯片的設計者,而芯片團隊主導者李愛軍是原中興通訊手機芯片的研發負責人,主導研發了國內第一顆28nm手機芯片商用(2010)和國內首款LTE多模手機芯片商用。

陳寧說,“我們的芯片研發團隊是國內頂尖的ASIP矢量處理器芯片設計團隊,主要的骨干團隊成員有豐富的矢量處理器、復雜SoC芯片設計經驗,且平均設計經驗超過10年。”

IPU具有高能低耗、可編程、可云端升級等特點

據了解,云天勵飛在2016年完成了第一代深度學習神經網絡處理器NNP100的研制,并基于FPGA載體實現商用。

李愛軍介紹說,NNP100深度結合云天勵飛自研深度學習算法,與自研神經網絡模型深度耦合,具有強大的運算處理能力以及靈活的模型pooling能力,設計上支持PE數量根據場景需求任意擴展和裁剪,非常靈活,同時它又具有高性能、低時延和低功耗技術優勢。

“相比之前的應用效果,采用NNP100后FPGA加速卡,計算性能相比GPU提升2倍,功耗減低5 倍,時延減低100倍。”李愛軍介紹,目前NNP100應用在云天勵飛的DeepEye100智能盒子和DeepEye200服務器加速卡產品上。基于NNP100的技術基礎,云天勵飛已經在研發第二代深度學習神經網絡處理器NNP200,并取得階段性成果。NNP200將集成于云天勵飛IPU (inteligence processor unit)芯片上,并用于智能終端產品。

據介紹,云天勵飛的視覺AI芯片具有2Tops/W的高能量效率。與Nvidia開源的nvDLA相比,相同運算力下,在很小的內存帶寬下,算法模型效率可以提高18倍。與麒麟970相比,相同運算力下,比970的性能提高4.4倍。

“云天的芯片除了高能低耗的優勢之外,還能實現可編程,遠程一鍵升級。芯片可同時處理多路高清視頻,此外,通過片間級聯還可進行擴展。”李愛軍說,多芯片級聯,相當于搭積木一樣,一顆一顆之間通過板級互聯進行擴展。通過級聯擴展最多可以同時處理64路視頻。

“我們采用業界領先的22nm工藝,工藝的性能、功耗、面積經過仿真、分析、比對,對比業界主流的28nm工藝,都具有一定優勢,性能提升約10%,功耗降低約15%,面積減小15%-20%。”陳寧還提到,云天勵飛的IPU芯片計劃在今年年中實現流片,并在明年上半年推向商用,最終通過模式創新,打造一個開放賦能的芯片平臺。

云天IPU最大亮點——對場景理解更為深刻

相比傳統的芯片,AI芯片更注重“從場景到算法,從算法到芯片”。正因為不同于以往從硬件出發的思路,AI芯片的行業形態和商業模式正在發生著變化。目前,AI芯片的應用場景主要集中在安防、智能家居消費電子自動駕駛云計算、智慧城市等行業。

“由于目前還不存在適用于所有通用算法的嵌入式AI芯片,確定芯片的應用場景就顯得尤為重要。”陳寧提到,過往三年,云天勵飛深耕安防領域,最先提出了針對安防行業“云+端”的解決方案,真正做到將AI技術落地于垂直場景。

來源: 智能科技熱點

深度分析:比特大陸二代AI芯片性能躍升,專注安防視頻

近日,坊間傳聞許久的比特大陸第二代人工智能芯片BM1682,正式出現在其官網頁面。根據比特大陸一貫神秘務實的風格,相信基于BM1682的板卡、服務器也已經備好了。筆者在芯片行業浸淫十多年,嘗試根據比特大陸官網公布的產品白皮書,來分析一下這兩代人工智能芯片之間的異同,嘗試談一談比特大陸在人工智能領域的意圖和野心。

2017年第4季度,比特大陸正式推出了其人工智能品牌算豐(SOPHON),發布了全球首款公開發售的TPU(Tensor Processing Unit張量計算單元)芯片BM1680,專門用于人工智能中的深度學習加速。時隔不足一年,2018年3月,比特大陸又推出其第二款TPU芯片BM1682,根據初步披露的資料顯示,BM1682是一塊專門用于圖像/視頻處理方向的人工智能芯片。

BM1682與BM1680使用了相同的深度學習算法的硬件加速模塊,但相比BM1680而言,BM1682具有更強大的深度學習算法執行能力,此外BM1682還增加了視頻處理子模塊,以及適用于具體應用場景的諸多功能模塊。

下面我們對其兩者進行一個具體的對比評測:

頂層架構——BM1682定位更細分

從頂層架構可以看出,BM1680和BM1682均集成了深度學習算法所用到的核心模塊NPUs。NPU是比特大陸自行研發的深度學習算法硬件加速器,用于加速深度學習算法的執行速度。

從頂層架構圖上可以看到,BM1680比BM1682額外集成了高度定制的BMDNN Chip Link Subsystem。該子模塊可以在高速SerDes上提供穩定、靈活、低延遲的鏈路。用戶可以通過該鏈路將多個BM1680芯片連接成一個統一的整體,使其協同工作,大大提高系統的運算能力。BM1682并沒有集成此模塊,這大概是基于BM1682專一化的市場應用定位,以及處理速度足夠滿足用戶對圖像/視頻處理需求而考慮的。

從頂層架構圖上可以看到與BM1680相比,BM1682芯片的整體架構發生了不小的變化,其定位則更加細分明確。從右上角增加的Video Subsystem模塊可以明確看出,該款芯片定位于圖像/視頻處理方向。

模塊細節——BM1682設計更豐富

BM1682的深度學習加速的核心功能模塊與BM1680是相同的。兩款芯片均包含了深度學習的核心單元—硬件加速器NPU Subsystem。兩者的NPU Subsystem均各自集成了64個NPU單元,統一由NPU Schedule Engine進行調度(BM1682架構圖中未體現),最大化的提高了NPUs的效率,加快了深度學習算法inference (推演)與training (訓練)的速度。根據初步資料顯示,兩者在MCU的配置上是有些許差異的,但由于資料不全面,故無法評斷出兩者的MCU處理能力的差別。

除了深度學習算法硬件加速模塊(NPUs)、用于高速連接其余BM1680的Chip Link模塊之外,BM1680還提供了4個獨立的DDR4通道,最高支持16GB的DDR3 或 DDR4 DRAM拓展,用于高速數據緩存讀取,以提高系統的執行速度。BM1680還加入了Global DMA模塊。DMA用于提供數據搬移功能,這可以在大塊數據進行讀寫搬移時不占用MCU的資源,如在DDR4 的RAM中搬移數據時。對于大數據量的深度學習系統,DMA可以極大的提高效率。BM1680的Peripheral Subsystem 提供了UART、SPI、IIC與GPIO等接口,用于外接傳感器,或與外界進行通訊、記錄、控制等操作。這些接口都屬于通用接口,可見BM1680的定位就是通用深度學習芯片,在外設上沒有給與太多支持。

從架構圖看,BM1682明顯復雜了很多。其額外增加了AP (Application Processor) Subsystem和Video Subsystem(視頻處理系統)。Video Subsystem(視頻子系統)則主要專注于視頻預處理的相關任務。

BM1682的Video Subsystem提供了2個H.264視頻解碼器,1個H.265解碼器。H.264 /H.265均為視頻編碼方式,也是比較流行的視頻編碼的兩種方式。相對而言,H.265視頻編碼比H.264具有更高的壓縮比、更強的網絡糾錯適應能力,但考慮到現階段在安防、智能家居和互聯網視頻領域中仍然還是以H.264編碼的視頻和視頻設備為主,兩者2:1的譯碼器數量在視頻支持類型和解碼帶寬做了一個合適的權衡。比較貼心的是,BM1682提供了Video Post-Processing功能,該子模塊用于對采用H.264或H.265編碼的視頻進行渲染處理,這些渲染處理主要包括顏色空間轉換、視頻剪裁、縮放操作、仿射變換、多幀拼接等常規操作。經過Video Post-Processing對外界進入的視頻數據進行硬件加速預處理后,Video Subsystem會將處理后數據通過總線傳輸給NPUs、DRAM、AP System或外接存儲設備,然后進行后續的深度學習處理等操作。

BM1682提供了豐富的外界交互接口,如高速接口PCIE、以太網SDIO3.0、WIFI等。BM1682將數據處理完畢后可以很方便的通過PCIE接口、以太網接口、或者WIFI接口將數據傳輸到總服務器。若是條件限制沒有網絡接入點,用戶可以選擇通過接入SDIO3.0的eMMC存儲器或是PCIE式存儲器將數據存儲到本地存儲裝置。可見,BM1682對其可能的應用場景做了充分的考慮并給予了硬件支持,用戶可以根據需求,靈活方便的進行配置。

Peripheral Subsystem方面,BM1682比BM1680要豐富的多,這大大方便了用戶進行系統拓展,如添加額外傳感器等。BM1682的外設包括2個SPI接口、4個UART接口、4個IIC、4路PWM生成器、一塊內嵌式SPI Flash、WDG、Timer、GPIO、PVT Sensor、Top Reg、Efuse、ROM。由給出的外設可以看到,BM1682的設計考慮了配置、存儲、對外界系統實時控制、以及加密保護等功能,極大提高了系統的靈活性、安全性,省卻了用戶額外添加相關功能的開發成本。

性能分析——BM1682極大提升

NPU深度學習硬件加速器是人工智能的核心。兩者NPUs模塊集成了64個NPUs單元,通過NPU Schedule Engine進行調度。BM1682中每個NPU含有32個EUs,BM1680未知。根據BM1680、BM1682數據手冊顯示,單片BM1680單精度運算速度為2TFLops;單片BM1682單精度運算速度為3TFLops。BM1682的單片運算速度高出BM1680 50%。

BM1680單片的運行速度低于BM1682,但BM1680支持級聯工作模式,數個BM1680可以通過高速的Chip Link Subsystem組成一個集群式的系統,進行更高處理量的運算處理任務。BM1682不具備級聯功能。下圖為BM1680芯片的級聯連接示意圖。

級聯方式:每個Node代表一個BM1680

電學方面,根據兩者的數據手冊顯示:滿載工作時BM1680的TPD(Thermal Design Power熱設計功耗)為41W;:滿載工作時BM1682的TPD小于50W。從功耗角度分析,BM1680的2TFlops的NPUs速度應該是有所保留的。

開發生態——兩代芯片都很到位

BM1680、BM1682均支持的主流的CNN/RNN/DNN深度學習架構,通過這兩款TPU芯片進行硬件加速,可以極大的提高深度學習算法的執行速度。當然,BM1680和BM1682也可以通過基礎的矩陣運算進行深度學習的模型、架構的搭建。

在開發生態方面,兩款芯片的支持也是很到位的。BM1680、BM1682均對后端用戶提供SDK;如果用戶需要進行深度優化以獲取算法最優性能,可以聯系廠家獲得相關教學支持。

應用領域——BM1682更專注圖像/視頻處理

由前述分析可知,BM1680為通用性人工智能芯片,其應用方向沒有偏向性,芯片內部主要集成了深度學習算法所需要的基本模塊,應用各種人工智能的深度學習算法,通過添加相應的外圍電路模塊,BM1680可以搭建成適用于任一個領域的深度學習系統——像圖片識別、自然語言處理、文本處理、金融、醫學等等大小領域均可選擇該芯片實現。BM1680更加具有靈活性。而且,BM1680可以進行級聯,所以對于需要處理巨大數據量的人工智能深度學習系統,BM1680尤為合適。像企業級應用、海量數據處理等方面,通過簡單的級聯BM1680就可以獲取相匹配的計算能力,靈活而強大。

而BM1682則是一個升級版的BM1680并配備了專門用于視頻處理的集成系統,整個BM1682芯片搭載了視頻處理所需要的全部核心模塊,以及對其具體應用場景適應性的輔助模塊。BM1682對于需要進行圖像/視頻處理的市場應用可謂是十分便捷了。BM1682的輔助功能配置模塊自帶有線與無線網絡功能,對于視頻監控方向的市場應用十分方便,無線功能更是省略了網線布線的繁瑣施工,并且可用于實現遠程監控。對于一些沒有網絡的場合,如科研領域的野外視頻收集處理、閉路視頻監控等,BM1682可以輕松的添加外置存儲裝置進行數據備份收集。BM1682作為圖像/視頻方向深度學習的SoC片上系統,市場前景很是廣闊,這款新品還是很值得期待的。

作者 | 中國科學院微電子研究所 劍白

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI芯片
    +關注

    關注

    17

    文章

    2128

    瀏覽量

    36780
  • 云天勵飛
    +關注

    關注

    0

    文章

    182

    瀏覽量

    12654
  • 比特大陸
    +關注

    關注

    6

    文章

    145

    瀏覽量

    30948
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    云天正式舉辦大算力芯片戰略前瞻會

    2月3日,云天正式舉辦“大算力芯片戰略前瞻會”,首次對外公布未來三年的大算力 AI 推理芯片
    的頭像 發表于 02-06 17:23 ?3662次閱讀

    新品 | CoolSiC? MOSFET 650V第二代產品,新增75m?型號

    新品CoolSiCMOSFET650V第二代產品,新增75m?型號CoolSiCMOSFET650V第二代器件基于性能卓越的第一溝槽SiCMOSFET技術打造,通過提升性能、增強設計靈活性及魯棒性
    的頭像 發表于 01-12 17:03 ?315次閱讀
    新品 | CoolSiC? MOSFET 650V<b class='flag-5'>第二代</b>產品,新增75m?型號

    TeledyneLeCroy發布第二代DisplayPort 2.1 PHY合規測試與調試解決方案

    TeledyneLeCoy(Teledyne子公司)宣布第二代QualiPHY 2自動化合規測試框架現已支持DisplayPort 2.1物理層(PHY)合規性測試。
    的頭像 發表于 12-26 11:04 ?1582次閱讀

    云天AI推理芯片如何賦能千行百業

    11月26日,云天會客廳第二期生態沙龍暨深商聯高科技高成長創新營走進上市公司活動圓滿舉辦。來自深圳科技領域的多位企業負責人齊聚云天,共同
    的頭像 發表于 12-03 13:58 ?627次閱讀

    新品 | 采用.XT擴散焊和第二代1200V SiC MOSFET的Easy C系列

    新品采用.XT擴散焊和第二代1200VSiCMOSFET的EasyC系列EasyPACK2C1200V8mΩ三電平模塊、EasyPACK2C1200V8mΩ四單元模塊以及
    的頭像 發表于 11-24 17:05 ?1467次閱讀
    新品 | 采用.XT擴散焊和<b class='flag-5'>第二代</b>1200V SiC MOSFET的Easy C系列

    新品 | 第二代CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回焊封裝

    新品第二代CoolSiCMOSFETG21400V,TO-247PLUS-4回焊封裝采用TO-247PLUS-4回焊封裝的CoolSiCMOSFETG21400V功率器件,是電動汽車充電、儲能
    的頭像 發表于 11-17 17:02 ?1348次閱讀
    新品 | <b class='flag-5'>第二代</b>CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回<b class='flag-5'>流</b>焊封裝

    云天與金蝶達成戰略合作

    11月4日,在2025金蝶全球創見者大會上,云天與金蝶簽署戰略合作協議。
    的頭像 發表于 11-05 18:09 ?1677次閱讀

    云天飛出席第二屆灣區半導體產業投融資戰略發展論壇

    在2025灣芯展同期舉辦的第二屆灣區半導體產業投融資戰略發展論壇上,云天董事長兼CEO陳寧受邀出席并發表演講。
    的頭像 發表于 10-27 10:02 ?721次閱讀

    云天正式加入OISA生態

    近日,云天正式加入 OISA 生態,攜手產業伙伴共同推動國產 AI 芯片互聯體系建設,為中國算力生態注入新的動力。
    的頭像 發表于 10-11 13:59 ?648次閱讀

    云天亮相2025全球AI芯片峰會

    9 月 17 日,全球 AI 芯片峰會在上海舉行,云天董事長兼 CEO 陳寧出席并發表演講。
    的頭像 發表于 09-17 17:56 ?1372次閱讀

    類比半導體推出全新第二代高邊開關芯片HD80012

    致力于提供高品質汽車驅動芯片和高品質工業模擬芯片供應商上海類比半導體技術有限公司(下稱“類比半導體”或“類比”)宣布推出全新第二代高邊開關芯片HD80012,單通道低內阻1.2mΩ產品
    的頭像 發表于 07-02 15:19 ?1321次閱讀
    類比半導體推出全新<b class='flag-5'>第二代</b>高邊開關<b class='flag-5'>芯片</b>HD80012

    AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統實現單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產品是對 Versal 產品組合的擴展,可為嵌入式系統實現單芯片智能。
    的頭像 發表于 06-11 09:59 ?1859次閱讀

    恩智浦推出第二代OrangeBox車規級開發平臺

    第二代OrangeBox開發平臺集成AI功能、后量子加密技術及內置軟件定義網絡的能力,應對快速演變的信息安全威脅。
    的頭像 發表于 05-27 14:25 ?1389次閱讀

    類比半導體推出全新第二代高邊開關芯片HD8004

    致力于提供高品質汽車驅動芯片和高品質工業模擬芯片供應商上海類比半導體技術有限公司(下稱“類比半導體”或“類比”)宣布推出全新第二代高邊開關芯片HD8004,單通道低內阻4.3mΩ產品。
    的頭像 發表于 05-21 18:04 ?1342次閱讀
    類比半導體推出全新<b class='flag-5'>第二代</b>高邊開關<b class='flag-5'>芯片</b>HD8004

    第二代AMD Versal Premium系列SoC滿足各種CXL應用需求

    第二代 AMD Versal Premium 系列自適應 SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統。該系列自適應 SoC 旨在滿足從簡單到復雜的各種 CXL 應用需求
    的頭像 發表于 04-24 14:52 ?1261次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Premium系列SoC滿足各種CXL應用需求