国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPGPU市場增長強勁 創(chuàng)新性架構(gòu)大幅提升AI計算效率!

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2022-01-19 11:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)GPU中文叫圖形處理單元,是一種并行處理的硬件,早起只用來渲染復(fù)雜的計算機圖形環(huán)境。隨著技術(shù)進步,GPU不再局限于圖形領(lǐng)域,擴展應(yīng)用到其他計算密集的領(lǐng)域,被稱為GPGPU,成為AI 芯片領(lǐng)域的代表。

GPU具有很好的通用性,同時傳統(tǒng)的架構(gòu)也存在一定局限,比如計算密度低、效率低,如何在保證通用性的情況下,又提高它的計算效率成為業(yè)界關(guān)注的重點。

創(chuàng)新架構(gòu)提高AI計算效率

那么應(yīng)該如何做呢?為了提高GPU的計算效率,GPU知名企業(yè)英偉達(dá)也進行的相應(yīng)的嘗試,即對原來的GPU架構(gòu)進行修改,比如增加專門的張量計算單元、增加片上內(nèi)存器等,這一定程度可以提高AI的計算效率,不過受限于GPU整體架構(gòu),問題并沒有得到很好的解決。

圖:傳統(tǒng)GPU對AI加速的局限體現(xiàn)在哪些方面(圖片來自登臨科技分享)


成立于2017年的登臨科技,從2018年自主研發(fā)創(chuàng)新性的GPU+架構(gòu),一款由軟件定義的、片內(nèi)異構(gòu)的支持并行化計算的架構(gòu)。GPU+架構(gòu)針對AI應(yīng)用,具備和GPU一樣的可編程能力和通用性。同時通過架構(gòu)創(chuàng)新,提供更高的計算密度,更快的計算速度,同時大幅降低對外部帶寬的需求。而這些是傳統(tǒng)GPU芯片無法兼顧的。


由于GPU良好的通用性,在服務(wù)器及云端等使用場景中,會大規(guī)模應(yīng)用 GPU。運行各類神經(jīng)網(wǎng)絡(luò)。大量開源生態(tài)的應(yīng)用、大量客戶定制化的軟件,都是在主流的GPU軟件生態(tài)上完成。如何保持客戶已有的投入,即如何減少客戶的使用成本,也是AI技術(shù)產(chǎn)業(yè)化的重要課題。

怎么做呢?登臨科技在接受電子發(fā)燒友采訪的時候表示,登臨自主創(chuàng)新的GPU+架構(gòu),通過對高效的Tensor引擎和可編程的GPGPU引擎的有機配合,硬件直接兼容CUDA/OpenCL,可無縫接入現(xiàn)有軟件生態(tài),大大降低了客戶的遷移成本。

通過片內(nèi)異構(gòu),GPU+解決了傳統(tǒng)的系統(tǒng)級異構(gòu)計算調(diào)度,數(shù)據(jù)交換的開銷大,以及數(shù)據(jù)的連貫相干性的難題。在整個系統(tǒng)的計算密度極高的基礎(chǔ)上,通過軟件定義,使針對不同神經(jīng)網(wǎng)絡(luò)的應(yīng)用場景,都能達(dá)到硬件性能和能效最大化。

登臨科技表示,通過大規(guī)模客戶實測,在同等功耗下,GPU+的性能可以達(dá)到國際主流產(chǎn)品3倍以上的能效。

打造真正符合市場需求的產(chǎn)品

登臨科技成立以后,一直思考如何制定真正符合市場需求的技術(shù)路線,即上文所談的如何保持客戶已有的投入,減少客戶的使用成本,這是登臨科技制定產(chǎn)品的價值導(dǎo)向。

2018年登臨確定了產(chǎn)品的方向:基于GPGPU的高能效計算,并自主研發(fā)創(chuàng)新的GPU+架構(gòu)。經(jīng)過團隊一年多的工作,于2019年6月,公司完成了首款基于GPU+架構(gòu)的Goldwasser設(shè)計,并mpw流片成功。

2020年6月Goldwasser成功回片通過測試,開始客戶送樣,Goldwasser目前已在成熟的12nm/14nm工藝上實現(xiàn)量產(chǎn)。登臨Goldwasser已于2021年在智慧城市、互聯(lián)網(wǎng)等領(lǐng)域順利實現(xiàn)了商業(yè)化落地,并同時與數(shù)十家客戶在邊緣至云端的不同應(yīng)用場景中進行產(chǎn)品開發(fā)、測試。


登臨科技的Goldwasser 系列產(chǎn)品包括:邊緣計算產(chǎn)品 Goldwasser UL,功率 25-35W,INT8 算力 32-64TOPS;半高半長的服務(wù)器計算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一種全高全長的 Goldwasser XL,輸出 512TOPS 算力。多種規(guī)格的產(chǎn)品,使得客戶可以根據(jù)自身需求分別部署在邊緣側(cè)、云端的各種計算設(shè)備中。

登臨科技方案架構(gòu)總監(jiān)鄭韜此前在某論壇上也介紹過,Goldwasser覆蓋主流系統(tǒng)生態(tài),登臨Hamming軟件開發(fā)包支持主流GPU編程語言,包括CUDA、OpenCL等;適配國內(nèi)外主流服務(wù)器廠家;支持主流國內(nèi)外AI計算框架,包括PyTorch、百度飛漿、TensorFlow等;適配國內(nèi)外主流CPU廠家,包括飛騰、龍芯、英特爾AMD等。

在不同的應(yīng)用場景下,Goldwasser可以支持多種不同的算法實現(xiàn)和落地,如智慧城市、智能交通、語音識別、虛擬客服、智慧工地、智慧車站、機器翻譯、工業(yè)視覺等,場景覆蓋CV、NLP、知識圖譜、信號處理和計算等多個領(lǐng)域。Goldwasser可以同時支持訓(xùn)練和推理。

登臨科技表示,目前Goldwasser正與30多家不同行業(yè)的頭部企業(yè)進行量產(chǎn)導(dǎo)入。同時,登臨科技打通供應(yīng)鏈上下游相關(guān)企業(yè)和合作伙伴,確保產(chǎn)品正常交付。

小結(jié)

當(dāng)前AI技術(shù)正快速發(fā)展,GPGPU呈現(xiàn)出強勁的增長勢頭,根據(jù)有關(guān)數(shù)據(jù)預(yù)測,到2025年,我國GPGPU芯片板卡的市場規(guī)模將達(dá)458億元,年復(fù)合增長率高達(dá)32%,未來市場可觀。

目前國際巨頭占據(jù)大部分市場,與之相比國內(nèi)廠商還存在差距,不過近幾年不少國內(nèi)GPU廠商通過自主創(chuàng)新,在技術(shù)上逐漸取得進展,產(chǎn)品也逐步走向落地商用,比如登臨科技。

另外,對于政府目前重點關(guān)注的降碳增效,登臨科技表示,對計算芯片而言關(guān)鍵指標(biāo)是能效比,而這也是公司產(chǎn)品的最重要的優(yōu)勢之一,登臨將繼續(xù)通過對傳統(tǒng)GPU的架構(gòu)創(chuàng)新,不斷提升異構(gòu)硬件的算力,達(dá)到非常顯著的能效比優(yōu)勢,為降碳和增效做貢獻。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Altair CFD 以技術(shù)賦能工程創(chuàng)新?

    的端到端無縫銜接。具備自動網(wǎng)格劃分、GPU加速、穩(wěn)態(tài)時間行進等功能,其中幾何模型準(zhǔn)備效率較傳統(tǒng)工具提升80%,穩(wěn)態(tài)仿真可在少于100次迭代中快速收斂,大幅縮短仿真周期。4. AI賦能+
    發(fā)表于 02-28 14:47

    Imagination:邊緣AI是半導(dǎo)體市場重要增長引擎,E-Series 架構(gòu)恰逢其時

    2025年半導(dǎo)體市場AI需求爆發(fā)與全產(chǎn)業(yè)鏈復(fù)蘇的雙重推動下,呈現(xiàn)出強勁增長態(tài)勢。以EDA/IP先進方法學(xué)、先進工藝、算力芯片、端側(cè)AI
    的頭像 發(fā)表于 01-08 10:21 ?456次閱讀
    Imagination:邊緣<b class='flag-5'>AI</b>是半導(dǎo)體<b class='flag-5'>市場</b>重要<b class='flag-5'>增長</b>引擎,E-Series <b class='flag-5'>架構(gòu)</b>恰逢其時

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    優(yōu)化計算資源并有效地適應(yīng)任務(wù)的復(fù)雜。 顯著特征: MoE 模型的一個顯著特征是在管理大型數(shù)據(jù)集方面的靈活性較高,它能夠在計算效率小幅降低的情況下,將模型容量擴大上千倍。稀疏門控混合專
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    的時間縮短、效率提升的硬件架構(gòu)非常重要。因此存內(nèi)加速方案,X-Former應(yīng)運而生。它是一種混合存內(nèi)計算架構(gòu),結(jié)合了NVM和基于互補金屬氧化
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    是展望未來的AGI芯片,并探討相關(guān)的發(fā)展和倫理話題。 各章的目錄名稱如下: 第1章 大模型浪潮下,AI芯片的需求與挑戰(zhàn)免費 第2章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu) 第3章
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場晉升新契機?

    、新架構(gòu)不斷涌現(xiàn)。能夠在工作中提出創(chuàng)新的解決方案,推動 AI 芯片性能、功耗、成本等關(guān)鍵指標(biāo)的優(yōu)化,將極大提升在職稱評審中的競爭力。例如,
    發(fā)表于 08-19 08:58

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    創(chuàng)新、應(yīng)用創(chuàng)新、系統(tǒng)創(chuàng)新五個部分,接下來一一解讀。 算法創(chuàng)新 在深度學(xué)習(xí)AI芯片的創(chuàng)新上,書中圍
    發(fā)表于 07-28 13:54

    AI芯片:加速人工智能計算的專用硬件引擎

    處理等應(yīng)用落地的關(guān)鍵硬件基礎(chǔ)。 ? AI芯片的核心技術(shù)特點 ? ? AI芯片的設(shè)計重點在于提升計算效率,主要技術(shù)特點包括: ? 1. ? 并
    的頭像 發(fā)表于 07-09 15:59 ?1577次閱讀

    全球各大品牌利用NVIDIA AI技術(shù)提升運營效率

    歐萊雅、LVMH 集團和雀巢利用 NVIDIA 加速的智能體 AI 和物理 AI大幅提升產(chǎn)品設(shè)計、營銷及物流等方面的運營效率
    的頭像 發(fā)表于 06-19 14:36 ?1204次閱讀

    芯原可擴展的高性能GPGPU-AI計算IP賦能汽車與邊緣服務(wù)器AI解決方案

    芯原股份 (芯原,股票代碼:688521.SH) 日前宣布其 高性能、可擴展的GPGPU-AI計算IP的最新進展,這些IP現(xiàn)已為新一代汽車電子和邊緣服務(wù)器應(yīng)用提供強勁賦能 。通過將可編程并行
    的頭像 發(fā)表于 06-16 10:44 ?1366次閱讀

    Intel-Altera FPGA:通信行業(yè)的加速引擎,開啟高速互聯(lián)新時代

    ,強化與AI、5G等技術(shù)的融合,同時通過獨立運營提升戰(zhàn)略專注度。市場機遇:AI、邊緣計算等領(lǐng)域的爆發(fā)式
    發(fā)表于 04-25 10:19

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應(yīng)用開發(fā)效率提升

    HarmonyOS應(yīng)用的AI智能輔助開發(fā)助手——CodeGenie,該AI助手深度集成在DevEco Studio中,提供鴻蒙知識智能問答、鴻蒙ArkTS代碼補全/生成和萬能卡片生成等功能,提升了開發(fā)
    發(fā)表于 04-18 14:43

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的端側(cè)部署,Token產(chǎn)生速度提升了40%,讓端側(cè)大模型擁有更高的計算效率和推理性能,使端側(cè)AI交互響應(yīng)更及時,用戶體驗更貼心。 聯(lián)發(fā)科還與vivo和全民K歌攜手,借助天璣
    發(fā)表于 04-13 19:52

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)

    隨著人工智能(AI)技術(shù)的迅猛發(fā)展,數(shù)據(jù)中心面臨著前所未有的計算和網(wǎng)絡(luò)壓力。從大語言模型(LLM)訓(xùn)練到生成式AI應(yīng)用,海量數(shù)據(jù)處理需求推動了網(wǎng)絡(luò)帶寬的快速增長。在此背景下,800G網(wǎng)
    發(fā)表于 03-25 17:35

    DeepSeek推動AI算力需求:800G光模塊的關(guān)鍵作用

    數(shù)據(jù)傳輸速率,減少帶寬瓶頸,成為數(shù)據(jù)中心和AI集群架構(gòu)優(yōu)化的重點。光模塊速率的躍升不僅提升了傳輸效率,也為大規(guī)模并行計算任務(wù)提供了必要的帶寬
    發(fā)表于 03-25 12:00