国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

匠人精神是怎么用在FPGA存儲(chǔ)器

OpenFPGA ? 來(lái)源:OpenFPGA ? 作者:OpenFPGA ? 2022-06-10 09:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

曾經(jīng)看到過(guò)一部紅極一時(shí)的紀(jì)錄片《壽司之神》。

小野二郎是世界上年紀(jì)最大的米其林三星主廚,老爺子一輩子就鉆研了一件事:壽司。

在垂直的領(lǐng)域做到世界頂級(jí),靠的就是匠人精神。


如果我們拋開(kāi)那些外在的包裝和炒作,沉淀下來(lái)去觀察他做的事情,就不難發(fā)現(xiàn)匠人精神的本質(zhì),其實(shí)就是專業(yè)和堅(jiān)持。

捏壽司是這樣,各行各業(yè)也是這樣,芯片行業(yè)也不例外。

推動(dòng)行業(yè)發(fā)展的,或許并不是圖靈那樣可遇不可求的天才,而是更多『匠人』對(duì)極致的追求,特別是他們?cè)谀硞€(gè)小領(lǐng)域不斷地深耕、優(yōu)化、提升

打個(gè)最簡(jiǎn)單的比方,天才創(chuàng)造了開(kāi)天辟地的理論,就像是1,但需要無(wú)數(shù)匠人在后面補(bǔ)上0,才能讓這個(gè)數(shù)變的越來(lái)越大。

芯片行業(yè)也不例外。

當(dāng)FPGA在1984年誕生的時(shí)候,就像是一個(gè)不起眼的1,沒(méi)有人會(huì)想到這將成為一個(gè)價(jià)值幾十億美元的產(chǎn)業(yè)。不到四十年的時(shí)間,后面加了十個(gè)0

這就是指數(shù)級(jí)的爆發(fā)。

摩爾定律描述的就是指數(shù)級(jí)的規(guī)律,而FPGA一直都是體現(xiàn)摩爾定律的最好例子。接下來(lái)我們就從FPGA存儲(chǔ)器這個(gè)小領(lǐng)域,看看匠人精神是怎么用在這里的。

1、新型存儲(chǔ)架構(gòu)

英特爾總結(jié)過(guò),F(xiàn)PGA現(xiàn)在和未來(lái)的發(fā)展趨勢(shì)只有三個(gè):

傳輸更快,存儲(chǔ)更多,計(jì)算更廣。

Move fast, Store more, Process everything.

所以,就像不要覺(jué)得壽司只是酸米飯配芥末一樣,再也不要覺(jué)得FPGA只是用來(lái)做芯片原型驗(yàn)證的了。FPGA早就被用作高能效的硬件加速單元,去加速你能想到的所有應(yīng)用了。

FPGA之所以有這樣的能力,是由它本身的結(jié)構(gòu)決定的。比如FPGA有著很強(qiáng)的硬件并行性,能像GPU那樣進(jìn)行并行運(yùn)算,但功耗卻低很多;它還能靈活地調(diào)整數(shù)據(jù)的精度,讓神經(jīng)網(wǎng)絡(luò)的壓縮和優(yōu)化成為現(xiàn)實(shí)。

同樣重要的是,FPGA能提供極高的內(nèi)存帶寬、同時(shí)兼顧計(jì)算的效率,從而解決很多應(yīng)用都存在的內(nèi)存瓶頸問(wèn)題。

而存儲(chǔ),就是FPGA上最體現(xiàn)「匠人」功力的地方。

傳統(tǒng)的FPGA存儲(chǔ)單元并不是只有一種結(jié)構(gòu),而是分成下面兩類:

片上內(nèi)存:如M20K、MLAB等

片外內(nèi)存:如DDR5、LPDDR5等

片上內(nèi)存速度最快、容量最小、造價(jià)最高;片外內(nèi)存速度慢、容量大、造價(jià)低。

這樣的結(jié)構(gòu),并不是某個(gè)天才一拍腦門想出來(lái)的。最早的FPGA只支持片上內(nèi)存。但是隨著需要處理的數(shù)據(jù)越來(lái)越多,就慢慢加入了對(duì)片外內(nèi)存的支持,并且逐漸成為了主流FPGA的標(biāo)配。

匠人精神的本質(zhì),就是不斷發(fā)現(xiàn)問(wèn)題、解決問(wèn)題、并且極致優(yōu)化的過(guò)程。

在這個(gè)過(guò)程中人們逐漸發(fā)現(xiàn),片上和片外這兩種內(nèi)存之間,仍然存在著一個(gè)巨大而關(guān)鍵的缺口:對(duì)于很多數(shù)據(jù)密集型的應(yīng)用,它們的數(shù)據(jù)量比片上內(nèi)存的容量大得多,但對(duì)于帶寬的需求又比片外內(nèi)存能提供的大得多

這時(shí)出現(xiàn)了第三種內(nèi)存類型:封裝內(nèi)存。這種內(nèi)存的最典型代表,就是HBM。

7f155a12-e855-11ec-ba43-dac502259ad0.png

典型的存儲(chǔ)層次結(jié)構(gòu)

它之所以叫「封裝內(nèi)存」,是因?yàn)閮?nèi)存顆粒與FPGA被集成在同一個(gè)芯片封裝里了。比如在英特爾最新的Agilex M系列FPGA里,就在芯片的上下兩側(cè)通過(guò)EMIB技術(shù)集成了兩個(gè)HBM2e,這也是業(yè)界第一個(gè)集成了HBM2e高帶寬存儲(chǔ)器的FPGA。這樣不僅減小了芯片的尺寸,還能進(jìn)一步降低功耗和數(shù)據(jù)傳輸?shù)臅r(shí)延。

7f4567fc-e855-11ec-ba43-dac502259ad0.png

英特爾Agilex-M FPGA平面圖

一個(gè)有趣的小知識(shí),Agilex M的“M”,就是Memory存儲(chǔ)器的意思。也就是說(shuō),Agilex M就是專門為高性能存儲(chǔ)而優(yōu)化的FPGA芯片。

和傳統(tǒng)的芯片結(jié)構(gòu)不同,HBM2e是一種三維結(jié)構(gòu)。如果說(shuō)傳統(tǒng)芯片是平房,那么HBM2e就是大樓。所以在容量這個(gè)維度,HBM2e秒殺片上內(nèi)存。比如它可以包含4層或8層,每層提供2GB內(nèi)存,再考慮到一個(gè)Agilex M里包含兩個(gè)HBM2e,這樣FPGA就能提供高達(dá)32GB的內(nèi)存容量,比片上內(nèi)存多兩個(gè)數(shù)量級(jí)

從內(nèi)存帶寬這個(gè)維度來(lái)看,每個(gè)HBM2e能提供410Gbps的內(nèi)存帶寬,比業(yè)界前沿的DDR5和GDDR6分別高18倍、和高7倍,比更加“主流”的DDR4等等更不知道要高到哪里去了。

有了HBM,看起來(lái)存儲(chǔ)的問(wèn)題已經(jīng)解決了?還遠(yuǎn)遠(yuǎn)沒(méi)有:HBM只是第一步。

2、新型非易失性存儲(chǔ)

對(duì)于片外內(nèi)存,新的問(wèn)題又出現(xiàn)了。對(duì)于很多應(yīng)用來(lái)說(shuō),DDR最大的問(wèn)題并不是慢,而是斷電后數(shù)據(jù)會(huì)消失。這時(shí)人們就不得不采用閃存這樣的“非易失性”存儲(chǔ),來(lái)保存那些關(guān)鍵數(shù)據(jù)。但硬幣的另一面,是閃存的性能比DDR還要低。

為了解決這個(gè)問(wèn)題,英特爾提供了一種名叫“傲騰”的新型存儲(chǔ)介質(zhì),這種存儲(chǔ)級(jí)內(nèi)存其存儲(chǔ)密度比普通內(nèi)存高,但存取速度又比閃存快。更重要的是,傲騰技術(shù)作為一種持久內(nèi)存的形態(tài)存在時(shí),它獨(dú)有的非易失性,使得它里面存的數(shù)據(jù)在斷電后并不會(huì)消失。

DRAM 內(nèi)存相比,持久內(nèi)存具有更經(jīng)濟(jì)的價(jià)格和更大的容量,和固態(tài)盤相比則擁有更優(yōu)的數(shù)據(jù)響應(yīng)速度和傳輸速度(接近 DRAM 內(nèi)存)。正因于此,傲騰也逐漸成為了很多高性能應(yīng)用里的關(guān)鍵存儲(chǔ)單元,多用來(lái)做內(nèi)存的大補(bǔ)充或者為內(nèi)存密集型應(yīng)用和延時(shí)敏感型應(yīng)用服務(wù)。

3、片上網(wǎng)絡(luò),終于來(lái)了

同樣還在進(jìn)化的,是FPGA的芯片架構(gòu)。之前的文章里介紹過(guò),Agilex FPGA對(duì)芯片布局進(jìn)行了大修,把各種I/O接口和存儲(chǔ)單元都移到了芯片的上下兩端,把各種高速收發(fā)器放在了芯片的左右兩端,這樣芯片中間就成了一個(gè)像足球場(chǎng)一樣的特別平整的結(jié)構(gòu)。之前開(kāi)一個(gè)大腳會(huì)踢到各種模塊單元,數(shù)據(jù)跑起來(lái)自然就慢。現(xiàn)在一馬平川,沒(méi)有擋路的東西了,數(shù)據(jù)跑起來(lái)就快多了。

可以說(shuō),這已經(jīng)是近幾年來(lái)FPGA架構(gòu)上最有創(chuàng)意的嘗試了。但你以為這樣就完了嗎?

Agilex M最大的架構(gòu)變化,就是引入了片上網(wǎng)絡(luò)Network-on-Chip。這就像在城市規(guī)劃里,不僅有道路交通,還有軌道交通。在軌道上運(yùn)行的地鐵或城鐵,不僅速度可以更快,還能運(yùn)更多的人。更重要的是,軌道可以建在地上或者地下,不影響在路上跑的汽車自行車摩托車。

7f78d9d4-e855-11ec-ba43-dac502259ad0.png

Agilex-M的片上網(wǎng)絡(luò)NoC結(jié)構(gòu)示意圖

Agilex M的片上網(wǎng)絡(luò)專門為存儲(chǔ)設(shè)計(jì),也就是說(shuō),這是一趟專列

有了片上網(wǎng)絡(luò),F(xiàn)PGA和各種內(nèi)存之間的數(shù)據(jù)傳輸就不用經(jīng)過(guò)FPGA的路由資源了。HBM2e通過(guò)UIB接口連接片上網(wǎng)絡(luò)、DDR和傲騰這些片外內(nèi)存則通過(guò)IO96子系統(tǒng)連接片上網(wǎng)絡(luò),并且可以實(shí)現(xiàn)7.52Tbps的總帶寬。

4、其他架構(gòu)優(yōu)化

除了片上網(wǎng)絡(luò),Agilex M還有很多其他的架構(gòu)優(yōu)化。I/O方面,它的收發(fā)器帶寬可以達(dá)到116Gbps,可以支持CXL、PCIe Gen5、400G以太網(wǎng)等等這些數(shù)據(jù)中心網(wǎng)絡(luò)通信的最新協(xié)議和接口。

計(jì)算性能方面,Agilex M集成了高達(dá)12300個(gè)可變精度DSP模塊,可以支持高達(dá)18.5TFLOPS的單精度浮點(diǎn)運(yùn)算、37TFLOPS的半精度浮點(diǎn)運(yùn)算、以及88.6TOPS的INT8運(yùn)算。

結(jié)語(yǔ)

作為專門針對(duì)存儲(chǔ)性能進(jìn)行優(yōu)化的FPGA,英特爾 Agilex M已經(jīng)把優(yōu)化做到了極致。這樣的優(yōu)化方式和思路其實(shí)有著很強(qiáng)的普適意義:它并不是由某個(gè)天才創(chuàng)造出來(lái)的突破性成果,而是在各種問(wèn)題的驅(qū)動(dòng)下,一步一步發(fā)展起來(lái)的,然后靠一個(gè)個(gè)擁有「匠人精神」工程師的專注與積累,達(dá)到最后的結(jié)果。

在大多數(shù)情況下,這種方式更加現(xiàn)實(shí),也更加有效。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22412

    瀏覽量

    636374
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54010

    瀏覽量

    466151
  • 存儲(chǔ)器
    +關(guān)注

    關(guān)注

    39

    文章

    7739

    瀏覽量

    171679

原文標(biāo)題:為什么芯片設(shè)計(jì)也需要「匠人精神」?

文章出處:【微信號(hào):Open_FPGA,微信公眾號(hào):OpenFPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【案例5.1】存儲(chǔ)器選型的考慮要點(diǎn)

    【案例5.1】存儲(chǔ)器選型的考慮要點(diǎn)某設(shè)計(jì),用戶接口數(shù)據(jù)傳輸速率為10Gbps,每8個(gè)字節(jié)的數(shù)據(jù)對(duì)應(yīng)一次查表需求,數(shù)據(jù)表存儲(chǔ)在由DDR4SDRAM組成的存儲(chǔ)器中。工程師需綜合考慮各方面要求,進(jìn)行
    的頭像 發(fā)表于 03-04 17:20 ?202次閱讀
    【案例5.1】<b class='flag-5'>存儲(chǔ)器</b>選型的考慮要點(diǎn)

    FIFO存儲(chǔ)器的種類、IP配置及應(yīng)用

    FIRST IN FIRST OUT (先入先出)。顧名思義,F(xiàn)IFO是一個(gè)數(shù)據(jù)具有先進(jìn)先出的存儲(chǔ)器
    的頭像 發(fā)表于 01-13 15:15 ?379次閱讀
    FIFO<b class='flag-5'>存儲(chǔ)器</b>的種類、IP配置及應(yīng)用

    瑞薩RA系列FSP庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南之常用存儲(chǔ)器介紹

    存儲(chǔ)器是計(jì)算機(jī)結(jié)構(gòu)的重要組成部分。存儲(chǔ)器是用來(lái)存儲(chǔ)程序代碼和數(shù)據(jù)的部件,有了存儲(chǔ)器計(jì)算機(jī)才具有記憶功能。基本的存儲(chǔ)器種類見(jiàn)圖21_1。
    的頭像 發(fā)表于 01-12 06:21 ?7212次閱讀
    瑞薩RA系列FSP庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南之常用<b class='flag-5'>存儲(chǔ)器</b>介紹

    DDR SDRAM是什么存儲(chǔ)器(雙數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器介紹)

    在計(jì)算機(jī)和電子設(shè)備中,存儲(chǔ)器扮演著數(shù)據(jù)臨時(shí)存放與快速交換的關(guān)鍵角色。其中,DDR SDRAM(雙數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)已成為現(xiàn)代內(nèi)存的主流技術(shù)之一。它不僅在速度上顯著超越前代產(chǎn)品,更憑借其高效傳輸機(jī)制,廣泛應(yīng)用于電腦、服務(wù)
    的頭像 發(fā)表于 12-08 15:20 ?1294次閱讀

    CW32L052 FLASH存儲(chǔ)器介紹

    概述CW32L052內(nèi)部集成了64KB嵌入式FLASH供用戶使用,可用來(lái)存儲(chǔ)應(yīng)用程序和用戶數(shù)據(jù)。 芯片支持對(duì) FLASH 存儲(chǔ)器的讀、擦除和寫操作,支持擦寫保護(hù)和讀保護(hù)。 芯片內(nèi)置 FLASH 編程
    發(fā)表于 12-05 08:22

    雙口SRAM靜態(tài)隨機(jī)存儲(chǔ)器存儲(chǔ)原理

    在各類存儲(chǔ)設(shè)備中,SRAM(靜態(tài)隨機(jī)存儲(chǔ)器)因其高速、低功耗和高可靠性,被廣泛應(yīng)用于高性能計(jì)算、通信和嵌入式系統(tǒng)中。其中,雙口SRAM靜態(tài)隨機(jī)存儲(chǔ)器憑借其獨(dú)特的雙端口設(shè)計(jì),在高帶寬和多任務(wù)場(chǎng)景中表現(xiàn)尤為出色,成為提升系統(tǒng)效率的重
    的頭像 發(fā)表于 11-25 14:28 ?552次閱讀

    芯源的片上存儲(chǔ)器介紹

    片上FLASH 閃存由兩部分物理區(qū)域組成:主FLASH 存儲(chǔ)器和啟動(dòng)程序存儲(chǔ)器。 ●● 主 FLASH 存儲(chǔ)器,共 64KB,地址空間為 0x0000 0000 - 0x0000 FFFF。該區(qū)
    發(fā)表于 11-12 07:34

    Everspin存儲(chǔ)器8位并行總線MRAM概述

    在需要高速數(shù)據(jù)寫入與極致可靠性的工業(yè)與數(shù)據(jù)中心應(yīng)用中,Everspin推出的8位位并行接口MRAM樹(shù)立了性能與耐用性的新標(biāo)桿。這款Everspin存儲(chǔ)器MRAM與SRAM引腳兼容的存儲(chǔ)器,以高達(dá)35
    的頭像 發(fā)表于 10-24 16:36 ?669次閱讀

    簡(jiǎn)單認(rèn)識(shí)高帶寬存儲(chǔ)器

    HBM(High Bandwidth Memory)即高帶寬存儲(chǔ)器,是一種基于 3D 堆疊技術(shù)的高性能 DRAM(動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)。其核心設(shè)計(jì)是通過(guò)硅通孔(TSV)和微凸塊(Microbump
    的頭像 發(fā)表于 07-18 14:30 ?4362次閱讀

    SK海力士如何成為面向AI的存儲(chǔ)器市場(chǎng)領(lǐng)跑者

    近年來(lái),SK海力士屢獲創(chuàng)新成果,這些成就皆得益于“一個(gè)團(tuán)隊(duì)”協(xié)作精神(One Team Spirit)”。無(wú)論是創(chuàng)下歷史最佳業(yè)績(jī)、開(kāi)發(fā)出全球領(lǐng)先產(chǎn)品,還是躍升成為全球頂級(jí)面向AI的存儲(chǔ)器供應(yīng)商,這些
    的頭像 發(fā)表于 05-23 13:54 ?1565次閱讀

    MCU存儲(chǔ)器層次結(jié)構(gòu)解析

    ? ? ? ?MCU的存儲(chǔ)器層次結(jié)構(gòu)通過(guò)整合不同性能與功能的存儲(chǔ)單元,優(yōu)化系統(tǒng)效率并滿足多樣化場(chǎng)景需求。其核心架構(gòu)可分為以下層次: 一、寄存層(最高速) 定位?:集成于CPU內(nèi)核中,直接參與運(yùn)算
    的頭像 發(fā)表于 05-09 10:21 ?793次閱讀

    半導(dǎo)體存儲(chǔ)器測(cè)試圖形技術(shù)解析

    在半導(dǎo)體存儲(chǔ)器測(cè)試中,測(cè)試圖形(Test Pattern)是檢測(cè)故障、驗(yàn)證可靠性的核心工具。根據(jù)測(cè)試序列長(zhǎng)度與存儲(chǔ)單元數(shù)N的關(guān)系,測(cè)試圖形可分為N型、N2型和N3/?型三大類。
    的頭像 發(fā)表于 05-07 09:33 ?1601次閱讀
    半導(dǎo)體<b class='flag-5'>存儲(chǔ)器</b>測(cè)試圖形技術(shù)解析

    存儲(chǔ)器IC的應(yīng)用技巧 【日 桑野雅彥】

    UV-EPROM的結(jié)構(gòu)與使用方法,閃速存儲(chǔ)器的結(jié)構(gòu)與使用方法,EEPROM的結(jié)構(gòu)與使用方法, SRAM的結(jié)構(gòu)與使用方法, 特殊的SRAM的結(jié)構(gòu)與使用方法 ,DRAM的結(jié)構(gòu)與使用方法,
    發(fā)表于 04-16 16:04

    瑞薩RA系列MCU FSP庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南(09)存儲(chǔ)器映射

    3.3 存儲(chǔ)器映射 前文所述,寄存與RAM、FLASH一樣都是芯片內(nèi)部的一種存儲(chǔ)設(shè)備。那么,當(dāng)我們需要訪問(wèn)它們的時(shí)候,我們需要知道它們的存儲(chǔ)地址。 3.3.1
    的頭像 發(fā)表于 04-16 15:52 ?1603次閱讀
    瑞薩RA系列MCU FSP庫(kù)開(kāi)發(fā)實(shí)戰(zhàn)指南(09)<b class='flag-5'>存儲(chǔ)器</b>映射

    扒一扒單片機(jī)與存儲(chǔ)器的那些事

    單片機(jī)與存儲(chǔ)器的關(guān)系像什么?單片機(jī)里的存儲(chǔ)都是一樣的嗎?為什么有的單片機(jī)既有EEPROM又有Flash?
    的頭像 發(fā)表于 04-10 10:06 ?1672次閱讀
    扒一扒單片機(jī)與<b class='flag-5'>存儲(chǔ)器</b>的那些事