国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

計算型存儲: 異構計算的下一個關鍵應用

璟琰乀 ? 來源:SSDFans ? 作者:SSDFans ? 2020-12-18 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AWS re:Invent2019顯示AWS市場占用率達到45%,相比2018年營收增長29%。使用專用芯片構建用于加速特定場景的戰(zhàn)略更加清晰,除去IntelAMD的X86和Nvidia GPU,還有通過其Annapurna Labs部門推出的基于Arm的Graviton的定制芯片,并承諾基于Graviton2(7納米)的新型EC2實例的性能是第一代Graviton的7倍。

早在摩爾定律失效之前,一個逐漸達成的共識就是通用處理器的算力應該專注于復雜的商業(yè)邏輯,而簡單重復的工作則由專用芯片完成更加合適。

超算和智能網(wǎng)卡

早在20年以前,基于異構計算的智能網(wǎng)卡就已經(jīng)應用于超算(HPC)領域。從1993年開始 TOP500 就以每年兩次的頻率,基于 Linpack benchmark 負載模型來統(tǒng)計地球上運行最快的超級計算集群。

2003年,弗吉尼亞理工學院暨州立大學創(chuàng)建一個InfiniBand集群,在當時的TOP500排名第三;

2009年,世界500強超級算機中,152個使用InfiniBand,并提供38.7%的算力;

2020年11月,根據(jù)最新的第56版,155個使用 InfiniBand,并提供40%的算力,排名前10的超算集群有8個由 InfiniBand 構建,更是占據(jù)了前5的4席位置。

在構建高速網(wǎng)路時,爭論主要是把網(wǎng)絡功能OnloadCPU上,還是把這些功能Offload到專用硬件:

常用Onloading,TCP/IP技術在數(shù)據(jù)包從網(wǎng)卡到應用程序的過程中,要經(jīng)過OS,數(shù)據(jù)在主存、CPU緩存和網(wǎng)卡緩存之間來回復制,給服務器的CPU和主存造成負擔,也加劇網(wǎng)絡延遲。

Offloading 基于RDMA實現(xiàn)遠程內(nèi)存直接訪問,將數(shù)據(jù)從本地快速移動到遠程主機應用程序的用戶空間,通過Zero-copy和Kernel bypass來實現(xiàn)高性能的遠程直接數(shù)據(jù)存取的目標。

下圖可以直觀的看到兩者在訪問路徑的區(qū)別:

當然,Offloading 需要將RDMA協(xié)議固化于硬件上,所以依賴于網(wǎng)卡的算力是否可以滿足運行RDMA協(xié)議的開銷,這實際上就是專用芯片和網(wǎng)卡的結(jié)合。用更性感的說法是

SmartNICs are an example of DPU (Data Processing Unit) technology

AWS和Nitro

云計算催生超大規(guī)模數(shù)據(jù)中心,也同時放大通用算力的不足和異構計算的優(yōu)勢。就好比研發(fā)團隊規(guī)模變大的同時必然走向?qū)I(yè)化。AWS EC2早期由純軟(也意味著需要消耗CPU)的Xen對CPU、存儲和網(wǎng)絡完成虛擬化。基于這種實現(xiàn)方式,一個EC2實例的虛擬化管理開銷高達30%。

30%相當可觀,最重要的是并沒有為客戶提供直接價值。按照 Werner Vogels(AWS CTO )的說法

想為客戶顯著提高性能、安全性和敏捷性,我們必須將大部分管理程序功能遷移到專用硬件上。

2012年,AWS開始構建Nitro系統(tǒng),也正是這,登納德縮放定律(嚴格說是預測)幾乎消失:

2013年, Nitro 應用于C3實例,其網(wǎng)絡進程卸載到硬件中;

2014年,推出了C4實例類型,將EBS存儲卸載到硬件中,并開始和Annapurna Labs合作;

2015年,收購 Annapurna Labs;

2017年,C5實例卸載控制平面和剩余的I/O,實現(xiàn)完整的Nitro系統(tǒng);

此時,Nitro系統(tǒng)已經(jīng)包含三個主要部分:Nitro卡、Nitro安全芯片和Nitro管理程序。主要卸載和加速IO,虛擬私有云(VPC)、彈性塊存儲(EBS)和實例存儲,從而讓用戶可以使用100%的通用算力。

對客戶而言,意味更好的性能和價格,下圖可以看到基于Nitro的C5和I3.metal的延時明顯降低:

計算型存儲和數(shù)據(jù)庫

從AWS的營收看,網(wǎng)絡、存儲、計算和軟件是收入的四駕馬車,數(shù)據(jù)庫毫無疑問是存儲領域的關鍵場景。隨著云計算帶來基礎環(huán)境的改變,也直接加速云原生技術的發(fā)展和成熟,程序員不會再寫出單體(Monolithic)應用,也再也不會在應用中只使用一種數(shù)據(jù)庫。還是借用Werner Vogels的話

A one size fits all database doesn‘t fit anyone.

從AWS提供的數(shù)據(jù)庫服務也應證了一點(國內(nèi)的云計算巨頭也類似)。

不同的數(shù)據(jù)庫針對不同的場景,比如Airbnb使用 Aurora 替代 MySQL,Snapchat 使用DynamoDB 承載起最大的寫負載,麥當勞將ElastiCache應用于低延時高吞吐的工作負載,旅游網(wǎng)站expedia.com使用ElasticSearch實時優(yōu)化產(chǎn)品價格。當然,對于存儲介質(zhì),更快速和更大容量的需求普遍存在。從下面數(shù)據(jù)庫的工程實踐看,壓縮是實現(xiàn)這一目標的共識:

DB-Engines DBMS數(shù)據(jù)壓縮特性

DBMS

是否支持數(shù)據(jù)壓縮

Oracle

MySQL

Microsoft SQL Server

PostgreSQL

MongoDB

IBM Db2

Elasticsearch

Redis

SQLite

Cassandra

壓縮率依賴于數(shù)據(jù)本身,1948年由美國數(shù)學家克勞德·香農(nóng)(Claude Shannon)在經(jīng)典論文《通信的數(shù)學理論》中首先提出信息熵,理想情況下,不管是什么樣內(nèi)容的數(shù)據(jù),只要具有同樣的概率分布,就會得到同樣的壓縮率。

在實現(xiàn)時,常常要在壓縮吞吐,解壓吞吐,和犧牲壓縮率之間做取舍,這也是產(chǎn)生諸多壓縮算法的原因。下圖是基于Silesia compression corpus不同壓縮算法之間的差異。

Compressor Name

Ratio

CompressionDecompress

zstd 1.4.5 -1

2.884

500MB/S

1660MB/S

zlib 1.2.11 -1

2.743

90MB/S400MB/S

brotli 1.0.7 -0

2.703

400MB/S450MB/S

zstd 1.4.5--fast=1

2.434

570MB/S2200MB/S

zstd 1.4.5--fast=3

2.312

640MB/S2300MB/S

quicklz 1.5.0 -1

2.238

560MB/S710MB/S

zstd 1.4.5 --fast=5

2.178

700MB/S2420MB/S

lzo1x 2.10 -1

2.106

690MB/S820MB/S

lz4 1.9.2

2.101

740MB/S4530MB/S

lzf 3.6 -1

2.077

410MB/S860MB/S

snappy 1.1.8

2.073

560MB/S1790MB/S

從一個常見的場景出發(fā),應用多次寫入壓縮率各不相同的數(shù)據(jù),邏輯寫入量為36KB,如下圖所示:

muaqqq.png

按照前面所示的壓縮率,最理想的情況是壓縮后占用15.2KB。

rqYfm2.png

但現(xiàn)有的空間管理實踐會占用更多的物理空間,首先寫入時需要按照文件系統(tǒng)頁對齊寫入(假設4KB),占用物理空間為48KB,數(shù)據(jù)存儲分布如下圖所示:

Q7FrAb.png

iyYfu2.png

但因為壓縮后數(shù)據(jù)依然需要按照文件系統(tǒng)頁大小(4KB)對齊,數(shù)據(jù)存儲分布如下圖所示:

mqem2u.png

所以實際占用的物理空間是36KB離預期的壓縮率相去甚遠。

uQJfeu.png

為進一步提升壓縮效率,通常會進一步壓實(compaction)空間,壓實后數(shù)據(jù)存儲分布如下:

iMZ7be.png

這時占用的物理空間是 16KB,才接近15.2KB。

可見在工程實踐時,要想在應用場景中獲得可觀的壓縮收益,僅關注數(shù)據(jù)結(jié)構和壓縮算法是不夠的,還要考慮壓實(Compaction)效率,如果還要兼顧算力消耗、IO延時和代碼復雜度等指標,工程難度將指數(shù)級提升。

針對這個場景,支持透明壓縮的計算型存儲 CSD2000,將壓縮解壓縮算法offload到盤內(nèi)FPGA,使計算更靠近數(shù)據(jù)存儲的地方(“in-situ computing”),進一步縮短數(shù)據(jù)路徑,從而提升數(shù)據(jù)處理的效率。

對比“軟”壓縮(基于CPU)和硬壓縮(基于FPGA)兩者的收益并不復雜,下面以MySQL為例,將MySQL頁壓縮,MySQL表壓縮和CSD2000透明壓縮三者進行對比,采用TPC-C和TPC-E數(shù)據(jù)集和負載模型,以壓縮率和數(shù)據(jù)庫性能(TPS和時延)為指標衡量壓縮效率。

先看壓縮率,計算型存儲 CSD2000 提供更高的壓縮率,幾乎是MySQL自帶壓縮的2倍以上,如下所示:

VBNbum.png

再看性能,使用sysbench測試1/4/16/64/256/512并發(fā)下性能表現(xiàn),可以觀察到(如下圖所示):

≥ 64并發(fā)時,CSD2000 QPS/TPS平均提高~5倍,最高提高~12倍,99%平均時延降低68%以上;

《64并發(fā)時,CSD2000 QPS/TPS普遍高于普通NVMe SSD 20%~50%,99%平均時延降低8%~45%;

說明:為了便于對比,以普通NVMe SSD指標為基線做歸一化。

zyQ7ji.png

QVZrmu.png

Mark Callaghan (Facebook Distinguished Engineer)曾經(jīng)吐槽在數(shù)據(jù)庫中實現(xiàn)透明頁壓縮并應用在生產(chǎn)環(huán)境,工程實現(xiàn)過于復雜,難怪Jens Axboe(Linux內(nèi)核代碼主要貢獻者之一,F(xiàn)IO和IO_URING的作者)建議他把這些工作丟給計算型存儲公司 ScaleFlux。而從計算型存儲帶來的壓縮及性能(詳見:可計算存儲:數(shù)據(jù)壓縮和數(shù)據(jù)庫計算下推)收益來看已經(jīng)超額完成任務。

計算型存儲和文件系統(tǒng)

壓縮同時減少數(shù)據(jù)寫入量(Nand Written)和寫放大(Write Amplification),但實際的情況會更復雜一些,大多數(shù)情況下數(shù)據(jù)庫運行在文件系統(tǒng)之上。

以日志型文件系統(tǒng)ext4為例,設計以下測試驗證日志寫入量與數(shù)據(jù)庫數(shù)據(jù)寫入量的比例及透明壓縮對于減少寫入量的收益:

選用 MySQL 和 MariaDB;

200GB數(shù)據(jù)集;

3種負載模型:Insert/Update-Index/Update-Non-Index;

兩種數(shù)據(jù)訪問方式:熱點集中(Non-uniform Key Distribution) 和全隨機(Uniform Key Distribution);

最終測試結(jié)果如下:

因為文件系統(tǒng)的 WAL(Write Ahead Log)機制,加上日志的稀疏結(jié)構,日志寫入量占整體寫入量20%~90%,可見文件系統(tǒng)日志寫入量可能大于上層應用(數(shù)據(jù)庫)的數(shù)據(jù)寫入量;

透明壓縮對于減少數(shù)據(jù)庫數(shù)據(jù)量的寫入效果明顯,對于減少日志系統(tǒng)寫入量的效果更加顯著,全部測試場景減少日志寫入量約4~5倍;

說明:以普通NVMe SSD指標為基線做歸一化,直方圖面積越小,數(shù)據(jù)寫入量越少。

人類的智慧注定都要在山頂相遇

亞馬遜經(jīng)常談論單向(one-way)和雙向(two-way)門決策。雙向門決策容易逆轉(zhuǎn),例如A/B test,這類決策可以快速采取行動,即使失敗,成本也不高。單向門決策大多數(shù)時候不可撤銷,必須”大膽假設,小心求證“。Nitro 顯而易見是一個單向(one-way)門決策,即便是2012年開始,AWS也花了足足7年時間才完整落地。

在異構計算領域,頭部云計算廠已經(jīng)達成共識,相關產(chǎn)品也加速推出,包括支持計算下推的阿里云PolarDB(詳見:可計算存儲:數(shù)據(jù)壓縮和數(shù)據(jù)庫計算下推),以及 AWS re:Invent2020 再次提到的基于 AUQA(Advanced Query Accelerator) 節(jié)點加速的 Redshift。

風物長宜放眼量,人類的智慧注定都要在山頂相遇。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4791

    瀏覽量

    90066
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93205
  • AWS
    AWS
    +關注

    關注

    0

    文章

    444

    瀏覽量

    26563
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    半導體測試,是“下一個前沿”

    ,但半導體測試是“下一個前沿”,它是設計與制造之間的橋梁,解決了傳統(tǒng)分離領域之間模糊的界限。更具體地說,通過連接設計和制造,測試可以幫助產(chǎn)品和芯片公司更快地生產(chǎn)出
    的頭像 發(fā)表于 12-26 10:02 ?545次閱讀
    半導體測試,是“<b class='flag-5'>下一個</b>前沿”

    美光科技與聯(lián)想車計算引領車載存儲新篇章

    解決方案,聯(lián)想的強大異構計算能力結(jié)合美光的先進存儲技術,雙方在彼此優(yōu)勢上深化協(xié)作,共同應對汽車產(chǎn)業(yè)升級帶來的技術挑戰(zhàn)。
    的頭像 發(fā)表于 09-28 16:45 ?4647次閱讀

    【TEC100TAI-KIT】青翼凌云科技基于JFMQL100TAI的全國產(chǎn)化智能異構計算平臺

    TEC100TAI-KIT是款基于國產(chǎn)100TAI的全國產(chǎn)智能異構計算平臺開發(fā)套件,該套件包含1100TAI核心板和1PCIE規(guī)格的擴展底板。 該套件的核心板集成了100TAI
    的頭像 發(fā)表于 09-19 17:16 ?893次閱讀
    【TEC100TAI-KIT】青翼凌云科技基于JFMQL100TAI的全國產(chǎn)化智能<b class='flag-5'>異構計算</b>平臺

    科技云報到:西湖大學、智元機器人都選它,存儲成為AI下一個風口

    科技云報到:西湖大學、智元機器人都選它,存儲成為AI下一個風口
    的頭像 發(fā)表于 09-03 11:24 ?692次閱讀

    【原創(chuàng)】TDMS設置下一個寫入位置函數(shù)的摸索

    labview在20版本前,tdms都有高級函數(shù),寫入文件位置set file positon,但是在20版本后被取消了。取而代之是‘tdms設置下一個寫入位置函數(shù)’ 本意是想利用tdms設置
    發(fā)表于 08-11 20:54

    AI玩具或成為下一個萬億新賽道

    如果你將擁有家庭新成員,你首先會想到什么?是孩子還是寵物?如果我說你下一個家庭成員,或許是會“察言觀色”的AI玩具,這件事是不是聽上
    的頭像 發(fā)表于 07-29 10:15 ?1106次閱讀

    PCIe協(xié)議分析儀能測試哪些設備?

    PCIe協(xié)議分析儀能測試多種依賴PCIe總線進行高速數(shù)據(jù)傳輸?shù)脑O備,其測試范圍覆蓋計算存儲、網(wǎng)絡及異構計算等多個領域,具體設備類型及測試場景如下:、核心
    發(fā)表于 07-25 14:09

    【PZ-ZU15EG-KFB】——ZYNQ UltraScale + 異構架構下的智能邊緣計算標桿

    璞致電子推出PZ-ZU15EG-KFB異構計算開發(fā)板,搭載Xilinx ZYNQ UltraScale+ XCZU15EG芯片,整合四核ARM Cortex-A53、雙核Cortex-R5F
    的頭像 發(fā)表于 07-22 09:47 ?1092次閱讀
    【PZ-ZU15EG-KFB】——ZYNQ UltraScale + <b class='flag-5'>異構</b>架構下的智能邊緣<b class='flag-5'>計算</b>標桿

    智能安防邊緣計算的技術解析

    維度,剖析核心板如何推動安防從"被動記錄"到"主動決策"的升級,并給出選型建議。 ? --- 、核心板的硬件架構創(chuàng)新** ? 1. 異構計算架構:算力與能效的平衡? 以SSD2351為例,其采用**"CPU+NPU+IVE"三級計算
    的頭像 發(fā)表于 06-26 11:56 ?577次閱讀

    異構計算解決方案(兼容不同硬件架構)

    異構計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術與實踐方案如下: 、硬件架構設計 異構處理
    的頭像 發(fā)表于 06-23 07:40 ?859次閱讀

    如何釋放異構計算的潛能?Imagination與Baya Systems的系統(tǒng)架構實踐啟示

    報告作者:PallaviSharma,Imaginaiton產(chǎn)品管理總監(jiān)Dr.EricNorige,BayaSystems首席軟件架構師關注Imagination公眾號,消息框發(fā)送【異構計算】,即可
    的頭像 發(fā)表于 06-13 08:33 ?1143次閱讀
    如何釋放<b class='flag-5'>異構計算</b>的潛能?Imagination與Baya Systems的系統(tǒng)架構實踐啟示

    如何計算存儲示波器的垂直分辨率?

    參數(shù)要計算存儲示波器的垂直分辨率,需要明確以下兩關鍵參數(shù): 模數(shù)轉(zhuǎn)換器(ADC)位數(shù)(n):ADC 是將模擬信號轉(zhuǎn)換為數(shù)字信號的核心部件,其位數(shù)決定了轉(zhuǎn)換后數(shù)字信號的精度。位數(shù)越高,
    發(fā)表于 05-30 14:03

    能效提升3倍!異構計算架構讓AI跑得更快更省電

    。它是應對復雜計算需求的關鍵技術之。 ? 異構計算架構的核心優(yōu)勢 ? 異構計算架構的核心要素主要包括多種
    的頭像 發(fā)表于 05-25 01:55 ?4013次閱讀

    RAKsmart智能算力架構:異構計算+低時延網(wǎng)絡驅(qū)動企業(yè)AI訓練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應用爆發(fā)的今天,企業(yè)AI訓練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構,以異構計算資源池化與超低時延網(wǎng)絡為核心,重構AI訓練基礎設施,助力企業(yè)實現(xiàn)訓練速度提升、硬件成本下降與算法迭代加速的三重突破。
    的頭像 發(fā)表于 04-17 09:29 ?769次閱讀

    ad7616 burst模式讀取數(shù)據(jù)時,是否可以在下一個convst啟動轉(zhuǎn)換?

    ad7616 burst模式讀取數(shù)據(jù)時,是否可以在下一個convst啟動轉(zhuǎn)換,但busy還沒有拉低的情況下繼續(xù)讀取上次轉(zhuǎn)換的數(shù)據(jù)嗎?主要是串行讀取時,有可能出現(xiàn)convst臨界的情況,如果這樣可以的話,能夠提升小部分con
    發(fā)表于 04-15 07:50