伦伦影院久久影视,天天操天天干天天射,ririsao久久精品一区 ,一本大道香蕉大久在红桃,999久久久免费精品国产色夜,色悠悠久久综合88,亚洲国产精品久久无套麻豆,亚洲香蕉毛片久久网站,一本一道久久综合狠狠老

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于FDP SSD的ROCKSDB寫放大優化

三星半導體和顯示官方 ? 來源:三星半導體和顯示官方 ? 2026-03-23 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于FDP SSD的ROCKSDB寫放大優化

作為SSD的關鍵指標,寫放大(WriteAmplification,WA)始終是SSD領域待攻克的技術難題之一。其本質表現為SSD的實際物理寫入量超過主機原始請求寫入量。這一現象的根本原因在于NAND閃存介質必須以塊(BIoCK)為單位進行擦除,而主機端的寫入請求往往以頁(Page)為單位分散分布于多個塊中。當某塊內有效數據占比低于闊值時,SSD控制器啟動垃圾回收(Garbage Collection,GC)機制,將尚存的有效數據搬運至新擦除的塊中,同時釋放原塊以供復用,這一過程必然產生額外的寫入量。這些額外的寫開銷不僅影響系統整體性能,導致吞吐量下降和延遲升高,還會縮短SSD的使用壽命。

這一挑戰推動了SSD領域的一個重要研究方向一數據放置技術。SSD數據放置技術是通過硬件與軟件的深度協同設計,對主機數據在SSD介質中的物理布局進行優化的技術方案,其核心在于通過降低GC的觸發頻率,從根本上抑制寫放大(Write Amplification,WA)效應的產生機制。

NVMev2.1規范所定義的靈活數據放置(Flexible Data Placement,FDP)技術,既從底層閃存管理層面顯著減少無效GC操作引I發的超額寫入流量,又通過FDP的控制指令集降低了上層存儲棧的適配復雜度。此外,FDP還具有向后兼容能力,能夠復用當前的軟件棧,最終在解決寫放大問題與軟件生態兼容性之間建立了技術平衡點。FDP突破了傳統SSD被動式數據管理的局限,通過向主機公開設備資源信息,并提供數據分類放置接口,使主機能夠根據數據特性(如冷/熱數據)主動將數據分類放置在SSD上不同的存儲單元中。這一機制實現了數據的分流隔離和存儲單元的精細化布局,從根本上解決了不同特性數據混合存儲導致的的余搬移問題。關于FDP技術的實現機制的深度解析,可參考我們發布在ODCC官網上的《FDPSSD技術與應用白皮書》。

Linux虛擬文件系統(VFS)從版本4.13起,定義了文件生命周期的管理機制,分別為SHORT(短周期),MEDIUM(中周期),LONG(長周期)和EXTREME(超長周期)。應用可通過fcntI(2)系統調用對文件顯式的指定上述生命周期等級。此外,VFS還定義了NOT_SET和NONE兩種類型,NOT_SET為VFS默認類型,表示當文件沒有被顯示聲明生命周期時的類型。

NONE表示文件不關聯任何生命周期屬性的配置。該機制與FDP SSD相結合時,可將不同生命周期的文件映射至FDP內部預設數據流中降低寫放大效應。

RocksDB是Meta公司開源的一款高性能嵌入式鍵值對存儲系統,其核心架構基于Log-StructuredMerge-Tree(LSM-Tree)算法設計,采用分層存儲結構進行數據管理,通過追加寫(Append-only)與合并(Compaction)兩大核心機制實現高吞吐與低延遲特性。其中,SSTable(Sorted String Table),是RocksDB持久化存儲的核心文件,以鍵值對有序序列的形式存儲數據,并按層級(Level)進行組織。較新的數據存儲在Levelo中,較老的數據隨著合并(Compaction)過程逐步歸并在編號更高的Level中。

ROCkSDB默認的數據分類策略是將文件的層級特性映射為VFS的文件生命周期標識,具體表現為:預寫日志(WAL)文件被標記為SHORT;LeVelO和LeVel1的SSTable文件被標記為MEDIUM;LeVeI2的SSTable文件被標記為LONG;LeVeI3及更高層級的SSTable文件則被標記為EXTREME;其它文件(包括MANIFEST、CURRENT、檢查點日志等)未進行顯式生命周期標記,默認保留為NOT_SET標識。

通過對ROockSDB的數據分類策略進行系統性分析,我們發現SSTable文件在LSM-Tree層級中的生命周期存在顯著的階段性分布特征:位于LevelO至Level3的SSTable文件具有相對較短的駐留周期,而Level4以及上的文件則展現出最長的存活時間。基于這一觀測結果,本實驗摒棄了RoCkSDB原生的數據分類策略,轉而提出一種優化的分類方案。即WAL文件標記保持不變,將LeVeI03文件標記為MEDIUM,LeVel4文件標記為LONG,LeVeI5及以上文件標記為EXTREME,其余未歸類文件統一標記為NOT_SET。如表1所示:

wKgZPGnAlQ6AFNhcAACbDjD-rKI989.png

表 1:RocksDB 分類策略對比

我們采用FDPSSD(型號U.2PM9D3a,7.68TB容量),針對優化前后的ROCkSDB分類方案進行了對比測試。通過YCSB基準測試工具對2億條記錄進行數據加載(Load)與更新(Update)操作,全面評估不同分類策略的表現。測試結果表明,RocksDB的原生分類方案在FDPSSD上的WAF相比普通SSD降低了約8%,而優化后的分類方案將WAF顯著降低30%。此外,優化后的分類方案使每秒操作數(OPS)提升了10%,同時p99.9延遲得到了55%的改善。

wKgZPGnAlSyALDJvAAFQlD60AvM494.png

圖1. RocksDB 在關閉 FDP,開啟 FDP 使用原生分類策略和優化分類策略的 WAF 對比

wKgZPGnAlVuAQpJgAAFLwyyc95c873.png

圖 2. 寫放大和 SSD 容量利用率的相關性

wKgZO2nAlZaAectMAAH-FciJQy4331.png

圖3.ROCKSDB在關閉FDP,開啟FDP使用優化分類策略的性能對比

除了在文件系統層面支持FDPSSD外,我們還為ROCKSDB開發了基于FDPSSD的端到端解決方案。ROCKSDB通過抽象封裝API支持多種存儲后端,我們開發了RoCkSDB擴展插件一TorFS。該插件通過深度集成FDP特性,實現了面向FDPSSD的數據分流。在IO調度層,依托xNVMe開源庫實現多路徑IO的支持。為促進生態發展,TorFS提供了標準化IO接口,允許第三方開發者集成定制化的10路徑。

wKgZO2nAlbSAIlmgAAE3IeBMTRA478.png

圖 4. TorFS 架構

基于TorFS的端到端方案進行測試,測試結果表明,RocksDB成功實現了對寫放大效應的顯著抑制,其寫放大因子(WAF)值近乎趨近于理論極限的1,同時系統性能指標達到最優水平,展現出低延遲、高吞吐量與穩定持久化的綜合優勢。

wKgZPGnAlc6AFck1AAGzwa3btrk947.png

圖5.RocksDB使用TorFS端到端解決方案的寫放大和性能

上述實驗證實,通過對數據生命周期管理,FDP技術顯著提升了SSD的性能與壽命指標。我們期待將這項技術及優勢帶給整個超大規模數據中心。我們致力于將這一技術及優勢推廣至超大規模數據中心生態系統,以實現存儲架構中數據布局與底層介質特性的深度適配。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Linux
    +關注

    關注

    88

    文章

    11784

    瀏覽量

    219283
  • SSD
    SSD
    +關注

    關注

    21

    文章

    3132

    瀏覽量

    122354
  • 數據庫
    +關注

    關注

    7

    文章

    4059

    瀏覽量

    68441

原文標題:科技之心|優化數據庫寫入:FDP SSD 的新思路

文章出處:【微信號:sdschina_2021,微信公眾號:三星半導體和顯示官方】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    SSD是什么意思,什么是SSD

    、SONY等一大批國外實力廠家的不斷開發研究,SSD市場已經全面開花了。不過不要擔心,中國第一款SSD已經由深圳億正存儲科技公司于2007年1月1日宣布研發完成,并可以大批量進行生產,而且讀與速度均大于
    發表于 03-25 16:20

    SSD優化

    一、確定你的電腦運行在AHCI模式優化SSD的第一步首先就是要確保你的磁盤讀寫模式為AHCI,一般來講如果你的電腦是windows7系統,只需要在安裝系統前進入BIOS設置下磁盤讀寫模式為“AHCI
    發表于 12-24 02:22

    SSD1289寄存器函數

    ;}這是一個例程的關于SSD1289寄存器的一個函數,有兩點不明白:1、這個 (u32)0x6c000000中的0x6c000000代表什么,為什么有這個數字,難道涉及SSD1289的寄存器地址范圍?2
    發表于 03-21 21:12

    基于全HDD aarch64服務器的Ceph性能調優實踐總結

    rocksdb的調優是對放大,讀放大,空間放大之間的權衡。7 總結本文介紹了基于全HDD aarch64服務器的Ceph性能調優實踐,希望
    發表于 07-05 14:26

    面向多目標優化的自適應SSD緩存系統

    SSD(solid state drive)為代表的新型存儲介質在虛擬化環境下得到了廣泛的應用,通常作為虛擬機讀寫緩存。起到優化磁盤I/O性能的作用.已有研究往往關注SSD緩存的容量規劃,依據緩存
    發表于 12-26 17:13 ?0次下載
    面向多目標<b class='flag-5'>優化</b>的自適應<b class='flag-5'>SSD</b>緩存系統

    全面優化SSD,浪潮智能全閃存儲G2-F滿足企業關鍵業務需求

    ,從全閃存存儲架構、效率、可靠性等方面進行了全面優化,將閃存技術與企業級高可靠數據存儲平臺深度融合,滿足了IO密集型企業關鍵業務的數據存儲需求。 擦寫壽命限制及放大先天弱點,挑戰全閃存存儲系統 相對傳統機械磁盤,
    發表于 02-23 15:37 ?587次閱讀

    怎么使用SSD才能避免越越慢?

    江湖傳言:SSD越慢。沒錯,其實這是有科學依據的:可用閃存空間富裕時,SSD是無需做GC的,因為總有空閑的空間可寫。SSD使用早期,由于沒有觸發GC,無需額外的讀寫,所以速度很快。
    的頭像 發表于 06-02 10:58 ?5831次閱讀
    怎么使用<b class='flag-5'>SSD</b>才能避免越<b class='flag-5'>寫</b>越慢?

    SSD中有個重要參數,就是放大

    小方塊時,每個小方塊的平均有效數據為180/216 = 0.83,一個閃存塊上的有效數據為0.83*9 = 7.5,也就是一個閃存塊上面平均有7.5個小綠塊和1.5個小紅塊。為了1.5個用戶數據方塊,需要寫9個方塊的數據(原有7.5個有效數據,加1.5個用戶數據),
    的頭像 發表于 07-24 15:39 ?1w次閱讀
    <b class='flag-5'>SSD</b>中有個重要參數,就是<b class='flag-5'>寫</b><b class='flag-5'>放大</b>

    SSD 上使用 btrfs 文件系統的相關優化

    btrfs 文件系統有對 SSD 進行優化,在掛載參數中加入 ssd 即可。該參數不會自動啟用 TRIM/discard。
    發表于 04-27 14:06 ?3224次閱讀

    FDP4D5N10C N通道屏蔽柵極PowerTrench

    電子發燒友網為你提供()FDP4D5N10C相關產品參數、數據手冊,更有FDP4D5N10C的引腳圖、接線圖、封裝手冊、中文資料、英文資料,FDP4D5N10C真值表,FDP4D5N1
    發表于 04-18 23:09

    FDP8D5N10C N通道屏蔽柵極PowerTrench

    電子發燒友網為你提供()FDP8D5N10C相關產品參數、數據手冊,更有FDP8D5N10C的引腳圖、接線圖、封裝手冊、中文資料、英文資料,FDP8D5N10C真值表,FDP8D5N1
    發表于 04-18 23:08

    讀、、擦除是SSD對NAND的三大基本操作

    通過一系列的介紹和實驗驗證,我們看到了TRIM的價值和實現原理。在TRIM的幫助下,NVMe SSD的GC等操作效率更高,進而達到降低放大,提高產品性能和壽命的效果。
    的頭像 發表于 04-28 11:39 ?1.2w次閱讀

    Rocksdb原理簡介

    Rocksdb作為當下nosql中性能的代表被各個存儲組件(mysql、tikv、pmdk、bluestore)作為存儲引擎底座
    的頭像 發表于 06-01 17:17 ?1743次閱讀
    <b class='flag-5'>Rocksdb</b>原理簡介

    下一代ZNS?淺談FDP在企業級SSD應用前景

    ,通過系統側的主動垃圾回收(Garbage Collection,簡稱GC),將SSD內的GC削減到0。一方面,可以減少系統和SSD兩層GC帶來的放大和讀寫沖突,延長盤片使用壽命,也
    的頭像 發表于 10-12 15:55 ?3700次閱讀
    下一代ZNS?淺談<b class='flag-5'>FDP</b>在企業級<b class='flag-5'>SSD</b>應用前景

    KIOXIA推出全新開源軟件,提升RocksDB中閃存存儲的壽命和性能

    支持靈活數據放置(FDP)的SSD,公司將在即將召開的Open Compute Project (OCP)全球峰會上展示這一技術進展。 在4驅動器RAID 5配置中,Kioxia的這款新插件將
    的頭像 發表于 10-13 11:15 ?443次閱讀