国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Hudi系列:Hudi核心概念之文件布局(Storage Layouts)

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2025-10-14 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Hudi系列:Hudi核心概念(版本1.0)

?Hudi架構

?一. 時間軸(TimeLine)

?1.1 時間軸(TimeLine)概念

?1.2 Hudi的時間線由組成

?1.3 時間線上的Instant action操作類型

?1.4 時間線上State狀態類型

?1.5 時間線官網實例

?二. 文件布局

?三. 索引

?3.1 簡介

?3.2 對比Hive沒有索引的區別

?3.3 Hudi索引類型

?3.4 全局索引與非全局索引

?四. 表類型

?4.1 COW:(Copy on Write)寫時復制表

?4.1.1 概念

?4.1.2 COW工作原理

?4.1.3 COW表對表的管理方式改進點

?4.2 MOR:(Merge on Read)讀時復制表

?4.2.1 概念

?4.2.2 MOR表工作原理

?4.3 總結了兩種表類型之間的權衡

?五. 查詢類型

?5.1 Snapshot Queries

?5.2 Incremental Queries

?5.3 Read Optimized Query

下面描述了 Hudi 表存儲文件的一般組織方式。

?Hudi 將數據表組織到存儲中基本路徑下的目錄結構中。

?根據表架構中定義的分區列,表可以選擇性地分為多個分區。

?在每個分區中,文件被組織成文件組,由文件 ID (uuid) 唯一標識

?每個文件組包含多個文件切片。

?每個切片包含一個基本文件 (parquet/orc/hfile)(由配置 - hoodie.table.base.file.format 定義),由在特定時刻完成的提交寫入,以及一組日志文件 (.log.),由在下一個基本文件請求時刻之前完成的提交寫入。

?Hudi 采用多版本并發控制 (MVCC),其中壓縮操作合并日志和基本文件以生成新的文件切片,清理操作刪除未使用/較舊的文件切片以回收文件系統上的空間。

?所有元數據(包括時間線、元數據表)都存儲在基本路徑下的特殊 .hoodie 目錄中。

wKgZPGjuBHWAfLVnAAT8nIrydeA039.png

1.基礎文件

基礎文件存儲完整記錄,而更改記錄則存儲在下面的增量日志文件中。Hudi 目前支持以下基礎文件格式。

用于矢量化讀取、列壓縮和高效列式訪問的列式格式,適用于分析/數據科學
用于快速掃描以讀取整個記錄的行式 avro 文件
用于高效搜索索引記錄的隨機訪問優化 HFile(基于 SSTable 格式)

wKgZO2juBHaAWNLIAAVuJTHTIG8925.png

?

2.日志文件

日志文件存儲基礎文件創建后對基礎文件的增量更改(部分或全部),例如更新、插入和刪除。日志文件包含不同的塊(數據、命令、刪除塊等),這些塊對基礎文件的特定更改進行編碼。數據塊對基礎文件的更新/插入進行編碼,并可自定義以支持不同的需求。

面向行的 avro 文件,用于快速/輕量級寫入
隨機訪問優化的 HFile,用于高效搜索索引記錄(基于 SSTable 格式)
列式 parquet 文件,用于矢量化日志合并。

3. 存儲格式版本控制

Hudi 存儲格式的元素(如日志格式、日志塊結構、時間線文件/數據模式)都是版本化的,并與給定的表版本相關聯。表版本是一個單調遞增的數字,每次存儲中產生的某些位發生變化時,該數字就會增加。

Backwards compatible reading

Hudi 版本向后兼容,以確保新軟件版本可以讀取最近的舊表版本。跨不同引擎升級 Hudi 的推薦方法是首先升級所有讀取器(例如使用表的交互式查詢引擎),然后升級任何/所有寫入器和表服務。
Hudi 存儲引擎還實現了自動升級功能,可以在后續寫入操作中優雅地執行表版本升級,通過自動執行任何必要的步驟而無需停機查詢/讀取。

Backwards compatible writing

但是,這可能并非總是可行的,因為基于 Hudi 構建的數據平臺可能具有可以同時充當讀取器和寫入器的多階段管道。在這種情況下,Hudi 升級需要通過首先升級最下游的作業來執行,一直跟蹤
到可能由攝取系統寫入的第一個 Hudi 表。為了簡化此過程,Hudi 還允許寫入最近的舊表版本,以便可以首先在同一個舊表版本之上在整個部署中推出新的 Hudi 軟件二進制文件。一旦所有作
業和引擎都有了新的二進制文件,那么就可以按任何順序升級到較新的表版本,并且讀者將動態適應

4. 配置

以下寫入器配置控制寫入舊表版本和自動升級行為。

配置名稱 默認 描述
hoodie.write.table.version latest (Optional) 此寫入器存儲表的表版本。如果表已存在,則此版本應與當前表版本匹配。按上述方法升級時,請將此版本設置為較低的版本。
hoodie.write.auto.upgrade true (Optional) 假如設置為enabled, 如果當前表版本較低,則寫入器會自動將表遷移到指定的寫入表版本。

?

文獻: https://hudi.apache.org/docs/overview

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4787

    瀏覽量

    90057
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從eMMC到SPI+SSD:雙存儲方案下Vendor Storage適配指南

    Vendor Storage 訪問異常。本文將結合實際調試案例,拆解適配過程中的核心問題與解決方案,幫助開發者快速踩坑。
    的頭像 發表于 02-04 17:38 ?2343次閱讀
    從eMMC到SPI+SSD:雙存儲方案下Vendor <b class='flag-5'>Storage</b>適配指南

    深入解析RK平臺Android/Linux Bootloader核心文件:android_bootloader.c

    是對接Android啟動邏輯的核心文件——它決定了設備是進入正常系統、Recovery模式還是Fastboot模式,同時承擔了AVB(Android Verified Boot)驗證、內核加載、命令行
    的頭像 發表于 01-09 10:58 ?1195次閱讀
    深入解析RK平臺Android/Linux Bootloader<b class='flag-5'>核心</b><b class='flag-5'>文件</b>:android_bootloader.c

    KYOCERA AVX FloXY系列浮動板對板連接器:工業、汽車與交通應用的理想

    KYOCERA AVX FloXY系列浮動板對板連接器:工業、汽車與交通應用的理想選 在工業、汽車和交通運輸等領域的設計中,對于高可靠性信號和電源連接器的需求日益增長。KYOCERA AVX
    的頭像 發表于 12-30 11:10 ?283次閱讀

    TDK IBQ系列磁性片:RFID應用的理想

    TDK IBQ系列磁性片:RFID應用的理想選 在電子工程領域,RFID(射頻識別)技術的應用日益廣泛,而磁性片作為其中關鍵的組成部分,其性能的優劣直接影響著整個系統的表現。今天,我們就來深入
    的頭像 發表于 12-25 15:40 ?289次閱讀

    25W平面DC - DC變壓器:PLR系列的卓越

    25W平面DC - DC變壓器:PLR系列的卓越選 在電子設備的設計中,電源轉換是一個核心問題,而變壓器作為電源轉換的關鍵元件,其性能直接影響著整個系統的穩定性和效率。今天,我們就來深入了解一下
    的頭像 發表于 12-23 14:25 ?295次閱讀

    828系列高壓管狀熔斷器:緊湊汽車電子應用的理想

    828系列高壓管狀熔斷器:緊湊汽車電子應用的理想選 在電子工程師的日常設計工作中,熔斷器是保障電路安全的關鍵元件。今天,我們就來深入了解一下Littelfuse的828系列高壓管狀熔斷器,看看它在
    的頭像 發表于 12-16 15:10 ?356次閱讀

    IBM Storage Scale System 6000煥新升級

    沒有數據的 AI 工廠就像沒有燃料的引擎,根本無法運轉。IBM Storage Scale System 6000 的全局命名空間和 Active File Management (AFM) 功能
    的頭像 發表于 11-30 09:12 ?653次閱讀

    RK?平臺?Vendor Storage?開發指南:基礎知識、流程與實用技巧

    在瑞芯微(RK)平臺的嵌入式開發中,vendor_storage?是一個核心模塊,專門用于存儲?SN(序列號)、MAC?地址、DRM?密鑰等廠商專屬數據。它不僅提供了跨環境的數據讀寫能力,還具
    的頭像 發表于 11-22 07:11 ?644次閱讀
    RK?平臺?Vendor <b class='flag-5'>Storage</b>?開發指南:基礎知識、流程與實用技巧

    Hudi系列:Hudi核心概念索引(Indexs)

    Hudi系列:Hudi核心概念(版本1.0) ?Hudi架構 ?一. 時間軸(TimeLine)
    的頭像 發表于 10-21 09:47 ?388次閱讀
    <b class='flag-5'>Hudi</b><b class='flag-5'>系列</b>:<b class='flag-5'>Hudi</b><b class='flag-5'>核心</b><b class='flag-5'>概念</b><b class='flag-5'>之</b>索引(Indexs)

    電機轉子永磁體布局怎么選?一文GET!

    轉子永磁體布局是永磁電機轉子設計的核心環節,直接影響電機的轉矩輸出、功率密度、調速性能和運行穩定性。不同永磁體布局的特點及設計邏輯,是匹配電機應用場景、提升電機性能的關鍵。下面從布局
    的頭像 發表于 09-18 08:33 ?1191次閱讀

    辰專利布局,深挖傳感技術發展護城河

    深圳市瑞辰科技有限公司成立于2007年,成立多年來在MEMS傳感器領域展現出了驚人的創新能力和技術實力。瑞辰深知知識產權的重要性,已經申請和獲取了數十項以MEMS為核心的專利,涵蓋了傳感器芯片
    的頭像 發表于 07-04 13:57 ?1287次閱讀
    瑞<b class='flag-5'>之</b>辰專利<b class='flag-5'>布局</b>,深挖傳感技術發展護城河

    harmony-utilsFileUtil,文件相關工具類

    harmony-utilsFileUtil,文件相關工具類
    的頭像 發表于 07-03 18:23 ?563次閱讀

    harmony-utilsPreviewUtil,文件預覽工具類

    harmony-utilsPreviewUtil,文件預覽工具類 harmony-utils 簡介與說明 [harmony-utils] 一款功能豐富且極易上手的HarmonyOS工具庫,借助眾多
    的頭像 發表于 07-03 11:40 ?485次閱讀

    harmony-utilsPickerUtil,拍照、文件選擇和保存,工具類

    harmony-utilsPickerUtil,拍照、文件選擇和保存,工具類 harmony-utils 簡介與說明 harmony-utils 一款功能豐富且極易上手的HarmonyOS工具庫
    的頭像 發表于 06-27 16:03 ?477次閱讀

    Linux系統管理的核心概念

    在前一篇文章中,我們深入探討了Linux中的文件操作命令,如cp、mv、rm,以及文本處理命令grep、wc和管道符。本文將繼續深入Linux系統管理的核心概念,包括root用戶的角色、用戶和用戶組
    的頭像 發表于 05-15 17:05 ?661次閱讀