国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于HDFS的概述及組成與架構詳解

jf_f8pIz0xS ? 來源:CSDN技術社區 ? 作者:苜苜的爛筆頭 ? 2021-04-15 13:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、 HDFS簡介

1.1 HDFS的概述

HDFS是基于 流數據 訪問模式的 分布式文件系統 ,其設計建立在 “一次寫入、多次讀取” 的基礎上,提供高吞吐量、高容錯性的數據訪問,能很好地解決海量數據的存儲問題。

流數據 是指數千個數據源 持續生成 的數據,可以理解為隨時間延續而 無限增長 的動態數據集合。

通俗點說,如果把數據比如成一個水庫,那么流進去的水,就是流數據(就像我們聽的音樂,屬于音樂流;而看到的文字、圖片這些較為固定的,一次性下載的,形成不了流)。

在Hadoop生態圈中,HDFS屬于底層基礎,負責存儲文件。

1.2 HDFS的優點

HDFS的優點:

高容錯性。提供了容錯和恢復機制,副本丟失后,自動恢復。

高可靠性。數據自動保存多個副本,通過多副本提高可靠性。

適合大數據處理??梢蕴幚沓笪募?,比如 TB級甚至PB級 的文件。

適合批處理。移動計算而非移動數據;數據位置暴露給計算框架。

支持流式數據訪問。一次性寫入,多次讀?。ㄒ粋€數據集一旦生成,就會被復制分發到不同的存儲節點,各節點可以進行讀取/訪問);保證數據一致性。

低成本運行??梢赃\行在低成本的硬件之上。

HDFS 默認保存 3 份副本。

第一個副本:放置在 上傳文件 的數據節點(第一個副本如果是在 集群外 提交,則隨機挑選一個 CPU 比較空閑 、 磁盤不太滿 的節點);

第二個副本:放置在與 第一個副本 不同 的機架的節點上;

第三個副本:放在與 第二個副本 相同 的機架的其他節點上。

1.3 HDFS的缺點

HDFS的缺點:

不適合處理 低延遲 的數據訪問。比如用戶 要求時間比較短 的低延遲應用(主要處理高數據吞吐量的應用)。

不適合處理 大量的小 文件。會造成尋址時間超過讀取時間;會占用NameNode大量內存,因為NameNode把文件系統的元數據存放在內存中(文件系統的容量由NameNode的大小決定),小文件太多會消耗NameNode的內存。

不適合 并發寫入。一個文件只能有一個寫入者,HDFS暫不支持多個用戶對同一個文件的寫操作。

不適合 任意修改 文件。僅支持append(附加),不支持在文件的任意位置進行修改。

二、 HDFS的組成與架構

HDFS的組成架構圖及各部分功能如下所示:

2.1 NameNode節點

當用戶訪問數據文件時,為了保證能夠讀取到每一個數據塊, HDFS有一個專門 負責保存文件屬性信息的節點,這個節點就是 NameNode 節點(即 名稱節點 )。

2.1.1 節點職責

NameNode節點 是HDFS的管理者,負責保存和管理HDFS的元數據。

其職責有以下三個方面:

① 管理維護HDFS的命名空間

NameNode管理HDFS系統的命名空間,維護文件系統樹以及文件系統樹中所有文件的元數據。管理這些信息的的文件分別是 edits(操作日志文件) 和 fsimage(命名空間鏡像文件) 。

editlog(操作日志):在NameNode啟動的情況下,對HDFS進行的各種操作進行記錄。(HDFS客戶端執行的所有操作都會被記錄到editlog文件中,這些文件由edits文件保存)

fsimage:包含HDFS中的元信息(比如修改時間、訪問時間、數據塊信息等)。

② 管理DataNode上的數據塊

負責管理數據塊上所有的元數據信息(管理DataNode上數據塊的均衡,維持副本數量)。

③ 接收客戶端的請求

接收客戶端文件上傳、下載、創建目錄等的請求。

2.2 DataNode節點

HDFS首先把大文件切分成若干個小的數據塊,再把這些數據塊寫入不同的節點,這個 負責保存文件數據的節點就是 DataNode 節點(即 數據節點 )。

2.2.1 節點職責

DataNode節點 負責存儲數據,把Block(數據塊)以Linux文件的形式保存在磁盤上,并根據Block標識和字節范圍來讀寫塊數據。

其職責有以下三個方面:

① 保存數據塊

一個數據塊會在多個DataNode進行冗余備份(在某一個DataNode最多只有一個備份)。

② 負責客戶端對數據塊的IO請求

在客戶端執行寫操作時,DataNode之間會相互通信,保證寫操作的一致性。

③ 定期和NameNode進行心跳通信,接受NameNode的指令

如果NameNode節點10分鐘沒有收到DataNode的心跳信息,就會將其上的數據塊復制到其他DataNode節點。

因此,NameNode節點上并不會永久保存DataNode節點上的數據塊信息,而是通過與DataNode節點心跳聯系的方式,來更新節點上的映射表,以此減輕負擔。

問題:HDFS數據塊默認大小為128M(Hadoop2.2之前為64M),將HDFS的數據塊設置得很大的目的是什么?(傳統數據塊只有512個字節)

答:為了減少尋址開銷,讓HDFS的文件傳輸時間由傳輸速率決定(如果塊設置得足夠大,從磁盤 傳輸數據的時間 會明顯大于 定位這個塊開始位置 所需的時間)。

2.3 SecondaryNameNode節點

HDFS有一個定期創建命名空間的檢查點(CheckPoint)操作的節點,也就是SecondaryNameNode節點(即 第二名稱節點)。

出于可靠性考慮,SecondaryNameNode節點與NameNode節點通常運行在不同的機器上,且SecondaryNameNode節點與NameNode節點的內存要一樣大。

(如果想了解 SecondaryNameNode 的工作流程,可以參考這篇文章:淺析 SecondaryNameNode 的工作流程 )

問題:一般情況下,一個集群中的SecondaryNameNode節點也是只有一個的原因是什么?

答:因為如果多的話,會增加NameNode的壓力,使其忙于元數據的傳輸/接收、日志的傳輸/切換,從而導致性能下降;同時,NameNode節點也不支持做并發檢查點。

2.3.1 節點職責

SecondaryNameNode節點 定期把NameNode的 fsimage 和 edits 下載到本地,再將它們加載到內存并進行合并,最后把合并后新的 fsimage 返回NameNode (這個過程稱為檢查點)。

經典問題:NameNode與SecondaryNameNode有沒有關系?

SecondaryNameNode節點的工作流程可以參考這篇文章:

其職責有以下兩個方面:

① 防止edits過大

定期合并 fsimage 和 edits 文件,使 edits 大小保持在限制范圍內。這樣做減少了重新啟動NameNode時合并 fsimage 和 edits 耗費的時間,從而減少了NameNode啟動的時間。

② 做冷備份

對一定范圍內數據做快照性備份,在NameNode失效時能恢復部分 fsimage 。

好了,HDFS 及其組成框架介紹完成。

如果想進一步了解 HDFS 的工作機制,可以參考這篇文章:圖文詳解 HDFS 工作機制及其原理 。
編輯:lyn

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • HDFS
    +關注

    關注

    1

    文章

    32

    瀏覽量

    10115
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從“人機交互”到“數字預演”:詳解 HMI、SCADA 與虛擬調試的閉環架構

    從“人機交互”到“數字預演”:詳解 HMI、SCADA 與虛擬調試的閉環架構
    的頭像 發表于 03-05 11:36 ?58次閱讀
    從“人機交互”到“數字預演”:<b class='flag-5'>詳解</b> HMI、SCADA 與虛擬調試的閉環<b class='flag-5'>架構</b>

    TAS3103A數字音頻處理器:特性、架構與應用詳解

    TAS3103A數字音頻處理器:特性、架構與應用詳解 引言 在當今數字化音頻處理領域,一款高性能、可配置的音頻處理器至關重要。德州儀器(Texas Instruments)的TAS3103A數字音頻
    的頭像 發表于 02-27 16:25 ?108次閱讀

    【「龍芯之光 自主可控處理器設計解析」閱讀體驗】--全書概覽與概述

    感謝論壇與出版社提供此書以及作者編著此書。下面是書籍實物,不是很厚但很通俗易懂、簡明概要。 首先對全書章節進行概覽,然后對第一章概述進行閱讀學習。 全書分6章,在架構、工具鏈、案例方面進行了介紹
    發表于 01-18 12:58

    光伏四可裝置硬件平臺架構詳解:計算單元、通信接口與可靠性設計

    光伏設備“單一功能、適配性差”的局限,以“計算為核、通信為脈、可靠為基”構建架構體系。西格電力提供光伏策略控制服務器,了解詳情可咨詢:1.3.7-5.0.0.4-6.2.0.0。本文從計算單元的算力配置、通信接口的鏈路設計、可靠性的全場景防護三個維度,詳解光伏四可裝置硬件
    的頭像 發表于 01-04 15:40 ?1127次閱讀
    光伏四可裝置硬件平臺<b class='flag-5'>架構</b><b class='flag-5'>詳解</b>:計算單元、通信接口與可靠性設計

    室內外融合定位技術從核心架構、技術原理到部署實施流程等詳解(二)

    本文詳解室內外融合定位系統核心技術,涵蓋北斗RTK厘米級定位、UWB高精度測距、場景自適應切換與多源數據融合四大模塊。通過終端-網絡-平臺三層架構,實現室外高精度、室內無縫銜接的連續定位,支持化工、礦山等高危場景下的精準管控與安防聯動,解決“進車間失聯”難題。
    的頭像 發表于 12-26 17:10 ?619次閱讀

    企業級HDFS高可用與YARN資源調度方案

    作為一名在大數據運維領域摸爬滾打8年的老兵,我見過太多因為基礎架構不夠健壯而導致的生產事故。今天,我想和大家分享一套經過實戰檢驗的 HDFS 高可用與 YARN 資源調度方案,這套方案幫助我們團隊將平臺可用性從 99.5% 提升到 99.99%,年故障時間從 43 小時降
    的頭像 發表于 09-08 17:15 ?732次閱讀

    新能源汽車高壓架構詳解

    應讀者建議,講一下高壓電氣架構,花了一點時間做了一些圖,便于直觀理解,分析一下高壓架構的發展歷程和趨勢。
    的頭像 發表于 09-02 15:01 ?3065次閱讀
    新能源汽車高壓<b class='flag-5'>架構</b><b class='flag-5'>詳解</b>

    光伏智能電網的組成架構

    光伏智能電網是融合光伏發電與智能電網技術的現代電力系統,其核心目標是通過智能化手段實現光伏發電的高效接入、靈活調控與優化運行,從而提升電網的可靠性、經濟性和環保性。以下從組成架構兩方面展開
    的頭像 發表于 07-22 10:54 ?1267次閱讀

    MySQL的組成結構與結構化查詢語言詳解

    MySQL作為世界上最流行的開源關系型數據庫管理系統,采用了分層架構設計
    的頭像 發表于 07-14 11:21 ?640次閱讀

    Nginx架構拆分集群詳解

    單臺服務器運行整個 LNMP 架構會導致網站訪問緩慢,當系統內存被吃滿時,很容易導致系統出現oom,從而kill掉MySQL數據庫,為了避免這種情況的發生,我們可以將數據庫服務拆分到獨立的服務器上部署。
    的頭像 發表于 06-28 16:03 ?1372次閱讀
    Nginx<b class='flag-5'>架構</b>拆分集群<b class='flag-5'>詳解</b>

    Transformer架構概述

    由于Transformer模型的出現和快速發展,深度學習領域正在經歷一場翻天覆地的變化。這些突破性的架構不僅重新定義了自然語言處理(NLP)的標準,而且拓寬了視野,徹底改變了AI的許多方面。
    的頭像 發表于 06-10 14:24 ?1286次閱讀
    Transformer<b class='flag-5'>架構</b><b class='flag-5'>概述</b>

    FPC組成簡介及工程設計規范

    FPC產品簡介概述: 1,FPC概念 2,FPC產品結構組成 3,FPC材料 4,FPC產品類型 5,FPC產品特征 FPC(Flexible Printed Circuit)撓性印刷電路版,簡稱
    發表于 05-27 15:10

    詳解電動汽車的區域控制架構

    故障情況。不同于傳統的域架構,區域控制架構采用集中控制和計算的方式,將分散在各個 ECU 上的軟件統一交由強大的中央計算機處理,從而為下游的電子控制和配電提供了更高的靈活性。
    的頭像 發表于 05-15 09:23 ?2100次閱讀
    <b class='flag-5'>詳解</b>電動汽車的區域控制<b class='flag-5'>架構</b>

    SVPWM的原理及法則推導和控制算法詳解

    SVPWM 是近年發展的一種比較新穎的控制方法,是由三相功率逆變器的六個功率開關元件組成的特定開關模式產生的脈寬調制波,能夠使輸出電流波形盡 可能接近于理想的正弦波形??臻g電壓矢量 PWM 與傳統
    發表于 03-14 14:51

    開關電源各部電路詳解

    開關電源原理及各功能電路詳解 一、 開關電源的電路組成:: 開關電源的主要電路是由輸入電磁干擾濾波器(EMI)、整流濾波電路、功率變換電路、PWM控制器電路、輸出整流濾波電路組成。輔助電路有輸入過
    發表于 03-10 16:51