国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

湖倉一體:揭秘數據湖架構現代化之道

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-07-17 21:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Hebert W. Pereyra,IBM 杰出工程師,Hybrid Data Management首席架構師

譯者:劉俊 ,IBM watsonx.data開發架構師

北京2023年7月17日/美通社/ -- 數據湖誕生至今已有十多年的歷史,為全球一些最大的企業提供了數據分析的支持。然而,也有人認為,絕大多數數據湖部署已經演變成為"數據沼澤"。不論你站在哪一邊,現實情況是,這些系統中仍然承載著大量的數據。這些數據規模龐大,使得移動、遷移或對其進行現代化都變得異常困難。

數據湖的巨大挑戰:單一結構的架構問題

從較高層次來看,數據湖是一個大規模的單一數據存儲庫。數據可以以原始形式存儲,也可以經過優化,采用適合專用引擎使用的不同格式。

就Hadoop而言,它是最受歡迎的數據湖之一,通過使用開源軟件實現該存儲庫,并在通用硬件上運行,可以以非常低的成本在系統中存儲大量數據。數據可以以開放的數據格式進行持久化,從而實現了數據消費的民主化,并通過自動復制提供了高可用性的支持。默認的處理框架具備從故障中恢復的能力。這無疑是與傳統分析環境有著顯著差異的重要轉變,傳統數據分析環境往往意味著供應商鎖定以及無法處理大規模數據。

另一個出乎意料的挑戰是將Spark引入作為大數據處理框架。由于其支持數據轉換、流式處理和SQL,它迅速獲得了廣泛的認可。然而,它并未能與現有的數據湖環境友好共存,因此通常需要額外的專用計算集群才能運行Spark。

我們將時間前移15年回到當下,現實已經清楚地表明了這項技術所涉及的權衡和妥協。其快速的采用意味著客戶很快失去了對數據湖中數據的追蹤。同樣具有挑戰的是,他們無法確定數據的來源、獲取方式以及在處理過程中的轉換方式。數據治理仍然是這項技術中尚未探索的領域。雖然軟件可能是開源的,但需要有人學習如何使用、維護和支持它。僅依賴社區支持并不能持續滿足業務運營所需的響應時間。高可用性通過復制實現則意味著需要更多磁盤上的數據副本,增加存儲成本,并導致故障更加頻繁。而高可用的分布式處理框架則意味著不得不在性能方面做出妥協,以換取彈性(這將導致交互式分析和商業智能的性能嚴重下降)。

為何要對數據湖進行現代化?

數據湖在特定的使用場景中已經被證明是成功的。然而清楚的是,企業迫切需要對這些部署進行現代化,保護基礎設施、技能和存儲在這些系統中的數據的投資。

在尋找答案的過程中,行業研究了現有的數據平臺技術及其優勢。很明顯,有效的方法是將傳統的(或者說是遺留的)數據倉庫或數據集市的關鍵特性與數據湖的優勢結合起來。以下幾個關鍵要素迅速浮出水面:

具備彈性和可擴展的存儲,能夠滿足日益增長的數據規模需求。

采用開放的數據格式,使數據對所有人都可訪問,同時針對高性能進行優化,并具備良好定義的結構。

開放的元數據(可共享),能夠支持多個消費引擎或框架。

支持數據更新(ACID特性)和事務并發處理。

綜合的數據安全和數據治理(如數據血緣、完整的數據訪問策略定義和執行,包括地理分布)。

上述要素導致了湖倉一體的出現。湖倉一體是一種數據平臺,是將數據倉庫和數據湖的優點融合在一起,形成統一、協調的數據管理解決方案。

利用watsonx.data來現代化數據湖的好處

站在當下數據分析的十字路口,IBM的回應是為企業提供watsonx.data解決方案。

站在當下數據分析的十字路口,IBM的回應是為企業提供watsonx.data解決方案,這是一個用于大規模數據管理的新型開放式數據存儲,允許企業在無需遷移的情況下圍繞、增強和現代化其現有的數據湖和數據倉庫。它支持開放式的多云與混合云,可以在客戶管理的基礎設施(本地或者私有云)和公有云上運行。它建立在湖倉一體架構之上,并嵌入了一整套解決方案(以及通用軟件堆棧),適用于所有形態。

與市場上的競品相比,IBM的方法基于開源堆棧和架構。這些組件并不是新的,而是業界已經廣泛使用的成熟組件。IBM關注它們的互操作性、共存性和元數據交換。用戶可以快速入門,從而大大降低了入門和使用的成本,因為其上層架構和基礎概念是大家熟悉且直觀的:

通過對象存儲實現開放的數據(和表格格式)

通過S3進行數據訪問

使用Presto和Spark進行查詢計算(SQL、數據科學、轉換和流處理)

通過Hive和兼容結構實現開放的元數據共享

Watsonx.data為企業提供了一種保護他們在數據湖和數據倉庫數十年投資的方式,使企業可立即擴展并逐步現代化其安裝,將每個組件專注于對企業最重要的使用場景。

一個關鍵的差異化因素是多引擎策略,允許用戶在統一的數據平臺上根據實際情況選擇適合的技術。watsonx.data使客戶能夠實現完全動態的分層存儲(以及相關的計算)。隨著時間的推移,這可以帶來非常顯著的數據管理和處理的成本節省。

如果最終企業的目標是通過湖倉一體架構來現代化現有的數據湖部署,那么watsonx.data則通過選擇計算方式來最小化數據遷移和應用遷移,從而簡化了任務。

接下來可以做什么?

在過去的幾年里,數據湖在大多數企業的數據管理策略中發揮了重要作用。如果企業的目標是對其數據管理策略進行演進并現代化為真正的混合分析云架構,那么IBM基于湖倉一體架構構建的新型數據存儲watsonx.data,則是值得企業考慮的技術選擇。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4790

    瀏覽量

    90058
  • 架構
    +關注

    關注

    1

    文章

    532

    瀏覽量

    26589
  • 數據分析
    +關注

    關注

    2

    文章

    1516

    瀏覽量

    36215
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    生態水量動態監測與管理系統

    生態水量是維持水生態系統健康的關鍵要素,關系到生物多樣性、水質凈化與景觀維護。傳統河湖水量管理多依賴人工觀測與經驗調度,難以實現動態精準調控,容易造成生態用水不足或浪費。同時,在進行數據匯總
    的頭像 發表于 02-05 13:36 ?127次閱讀
    河<b class='flag-5'>湖</b>生態水量動態監測與管理系統

    機電液一體化集成創新:現代液壓伺服電液執行器的原理、架構與設計范式演進

    在全球工業自動與智能浪潮的推動下,作為高端機電液一體化核心部件的液壓伺服電液執行器,正迎來市場規模與技術革新的雙重擴張。根據行業研究報告,全球伺服液壓執行器市場規模預計將從2025年的2.03億美元增長至2031年的2.59
    的頭像 發表于 02-04 10:07 ?124次閱讀
    機電液<b class='flag-5'>一體化</b>集成創新:<b class='flag-5'>現代</b>液壓伺服電液執行器的原理、<b class='flag-5'>架構</b>與設計范式演進

    軟通動力旗下鴻萬聯榮膺開源鴻蒙共建貢獻TOP單位

    11月28日,以“在起,就可以”為主題的鴻蒙星光盛典生態論壇于深圳召開。在這場開源生態的年度盛會上,軟通動力及子公司鴻萬聯,作為開源鴻蒙的核心共建單位受邀出席,榮膺“共建貢獻TOP單位”殊榮,并
    的頭像 發表于 12-01 14:31 ?511次閱讀

    部署Denodo與數據架構聯用,用戶可獲得345%投資回報率(ROI),實現3–4倍數據洞察提速

    投資價值最大化 Veqtor8 對比了企業在僅使用現代數據(如 Snowflake、Databricks)與在其基礎上部署 Deno
    的頭像 發表于 10-23 17:27 ?677次閱讀

    NetApp助力對象存儲現代化,提升速度、可擴展性和安全性

    計。最新版本的StorageGRID將引入新功能,旨在推進人工智能計劃、提高數據安全性并實現企業數據基礎設施的現代化。 無論企業是處于數據
    的頭像 發表于 09-11 10:41 ?546次閱讀

    水利水文監測與河長制管理平臺解決方案

    人工巡查、紙質記錄,存在信息傳遞滯后、管理效率低下、問題發現不及時等問題,難以滿足現代管理復雜多變的需求。對此,物通博聯以“水文數采網關+河長制信息管理平臺”為核心,提出
    的頭像 發表于 08-25 14:27 ?697次閱讀
    水利水文監測與河<b class='flag-5'>湖</b>長制管理平臺解決方案

    生態流量監測平臺解決方案?

    依賴人工測流、定點觀測,存在數據采集頻次低、覆蓋范圍有限、生態流量達標評估滯后等問題,不僅難以實時掌握河生態基流變化,還可能因相關措施不及時而導致河道斷流、水質惡化、生物多樣性減少等生態問題,制約流域生態
    的頭像 發表于 08-22 17:08 ?621次閱讀
    河<b class='flag-5'>湖</b>生態流量監測平臺解決方案?

    文看懂“存算一體

    今天這篇文章,我們來聊個最近幾年很火的概念——存算一體。為什么會提出“存算一體”?存算一體,英文叫ComputeInMemory,簡稱CIM。顧名思義,就是將存儲和計算放在
    的頭像 發表于 08-18 12:15 ?1438次閱讀
    <b class='flag-5'>一</b>文看懂“存算<b class='flag-5'>一體</b>”

    微軟推出全新Microsoft Sentinel數據國際版

    近期,MicrosoftSentinel數據(國際版)正式開放公開預覽,重塑安全運營架構。它通過統所有安全數據,以遠低于傳統方案的成本,
    的頭像 發表于 08-04 15:36 ?975次閱讀

    現代化智慧農業四情監測設備方案

    現代化智慧農業四情監測設備方案 柏峰【BF-NYSQ】強農固本,為推進中國式現代化提供基礎支撐,農穩社稷,糧安天下。強化耕地保護和質量提升、推進農業科技力量,全方位夯實國家糧食安全根基,堅持產量產能、生產生態、增產增收起抓,切
    的頭像 發表于 08-01 10:11 ?811次閱讀
    <b class='flag-5'>現代化</b>智慧農業四情監測設備方案

    軟通動力攜手鴻萬聯亮相華為開發者大會2025

    近日,華為開發者大會 2025在東莞松山盛大舉行,軟通動力攜子公司鴻萬聯深度參與會議。作為開源鴻蒙核心共建者,鴻萬聯集中展示了基于天鴻操作系統(SwanLinkOS)及天鴻智能
    的頭像 發表于 06-26 14:15 ?1104次閱讀

    從接口到架構:工控一體機定制的深度技術剖析

    在工業4.0與數字轉型的浪潮中,工控一體機作為工業自動與信息融合的核心載體,正通過深度定制技術重構工業控制系統的底層邏輯。從硬件接口
    的頭像 發表于 06-17 16:47 ?565次閱讀

    模塊設計賦能:工控一體機廠家聚徽分享如何通過靈活架構滿足多樣化工業需求?

    了有效途徑。通過將工控一體機的硬件和軟件拆分為獨立、可替換的模塊,以靈活架構滿足多樣化工業需求,使工控一體機在工業自動領域展現出更強的適應性和生命力。
    的頭像 發表于 05-23 16:42 ?871次閱讀

    測控一體化閘門工情監控運維管理系統

    在當今數字浪潮席卷各行各業的時代,水利行業也正加速邁向智能、精細化管理的新征程。測控一體化閘門作為現代化水利設施的關鍵組成部分,對于實現水資源的精準調配、高效利用以及保障水利工程安
    的頭像 發表于 04-15 17:19 ?1038次閱讀
    測控<b class='flag-5'>一體化</b>閘門工情監控運維管理系統