国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

還在數據中臺與傳統大數據平臺之間傻傻分不清?

工業互聯網前線 ? 來源:大數據DT ? 作者:彭鋒 宋文欣 孫浩 ? 2021-10-12 17:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:彭鋒 宋文欣 孫浩峰

來源:大數據DT(ID:hzdashuju),本文經授權轉載

導讀:我們可以這樣理解,傳統大數據平臺和數據倉庫是數據中臺的數據來源,建設數據中臺是為了更好地服務于業務部門。

圖1-1顯示了信息化系統、數據倉庫、傳統大數據平臺、數據中臺之間的關系,其中的箭頭表示數據的主要流向。

數據中臺與傳統大數據平臺到底有什么區別?為了敘述方便,我們先給出傳統大數據平臺的架構。

大數據基礎能力層:Hadoop、Spark、Hive、HBase、Flume、Sqoop、Kafka、 Elasticsearch等。

在大數據組件上搭建的 ETL流水線,包括數據分析、機器學習程序。

數據治理系統。

數據倉庫系統。

數據可視化系統。

可以看到,這些是傳統大數據平臺的核心功能。在很多大數據項目里,只要把這些系統搭起來,每天可以生成業務報表(包括實時大屏),就算大數據平臺搭建成功了。

但數據中臺應該是大數據平臺的一個超集。我們認為,在大數據平臺的基礎之上,數據中臺還應該提供下面的系統功能。

1. 全局的數據應用資產管理

這里所說的數據應用資產管理包括整個生態系統中的數據和應用。傳統的數據資產管理絕大部分只包括關系型數據庫中的資產(包括Hive),而一個數據中臺應該管理所有結構化、非結構化的數據資產,以及使用這些數據資產的應用。

如果傳統的數據資產管理提供的是數據目錄,那么數據中臺提供的應該是擴展的數據及應用目錄。要避免重復造輪子,首先要知道系統中有哪些輪子,因此維護一個系統中數據及數據應用的列表是很關鍵的。

2. 全局的數據治理機制

與傳統的數據治理不一樣,數據中臺必須提供針對全局的數據治理工具和機制。傳統數據倉庫中的數據建模和數據治理大多針對一個特定部門的業務,部分原因是全局數據建模和治理周期太長,由于存在部門之間的協調問題,往往難度很大。

數據中臺提供的數據治理機制必須允許各個業務部門自主迭代,但前提是要有全局一致的標準。阿里提出的OneID強調全局統一的對象ID(例如用戶ID),就屬于這個機制。

3. 自助的、多租戶的數據應用開發及發布

現有的絕大部分大數據平臺要求使用者具備一定的編程能力。數據中臺強調的是為業務部門賦能,而業務人員需要有一個自助的、可適應不同水平和能力要求的開發平臺。這個開發平臺要能夠保證數據隔離和資源隔離,這樣任何一個使用系統的人都不用擔心自己會對系統造成損害。

4. 數據應用運維

用戶應該可以很方便地將自己開發的數據應用自助發布到生產系統中,而無須經過專門的數據團隊。因為我們需要共享這些應用及其產生的數據,所以需要有類似于CI/CD的專門系統來管理應用的代碼質量和進行版本控制。

在數據應用運行過程中產生的數據也需要全程監控,以保證數據的完整性、正確性和實時性。

5. 數據應用集成

應該可以隨時集成新的數據應用。新的大數據應用、人工智能工具不斷涌現,我們的系統應該能夠隨時支持這些新應用。如果數據中臺不能支持這些應用,各個業務部門可能又會打造自己的小集群,造成新的數據孤島及應用孤島。

6. 數據即服務,模型即服務

數據分析的結果,不管是統計分析的結果,還是機器學習生成的模型,應該能夠很快地使用無代碼的方式發布,并供全機構使用。

7. 數據能力共享管理

大部分數據能力應當具有完善的共享管理機制、方便安全的共享機制以及靈活的反饋機制。最后決定數據如何使用的是獨立的個人,他們需要一套獲取信息的機制,因此在機構內部必須要有這樣的共享機制,才能真正讓數據用起來。

8. 完善的運營指標

數據中臺強調的是可衡量的數據價值,因此,對于數據在系統中的使用方式、被使用的頻率、最后產生的效果,必須要有一定的運營指標,才能驗證數據的價值和數據中臺項目的效率。

綜合上面的討論,除了阿里巴巴提出的OneID、OneModel、OneService之外,我們認為數據中臺還應該滿足以下兩個要求。

1. TotalPlatform

所有中臺數據及相關的應用應該在統一平臺中統一管理。如果有數據存儲在中臺管理不到的地方,或者有人在中臺未知的情況下使用數據,我們就無法真正實現對數據的全局管理。這要求數據中臺能快速支持新的數據格式和數據應用,便于數據工具的共享,而無須建立一個分離的系統。

2. TotalInsight

數據中臺應該能夠理解并管理系統中數據的流動,提供數據價值的定量衡量,明確各個部門的花費和產出。整個中臺的運營是有序可控的,而不是一個黑盒子,用戶可以輕松理解全局的數據資產和能力,從系統中快速實現數據變現。

如圖1-3所示,數據中臺可以說是按照一定的規范要求建設的數據能力平臺,在數據倉庫、大數據平臺、數據服務、數據應用的建設中實現了符合OneID、OneModel、OneService的數據層。

這個數據層,加上在其上建立的業務能力層以及運營這個數據中臺需要的TotalPlatform、TotalInsight,形成我們看到的數據中臺。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據中心
    +關注

    關注

    18

    文章

    5651

    瀏覽量

    75015
  • 人工智能
    +關注

    關注

    1817

    文章

    50098

    瀏覽量

    265328
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136940
  • 數據分析
    +關注

    關注

    2

    文章

    1516

    瀏覽量

    36215
  • 大數據
    +關注

    關注

    64

    文章

    9063

    瀏覽量

    143746

原文標題:數據中臺與傳統大數據平臺有什么區別?終于有人講明白了

文章出處:【微信號:IndustryIOT,微信公眾號:工業互聯網前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大數據解決方案如何實施

    大數據解決方案實施的難點在于以下幾點: ?1.很少有優質可用的數據 ?在數聚股份看來,這幾年數據交易機構如雨后春筍,“數據變現”成為很多擁有
    的頭像 發表于 12-25 18:22 ?1043次閱讀

    大數據平臺運營的基礎是什么

    在數聚股份看來,越來越多的企業開始搭建自己的大數據平臺體系,并傾注大量資源用于平臺的迭代和運營。那么大數據
    的頭像 發表于 12-23 16:07 ?230次閱讀

    工業數據支持接入MySQL數據庫嗎

    工業數據完全支持接入MySQL數據庫 ,且通過數據同步、集成與治理等技術手段,能夠充分發揮MySQL
    的頭像 發表于 12-04 11:23 ?376次閱讀
    工業<b class='flag-5'>數據</b><b class='flag-5'>中</b><b class='flag-5'>臺</b>支持接入MySQL<b class='flag-5'>數據</b>庫嗎

    邊緣計算和人工智能,別再傻傻分不清啦!

    ,今天我們就用最通俗的方式,把這事講明白 一、什么是“邊緣計算”?——讓數據不必跑那么遠 傳統做法是:設備采集的數據,全都上傳到“云端”去處理。比如,一產線設備溫度異常,要傳到服務器
    的頭像 發表于 11-19 15:46 ?309次閱讀

    UV三防漆vs普通三防漆:5大關鍵區別,教你精準避坑!

    別再傻傻分不清!選對三防漆,產品壽命翻倍不是夢。
    的頭像 發表于 10-25 17:45 ?536次閱讀
    UV三防漆vs普通三防漆:5大關鍵區別,教你精準避坑!

    如何規劃數據

    1. 數據是一套解決方案 在數聚股份看來,數據
    的頭像 發表于 10-15 16:04 ?343次閱讀
    如何規劃<b class='flag-5'>數據</b><b class='flag-5'>中</b><b class='flag-5'>臺</b>

    家里220V,工廠380V,電還分不同&quot;花色&quot;?揭秘三相四線與五線的關鍵選擇

    火線、零線、地線傻傻分不清?電工師傅教你如何根據用電選對電能表
    的頭像 發表于 09-10 10:48 ?1482次閱讀
    家里220V,工廠380V,電還分不同&quot;花色&quot;?揭秘三相四線與五線的關鍵選擇

    工業物聯網平臺數據的區別

    定位與使命不同。工業物聯網平臺是“設備數字化底座”,聚焦把工業現場的PLC、機器人、傳感器等實時接入,實現監控、告警、反向控制;數據則是“企業
    的頭像 發表于 08-29 17:23 ?674次閱讀

    數據可以接入哪些物聯網云平臺

    : 一、工業互聯網平臺 工業互聯網平臺聚焦制造業場景,提供設備連接、協議解析、邊緣計算及工業大數據分析能力,與數據
    的頭像 發表于 08-19 15:22 ?759次閱讀

    工業設備與管理系統之間數據是什么?

    。工業設備與管理系統之間數據,就是連接兩者的“數據樞紐”——它通過統一的數據采集、處理、存
    的頭像 發表于 08-11 13:49 ?739次閱讀

    別再傻傻分不清!USB和TYPE-C的全面解析

    別再傻傻分不清!USB和TYPE-C的全面解析
    的頭像 發表于 04-26 15:51 ?1.3w次閱讀

    什么是有功功率/無功功率,電能表是如何計量的?

    什么是有功功率、無功功率,傻傻分不清
    的頭像 發表于 04-11 08:25 ?7373次閱讀
    什么是有功功率/無功功率,電能表是如何計量的?

    智慧水務物聯網平臺數據有什么關系

    ,這些數據是水務系統運行狀態的直接反映。它將分散在不同地點、不同類型的數據源進行整合,實現數據的初步匯聚,為后續的處理和分析提供基礎。 智慧水務物聯網平臺:其
    的頭像 發表于 03-21 15:01 ?646次閱讀

    數據可以解決哪些問題

    數據是一種集成和管理企業內部及外部數據的技術架構,旨在實現數據的采集、存儲、處理、分析和應用。它能夠解決多個方面的問題,具體如下: ?
    的頭像 發表于 03-18 15:24 ?930次閱讀

    MES系統為什么需要數據

    層次的分析和應用。數據作為一種數據管理和服務的架構,能夠為MES系統提供強大的數據支撐,解決傳統
    的頭像 發表于 03-11 11:14 ?761次閱讀
    MES系統為什么需要<b class='flag-5'>數據</b><b class='flag-5'>中</b><b class='flag-5'>臺</b>