国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

50億海量數據如何高效存儲和分析? 華為云數據庫GaussDB (for Cassandra) 3個秘訣搞定

IT科技蘇辭 ? 來源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

50億海量數據如何高效存儲和分析?

華為云數據庫GaussDB (for Cassandra) 3個秘訣搞定

當下,信息社會正在從互聯網時代走向物聯網時代,信息交互變得更加龐雜、高效和智能。對于互聯網公司和IOT企業來說,既是機遇,也是挑戰。因為,企業不可避免的要面對數據量劇增帶來的一系列問題:如何高效存儲和擴容,如何在對原有業務改動最小的情況下做到智能化和實時分析。

針對挑戰,華為云GaussDB (for Cassandra)為客戶提供了強擴展、高存儲、高效導入/導出和實時分析等一系列能力,并成功服務了眾多互聯網公司和IOT企業,獲得了客戶的高度認可和支持。本文將以其中一個客戶業務的痛點問題舉例,聊聊高效存儲和實時分析的3個秘訣。

海量存儲,PB級無感擴展

該用戶在線下本地化部署使用數據庫或者使用其他的存儲為云盤的數據庫時,常常需要在容量達到閾值時,提前規劃和申購存儲資源,可能還需要連帶擴容不必要的計算資源。而使用GaussDB (for Cassandra)之后,便再無此煩惱。GaussDB (for Cassandra)采用存算分離架構,可單獨擴展存儲,高效擴容,業務無感,最高可擴展到PB級。

此外,客戶為了做大數據分析,將數據庫中的數據再寫入一份到HDFS中,供MapReduce和Spark分析,同時需要維護兩套資源,維護和資源成本成為了痛點。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數據庫存儲和對接大數據分析的功能,同時GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發,而不是資源管理。

數據變更捕獲和實時分析

客戶的一個使用場景需要將爬蟲或用戶輸入的數據,進行在線分析和實時推薦業務,該業務中全量數據達到了50億條,但增量數據不足5億,分析對象主要是每日新增數據。在這個場景中,GaussDB (for Cassandra)為客戶提供了streaming服務+實時分析解決方案,在損失小部分讀寫性能的前提下,客戶端無需改造即可做到數據讀寫和實時分析并行,解決方案如下圖,該解決方案主要有以下幾個階段:

1.客戶業務用過開源驅動寫入數據到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對外提供streaming接口,該接口可獲取數據變更捕獲

3.客戶構建的流服務組件讀取streaming接口數據寫入到指定的Kafka隊列

4.Kafka隊列將streaming數據寫入到Spark或者Flink中

5.客戶在Spark中可對增量數據做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數據導出分析

客戶的另一個業務需要周期性對全量數據進行分析和處理,但不想影響在線業務,希望在閑時處理。GaussDB (for Cassandra)提供了全量數據導出和分析解決方案,可在業務低峰期觸發任務進行數據導出和冷數據分析,數據導出速率是開源的10+倍,同時做到對業務讀寫基本無影響。如下為互聯網客戶每周定期導出數據分析用戶畫像的解決方案,該方案有以下幾個階段:

1.客戶根據需求配置ECS規格,并掛載obsfs并行文件系統

2.客戶在DLF上配置導出作業,包括ECS信息,導出參數和定時任務

3.CDM下發作業任務

4.ECS上的導出任務將GaussDB (for Cassandra)中的指定表指定條件的數據導出到obsfs

5.Spark從obsfs中讀取全量數據進行數據分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過這3個秘訣,華為云GaussDB (for Cassandra)完美解決了難擴展、高成本、變更不及時等問題,實現了海量數據的高效存儲和實時分析,為互聯網公司和IOT企業的數字化發展提供了更多可能。

審核編輯黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為云
    +關注

    關注

    3

    文章

    2832

    瀏覽量

    19248
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    恒訊科技解析:如何安裝MySQL并創建數據庫

    管理系統(RDBMS),使用結構化查詢語言(SQL)高效地組織和管理數據。它是全球最受歡迎的開源數據庫系統之一,廣泛應用于網頁開發、電子商務和商業應用。 常見用例? MySQL 是多種應用的可靠選擇,包括: 網絡應用:管理用戶認
    的頭像 發表于 01-14 14:25 ?174次閱讀

    華納香港服務器數據庫索引優化策略

    )實施有效的索引優化策略。無論您是IT管理員還是開發人員,了解這些技巧都能幫助您優化數據庫效率,確保業務高效運轉。下面,華納(hncloud)將通過結構化分析,一步步解析香港服務器
    的頭像 發表于 10-16 17:06 ?518次閱讀

    華納為游戲數據庫選擇高性能NVMe SSD存儲

    游戲數據庫對速度、可靠性和可擴展性有極高要求。隨著在線游戲的發展,開發者越來越依賴NVMe SSD存儲來提供服務器租用和服務器托管解決方案。本文將指導您了解為游戲數據庫選擇高性能NVMe SSD
    的頭像 發表于 09-30 16:03 ?1066次閱讀

    mysql數據恢復—mysql數據庫表被truncate的數據恢復案例

    ECS網站服務器,linux操作系統,部署了mysql數據庫。工作人員在執行數據庫版本更新測試時,錯誤地將本應在測試執行的sql腳本在生產
    的頭像 發表于 09-11 09:28 ?871次閱讀
    mysql<b class='flag-5'>數據</b>恢復—mysql<b class='flag-5'>數據庫</b>表被truncate的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—服務器異常斷電導致Oracle數據庫故障的數據恢復案例

    備份,僅有一些斷斷續續的歸檔日志。 Oracle數據庫恢復流程: 1、檢測數據庫故障情況; 2、嘗試掛起并修復數據庫3、解析數據庫
    的頭像 發表于 07-24 11:12 ?637次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—服務器異常斷電導致Oracle<b class='flag-5'>數據庫</b>故障的<b class='flag-5'>數據</b>恢復案例

    三款主流國產數據庫的技術特點

    隨著數字經濟的快速發展和數據安全要求的提升,國產數據庫正迎來前所未有的發展機遇。在信創浪潮推動下,達夢數據庫、TiDB、華為高斯數據庫等國產
    的頭像 發表于 07-14 11:08 ?1145次閱讀

    milvus向量數據庫的主要特性和應用場景

    Milvus 是一開源的向量數據庫,專門為處理和分析大規模向量數據而設計。它適用于需要高效存儲
    的頭像 發表于 07-04 11:36 ?1067次閱讀
    milvus向量<b class='flag-5'>數據庫</b>的主要特性和應用場景

    數據庫數據恢復—MongoDB數據庫文件丟失的數據恢復案例

    MongoDB數據庫數據恢復環境: 一臺操作系統為Windows Server的虛擬機上部署MongoDB數據庫。 MongoDB數據庫故障: 工作人員在MongoDB服務仍
    的頭像 發表于 07-01 11:13 ?637次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—MongoDB<b class='flag-5'>數據庫</b>文件丟失的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫被加密如何恢復數據

    SQL Server數據庫故障: SQL Server數據庫被加密,無法使用。 數據庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發表于 06-25 13:54 ?671次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>被加密如何恢復<b class='flag-5'>數據</b>?

    SQLSERVER數據庫是什么

    SQL Server 是由微軟公司開發的一款 關系型數據庫管理系統(RDBMS) ,用于存儲、管理和檢索結構化數據。它是企業級應用中廣泛使用的數據庫解決方案之一,尤其適用于Window
    的頭像 發表于 05-26 09:19 ?1168次閱讀

    MySQL數據庫是什么

    MySQL數據庫是一種 開源的關系型數據庫管理系統(RDBMS) ,由瑞典MySQL AB公司開發,后被Oracle公司收購。它通過結構化查詢語言(SQL)進行數據存儲、管理和操作,廣
    的頭像 發表于 05-23 09:18 ?1205次閱讀

    HarmonyOS5服務技術分享--數據庫使用指南

    ??: 敏感數據啟用字段級加密(如用戶手機號)。 ? ??總結?? 華為數據庫(CloudDB)讓HarmonyOS應用的數據管理變得輕
    發表于 05-22 18:29

    分布式存儲數據恢復—虛擬機上hbase和hive數據庫數據恢復案例

    分布式存儲數據恢復環境: 16臺某品牌R730xd服務器節點,每臺服務器節點上有數臺虛擬機。 虛擬機上部署Hbase和Hive數據庫。 分布式存儲故障:
    的頭像 發表于 04-17 11:05 ?714次閱讀

    #### KEPServerEX 數據存儲插件\\-2

    觸發存儲。 觸發條件類型具體如下: 二、存儲數據的時候有沒有一值可以代表某一類設備/數據,方便后期數據
    發表于 04-09 16:09

    數據庫數據恢復——MongoDB數據庫文件拷貝后服務無法啟動的數據恢復

    MongoDB數據庫數據恢復環境: 一臺Windows Server操作系統虛擬機上部署MongoDB數據庫。 MongoDB數據庫故障: 管理員在未關閉MongoDB服務的
    的頭像 發表于 04-09 11:34 ?864次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復——MongoDB<b class='flag-5'>數據庫</b>文件拷貝后服務無法啟動的<b class='flag-5'>數據</b>恢復