国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

vivo服務端監控架構設計與實踐

PLC工控專欄 ? 來源:加密狗破解 ? 作者:加密狗破解 ? 2022-02-22 09:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當今時代處在信息大爆發的時代,信息借助互聯網的潮流在全球自由的流動,產生了各式各樣的平臺系統和軟件系統,越來越多的業務也會導致系統的復雜性。

當核心業務出現了問題影響用戶體驗,開發人員沒有及時發現,發現問題時已經為時已晚,又或者當服務器的CPU持續增高,磁盤空間被打滿等,需要運維人員及時發現并處理,這就需要一套有效的監控系統對其進行監控和預警。

如何對這些業務和服務器進行監控和維護是我們開發人員和運維人員不可忽視的重要一環,這篇文章全篇大約5000多字,我將對vivo服務端監控的原理和架構演進之路做一次系統性整理,以便大家做監控技術選型時參考。

vivo服務端監控旨在為服務端應用提供包括系統監控、JVM監控以及自定義業務指標監控在內的一站式數據監控,并配套實時、多維度、多渠道的告警服務,幫助用戶及時掌握應用多方面狀態,事前及時預警發現故障,事后提供詳實的數據用于追查定位問題,提升服務可用性。目前vivo服務端監控累計接入業務方數量達到200+,本文介紹的是服務端監控,我司還有其他類型的優秀監控包括通用監控、調用鏈監控和客戶端監控等。

1.1 監控系統的基本流程

無論是開源的監控系統還是自研的監控系統,整體流程都大同小異。

1)數據采集:可以包括JVM監控數據如GC次數,線程數量,老年代和新生代區域大??;系統監控數據如磁盤使用使用率,磁盤讀寫的吞吐量,網絡的出口流量和入口流量,TCP連接數;業務監控數據如錯誤日志,訪問日志,視頻播放量,PV,UV等。

2)數據傳輸:將采集的數據以消息形式或者 HTTP 協議的形式等上報給監控系統。

3)數據存儲:有使用 MySQL、Oracle 等 RDBMS 存儲的,也有使用時序數據庫OpenTSDB、InfluxDB 存儲的,還有使用 HBase 直接存儲的。

4)數據可視化:數據指標的圖形化展示,可以是折線圖,柱狀圖,餅圖等。

5)監控告警:靈活的告警設置,以及支持郵件、短信、IM 等多種通知通道。

1.2 如何規范的使用監控系統

在使用監控系統之前,我們需要了解監控對象的基本工作原理,例如JVM監控,我們需要清楚JVM的內存結構組成和常見的垃圾回收機制;其次需要確定如何去描述和定義監控對象的狀態,例如監控某個業務功能的接口性能,可以監控該接口的請求量,耗時情況,錯誤量等;在確定了如何監控對象的狀態之后,需要定義合理的告警閾值和告警類型,當收到告警提醒時,幫助開發人員及時發現故障;最后建立完善的故障處理體系,收到告警時迅速響應,及時處理線上故障。

二、vivo服務端監控系統架構及演進之路

在介紹vivo服務端監控系統架構之前,先帶大家了解一下OpenTSDB時序數據庫,在了解之前說明下為什么我們會選擇OpenTSDB,原因有以下幾點:

1) 監控數據采集指標在某一時間點具有唯一值,沒有復雜的結構及關系。

2)監控數據的指標具有隨著時間不斷變化的特點。

3)基于HBase分布式、可伸縮的時間序列數據庫,存儲層不需要過多投入精力,具有HBase的高吞吐,良好的伸縮性等特點。

4)開源,Java實現,并且提供基于HTTP的應用程序編程接口,問題排查快可修改。

2.1 OpenTSDB簡介

1)基于HBase的分布式的,可伸縮的時間序列數據庫,主要用途就是做監控系統。譬如收集大規模集群(包括網絡設備、操作系統、應用程序)的監控數據并進行存儲和查詢,支持秒級數據采集,支持永久存儲,可以做容量規劃,并很容易地接入到現有的監控系統里,OpenTSDB的系統架構圖如下:

vivo服務端監控架構設計與實踐

存儲結構單元為Data Point,即某個Metric在某個時間點的數值。Data Point包括以下部分:

Metric,監控指標名稱;

Tags,Metric的標簽,用來標注類似機器名稱等信息,包括TagKey和TagValue;

Value,Metric對應的實際數值,整數或小數;

Timestamp,時間戳。

核心存儲兩張表:tsdb和tsdb-uid。表tsdb用來存儲監控數據,如下圖:

vivo服務端監控架構設計與實踐

Row Key為Metric+Timestamp的小時整點+TagKey+TagValue,取相應的字節映射組合起來;列族t下的Qualifier為Timestamp的小時整點余出的秒數,對應的值即為Value。

表tsdb-uid用來存儲剛才提到的字節映射,如下圖:

vivo服務端監控架構設計與實踐

圖中的“001”表示tagk=hots或者tagv=static,提供正反查詢。

2)OpenTSDB使用策略說明:

不使用OpenTSDB提供的rest接口,通過client與HBase直連;

工程端禁用compact動作的Thrd線程;

間隔10秒獲取Redis緩沖數據批量寫入OpenTSDB。

2.2OpenTSDB在實踐中需要關注的點

1)精確性問題

String value = "0.51";
float f = Float.parseFloat(value);
int raw = Float.floatToRawIntBits(f);
byte[] float_bytes = Bytes.fromInt(raw);
int raw_back = Bytes.getInt(float_bytes, 0);
double decode = Float.intBitsToFloat(raw_back);
/**
 * 打印結果:
 * Parsed Float: 0.51
 * Encode Raw: 1057132380
 * Encode Bytes: 3F028F5C
 * Decode Raw: 1057132380
 * Decoded Float: 0.5099999904632568
 */
System.out.println("Parsed Float: " + f);
System.out.println("Encode Raw: " + raw);
System.out.println("Encode Bytes: " + UniqueId.uidToString(float_bytes));
System.out.println("Decode Raw: " + raw_back);
System.out.println("Decoded Float: " + decode);

如上代碼,OpenTSDB在存儲浮點型數據時,無法知悉存儲意圖,在轉化時會遇到精確性問題,即存儲"0.51",取出為"0.5099999904632568"。

2)聚合函數問題

OpenTSDB的大部分聚合函數,包括sum、avg、max、min都是LERP(linear interpolation)的插值方式,即所獲取的值存在被補缺的現象,對于有空值需求的使用很不友好。詳細原理參見OpenTSDB關于interpolation的文檔。

目前vmonitor服務端監控使用的OpenTSDB是我們改造后的源碼,新增了nimavg函數,配合自帶的zimsum函數滿足空值插入需求。

2.3vivo服務端監控采集器原理

vivo服務端監控架構設計與實踐

1)定時器

內含3種采集器:OS采集器、JVM采集器和業務指標采集器,其中OS及JVM每分鐘執行采集和匯聚,業務指標采集器會實時采集并在1分鐘的時間點完成匯聚重置,3份采集器的數據打包上報至RabbitMQ,上報動作異步超時。

2)業務指標采集器

業務指標采集方式有2種:日志輸出過濾和工具類代碼上報(侵入式),日志輸出過濾是通過繼承log4j的Filter,從而獲取指標配置中指定的Appender輸出的renderedMessage,并根據指標配置的關鍵詞、聚合方式等信息進行同步監聽采集;代碼上報根據代碼中指定的指標code進行message信息上報,屬于侵入式的采集方式,通過調用監控提供的Util實現。業務指標配置每隔5分鐘會從CDN刷新,內置多種聚合器供聚合使用,包括count計數、 sum求和、average平均、max最大值和min最小值統計。

2.4 vivo服務端監控老版本架構設計

vivo服務端監控架構設計與實踐

1)數據采集及上報:需求方應用接入的監控采集器vmonitor-agent根據監控指標配置采集相應數據,每分鐘上報1次數據至RabbitMQ,所采用的指標配置每5分鐘從CDN下載更新,CDN內容由監控后臺上傳。

2)計算及存儲:監控后臺接收RabbitMQ的數據,拆解后存儲至OpenTSDB,供可視化圖表調用,監控項目、應用、指標和告警等配置存儲于MySQL;通過Zookeeper和Redis實現分布式任務分發模塊,實現多臺監控服務協調配合運作,供分布式計算使用。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 監控
    +關注

    關注

    6

    文章

    2380

    瀏覽量

    59421
  • 服務器
    +關注

    關注

    14

    文章

    10251

    瀏覽量

    91480
  • vivo
    +關注

    關注

    13

    文章

    3340

    瀏覽量

    66788
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    EtherCAT FOE工作原理揭秘:客戶-服務器模型如何運轉?

    上期我們聊了EtherCATFOE的五大應用場景,本期深入解析其底層工作機制。FOE究竟是如何實現文件傳輸的?答案藏在客戶-服務器模型中。核心架構:一客戶
    的頭像 發表于 03-02 11:50 ?76次閱讀
    EtherCAT FOE工作原理揭秘:客戶<b class='flag-5'>端</b>-<b class='flag-5'>服務</b>器模型如何運轉?

    新西蘭服務器運維必備:自動化監控與故障預警實踐

    。 什么是自動化監控與故障預警? 自動化監控與故障預警是服務器運維中的一種實踐,通過自動化手段對服務器進行持續
    的頭像 發表于 02-26 14:26 ?151次閱讀

    無線賦能,配電智控:系統設計與應用實踐

    智能配電監控系統的無線化設計,始終圍繞 “感知全面、傳輸穩定、監控智能、部署便捷” 的核心目標,摒棄傳統有線系統的布線痛點,通過模塊化、分層化的架構設計,讓配電監控更貼合實際應用需求。
    的頭像 發表于 02-04 16:51 ?494次閱讀
    無線賦能,配電智控:系統設計與應用<b class='flag-5'>實踐</b>

    全液冷服務器系統架構設計案例分享

    服務器的全液冷,一般都需要液冷板覆蓋CPU、內存(DIMM)、硬盤(SSD)、電源、IO以及其他SOC的散熱。今天給大家分享一款浪潮的全液冷冷板服務器的液冷系統架構。
    的頭像 發表于 01-27 15:33 ?442次閱讀
    全液冷<b class='flag-5'>服務</b>器系統<b class='flag-5'>架構設</b>計案例分享

    OPC UA 服務端用戶認證的底層邏輯:哈希與加鹽應用詳解

    摘要在基于UnifiedAutomationSDK開發OPCUA服務端時,用戶認證(UserAuthentication)是安全體系的第一道防線。除了傳輸層的加密通道外,服務端如何安全地存儲和驗證
    的頭像 發表于 01-15 17:29 ?143次閱讀
    OPC UA <b class='flag-5'>服務端</b>用戶認證的底層邏輯:哈希與加鹽應用詳解

    20個常用服務端口及對應服務信息

    (1) 端口號:21 服務名稱:FTP 服務描述:文件傳輸協議,用于在客戶服務器之間傳輸文件。 (2) 端口號:22 服務名稱::SS
    發表于 12-03 06:07

    分布式光伏環境監測站的技術架構與應用實踐

    分布式光伏環境監測站的技術架構與應用實踐 柏峰【BF-GFQX】一、系統技術架構解析 分布式光伏環境監測站采用“感知層-傳輸層-應用層”三層架構設計,實現環境數據的全鏈路智能化處理。
    的頭像 發表于 10-13 10:05 ?578次閱讀
    分布式光伏環境監測站的技術<b class='flag-5'>架構</b>與應用<b class='flag-5'>實踐</b>

    TensorRT-LLM的大規模專家并行架構設

    之前文章已介紹引入大規模 EP 的初衷,本篇將繼續深入介紹 TensorRT-LLM 的大規模專家并行架構設計與創新實現。
    的頭像 發表于 09-23 14:42 ?1106次閱讀
    TensorRT-LLM的大規模專家并行<b class='flag-5'>架構設</b>計

    Zabbix與Prometheus運維監控系統的對比

    在當今云原生和微服務架構盛行的時代,監控系統已成為運維工程師不可或缺的核心工具。面對市場上眾多監控解決方案,Zabbix和Prometheus作為兩大主流選擇,各自擁有獨特的優勢和適用
    的頭像 發表于 09-18 14:57 ?648次閱讀

    華納云:海外服務器負載均衡與高可用架構設

    在現代互聯網應用中,海外服務器承擔著跨境業務、高并發請求和實時數據傳輸的關鍵角色。單臺服務器難以支撐大量并發請求,一旦發生故障,可能導致服務中斷和業務損失。因此,合理設計負載均衡與高可用架構
    的頭像 發表于 08-28 18:32 ?655次閱讀

    深入剖析RabbitMQ高可用架構設

    在微服務架構中,消息隊列故障導致的系統不可用率高達27%!如何構建一個真正可靠的消息中間件架構?本文將深入剖析RabbitMQ高可用設計的核心要點。
    的頭像 發表于 08-18 11:19 ?956次閱讀

    蔚來模型化架構如何大幅提升安全上限

    2024年7月,蔚來將行業首個基于模型化架構的「自動緊急制動 AEB」推送上車,蔚來也成為了行業首家使用模型化
    的頭像 發表于 08-15 15:35 ?923次閱讀

    不用聯網不用編程,PLC通過智能網關快速實現HTTP協議JSON格式與MES等系統平臺雙向數據通訊

    智能網關IGT-DSER支持POST/GET/PUT等多種方法,可同時作為HTTP協議的客戶服務端。作為客戶通訊時將JSON文件提交給HTTP的服務端, 如果
    的頭像 發表于 05-13 14:40 ?1194次閱讀
    不用聯網不用編程,PLC通過智能網關快速實現HTTP協議JSON格式與MES等系統平臺雙向數據通訊

    一文帶你厘清自動駕駛架構差異

    [首發于智駕最前沿微信公眾號]隨著自動駕駛技術飛速發展,智能駕駛系統的設計思路也經歷了從傳統模塊化架構大模型轉變。傳統模塊化架構將感知、預測、規劃和控制等子任務拆分開,分別由不
    的頭像 發表于 05-08 09:07 ?1029次閱讀
    一文帶你厘清自動駕駛<b class='flag-5'>端</b>到<b class='flag-5'>端</b><b class='flag-5'>架構</b>差異

    設備遠程監控與預測性維護系統架構設計及應用實踐

    本文探討了在工業4.0與數字化轉型背景下,設備管理系統從傳統人工巡檢向智能運維的深刻變革。文章從技術架構、實施路徑和典型應用三個方面深入解析了設備遠程監控與預測性維護系統的實現方法。
    的頭像 發表于 04-15 10:16 ?1212次閱讀
    設備遠程<b class='flag-5'>監控</b>與預測性維護系統<b class='flag-5'>架構設</b>計及應用<b class='flag-5'>實踐</b>