国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

存儲磁盤故障預測和性能容量預測技術

浪潮存儲 ? 來源:浪潮存儲 ? 作者:浪潮存儲 ? 2020-09-08 11:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著“新基建”的逐步發展落地,現代數據中心迅速崛起,數據量呈指數級增長,同時各種新存儲介質和技術的應用,使得存儲系統變得越來越復雜。用戶需要一套穩定、高性能且簡單易用的存儲系統。 AI技術可以解決存儲系統使用的復雜性問題,提供簡單易用、智能化的存儲系統。AI會不斷地從存儲及其運行環境中采集存儲的各種狀態信息和性能數據,用機器學習算法分析,學習用戶的存儲使用情況,進而自動化的調整并優化存儲系統,使存儲服務能更好地適應用戶的需求。有AI加持的智能化存儲可以增強系統的可靠性,降低存儲的復雜性和維護成本。 因此,在前期的文章中,我們提出”客戶的未來,從AI加持的新存儲開始”的觀點,并介紹了存儲AIOps的五大關鍵技術:監控、學習、預測、推薦、實施。 今天我們來具體探討一下被客戶重點關注的存儲磁盤故障預測和性能容量預測技術。

1

磁盤故障預測和性能容量預測

給復雜的存儲管理做“減法”

存儲本身很復雜,數據中心環境和客戶應用也很復雜,預測性分析技術是準確預測存儲風險和故障,解決存儲的復雜性的重要一部分。預測性分析技術是通過分析歷史的日志、告警、報錯等信息,AI算法可以自動分析出問題出現前的頻繁出現的數據模式,之后在從正常存儲系統上匹配這些AI學習到模式就能形成預測。 對于一個復雜的存儲系統來說,用戶關注最多的是硬盤、性能和容量的預測分析,磁盤故障預測和性能容量預測則成為兩大關鍵功能。 為什么關注硬盤故障預測?

公開數據顯示百度數據中心4年29萬次硬件故障中,硬盤故障占比高達81.84%。對于傳統的存儲廠商來說,雖然磁盤的絕對故障率不高,但是在所有的存儲部件中,如CPU、內存、主板、網卡、HBA卡、電源等,磁盤的故障率是最高的。

雖然傳統存儲有RAID、副本等機制,但是數據重建過程中使用了大量IO資源,這導致存儲性能嚴重下降,而且重建時間很長往往以天計。因此,數據重建對客戶的業務影響很大。如果我們可以提前預測磁盤故障,用戶可以選擇業務不繁忙的時間來重建數據,那么重建帶來的影響可以忽略不計。同時,預測可以把突發事件變為計劃事件,也降低了存儲的維護成本。

為什么關注容量性能預測?

除故障外,用戶在日常使用存儲的過程中關注最多的就是容量和性能。系統容量不足會導致系統不可用,客戶業務中斷。性能指標主要指時延、帶寬、IOPS,隨著用戶業務的發展,給存儲帶來的性能壓力越來越大,性能不足會讓客戶的應用變慢甚至無響應。

利用AI技術,對存儲的性能、容量變化趨勢進行準確預測,一方面可以告知客戶進行擴容、軟硬件升級的時間點,另一方面也能提供存儲規劃的具體參考指標。

2

存儲磁盤故障預測技術 同典型的AI系統一樣,先對歷史數據進行訓練,生成AI模型,最后在新的數據到來時形成預測。具體說包括以下五個部分:輸入數據、預處理、模型訓練、優化集成和預測。對于軟件系統來說關鍵點有:數據來源、算法選擇和評估指標。

磁盤故障預測系統整體架構 數據來源

硬盤本身提供了SMART數據(Self-Monitoring Analysis andReporting Technology)。SMART是90年代定義的硬盤狀態檢測和預警系統的規范,提供了磁頭、磁盤、電機、電路等硬盤硬件的運行數據。目前幾乎所有的硬盤廠商都已經支持了該規范。下表列出了與故障相關的SMART值。

表1:故障相關的SMART值

絕大多數的廠商和科研院校都是基于SMART數據進行磁盤故障預測,且都取得了不錯的效果。但是在2020年2月的存儲頂會FAST(USENIXConference on File and Storage Technologies)上發表的最新論文表明,SMART再加上存儲性能數據可以進一步提升預測準確率。作者采用了12個磁盤IO性能指標、18個服務器性能指標、4個位置信息,基于CNN和LSTM的AI算法實現了提前10天故障預測誤報率0.5%、漏報率5.1%。我們期待著存儲產品上能應用最新的技術來進一步提高預測的準確性。

算法選擇

可用于磁盤故障預測的AI算法有很多,如傳統算法決策樹、經典的SVM(Support Vector Machine)、在各種競賽上大放異彩的XGBoost(Gradient Tree Boosting)以及深度學習算法CNN和LSTM。實際效果及頂級會議KDD、ATC、FAST的論文實驗結果都表明,XGBoost、CNN、LSTM的效果比傳統算法有明顯優勢。

評價指標在完成了歷史數據訓練,故障預測之后,我們需要對預測的效果進行評估。表2描述了機器學習中標準的評價指標。

表2:機器學習模型評價指標

基于表2中的定義,評價磁盤故障預測的主要有準確率、漏報率和誤報率:

準確率=:判定正確的盤(含好盤和壞盤)占所有盤的比例

誤報率=:好盤被誤判成壞盤占所有好盤的比例

漏報率=:沒有識別出的壞盤占所有壞盤的比例

準確率高,誤報和漏報低,是我們追求的目標。這相當于我們在發現幾乎壞盤的同時沒有把好盤誤判成壞盤。但是從算法調優的角度看,誤報率和漏報率是一對矛盾,誤報率的降低會引起漏報率的上升,漏報率的降低會引起誤報率的上升。對于同一個算法來說,如果誤報和漏洞同時降低,很可能發生了過擬合現象,當換一類盤后,誤報和漏報都會大幅上升。

3

存儲性能容量預測技術 對于存儲來說,性能和容量預測是兩件不同的事情,都為客戶帶來不同的價值。但是站在技術角度,兩者都屬于數據挖掘中時間序列預測問題(Time Series Prediction)。時間序列,也叫時間數列、歷史復數或動態數列。它是將某種統計指標的數值,按時間先后順序排到所形成的數列。預測的基本原理是:統計分析過去的時間序列數據,形成擬合函數或者AI算法模型,以擬合的函數結果或模型來預測未來的趨勢。

時間序列預測法可用于短期、中期和長期預測。造成時間序列數據發生變化的因素主要有以下四個:

趨勢性:時間序列曲線呈現出一種緩慢而長期的持續上升、下降、不變的整體趨勢。

周期性:由于外部的影響,隨季節的交替,時間序列曲線有明顯的周期性的高峰、低谷。

隨機性:個別的數據變化為隨機變動,但整體呈現出統計規律。

綜合性:以上幾種變化因素的疊加或組合。預測時可以過濾除去不規則的隨機因素,最終展現出趨勢性和周期性變動。

經典的時間序列預測算法有ARIMA、線性回歸、深度學習算法等。這些算法有各自的優劣勢,產品會根據不同的客戶應用場景來選擇不同的算法。下圖展示了各個算法的實際效果。

時間序列算法效果比較

對于存儲來說,除核心算法外,存儲還有自身的容量和性能指標。表3列出了浪潮智能存儲管理平臺InView支持的未來1天、7天、30天、90天的3個容量趨勢指標,15個性能趨勢指標。

表3:浪潮存儲性能容量預測指標

4

存儲AIOps的產業落地浪潮智能存儲管理平臺InView 存儲產業界中,作為新數據時代“新存儲”引領者,浪潮存儲推出了領先且獨具特色的智能存儲管理平臺InView,提供了預測性分析、端到端的故障定位、性能洞察等一系列的智能化功能,幫助用戶分析復雜應用環境下從虛擬機到后端存儲端到端的性能瓶頸,確定影響性能瓶頸的主要因素,并最終給出可行的優化或解決問題的建議。 其中磁盤故障預測、性能容量預測的智能化功能,可以幫助客戶預防硬件故障帶來的損失,并給出具體的擴容建議,為客戶提供更穩定、高性能、智能化的存儲服務,使存儲服務能更好地適應用戶需求,同時降低存儲的復雜性和維護成本。 注:感謝我的同事葉毓睿對本篇文章提供啟發。

原文標題:【科技放大鏡】AI加持,給復雜存儲管理做“減法”

文章出處:【微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4791

    瀏覽量

    90061
  • 磁盤
    +關注

    關注

    1

    文章

    398

    瀏覽量

    26477
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301406

原文標題:【科技放大鏡】AI加持,給復雜存儲管理做“減法”

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    從數據到模型:如何預測細節距鍵合的剪切力?

    在微電子封裝領域,細節距鍵合工藝的開發與質量控制面臨著巨大挑戰。工程師們常常需要在缺乏大量破壞性測試的前提下,快速評估或預測一個鍵合點的剪切力性能。能否根據焊球的表觀尺寸,通過一個可靠的數學模型來
    發表于 01-08 09:45

    labview如何實現數據的采集與實時預測

    現有以下問題:labview可以實現數據的采集以及調用python代碼,但如何將這兩項功能集成在一個VI文件里,從而實現數據的采集與實時預測。現有條件如下:已完成數據的采集系統,python中的預測代碼也已經訓練封裝完成。
    發表于 12-03 21:13

    蜂鳥E203簡單分支預測的改進

    是最簡單的靜態分支預測,其預測的命中率并不是很高,因此流水線常常需要因為沖刷而浪費很多周期,導致CPU的性能下降。因此,針對題目通過對E203微架構進行優化提升處理器性能的要求,我們想
    發表于 10-24 07:45

    提高條件分支指令預測正確率的方法

    “Gshare方法”。 BTB: 分支目標緩沖器(Branch Target Buffer,BTB)是一個用于存儲分支指令地址和目標地址的高速緩存,其常見于超標量處理器中,主要用于提高分支預測器的性能,因為它可
    發表于 10-22 08:22

    基于全局預測歷史的gshare分支預測器的實現細節

    的地址位數,雖然BHR位數越多,分支預測器的準確度越高,但正確率提高的代價是PHT消耗的資源呈指數形式迅速地增長,因此我們必須在面積與性能之間進行權衡。。最終經過對各類32位RISC-V開源處理器內核
    發表于 10-22 06:50

    服務器數據恢復—EqualLogic存儲上raid5磁盤陣列數據恢復案例

    服務器存儲數據恢復環境&故障: 某品牌EqualLogic PS6100存儲陣列上有一組由16塊硬盤組建的raid5磁盤陣列。磁盤陣列上層
    的頭像 發表于 10-21 15:04 ?337次閱讀

    MES系統怎么實現數字化閉環與設備預測性維護?

    預測性維護代表了MES系統從被動應對到主動預防的轉變,通過數據驅動的方法預測設備故障,實現從"預防性維護"到"預測性維護"的跨越。
    的頭像 發表于 08-14 11:35 ?739次閱讀
    MES系統怎么實現數字化閉環與設備<b class='flag-5'>預測</b>性維護?

    設備預測性維護與健康管理:工業高效運行新引擎

    隨著科技的不斷進步,設備預測性維護與健康管理解決方案將不斷完善和發展。一方面,傳感器技術將更加先進,能夠采集更多維度、更精準的數據;另一方面,人工智能算法將不斷優化,提高故障預測的準確
    的頭像 發表于 08-08 14:48 ?1172次閱讀
    設備<b class='flag-5'>預測</b>性維護與健康管理:工業高效運行新引擎

    如何統計蜂鳥E203的分支預測率?

    想請問大家如何統計蜂鳥E203的分支預測率,我嘗試在exu_commit模塊里統計,但是發現預測率都有寫問題,想請教以下大家
    發表于 06-10 07:05

    Simcenter STAR-CCM+多物理場解決方案:支持在設計早期對實際性能進行預測

    優勢支持用戶在設計早期預測實際性能減少代價高昂的故障,縮短上市時間通過無縫的單一集成用戶界面提供各種物理場,提高真實感和精度摘要多物理場工程仿真可以精確捕獲影響日益復雜的產品性能的所有
    的頭像 發表于 06-05 10:26 ?2500次閱讀
    Simcenter STAR-CCM+多物理場解決方案:支持在設計早期對實際<b class='flag-5'>性能</b>進行<b class='flag-5'>預測</b>

    提早預見問題:預測性維護有效降低企業停機風險

    (Predictive Maintenance)。預測性維護是整合傳感器、物聯網(IoT)與人工智能(AI)等技術,即時監測設備運行的狀態,收集并分析設備健康數據,在問題發生前的時機進行維修或保養。相較于傳統維護方式只能被動回應故障
    的頭像 發表于 05-06 16:32 ?981次閱讀
    提早預見問題:<b class='flag-5'>預測</b>性維護有效降低企業停機風險

    預測性運維管理平臺是什么?有什么功能?

    預測性運維管理平臺是一種基于物聯網(IoT)、大數據分析、人工智能(AI)和機器學習等先進技術的智能化運維系統,旨在通過對設備運行狀態的實時監測、數據采集與深度分析,提前預測設備潛在故障
    的頭像 發表于 04-10 09:23 ?605次閱讀

    邊緣計算網關的實時監控與預測性維護都有哪些方面?適合哪些行業使用?

    邊緣計算網關的實時監控與預測性維護都有哪些方面?適合哪些行業使用? 有實施過得案例的介紹嗎? 深控技術的不需要點表的邊緣計算網關如何?
    發表于 04-01 09:44

    預測性維護實戰:如何通過數據模型實現故障預警?

    預測性維護正逐步成為企業降本增效的核心手段,通過數據驅動的故障預警邏輯框架,可以預測設備是否正常運行,提前預警并避免損失。案例中,通過振動傳感器采集數據,發現軸承故障,通過隨機森林模型
    的頭像 發表于 03-21 10:21 ?3024次閱讀
    <b class='flag-5'>預測</b>性維護實戰:如何通過數據模型實現<b class='flag-5'>故障</b>預警?

    工業元宇宙落地!數字孿生如何預測設備壽命誤差<3%?

    工業元宇宙正以迅猛之勢重塑設備管理模式,通過數字孿生技術精準預測、高效維護,實現未雨綢繆的主動運維。精準預測通過機器學習提前識別故障,動態優化實現資源最優配置,遠程管控減少現場人員。
    的頭像 發表于 03-19 14:18 ?971次閱讀
    工業元宇宙落地!數字孿生如何<b class='flag-5'>預測</b>設備壽命誤差<3%?