国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

基于分段聚類壓縮和Hash recoding壓縮方法

大?。?/span>0.95 MB 人氣: 2017-11-24 需要積分:0

  今日頭條的服務器每天都會產生規模龐大的訓練數據,為方便進行訓練,這些數據都具有特定的格式和分布特征。使用不同類型的通用壓縮算法(字典類型及非字典類型)進行測試,發現單獨任何一種算法都無法在滿足業務需求(速率需求和CPU占比等)的同時獲得較為可觀的壓縮比。針對今日頭條的訓練數據,提出了分段聚類壓縮和Hash recoding壓縮兩種策略。實驗結果表明,分段聚類壓縮方式在更好地保證了壓縮率的同時提高了壓縮速率的目的;Hash recoding壓縮方式則更好地達到了以少量壓縮速率的損失換取更可觀的壓縮率的目的。分段聚類方式搭配Gzip壓縮算法的組合能使壓縮速率提高300%以上;Hash recoding方式匹配Snappy壓縮算法能使壓縮率縮小50%以上。根據實際需求,不論選擇哪種策略,對于降低今日頭條的運營成本,提升業務處理的效率,提供更好的用戶體驗,都有一定意義。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?