国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

網頁鏈接分類的并行算法

大?。?/span>0.72 MB 人氣: 2018-01-19 需要積分:1

  1998年4月,在第七屆國際WWW( World Wide Web)大會上,Page等提出了PageRank算法。這是一種基于網頁鏈接的排序算法,根據網頁之間的鏈接結構來計算網頁的重要性,從而實現網頁排序。Google搜索引擎使用該算法對網頁進行了準確的排名。

  隨著信息技術的發展,網頁數量急劇增加,采用串行PageRank算法迭代計算網頁排名時,需要消耗大量的存儲和計算資源,且計算效率相當低下,尋求一種高效排名算法勢在必行。Hadoop是Apache公司提出的開源分布式計算框架,該框架下的MapReduce并行編程模型非常適合于海量數據的并行計算。

  針對串行PageRank算法在處理海量網頁數據時效率低下的問題,提出一種基于網頁鏈接分類的PageRank并行算法。首先,將網頁按照網頁所屬網站分類,為來自不同站點的網頁設置不同的權重;其次,利用Hadoop并行計算框架,結合MapReduce分而治之的特點,并行計算網頁排名;最后,采用一種包含3層:數據層、預處理層、計算層的數據壓縮方法,對并行算法進行優化。實驗結果表明,與串行PageRank算法相比,所提算法在最好情況下結果準確率提高了12%,計算效率提高了33%。

網頁鏈接分類的并行算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?