国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大數據分析學習的挑戰:復雜性、不確定性及涌現性

454398 ? 來源:alpha007 ? 作者:alpha007 ? 2022-11-17 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:ST社區

科多分享的大數據分析學習與研究的新挑戰:對于習慣結構化數據研究的統計學來說,大數據分析顯然是一種嶄新的挑戰。

挑戰來自何方?來自于大數據的復雜性、不確定性和涌現性三個方面,其中復雜性最為根本。

大數據的復雜性

復雜性是大數據區別于傳統數據的根本所在,它主要表現為類型復雜性、結構復雜性和內在模式復雜性三個方面,從而使得大數據的存儲與分析產生多方面的困難。對于大數據的類型與結構的復雜性這里不再贅述,但它們決定了數據模式的多樣化,使得刻畫數據特征的模式不斷變化、呈幾何級數增加。統計學盡管長期以來研究復雜現象的數量特征,但所涉及的數據是結構化的,模式是固定化的,比起大數據要簡單得多。

因此,學習大數據,我們不僅要熟悉各種類型的數據模式,還要善于把握它們之間的相互關系與作用,善于綜合利用各方面的知識(包括文本挖掘、圖像處理、信息網絡技術、心理學、社會學等等)加以研究。已有一些學者提出利用網絡來描述異質數據間的關系,同時提出了目標數據的“元路徑(Meta-Path)”概率刻畫模式。同時,由于非結構化數據通常比結構化數據包含更多的無用信息和垃圾信息,因此需要運用特定的方法來去偽存真、去粗存精,例如通過搜索引擎從非結構化數據中檢索出有用的信息等等。

大數據的不確定性

網絡大數據通常是高維的,以往的統計學習方法往往難以產生令人滿意的效果。復雜性必然帶來不確定性。

大數據的不確定性表現為數據本身的不確定性、模型的不確定性和學習的不確定性,從而給大數據建模和學習造成困難。數據的不確定性既包括原始數據的不準確,也包括數據處理過程中由各種因素所造成的在不同維度、不同尺度上的不確定性。例如阿里巴巴數據官曾經介紹,區淘寶網上購物者的性別特征就可以有十幾種判斷。雖然傳統的統計學方法主要研究不確定性數據,但傳統數據的不確定性明顯不同于大數據的不確定性,面對海量、高維、多類型的不確定性數據,傳統的統計方法顯得力不從心,無論是數據的采集、存儲、建模還是查詢、檢索和挖掘,都需要創新方法。大數據的不確定性必然帶來數據處理與分析模型的不確定性,但要解決這一點非常困難,有人提出了“可能世界模型”,認為應該在一定的結構規范下刻畫出數據的每一種狀態,但這同樣極其困難,在實際應用中不可能存在這樣一種通用的模型結構,只能采取簡化的模型,例如獨立性假設、同分布假設等等,尤其是概率圖模型已在數據相關性建模等方面得到了廣泛的應用。

模型的不確定性又必然帶來大數據學習的不確定性,使得模型參數的學習很難找到最優解,找到一個局部最優解都很困難,通常只能采用近似的方法來替代。

隨著多核CPU/GPU的普及以及并行計算框架的研究,碎片化方法被普遍認為是解決網絡大數據問題的可行方法,但需要做的工作仍然非常多。近些年來,統計學習領域的非參數模型方法提供了一種自動學習思路,但計算過程依然復雜,如何應用到網絡大數據以及大數據培訓中仍然是個問題。

大數據的涌現性

涌現性是網絡大數據有別于其他數據的關鍵特性,是大數據動態變化、擴展、演化的結果,表現為模式的涌現性、行為的涌現性和智慧的涌現性,其在度量、研判與預測上的困難使得網絡數據難以被駕馭。

涌現性的背后是各種信息的交互作用,是產生新的人類行為方式、以及社會經濟規律的重要基礎。模式的涌現性是指網絡數據由于多尺度、異質性而表現出來的、在屬性和功能等方面既存在差異又相互關聯的特定模式特征,這種涌現性結果對于研究社會網絡模型、理解網絡瓦解原因具有重要意義。行為的涌現性則與數據的時序性有關,是社會網絡中個體行為基于時序分布的統計結果,表現為較大相似性個體之間容易建立社會關系,使得網絡在演化過程中自發形成相互分離的連通塊。這種涌現性對于研究更多的社會網絡模型、理解行為涌現規律具有重要意義。例如,著名網絡科學家巴拉巴斯(Barabasi)通過研究發現,人們發送郵件的數量存在著特定的時間分布特征。智慧的涌現性是指網絡數據在沒有全局控制和預先定義的情況下,來自大量個體的自發語義通過互相融合和連接可以形成為有特定意義的通用語義,整個過程隨著數據的變化而持續演進。這種涌現性對于理解網絡語義的形成與變化具有重要意義。

總體而言,盡管近些年與大數據研究密切相關的數據庫、數據挖掘、機器學習和智能工程等領域都取得了很大的進展,但由于大數據的復雜性、不確定性和涌現性,使得相關研究成果難以被直接應用于學習大數據的分析研究之中。傳統的分析方法不能準確表示網絡大數據在異構性、交互性、時效性和突發性等方面的特點,傳統的“假設—模型—驗證”的統計方法受到了質疑,而從“數據”到“數據”的第四研究范式還沒有真正建立,因此亟需一個新的理論體系來指導,建立新的分析模型。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 大數據
    +關注

    關注

    64

    文章

    9063

    瀏覽量

    143748
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    功率放大器在膠滴氣泡質量與一致分析研究中的應用

    不確定性流變特性、機電液耦合動力學及可靠評價的系統分析。本文通過區間過程模型、高保真耦合建模、可靠性分析及貝塞爾曲線優化控制,結合理論/仿真/實驗,揭示膠粘劑分配性能演化規律,為高
    的頭像 發表于 03-06 11:18 ?19次閱讀
    功率放大器在膠滴氣泡質量與一致<b class='flag-5'>性</b><b class='flag-5'>分析</b>研究中的應用

    工業制造顛覆挑戰

    當下AI以前所未有的觸角,滲透人類各生活場景,但在工作制造領域,因為工業基礎模型的不確定性,AI仍處于止步不前的試探期,但豆包AI手機橫空出世,對工業AI的潛力仍不可小覷。以下來自《工業周刊》列舉
    的頭像 發表于 12-17 22:09 ?430次閱讀
    工業制造顛覆<b class='flag-5'>性</b><b class='flag-5'>挑戰</b>

    DP83826Ax:確定性、低延遲工業以太網PHY的深度解析

    DP83826Ax:確定性、低延遲工業以太網PHY的深度解析 在工業以太網領域,對于物理層收發器的性能要求愈發嚴苛,尤其是在實時、低延遲和低功耗等方面。DP83826Ax作為一款符合
    的頭像 發表于 12-15 15:20 ?400次閱讀

    渦輪部件多源不確定性機理與分類體系研究:從幾何變異到認知局限的系統解析

    渦輪部件作為航空發動機和燃氣輪機的核心組成部分,其性能直接決定了整個動力系統的效率、可靠與壽命。在實際運行環境中,渦輪部件的氣動與換熱性能往往與設計預期存在顯著差異,這種差異主要源于全壽命周期中存在的多源不確定性因素。
    的頭像 發表于 11-12 14:29 ?635次閱讀
    渦輪部件多源<b class='flag-5'>不確定性</b>機理與分類體系研究:從幾何變異到認知局限的系統解析

    4種神經網絡不確定性估計方法對比與代碼實現

    患者血壓,假設輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實對這個預測很不確定呢?這時候光看數值就不夠了。神經網絡有幾種方法可以在給出預測的同時估計不
    的頭像 發表于 11-10 10:41 ?487次閱讀
    4種神經網絡<b class='flag-5'>不確定性</b>估計方法對比與代碼實現

    廣立微DE-G零斷檔重構智能數據分析

    近日,數據分析領域被一則消息推上風口浪尖:一家老牌軟件巨頭將撤出中國。在此背景下,其旗下以靈活著稱的數據分析軟件,在中國市場的未來將面臨極大的不確定性
    的頭像 發表于 11-07 10:39 ?665次閱讀

    尋跡智行AMR融合RFID識別技術,為柔性搬運注入“確定性&quot;

    在智能物流與制造業不斷追求高效與柔性的今天,自主移動機器人(AMR)已成為革新場內物流的核心力量。其“柔性”特質——靈活部署、智能調度、自主避障——完美應對了現代生產中的不確定性
    的頭像 發表于 10-27 14:34 ?321次閱讀
    尋跡智行AMR融合RFID識別技術,為柔性搬運注入“<b class='flag-5'>確定性</b>&quot;

    從微秒級響應到確定性延遲:深入解析米爾全志T536核心板的實時技術突破

    延遲、調度器抖動...這些因素導致Linux的延遲通常在幾十毫秒級別波動,根本無法滿足工業場景對確定性的苛刻要求。 一、工業實時挑戰:從理論到實踐的鴻溝1.1 實時的分級標準在
    發表于 10-22 17:25

    深入解析米爾全志T536核心板的實時技術突破

    延遲、調度器抖動...這些因素導致Linux的延遲通常在幾十毫秒級別波動,根本無法滿足工業場景對確定性的苛刻要求。 一、工業實時挑戰:從理論到實踐的鴻溝1.1 實時的分級標準在工業
    發表于 10-17 17:41

    醫療PCB供應鏈復雜性與風險管控

    所談的PCB,可能涉及多層疊層結構、多次鉆孔壓合工序,并需要通過大量認證來滿足特定行業應用標準。 這些復雜性僅僅是PCB供應鏈宏觀概念中的一小部分。管理好常規PCB供應鏈的風險已頗具挑戰 – 當PCB被應用到關乎患者健康的醫療器械時
    的頭像 發表于 10-14 14:17 ?505次閱讀

    電磁兼容與電磁干擾在電磁兼容大數據分析中的智能管理系統

    北京華盛恒輝電磁兼容 (EMC) 大數據智能管理系統精簡解析 在 EMC 大數據分析中,電磁兼容與電磁干擾(EMI)智能管理系統是保障設備穩定、提升系統可靠的核心工具。系統整合 EMC/EMI
    的頭像 發表于 09-17 14:58 ?618次閱讀

    電磁兼容與電磁干擾在電磁兼容大數據分析中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容大數據分析中的智能管理系統
    的頭像 發表于 09-17 14:58 ?576次閱讀
    電磁兼容與電磁干擾在電磁兼容<b class='flag-5'>性</b><b class='flag-5'>大數據分析</b>中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容大數據分析中的智能管理系統

    電磁兼容與電磁干擾在電磁兼容大數據分析中的智能管理系統
    的頭像 發表于 09-17 14:42 ?859次閱讀
    電磁兼容與電磁干擾在電磁兼容<b class='flag-5'>性</b><b class='flag-5'>大數據分析</b>中的智能管理系統

    康謀分享 | 基于多傳感器數據的自動駕駛仿真確定性驗證

    自動駕駛仿真測試中,游戲引擎的底層架構可能會帶來非確定性的問題,侵蝕測試可信度。如何通過專業仿真平臺,在多傳感器配置與極端天氣場景中實現測試數據零差異?確定性驗證方案已成為自動駕駛研發的關鍵突破口!
    的頭像 發表于 07-02 13:17 ?4252次閱讀
    康謀分享 | 基于多傳感器<b class='flag-5'>數據</b>的自動駕駛仿真<b class='flag-5'>確定性</b>驗證

    Marvell展示2納米芯片3D堆疊技術,應對設計復雜性挑戰

    隨著現代科技的迅猛發展,芯片設計面臨著前所未有的挑戰。特別是在集成電路(IC)領域,隨著設計復雜性的增加,傳統的光罩尺寸已經成為制約芯片性能和功能擴展的瓶頸。為了解決這一問題,3D堆疊技術應運而生
    的頭像 發表于 03-07 11:11 ?1142次閱讀
    Marvell展示2納米芯片3D堆疊技術,應對設計<b class='flag-5'>復雜性</b><b class='flag-5'>挑戰</b>!