国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺談物聯網機器學習的挑戰與機遇

5RJg_mcuworld ? 來源:未知 ? 2018-11-28 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據研究報告到2020年,將有超過200億臺互聯網連接設備投入使用,這些設備每年將產生超過500個zettabytes的數據,隨著更多的技術進步,這個數字預計將繼續大幅增加。對于已經投資物聯網的70%以上的組織而言,所有這些數據自然代表了獨特的競爭優勢,并且獲得了用于開發創新AI應用程序的寶貴信息和見解的巨大機會。

事實證明,對于數據科學家和機器學習工程師而言,物聯網數據與商業領袖一樣令人興奮。從醫療保健和農業到教育和運輸,物聯網蓬勃發展的領域與其應用程序一樣多樣化,從發現新信息到決策控制。物聯網數據科學為創建令人興奮的新數據產品打開了大門。但是,我們將在本文中研究物聯網數據科學的一些特殊性。

數據注意事項

正如我們所看到的,物聯網構成了新數據的最大來源之一。物聯網數據實際上可能被視為大數據的縮影。如果我們查看通過一個設備生成的數據,我們通常會處理相當少量的數據(即使這也正在改變)。然而,隨著無數分布式設備生成連續的數據流,物聯網產生了大量的數據。它的多樣性同樣令人印象深刻:物聯網設備收集各種類型的信息,從音頻傳感器數據,并且總體上負責數據格式多樣性的奇妙爆發。因為這些設備靠近用戶并不斷收集信息,這個生成的數據通常是高速的; 這使得物聯網數據特別適合時間序列建模。

但是物聯網數據也有一些獨特的方面,使得它的開發極具挑戰性。由于在采集和傳輸過程中發生錯誤,因此通常會產生噪聲。這使得構建,清理和驗證數據的過程成為機器學習算法開發中的關鍵步驟。從本質上講,物聯網數據也是高度可變的,這是因為各種數據收集組件之間的數據流存在巨大的不一致,并且由于存在時間模式。不僅如此,數據本身的價值高度依賴于底層機制,捕獲數據的頻率以及處理數據的方式。即使來自特定設備的數據被認為是值得信賴的,我們仍然需要考慮到即使在類似條件下不同設備可能表現不同的事實。因此,在收集訓練數據時捕獲所有可能的情況在實踐中是不可行的。

半監督學習

然而,物聯網數據最顯著的特征之一在于它的粗糙:因為物聯網設備通過各種復雜的傳感器收集數據,它們生成的數據通常非常原始。這意味著在提取業務價值并構建強大的AI應用程序之前,必須進行大量數據處理。事實上,在構建智能物聯網應用程序時,將有意義的信號與噪聲分離并將這些非結構化數據流轉換為有用的結構化數據是最重要但危險的步驟。

大量的物聯網應用需要使用有監督的機器學習,這是一類機器學習算法,需要在訓練模型之前標記數據。由于手動標記大型數據集是一項耗時,容易出錯且可能成本高昂的任務,因此機器學習專業人員通常會先著手標記的開源數據集開始,或者從少量數據開始標記。然而,物聯網數據的困難來自于它的特殊性:因為這些數據通常是獨一無二的,所以不能保證現有的開源數據集是隨時可用的,因此工程師必須標記自己的數據。

但是,由于物聯網數據的可變性,標記一個小的隨機樣本可能是不夠的。考慮到這一點,這些是在監督算法訓練中利用標記和未標記數據的半監督學習策略的完美環境。特別是主動學習,其中允許算法向群眾工作者查詢在訓練時智能選擇的訓練實例的子集的標簽,這是非常適合的方法,允許機器學習科學家獲得類似的算法精度。標簽成本的一小部分。

人群傳感

在機器學習方面,物聯網發展的一個非常有趣的方面是人群感知的出現。群體感知存在兩種不同的形式:自愿,當用戶自愿提供信息時,以及機會主義,當沒有明確的用戶干預時自動收集數據。這是物聯網數據不僅可以為物聯網應用的開發或改進做出貢獻的一種方式,而且還可以用作其他非物聯網應用的輸入。

物聯網實際上允許以前所未有的方式收集非常獨特的數據集。因為每個設備生成的數據通常是人為的,所以用戶可以標記或驗證它。

模型開發

如今,人工智能取得令人矚目的進步背后的主要因素之一是出現了更好的技術,例如GPU,可以實現更快的數據處理。物聯網的機器學習帶來了一個有趣的難題:雖然最好的模型需要接受大量數據的培訓,但大多數物聯網設備仍然受限于存儲空間和處理能力。出于這個原因,安全有效地將大量數據從設備傳輸到服務器或云,反之亦然,這是開發AI應用程序的關鍵。在云計算時代,一種自然的解決方案是將數據導出到開發模型的云中,并在模型準備好使用后將模型導出回設備。這特別有吸引力,特別是因為預計到2021年,所有生成的數據中有94%將在云中處理,這意味著它也可以利用其他數據源,無論是歷史數據還是源自其他物聯網設備。然而,將復雜模型存儲回存儲器受限的設備本身就是一個挑戰,因為具有大量參數的復雜模型(例如深度學習模型)本身通常非常大。另一方面,在用于推理步驟的從設備向云上的模型發送數據的解決方案也可能是次優的,尤其是在延遲需要非常低的情況下。將復雜模型存儲回存儲器受限的設備本身就是一個挑戰,因為具有大量參數的復雜模型(例如深度學習模型)本身通常非常大。另一方面,在用于推理步驟的從設備向云上的模型發送數據的解決方案也可能是次優的,尤其是在延遲需要非常低的情況下。將復雜模型存儲回存儲器受限的設備本身就是一個挑戰,因為具有大量參數的復雜模型(例如深度學習模型)本身通常非常大。

另一個挑戰來自于物聯網設備可能無法連續連接到云,因此可能需要一些本地參考數據進行離線處理,以及獨立運行的能力。這是邊緣計算架構變得有趣的地方,因為它使數據能夠在邊緣設備級別進行初始處理。當需要增強安全性時,這種方法特別有吸引力; 這也是有利的,因為這種邊緣設備能夠過濾數據,降低噪聲并提高現場數據質量。

不出所料,人工智能工程師一直在努力實現兩全其美,最終開發出霧計算,這是一個分散的計算基礎設施。在這種方法中,數據,計算能力,存儲和應用程序以最合理的方式在設備和云之間分布,最終通過將它們更緊密地結合在一起來利用它們各自的優勢。

轉學習

我們已經看到物聯網設備能夠生成大數據,但在實踐中,使用外部歷史數據集開發物聯網智能應用程序的情況并不少見。這意味著可以依賴于由多個IoT設備的集合(通常是跨多個用戶的相同類型的設備)生成的數據,或者依賴于完全不同的數據源。應用程序越具體和獨特,現有數據集可用的可能性就越小 - 例如,當設備捕獲與開源圖像數據集沒有相似性的非常特定類型的圖像時就是這種情況比如Imagenet?。話雖如此,物聯網應用實際上是幾種現有現有模型的巧妙融合,這是很常見的。這使得轉移學習很好地適應了物聯網環境中智能應用的發展。

轉移學習范例包括在數據集上訓練模型(通常是金標準模型)并使用它來對另一個數據集進行推斷。或者,可以使用在生成此模型期間計算的參數作為在實際數據集上訓練模型的起點,而不是將模型初始化為隨機值。在這種情況下,我們將原始模型稱為“預訓練”模型,我們對特定于應用程序的數據進行微調。這種方法可以將訓練階段加速幾個數量級。使用相同的范例,可以使用由最終用戶直接生成的數據來訓練一般模型,然后根據具體情況對其進行細化和優化。

安全和隱私問題

由于互聯網連接設備技術通過提供物理和網絡世界之間的連接來擴展當前的互聯網,因此它生成的數據非常通用,但也是導致嚴重隱私問題的原因。事實上,參與物聯網的大約50%的組織認為安全是物聯網部署的最大障礙。考慮到大約三分之二的物聯網設備在消費者領域,以及個人的一些共享數據是如何,很容易理解為什么。這些問題加上與頻繁數據傳輸到云上的預期風險相結合,解釋了用戶為何要求保護其數據的保證。

然而,當這些物聯網應用程序由“聯合”數據(即多個用戶生成的數據)提供支持時,事情變得更加陰險:用戶數據不僅可以直接泄露,還可以通過旁道攻擊間接暴露,當惡意代理反向工程機器學習算法的輸出以推斷私人信息。由于這些原因,數據保護法明顯有必要與技術和應用程序本身一起發展。

物聯網機器學習是以人為本的機器學習

由于物聯網設備使互聯網更貼近用戶并觸及人類生活的各個方面,因此它們通常允許收集高度上下文和個人數據。物聯網數據敘述其用戶生活的故事,并使其比以往更容易理解用戶的需求,愿望,歷史和偏好。這使得物聯網數據成為構建根據用戶個性量身定制的個性化應用程序的完美數據。

而且,由于物聯網通過收集高度個性化的數據以及提供高度個性化的應用程序和服務而非常密切地觸及我們的生活,因此物聯網機器學習可以真正成為以人為本的機器學習。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2945

    文章

    47819

    瀏覽量

    414841
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931

原文標題:物聯網中的機器學習會有哪些挑戰和機遇?

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    聯網新手小白,求前輩推薦一款學習用開發板

    我是新手小白,想自學聯網和人工智能技術,希望前輩們能推薦一款適合進行初級到中級知識學習、實驗和項目開發的開發板兼顧性價比,包括具體的品牌和型號。
    發表于 12-25 18:44

    Lora基站在聯網應用的重要性

    Lora基站在聯網應用中具有重要的地位。首先,Lora基站可以實現對聯網設備的遠程監測和控制,為
    發表于 12-03 07:09

    學習聯網怎么入門?

    隨著聯網技術的不斷發展,越來越多的人開始關注學習這一領域。但是對于初學者來說,聯網似乎是一個龐雜的概念,
    發表于 10-14 10:34

    學習聯網可以做什么工作?

    學習聯網專業后,你可以從事多種與聯網相關的工作。聯網
    發表于 10-11 16:40

    深度學習對工業聯網有哪些幫助

    深度學習作為人工智能的核心分支,通過模擬人腦神經網絡的層級結構,能夠自動從海量工業數據中提取復雜特征,為工業聯網(IIoT)提供了從數據感知到智能決策的全鏈路升級能力。以下從技術賦能、場景突破
    的頭像 發表于 08-20 14:56 ?1022次閱讀

    請問什么是聯網智庫?

    什么是聯網智庫?
    發表于 08-07 06:45

    聯網藍牙模塊有哪些優勢?

    隨著聯網技術的不斷發展,藍牙模塊作為聯網的重要組成部分,其應用越來越廣泛。那么,聯網藍牙模
    發表于 06-28 21:49

    聯網的應用范圍有哪些?

    聯網,簡單來說,就是“萬相連的互聯網”。它以互聯網為基石,將用戶端延伸至物品與物品之間,實現信息的交換與通信。打個比方,你的智能手表能實
    發表于 06-16 16:01

    聯網未來發展趨勢如何?

    近年來,聯網行業以其驚人的增長速度和無限的潛力成為了全球科技界的焦點。它正在改變我們的生活方式、商業模式和社會運轉方式。那么,聯網行業的未來發展趨勢將會是怎樣的呢?讓我們一同探尋其
    發表于 06-09 15:25

    聯網工程師為什么要學Linux?

    聯網工程師需要掌握Linux的主要原因可以從技術生態、開發需求、行業應用及就業競爭力四個角度來分析: 一、技術生態與行業適配性 1)嵌入式開發的主流平臺 聯網設備往往基于嵌
    發表于 05-26 10:32

    一文淺談工業聯網是什么

    工業生產向數字化、智能化轉型。以下從定義、核心技術、應用場景、發展趨勢及挑戰五個維度展開解析: 一、定義與核心價值 工業聯網聯網技術為
    的頭像 發表于 05-20 17:32 ?1306次閱讀

    Nordic nRF54 系列芯片:開啟 AI 與聯網新時代?

    在科技飛速發展的今天,芯片技術的創新始終是推動行業進步的關鍵力量。Nordic 公司的 nRF54 系列芯片,正以其卓越的性能和獨特的設計,為 AI 機器學習聯網應用帶來前所未有的
    發表于 04-01 00:18

    蜂窩聯網怎么選

    的數據傳輸速率。有了蜂窩聯網技術,您就不必在功耗和數據傳輸速率之間做出妥協,而是可以兩全其美。 終身成本:雖然某些 LPWAN 技術的前期成本可能看起來很吸引人,但評估整個生命周期的成本(部署
    發表于 03-17 11:46

    為什么選擇蜂窩聯網

    在為您的聯網(IoT)應用評估最合適的低功耗廣域網(LPWAN)技術時,除了考慮技術指標外,還必須考慮各種因素,因為技術指標本身可能與實際性能大相徑庭。與 LoRaWAN、Sigfox
    發表于 03-17 11:42

    板狀天線:智能時代下的挑戰機遇并存

    深圳安騰納天線|板狀天線:智能時代下的挑戰機遇并存
    的頭像 發表于 03-13 09:02 ?1246次閱讀