国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習如何幫助解決大數據轉換及管理問題?

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-24 23:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管大數據分析技術取得了驚人的進步,但我們在很大程度上仍需要手動來完成重要任務,例如數據轉換和數據管理。隨著數據量的增長,手動完成任務與自動化產生的生產力差距越來越大,這使得以人工智能機器學習為基礎的自動化趨勢越來越有市場。機器學習可以幫助縮小這一差距嗎?

坦率地說,數據轉換和數據管理問題頗具挑戰性。各行各業的公司都渴望將機器學習與他們的數據庫結合使用,以獲得競爭優勢。但是,數據不干凈、數據未集成、不可比較和不匹配的數據問題層出不窮,使公司的大數據計劃陷入困境。

許多從事機器學習的數據科學家花費了90%的時間來查找、集成、修復和清理其輸入數據。 人們似乎沒有意識到數據科學家不再是數據科學家,而是成為了數據集成商。

不過也有一個好消息,機器學習本身可以幫助機器學習。這個想法是利用算法的預測能力來模擬人類數據處理。這不是100%完美的解決方案,但它可以幫助緩解工作強度,讓數據科學家轉向真正的創新工作。

您可以在任何你能買到的地方購買ML,通過使用ML來來幫助您完成ETL的轉換部分。

轉換和管理數據

雖然它們在某些方面是相似的,但是數據管理和數據轉換之間有重要的區別。數據轉換是數據集成過程中的第一步,其目標是將異類數據轉換為通用的全局模式,組織可以提前制定該模式。自動腳本通常用于將美元轉換成歐元,或將英鎊轉換成公斤。

轉換階段之后,分析人員開始管理和分析數據。第一步通常涉及運行“match/merge”函數來創建與相同實體對應的記錄集群,例如將不同但拼寫相似的名稱分組在一起。像“編輯距離”這樣的概念可以用來確定兩個不同實體之間的距離。

然后使用更多的規則來比較各種實體,以確定給定記錄的最佳值。公司可以聲明最后一項是最好的,或者使用一組值中的公共值,這樣就可以產生最佳數據。

幾十年來,這種通用的兩步過程已在許多數據倉庫中使用,并且在現代的數據湖中繼續使用。但是,ETL和數據管理在很大程度上未能跟上今天的數據量以及企業面臨的挑戰規模。

例如,這需要預先定義一個全局模式,這阻礙了許多ETL的進行,這些工作試圖集成更多的數據源。在有些時候,程序員無法跟上必須設置的數據轉換規則的數量。

如果您有10個數據源,您還可以這樣做,但是,如果您有10,000個,那就不太可能了。

顯然,這需要一種不同的方法。

在小型企業中,您可能可以提前創建全局數據模式,然后在整個組織中強制使用它,從而省去了昂貴的ETL和數據管理項目的成本,一起放在數據倉庫中。但是,在大型組織中,這種自上而下的方法不可避免地會失敗。

即使大型企業中的業務部門彼此非常相似,它們記錄數據的方式也會有微小的差異。這些微小差異需要加以考慮,然后才能對其進行有意義的分析,這只是企業數據性質的反映。

因此業務靈活性需要一定程度的獨立性,這意味著每個業務部門都建立自己的數據中心

例如,以豐田汽車歐洲公司(Toyota Motor Europe)為例,該公司在每個業務國家都有獨立的客戶支持組織。該公司希望為250個數據庫中的所有實體創建一個主記錄,其中包含40種不同語言的3000萬條記錄。

豐田汽車歐洲公司面臨的問題是,ETL和數據管理項目的規模是巨大的,如果按照傳統方式進行,將消耗大量的資源。該公司決定使用Tamr來幫助解決機器學習的挑戰,而不是數據轉換和使用數據管理過程。

ETL最大的問題是已經預先定義了全局模式,如何大規模地做到這一點是個問題。需要使用機器學習進行自下向上的匹配、自下而上地構造目標模式,從規模上看,這是唯一可行的方式。

這并不意味著機器學習提供了非常簡單的方法來解決這些棘手的數據集成問題。它仍然需要大量的數據和處理能力,您通常需要一個最優秀的員工來幫助指導軟件獲得正確的數據分析結果與決策見解。

這樣來看的話,成本并不便宜,但這不是最重要的。但還有一個問題是,不同的供應商之間該如何選擇。不同國家或地區的供應商提供的解決方案不同,而且出于一些宏觀因素,會出現不同的選擇。

出于安全考慮,這些數據問題不能完全外包給其他公司,所以不要指望完全用機器學習來處理數據,人在其中的作用還是非常重要的。人與機器學習合作才能夠使您的數據集成和管理效率最大化。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 工業自動化
    +關注

    關注

    17

    文章

    3128

    瀏覽量

    69882
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136937
  • 大數據
    +關注

    關注

    64

    文章

    9063

    瀏覽量

    143743
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據
    的頭像 發表于 01-07 15:37 ?189次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    大數據平臺運營的基礎是什么

    ,值得每一位企業運營者思考。 本文提供大數據平臺運營的三元素模型,旨在幫助企業管理層以全面的視角審視企業當前正在建設的大數據體系,真正地實現數據
    的頭像 發表于 12-23 16:07 ?228次閱讀

    大數據時代下的管理變革:勤哲EXCEL服務器助力企業高效運營

    大數據高速發展的今天,先進信息技術正在潛移默化地改變現代企業的經營管理模式。實踐證明,這些技術不但提升了管理效率,還為企業決策提供了科學依據。信息化建設已成為企業管理創新的重要趨勢,
    的頭像 發表于 11-19 14:29 ?499次閱讀

    組態大數據平臺是什么?有什么功能?

    組態大數據平臺是融合 組態技術 與 大數據處理能力 的綜合性平臺,通過圖形化、可配置的方式實現數據采集、存儲、分析、可視化及遠程控制,適用于工業自動化、能源管理、樓宇監控等領域。其核心
    的頭像 發表于 10-30 11:29 ?224次閱讀
    組態<b class='flag-5'>大數據</b>平臺是什么?有什么功能?

    電磁兼容與電磁干擾在電磁兼容性大數據分析中的智能管理系統

    北京華盛恒輝電磁兼容 (EMC) 大數據智能管理系統精簡解析 在 EMC 大數據分析中,電磁兼容與電磁干擾(EMI)智能管理系統是保障設備穩定、提升系統可靠性的核心工具。系統整合 EM
    的頭像 發表于 09-17 14:58 ?618次閱讀

    電磁兼容與電磁干擾在電磁兼容性大數據分析中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容性大數據分析中的智能管理系統
    的頭像 發表于 09-17 14:58 ?574次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數據</b>分析中的智能<b class='flag-5'>管理</b>平臺

    電磁兼容與電磁干擾在電磁兼容性大數據分析中的智能管理系統

    電磁兼容與電磁干擾在電磁兼容性大數據分析中的智能管理系統
    的頭像 發表于 09-17 14:42 ?859次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數據</b>分析中的智能<b class='flag-5'>管理</b>系統

    御控工業物聯網大數據解決方案:排水設備遠程監控與大數據統計系統

    御控工業物聯網推出排水設備遠程監控與大數據統計系統,通過物聯網、大數據、云計算等技術構建“感知-傳輸-分析-決策”閉環管理體系,助力排水行業數字化轉型。
    的頭像 發表于 09-12 10:04 ?662次閱讀

    東軟集團與貴州省大數據發展管理局達成戰略合作

    8月20日,東軟與貴州省大數據發展管理局共同簽署戰略合作協議。此次簽約將加速推動貴州省醫療、養老、就業的數據價值化進程,為地方經濟社會高質量發展注入強大動力,也將為東軟在數據價值化、人
    的頭像 發表于 08-25 16:53 ?976次閱讀

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2889次閱讀

    安科瑞有序充電平臺:物聯網與大數據驅動的充電設施管理

    概述 有序充電運營管理平臺是基于物聯網和大數據技術的充電設施管理系統,可以實現對充電樁的監控、調度和管理、提供充電樁的利用率和充電效率,提升用戶的充電體驗和服務質量。用戶可以通過APP
    的頭像 發表于 07-15 15:58 ?1563次閱讀
    安科瑞有序充電平臺:物聯網與<b class='flag-5'>大數據</b>驅動的充電設施<b class='flag-5'>管理</b>

    智慧環保大數據管理平臺有什么功能

    在環境污染問題日益嚴峻的當下,智慧環保大數據管理平臺成為環境治理的重要利器。它圍繞污水處理、垃圾處理、氣體監測三大核心場景,深度融合大數據、物聯網、人工智能等技術,構建起全方位、智能化的環境管理
    的頭像 發表于 06-06 15:17 ?594次閱讀
    智慧環保<b class='flag-5'>大數據管理</b>平臺有什么功能

    智慧光伏綜合管理系統的技術特點及應用價值體現

    生命周期管理的同時實現對能源的管理與優化,為光伏電站的運維管理工作提供更多可能。 系統具有多種技術特點,覆蓋物聯網與大數據技術、人工智能與機器
    的頭像 發表于 04-15 16:45 ?561次閱讀

    智能化管理系統對高鐵站的幫助與提升

    高鐵站作為現代綜合交通樞紐,具有客流量大、運營節奏快、服務需求多樣等特點。傳統的人工管理模式已難以滿足高效、安全、便捷的運營需求,而 智能化管理系統 的引入,通過大數據、人工智能、物聯網(IoT)等
    的頭像 發表于 04-01 15:33 ?1309次閱讀

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發表于 04-01 00:00