国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么90%的機器學習模型從未應用于生產

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 23:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

時代變幻莫測,僅僅增加客戶體驗流暢度和沉浸感并不能減輕企業的壓力。在這種情況下,投入數十億美元開發可以改進產品的機器學習模型就可以理解了。但有一個問題。公司不能只是把錢砸在數據科學家和機器學習工程師身上,就希望可以有奇跡發生。據 VentureBeat 報道,大約 90% 的機器學習模型從未投入生產。換句話說,數據科學家的工作只有十分之一能夠真正產出對公司有用的東西。

本文最初發布于 Towards Data Science,由 InfoQ 中文站翻譯并分享。

大多數機器學習模型從未部署。圖片由作者提供。

企業正在經歷艱難時期。我說的不是病毒流行和股市波動。

時代變幻莫測,僅僅增加客戶體驗流暢度和沉浸感并不能減輕企業的壓力。在這種情況下,投入 數十億美元 開發可以改進產品的機器學習模型就可以理解了。

但有一個問題。公司不能只是把錢砸在數據科學家和機器學習工程師身上,就希望可以有奇跡發生。

有數據為證。據 VentureBeat 報道,大約 90% 的機器學習模型從未投入生產。換句話說,數據科學家的工作只有十分之一能夠真正產出對公司有用的東西。

盡管 十分之九 的科技高管相信,人工智能將成為下一次科技革命的中心,但人工智能的采用和部署尚未獲得長足的發展,而這不能怪數據科學家。

企業尚未準備好采用機器學習

領導支持并不意味著投錢多

數據科學家的 就業市場非常好。企業在招聘,而且也已經準備好支付高薪。

當然,管理人員和企業負責人期望這些數據科學家能帶來巨大的價值。然而,就目前而言,他們并沒有為此提供便利。

GAP 數據分析高級副總裁 Chris Chapo表示:“有時人們會想,我所需要做的只是針對一個問題投入資金或技術,成功就會到來。”

為了幫助數據科學家在工作中發揮出色的作用,領導者不僅需要將資源引向正確的方向,還需要了解機器學習模型是干什么的。一個可能的解決方案是,讓領導者們自己接受一些數據科學的入門培訓,這樣他們就可以在公司里把這些知識付諸實踐。

數據訪問難度大

公司不擅長收集數據。許多公司都是高度筒倉化的,這意味著每個部門都有自己收集數據的方式、首選格式、存儲位置以及安全和隱私偏好。

另一方面,數據科學家經常需要來自多個部門的數據。筒倉化增加了清理和處理這些數據的難度。此外,許多數據科學家 抱怨,他們甚至無法獲得他們需要的數據。如果你沒有必要的數據,怎么開始訓練一個模型呢?

也許在過去,筒倉化的公司結構——以及無法訪問的數據——便于管理。但在一個技術飛速變革的時代,企業將需要加快步伐,在整個過程中建立起統一的數據結構。

對于數據科學家來說,能夠獲取所需的數據至關重要。圖片由作者提供。

IT、數據科學和工程脫節

如果公司的目標是減少“筒倉”,這就意味著各部門需要更多地相互溝通,調整各自的目標。

在許多公司中,IT 部門和數據科學部門之間存在著 根本性的分歧。IT 傾向于優先考慮讓事情正常運轉并保持穩定。另一方面,數據科學家喜歡實驗和破壞東西。這會導致溝通困難。

此外,對于數據科學家來說,工程并非總是必不可少的。這是一個問題,因為工程師有時候可能無法了解數據科學家所設想的所有細節,或者可能會由于溝通錯誤而改變實現方式。因此,正如 StackOverflow 指出 的那樣,能夠部署模型的數據科學家比那些不能部署模型的數據科學家更有競爭優勢。

機器學習模型自身面臨的挑戰

擴展比你想象的要難

模型在小環境中工作得很好,并不意味著它在任何地方都可以工作得很好。

首先,可能沒有處理更大數據集的硬件或云存儲空間可供使用。此外,在規模很大時,機器學習模型的模塊并不總是像規模較小時那么有效。

最后,數據獲取可能比較困難,甚至不可能。正如前面所討論的,這可能是由于公司的筒倉結構,也可能是由于在獲取更多數據時遇到的其他挑戰。

這也是在組織之間統一數據結構、鼓勵不同部門之間進行交流的另一個原因。

重復工作

在部署機器學習模型的漫長道路上,超過四分之一 的企業都存在重復工作。

例如,軟件工程師可能會按數據科學家的說法進行實現。后者可能也會繼續,自己做一些工作。

這不僅浪費時間和資源,而且,當涉眾不知道使用了哪個版本的代碼,在遇到任何錯誤時就不知道應該向誰求助,這會導致額外的混亂。

如果數據科學家能夠實現他們的模型,這是他們的優勢,但對于誰做什么,他們應該與工程師溝通清楚。這樣,就可以節省公司的時間和資源。

有效溝通對于機器學習模型正常運行至關重要。圖片由作者提供。

高管們可能會不認可

總體來說,技術高管 非常相信 人工智能的力量,但這并不意味著他們會同意所有的想法。據 Algorithmia 報道,三分之一的企業高管將糟糕的部署統計數據歸咎于缺乏高層支持。

似乎人們仍然認為數據科學家有點書呆子氣,缺乏商業意識。為此,數據科學家應加強他們的業務技能,并盡可能尋求與高管的對話。

當然,這并不意味著每個數據科學家需要 MBA 學位才能勝任他們的工作。然而,從課程或業務經驗中學習一些關鍵知識可能會對他們有長遠的幫助。

不能跨語言且缺少框架支持

由于機器學習模型仍處于起步階段,不同的語言和框架仍有相當大的差距。

有些管道開始時是 Python 開始,中間是 R,最后是 Julia。有的則相反,或者完全使用其他語言。由于每種語言都有自己獨特的庫和依賴項,項目很快就變得很難跟蹤。

此外,有些管道可能會使用 Docker 和 Kubernetes 進行容器化,其他管道可能不會。有些管道將部署特定的 API,其他管道則不會。這樣的例子不勝枚舉。

為了彌補這種不足,像 TFX、Mlflow 和 Kubeflow 這樣的工具出現了。但這些工具仍處于起步階段,到目前為止,這方面的專家還很少。

數據科學家們知道,他們需要不斷了解自己領域的最新進展。這應該也適用于模型部署。

版本控制和再現仍面臨挑戰

與上述問題相關的是,到目前為止,機器學習模型版本控制還沒有一種可行的方法。顯然,數據科學家需要跟蹤他們所做的任何更改,但現在這相當麻煩。

此外,數據集可能會隨時間漂移。隨著公司和項目的發展,這是很自然的,但這使得再現過去的結果變得更加困難。

更重要的是,一旦項目啟動,就會建立一個基準,用于現在和將來對模型進行測試。結合版本控制,數據科學家可以再現他們的模型。

如果模型不可再現,就會導致漫長的調查研究。圖片由作者提供。

停止嘗試,開始部署

如果數據科學家 90% 的努力都沒有結果,這可不是一個好現象。這不是數據科學家的錯,如上所述,這是由于組織結構上固有的障礙。

變革不是一天能完成的。對于剛剛開始接觸機器學習模型的公司,建議他們從一個非常小而簡單的項目開始。

一旦管理者勾勒出一個清晰而簡單的項目,第二步就是選擇合適的團隊。這個團隊應該是跨職能的,應該包括數據科學家、工程師、DevOps 和任何其他看起來對于獲得成功至關重要的角色。

第三,在開始的時候,管理者應該考慮利用第三方來幫助他們加速這個過程。IBM 是提供這種服務的公司之一,但市場上也有其他公司。

最后一點是,切莫不惜一切代價追求先進。如果一個簡單的低成本模型能滿足 80% 的客戶需求,并能在幾個月內交付,這已經是一個了不起的成就了。此外,從構建簡單模型積累的經驗將有助于實現更復雜的模型,并有望使客戶百分之百滿意。

結論:革命需要時間

下一個十年注定是革命性的,就像上一個十年一樣。人工智能的廣泛應用只是 眾多發展趨勢 中的一個,物聯網、高級機器人技術和區塊鏈技術也在興起。

我說的是幾十年,而不是幾年。例如,考慮到 90% 的公司都 已上云——如此之多,以至于我們很難想象沒有云我們怎么生活。而另一方面,云是花了 幾十年時間 才被廣泛地采用。

我們沒有理由認為人工智能革命會有任何不同。它需要一段時間才能推廣開,因為目前還有許多需要解決的障礙。

但是,由于機器學習提供了如此多的方法來改善客戶體驗和企業效率,顯然,贏家將是那些快速并盡早部署模型的公司。

本文轉自 公眾號:AI前線 ,作者Rhea Moutafis,點擊閱讀原文

審核編輯:符乾江
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1817

    文章

    50105

    瀏覽量

    265551
  • 機器學習
    +關注

    關注

    66

    文章

    8554

    瀏覽量

    136986
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124417
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    強化學習會讓自動駕駛模型學習更快嗎?

    是一種讓機器通過“試錯”學會決策的辦法。與監督學習不同,監督學習是有人提供示范答案,讓模型去模仿;而強化學習不會把每一步的“正確答案”都告訴
    的頭像 發表于 01-31 09:34 ?656次閱讀
    強化<b class='flag-5'>學習</b>會讓自動駕駛<b class='flag-5'>模型</b><b class='flag-5'>學習</b>更快嗎?

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注
    的頭像 發表于 01-07 15:37 ?206次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    基于ETAS嵌入式AI工具鏈將機器學習模型部署到量產ECU

    AI在汽車行業的應用日益深化,如何將機器學習領域的先進模型(如虛擬傳感器)集成到ECU軟件中,已成為業界面臨的核心挑戰。
    的頭像 發表于 12-24 10:55 ?6135次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>部署到量產ECU

    穿孔機頂頭檢測儀 機器視覺深度學習

    頂頭狀態。 檢測頂頭算法 引入人工智深度學習技術,通過Keras實現卷積神經網絡(CNN),用Numpy實現采集數據的訓練,得到符合現場需求的模型,進一步提升檢測的準確性和現場的適應性。 應用范圍
    發表于 12-22 14:33

    小蘿卜機器人的故事

    經過我的申請, 馬老師發放了, 小蘿卜機器人的, 開發權限, 原來的小蘿卜公司, 因為經營不善倒閉, 作為科研產品, 幾個技術對此惋惜, 自掏腰包, 要讓小蘿卜機器人, 再生, 每次聽到小蘿卜說
    發表于 10-23 05:24

    超小型Neuton機器學習模型, 在任何系統級芯片(SoC)上解鎖邊緣人工智能應用.

    Neuton 是一家邊緣AI 公司,致力于讓機器 學習模型更易于使用。它創建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進的邊緣設備上進行人工智能處理。在這篇博文
    發表于 07-31 11:38

    FPGA在機器學習中的具體應用

    ,越來越多地被應用于機器學習任務中。本文將探討 FPGA 在機器學習中的應用,特別是在加速神經網絡推理、優化算法和提升處理效率方面的優勢。
    的頭像 發表于 07-16 15:34 ?2907次閱讀

    通過NVIDIA Cosmos模型增強機器人學習

    通用機器人的時代已經到來,這得益于機械電子技術和機器人 AI 基礎模型的進步。但目前機器人技術的發展仍面臨一個關鍵挑戰:機器人需要大量的訓練
    的頭像 發表于 07-14 11:49 ?1100次閱讀
    通過NVIDIA Cosmos<b class='flag-5'>模型</b>增強<b class='flag-5'>機器人學習</b>

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)

    在人工智能大模型重塑教育與社會發展的當下,無論是探索未來職業方向,還是更新技術儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術研究的智能工具,大模型
    發表于 07-04 11:10

    邊緣計算中的機器學習:基于 Linux 系統的實時推理模型部署與工業集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學習模型(神經網絡)部署到邊緣設備上,利用從ModbusTCP寄存器獲取的實時數據來預測一臺復古音頻放大器的當前健康狀況。你將
    的頭像 發表于 06-11 17:22 ?1010次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>:基于 Linux 系統的實時推理<b class='flag-5'>模型</b>部署與工業集成!

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    人部署,詳細介紹了基于顏色閾值和深度學習的巡線方法。 二維碼識別則廣泛應用于機器人定位與任務觸發,例如AGV(自動導引車)的路徑規劃。 深度學習
    發表于 05-03 19:41

    存儲芯片在AI學習機中的發展趨勢

    隨著AI大模型等前沿技術的不斷發展,智能學習產品技術日益成熟,廣泛應用于多個教育學習場景,其廣闊的應用前景推動中國智能硬件行業規模快速增長。
    的頭像 發表于 04-21 14:42 ?1347次閱讀

    國產地物光譜儀在“高光譜-機器學習模型構建中的表現

    和可推廣性。 近年來,國產地物光譜儀在性能、穩定性和數據一致性等方面取得了顯著進步,不僅打破了對進口設備的長期依賴,也逐步展現出在“高光譜-機器學習模型構建中的實力。 一、國產儀器的數據質量,是否足夠
    的頭像 發表于 04-18 16:15 ?752次閱讀
    國產地物光譜儀在“高光譜-<b class='flag-5'>機器</b><b class='flag-5'>學習</b>”<b class='flag-5'>模型</b>構建中的表現

    十大鮮為人知卻功能強大的機器學習模型

    本文轉自:QuantML當我們談論機器學習時,線性回歸、決策樹和神經網絡這些常見的算法往往占據了主導地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強大的算法,它們能夠以驚人的效率
    的頭像 發表于 04-02 14:10 ?1100次閱讀
    十大鮮為人知卻功能強大的<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>

    Raspberry Pi Pico 2 上實現:實時機器學習(ML)音頻噪音抑制功能

    Arm公司的首席軟件工程師SandeepMistry為我們展示了一種全新的巧妙方法:在RaspberryPiPico2上如何將音頻噪音抑制應用于麥克風輸入。機器學習(ML)技術徹底改變了許多軟件應用
    的頭像 發表于 03-25 09:46 ?1230次閱讀
    Raspberry Pi Pico 2 上實現:實時<b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)音頻噪音抑制功能