国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習部署的難點

汽車玩家 ? 來源: AI公園 ? 作者:Alexandre Gonfalonier ? 2020-05-04 12:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

根據我作為顧問的經驗,只有非常少的機器學習項目能夠投入生產。一個人工智能項目可能會因為多種原因而失敗,其中之一就是部署。

在做了幾個人工智能項目之后,我意識到,對于那些愿意通過人工智能創造價值的公司來說,大規模部署機器學習(ML)模型是最重要的挑戰之一。

根據我作為顧問的經驗,只有非常少的機器學習項目能夠投入生產。一個人工智能項目可能會因為多種原因而失敗,其中之一就是部署。對于每個決策者來說,完全理解部署是如何工作的,以及在達到這一關鍵步驟時如何降低失敗的風險是非常關鍵的。

部署的模型可以定義為無縫集成到生產環境中的任何代碼單元,并且可以接收輸入并返回輸出。

我曾經看到,為了將他們的工作投入生產,數據科學家通常必須將他或她的數據模型進行工程實現。在這一步中,出現了一些最常見的數據科學問題。

挑戰

機器學習有一些獨特的特性,使得大規模部署變得更加困難。這是我們正在處理的一些問題:

管理數據科學語言

你可能知道,機器學習應用程序通常由使用不同的編程語言編寫組成。它們之間的相互作用并不是很好。我曾多次看到,機器學習pipeline從R開始,在Python中繼續,并以另一種語言結束。

一般來說,Python和R是機器學習應用程序中最流行的語言,但我注意到,由于各種原因(包括速度),很少使用這些語言部署生產模型。將Python或R模型移植到像c++Java這樣的生產語言中是很復雜的,并且通常會降低原始模型的性能(速度、準確性等)。

當軟件的新版本發布時,R包可能會崩潰。此外,R速度慢,無法高效地處理大數據。

對于原型設計來說,它是一種很棒的語言,因為它允許簡單的交互和解決問題,但是需要將它翻譯成Python或c++或Java來進行生產。

諸如Docker之類的容器化技術可以解決由大量工具引入的不兼容性和可移植性挑戰。然而,自動依賴項檢查、錯誤檢查、測試和構建工具將不能解決跨越語言障礙的問題。

可復現性也是一個挑戰。實際上,數據科學家可以使用不同的編程語言、庫或同一庫的不同版本來構建模型的多個版本。手動跟蹤這些依賴關系很困難。為了解決這些挑戰,需要一個機器學習生命周期工具,它可以在訓練階段自動跟蹤并記錄這些依賴項,并將它們作為代碼的配置,然后將它們與訓練的模型一起打包到一個隨時可以部署的工件中。

我建議你使用一種工具或平臺,它可以立即將代碼從一種語言轉換為另一種語言,或者允許你的數據科學團隊在API背后部署模型,以便在任何地方集成它們。

計算能力和GPU

神經網絡通常會非常深,這意味著訓練和使用它們進行推理需要大量的計算能力。通常,我們希望我們的算法運行得更快,對于很多用戶來說,這可能是一個障礙。

此外,現在許多生產上的機器學習都依賴于GPU。然而,它們既稀缺又昂貴,這很容易給機器學習的擴展任務增加另一層復雜性。

可移植性

模型部署的另一個有趣的挑戰是缺乏可移植性。我注意到這通常是遺留分析系統的問題。由于缺乏將軟件組件輕松遷移到另一個主機環境并在那里運行的能力,組件可能會被鎖定在特定的平臺上。這可能為數據科學家在創建和部署模型時制造障礙。

可擴展性

對于許多AI項目來說,可擴展性是一個真正的問題。實際上,你需要確保你的模型能夠擴展并滿足生產中性能和應用程序需求的增長。在項目開始時,我們通常依賴于可管理范圍內的相對靜態數據。隨著模型進入生產環境,它通常會接觸到大量的數據和數據傳輸模式。你的團隊將需要一些工具來監視和解決性能和可擴展性方面的問題,這些問題將隨著時間的推移而出現。

我認為,可擴展性問題可以通過采用一致的、基于微服務的方法來進行生產分析來解決。團隊應該能夠通過簡單的配置更改快速地將模型從批處理遷移到隨需應變的流處理。類似地,團隊應該有擴展計算和內存占用的選項,以支持更復雜的工作負載。

機器學習峰值計算

一旦你的算法被訓練好了,它們并不是時時刻刻被使用——你的用戶只會在需要的時候調用它們。

這可能意味著你只需要支持上午8:00時的100個API調用,而在8:30時需要支持10,000個API調用。

根據我的經驗,我可以告訴你,使用動態擴大或縮小你的服務來確保不為你不需要的服務器付費是一個挑戰

由于所有這些原因,只有少數數據科學項目最終真正進入生產系統。

模型的穩定和魯棒

我們總是花很多時間準備模型。我們需要把原型變得穩定和魯棒,這樣它就可以實際服務于大量的用戶,這通常需要大量的工作。

在許多情況下,整個模型需要用一種適合體系結構的語言重新編碼。僅這一點往往就會導致大量痛苦的工作,從而導致幾個月的部署延遲。完成之后,必須將其集成到公司的IT體系結構中,包括前面討論的所有庫問題。此外,在生產環境中訪問數據也常常是一項困難的任務。

更多的挑戰

在做項目的過程中,我也注意到了以下問題:

如果我們改變了一個輸入特征,那么其余特征的重要性、權重或使用可能也會改變。機器系統必須設計得易于跟蹤特征工程和選擇更改。

當模型被不斷迭代和微妙地改變時,跟蹤配置更新同時保持配置的清晰性和靈活性將成為額外的負擔。

有些數據輸入可能隨時間而改變。我們需要一種方法來理解和跟蹤這些變化,以便能夠完全理解我們的系統。

在機器學習應用程序中會出現一些傳統的單元/集成測試無法識別的錯誤。部署錯誤的模型版本、忘記某個特征以及在過時的數據集上進行訓練只是其中的幾個例子。

測試和驗證的問題

正如你可能已經知道的,模型由于數據更改、新方法等而不斷發展。因此,每次發生這樣的變化時,我們都必須重新驗證模型的性能。這些驗證步驟引入了幾個挑戰:

除了在離線測試中驗證模型外,評估生產模型的性能也非常重要。通常,我們在部署策略和監視部分對此進行規劃。

與常規軟件應用程序相比,機器學習模型需要更頻繁地更新。

自動化機器學習平臺

有些人可能聽說過自動化機器學習平臺。這可能是一個快速生成模型的好方法。此外,該平臺可以支持多個模型的開發和比較,因此企業可以選擇最適合其預測準確性、延遲和計算資源需求的模型。

多達90%的企業機器學習模型可以自動開發。數據科學家可以與業務人員合作,開發目前自動化無法實現的一小部分模型

許多模型經歷了漂移(性能隨時間降低)。因此,需要監視已部署的模型。每個部署的模型都應該記錄所有的輸入、輸出和異常。模型部署平臺需要提供日志存儲和模型性能可視化。密切關注模型性能是有效管理機器學習模型生命周期的關鍵。

必須通過部署平臺監視的關鍵元素

發布策略

探索許多不同的方式來部署你的軟件,“shadow mode”和“Canary”部署對機器學習應用程序特別有用。在“shadow mode”中,你捕獲生產中新模型的輸入和預測,而實際上并不服務于這些預測。相反,你可以自由地分析結果,如果檢測到錯誤,則不會產生重大后果。

當你的體系結構成熟時,請考慮啟用漸進的或“Canary”版本。這種做法是指你可以向一小部分客戶發布產品,而不是“要么全部發布,要么什么都不發布”。這需要更成熟的工具,但它可以最小化錯誤。

總結

機器學習仍處于初級階段。實際上,軟件和硬件組件都在不斷發展,以滿足機器學習的當前需求。

Docker/Kubernetes和微服務體系結構可以用來解決異構性和基礎設施方面的挑戰。現有的工具可以單獨地極大地解決一些問題。我認為,將所有這些工具結合起來以使ML運作化是當今最大的挑戰。

部署機器學習是并且將繼續是困難的,這只是組織將需要處理的一個現實。值得慶幸的是,一些新的架構和產品正在幫助數據科學家。此外,隨著越來越多的公司擴展數據科學操作,他們也在實現使模型部署更容易的工具。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136940
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能與機器學習在這些行業的深度應用

    自人工智能和機器學習問世以來,多個在線領域的數字化格局迎來了翻天覆地的變化。這些技術從誕生之初就為企業賦予了競爭優勢,而在線行業正是受其影響最為顯著的領域。人工智能(AI)與機器學習
    的頭像 發表于 02-04 14:44 ?475次閱讀

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    無論你是剛入門還是已經從事人工智能模型相關工作一段時間,機器學習和深度學習中都存在一些我們需要時刻關注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發諸多麻煩!只要我們密切關注數據、模型架構
    的頭像 發表于 01-07 15:37 ?190次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>中需避免的 7 個常見錯誤與局限性

    基于ETAS嵌入式AI工具鏈將機器學習模型部署到量產ECU

    AI在汽車行業的應用日益深化,如何將機器學習領域的先進模型(如虛擬傳感器)集成到ECU軟件中,已成為業界面臨的核心挑戰。
    的頭像 發表于 12-24 10:55 ?6106次閱讀
    基于ETAS嵌入式AI工具鏈將<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型<b class='flag-5'>部署</b>到量產ECU

    探索RISC-V在機器人領域的潛力

    SLAM等輕量級算法時表現出了不錯的性能,CPU占用率在可接受范圍內。整個系統響應及時,證明了MUSE Pi Pro完全有能力作為小型移動機器人的“大腦”。 四、 其他功能淺嘗 ? AI模型部署
    發表于 12-03 14:40

    今日看點:智元推出真機強化學習;美國軟件公司SAS退出中國市場

    智元推出真機強化學習機器人訓練周期從“數周”減至“數十分鐘” ? 近日,智元機器人宣布其研發的真機強化學習技術,已在與龍旗科技合作的驗證產線中成功落地。據介紹,此次落地的真機強化
    發表于 11-05 09:44 ?1091次閱讀

    如何在機器視覺中部署深度學習神經網絡

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術。事實上,這種印象忽視了該技術為機器視覺(乃至生產自動化)帶來的潛力,因為深度學習并非只屬于計算機科學家或程序員。 從頭開始:什么
    的頭像 發表于 09-10 17:38 ?901次閱讀
    如何在<b class='flag-5'>機器</b>視覺中<b class='flag-5'>部署</b>深度<b class='flag-5'>學習</b>神經網絡

    明陽 IPv6 解決方案,精準掃清深化部署中的難點與痛點

    隨著IPv4地址的枯竭和IPv6規模化部署的加速,企業網絡和應用系統向IPv6遷移已成為不可逆轉的趨勢。然而,在實際推進過程中,企業往往面臨諸多棘手問題。難點一:缺乏IPv6深化部署發展情況監測能力
    的頭像 發表于 08-19 14:28 ?1649次閱讀
    明陽 IPv6 解決方案,精準掃清深化<b class='flag-5'>部署</b>中的<b class='flag-5'>難點</b>與痛點

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?2889次閱讀

    【Banana Pi BPI-RV2開發板試用體驗】部署內網穿透

    支持,但已經不再推薦。 1. 在具有公網 IP 的機器部署 frps 部署 frps 并編輯 frps.toml 文件。以下是簡化的配置,其中設置了 frp 服務器用于接收客戶端連接的端口和簡單的認證
    發表于 06-29 20:05

    邊緣計算中的機器學習:基于 Linux 系統的實時推理模型部署與工業集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學習模型(神經網絡)部署到邊緣設備上,利用從ModbusTCP寄存器獲取的實時數據來預測一臺復古音頻放大器的當前健康狀況。你將
    的頭像 發表于 06-11 17:22 ?996次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>:基于 Linux 系統的實時推理模型<b class='flag-5'>部署</b>與工業集成!

    如何使用Docker部署大模型

    隨著深度學習和大模型的快速發展,如何高效地部署這些模型成為了一個重要的挑戰。Docker 作為一種輕量級的容器化技術,能夠將模型及其依賴環境打包成一個可移植的容器,極大地簡化了部署流程。本文將詳細介紹如何使用 Docker
    的頭像 發表于 05-24 16:39 ?1113次閱讀

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    視覺巡線,展示了如何從數據采集、模型訓練到機器人部署的完整流程。 值得注意的是,深度學習模型的實時性對機器人計算資源提出了較高要求,優化模型(如TensorRT加速)是實際部署的關鍵。
    發表于 05-03 19:41

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發表于 04-01 00:00

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發表于 03-13 07:34

    如何部署OpenVINO?工具套件應用程序?

    編寫代碼并測試 OpenVINO? 工具套件應用程序后,必須將應用程序安裝或部署到生產環境中的目標設備。 OpenVINO?部署管理器指南包含有關如何輕松使用部署管理器將應用程序打包并部署
    發表于 03-06 08:23