国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI項目研發過程中的一些感想

新機器視覺 ? 來源:新機器視覺 ? 作者:皮特潘 ? 2021-01-07 14:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

AI虐我千百遍,我待AI如初戀。什么才是好的AI?答:能落地的AI才是好AI。AI項目從無到有,再到最終落地,無非不是挖坑、踩坑、填坑的過程。本文從筆者的一些經歷、經驗、血淚教訓展開,說一下對AI項目研發過程中的感想。

被虐的案例

案例1:經過N次版本修改與優化,最終定稿。支持切換型號、云端訓練、人工調參等。搞到最后,才發現別人要求準確率100%。

案例2:樣機各種燈光閃來閃去,各種運動機構群魔亂舞。什么犄角旮旯都覆蓋到,什么劃痕、殘缺、臟污都面面俱到。但是,一個產品的檢測竟然要30s。到過一次現場才發現,人工目檢只需要2s。

案例3:光學算法、界面都ok了。在熱火朝天、干勁十足的準備推廣成千上百套變現的時候,客戶說只要一套。

案例4:同上,最終客戶說再考慮一下,當然是杳無音信。算是被耍呢?還是算是白嫖呢?

案例5:當我們正為識別準確率是99%的時候,客戶把一個識別成功的和一個識別失敗拿到一起,問:這兩個明明一模一樣,為啥這個失敗了,這個成功了?

案例6:我去生產現場培訓客戶標注。他們非常配合,找來的也是目檢老手。我示范了幾個后,讓他試試。他就是不肯,搞到最后才知道:額,他不會用電腦

案例7:我們的算法好牛掰,我們模型好先進。AI+傳統方法一起來搞,完美。不過你需要調整這20個超參數。人呢?別走啊!

案例8:已經上線運行了,最后發現某一種型號的某一種缺陷打光不佳,圖像上很難判斷。最終只能推倒重來。

案例9:沒有意識到數據的重要性,每次都是幾張圖片在測試,結果是很完美,最匆匆拍板上線。最終大批量測試的時候,發現不work了。

為啥這么難?

工業AI,尤其是缺陷檢測這塊都是硬骨頭。雖然場景非常簡單,雖然數據都是源源不斷,雖然算法都是非常純粹。主要是其需求太分散了,不是不能做,而是值不值得去做。因為你要面臨以下問題:

說不清道不明、模棱兩可的需求標準,某些難以量化的標準。

頻繁的變更需求標準,難以做到只靠調后處理參數就快速響應。

頻繁更換型號的場景,留給你訓練的時間不多。甚至無法提供良好的訓練環境。

立體的產品,各種吃光照,吃視角的缺陷,極其微弱的缺陷。

難以保證的樣本一致性問題。

準確率能不能到100%?

有沒有人工做的更快?

有沒有人工費用更便宜?

需要配合繁復的硬件設備,尤其是運動設備。如何才能保證整套設備的穩定性?

后期維護成本問題?由于涉及的環節太多,需要“全才”才能搞定。

......

一般流程

AI要敏捷開發,更要方法論,更更要穩定成熟的流程。

a6c18c74-503b-11eb-8b86-12bb97331649.jpg

這里要提的是,工業場景的AI不過是整套系統中的一個小小組件,你一定不會靠單純的AI去make money。即便如此,AI從無到有,依然經過以下幾個環節:

需求階段

包括場景分析,問題定義,可行性分析。很多任務都是從該階段直接進入end。這個是好事,一定不要盲目自信和盲目樂觀。所謂一葉障目不見泰山,只看到算法容易實現就忽略以上的問題,最后只能慘淡收場。最怕投入太多沉沒成本之后,想收場卻不甘心。

什么是需求,什么是真正需求,什么是隱藏等待發掘的真正需求。很多時候,和客戶一起聊需求的時候,他們給不出明確的需求。最簡單直接的辦法就是,深入參觀他們的生產現場。和工人融到一起,學會他們的判斷標準。為他們發掘需求,尤其是下面幾點必須提前明確清楚:

什么是絕對不能容忍的錯誤,一旦出現就是質量事故。我們要知道算法的下限在哪里。

涉不涉及更換型號,能否提供符合模型訓練的場景要求,比如至少得有GPU吧,或者可以上網進行云端訓練。

對時間上的要求,很多替換人工工位都要要求比人更快。我們要知道系統的物理極限,例如運動設備。

對于算法難以界定的灰色地帶,接不接受人工二次復檢。對于不work的個例,我們要有backup。

其他都比較直白,對于第二點說明一下。大家想必都知道,我們做算法復現的時候,推理部分比訓練部分要容易好幾個等級。同理,上線部署的時候,如果涉及用戶自己訓練,那么難度就上來了。要把標注、數據處理、訓練參數、測試評估等都打包在一起,還要實現全自動化。甚至會遇到諸如用戶電腦不能上網&沒有GPU,沒有錯,即便是你提訓練必須條件,他也不一定會給你配到。

以上這幾點,一定要仔細論證,全局論證,反復論證。論證不是內卷,不是效率不高,不是執行力不高。沒有詳細論證而匆匆上馬的項目,一般后期有無數個坑在等著你。

打光階段

包括光學設計,成像分析,當然還包括不是那么AI的結構設計等。俗話說:七分靠打光,三分靠調參。打光非常重要,因為后續算法只能為圖片負責。一般我會用“明顯”和“明確”來進行可行性分析,“明顯”就是來自光學。最直觀的判斷就是,人肉眼能否通過圖片進行精準判斷。如果存在模棱兩可的部分,那么它也將成為算法模棱兩可的地方。

數據階段

包括數據采集,數據標注,數據處理。數據的重要性不言而喻,正所謂:七分靠數據,三分靠trick。數據到位了,一切都好說。數據的重要性,想必是任何一個從業人員都深有體會的。我們要數據,要有效的數據。沒有數據的場景,抱歉請用傳統方法。要記住,模型泛化,沒那么重要,當然模型也沒有那么強的泛化能力。它之所以能夠識別,那是因為它見過。將模型理解成一個存儲器,而不是泛化器。之前的你,需要建立數據庫來存儲數據用以測試時的比對,現在的你,模型就是你的數據庫。

數據標注就會涉及標準的定義,很多時候很難拿到清晰的標準。或者說無法量化為清晰的標準。往往會存在灰色地帶,這就要提前有一個清晰的認識。對于灰色地帶的處理,或者說客戶的容忍,要提前想好策略。這里比較困難的是,灰色地帶可能很難量化出來,我們只是知道這個樣本是灰色地帶,到底有多灰,have no idea。

另外,比較重要的是盡快建立穩定的、有代表性的數據集合,尤其是測試集,這點非常重要。可以幫助非常敏捷進行后續的benchmark實驗。如果你不知道你對什么樣的最終結果負責,那么你將永無止境的做下去。

算法設計階段

包括任務定義,任務拆分,模型選擇。尤其是任務拆分,你不肯定把所有的大象都裝到一個冰箱里面,你也不可能把所有的雞蛋放到一個籃子里面。

杜絕唯模型論 & SOTA 論。我們需要的是在特定場景下解決特定的問題。這里涉及學院派思維轉變,學院派的高手為imageNet和COCO等數據集負責,而我為我自己的場景和自己數據集負責。SOTA看中的是模型的上限,而實際的場景,看中的是模型的下限。

杜絕唯AI論。不管傳統方法還是AI方法,能work的就是好算法。如果傳統方法沒有明顯的缺陷,那么請選擇傳統方案。或者你可以這么認為,當前看似高大上的AI并不是真正的AI,或許30年后一天,你會說:先用傳統方法YOLO V28 來試一下吧!

訓練評估階段

包括模型調參,模型訓練,指標評估。所謂的“煉丹”。前幾步做好了,一般不會有太大問題,如果有,請向前追溯。這里要說一句,“提前優化是萬惡之源“。在保證精度的時候,再去考慮速度,再去做優化。當然你靠58個模型聯合起來獲取的精度不在該討論范圍。

部署階段

這個階段坑比較多,基本上都是技術方面。也是所謂的“臟活”。包括模型優化,跨平臺前向推理,模型加密。終于到部署階段了,也看到了落地的曙光。關于深度學習人工智能落地,已經有有很多的解決方案,不論是電腦端、手機端還是嵌入式端,將已經訓練好的神經網絡權重在各個平臺跑起來,應用起來才是最實在的。不過依然存在這么多工作需要做:

跨平臺:可跑目標硬件上,包括各類cpu/gpu/npu/fpga等等。

高效能:速度快、占用內存少等。

精度沒有丟失:經過一通量化、剪枝、蒸餾、圖優化等操作后,終于滿足時間要求了,卻突然發現部署測試精度掉了一半,WTF

加密需求:你一定不希望自己辛辛苦苦搞出來的成果被別人白嫖吧!

閉環生態:當然你不能一勞永逸,怎么在應用中收集樣本,更新系統。你需要作成實用、好用的閉環工具鏈。

運維階段

包括運行監控,模型更新等。你以為可以所以口氣了,并沒有。能不能經受海量產能和時間的考驗,請瑟瑟發抖地注視著吧!運維的核心就是保證業務安全穩定運行。上面提到,AI泛化能力還是比較欠缺的,所以很可能會在實際運行的過程中遇到不work的情況。當然最最直接的辦法就是持續不斷擴充數據。當然要保證你的模型有足夠的capacity,如果沒有,那么就是算法設計環節沒有做好。收集數據利用上面部署階段所說的閉環生態工具鏈來持續完成這個事情。至此,你的AI項目已經落地。

責任編輯:xj

原文標題:談一談我對AI項目落地的看法

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    39760

    瀏覽量

    301366
  • 人工智能
    +關注

    關注

    1817

    文章

    50094

    瀏覽量

    265301

原文標題:談一談我對AI項目落地的看法

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【「龍芯之光 自主可控處理器設計解析」閱讀體驗】+可測試性設計章節閱讀與自己的一些感想

    ,也分享下 自己的一些感想。 先介紹了兩個術語DFT可測試性 設計,ATE自動測試設備,DFT目的是測試出制造問題而不是邏輯 bug,因為DFT也是固定設計的測試邏輯。 然后介紹了可控性,客觀性的概念
    發表于 01-15 23:30

    格靈深瞳靈感實驗室推出端到端開發平臺AI Edge Studio

    AI定制化開發過程中,開發者往往遇到模型訓練門檻高、邊緣端部署難度大、項目難以實現端到端閉環等共性問題,影響AI應用開發的效率提升。
    的頭像 發表于 12-17 15:28 ?631次閱讀

    在開發過程中如何利用CW32L083系列微控制器的官方固件庫進行程序編寫和調試?

    在開發過程中,如何利用CW32L083系列微控制器的官方固件庫進行程序編寫和調試?
    發表于 12-15 07:23

    【CPKCOR-RA8D1】關于AI人臉檢測移植遇到的一些問題

    \'uint16_t\' / \'uint32_t\' 定位與原因: 原項目把這些宏放在 common_util.h或 ra_gen 的common_data.h。 新項目沒有包含或復制這些頭文件
    發表于 10-31 13:39

    【開發指南】全志系列核心板開發過程中的常見問題及排查策略

    在長期提供技術支持服務的過程中,飛凌嵌入式總結了用戶開發全志系列產品時常見的問題及排查方法。本文中,小編將為大家梳理這些經驗,助力開發者快速定位問題,提升開發效率。
    的頭像 發表于 10-15 08:04 ?6870次閱讀
    【開發指南】全志系列核心板開<b class='flag-5'>發過程中</b>的常見問題及排查策略

    芯片研發過程中的兩種流片方式

    芯片在研發過程中一般包含4個階段:芯片設計、生產樣片、測試驗證和大規模量產。在完成芯片設計后,工程師們需要先拿到一些芯片樣片,用它們進行測試和驗證,來判斷新研發的芯片在功能和性能上是否符合設計要求
    的頭像 發表于 09-09 15:04 ?1931次閱讀
    芯片<b class='flag-5'>研發過程中</b>的兩種流片方式

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    ,又分為真菌計算和基于DNA的計算。 圖4 基本的真菌計算機結構 在用化學和生物方法實現AI功能的過程中,要經歷5個階段,見圖5所示。 圖5 以化學和生物方法實現AI功能各階段 期待從AI
    發表于 09-06 19:12

    AI 芯片浪潮下,職場晉升新契機?

    項目全流程的梳理與總結。從項目立項時對市場需求、技術可行性的調研分析,到研發過程中攻克技術難題的詳細過程,再到項目完成后的成果評估與應用推
    發表于 08-19 08:58

    射頻工程師需要知道的一些常見轉接頭

    作為個射頻工程師,測試人員,在日常的工作過程中,接觸最多的除了測試儀表,校準件,連接線纜之外,就是各種不同設備之間的轉接頭了。我們在維修的過程中,發現有比較多的儀器的損壞,或者是測試指標不穩定
    的頭像 發表于 08-06 17:39 ?1221次閱讀
    射頻工程師需要知道的<b class='flag-5'>一些</b>常見轉接頭

    在低功耗藍牙產品開發的過程中,會涉及到一些參數的選擇和設定,這些參數是什么意思,該如何設定呢?(藍牙廣播)

    在低功耗藍牙產品開發的過程中,會涉及到一些參數的選擇和設定,這些參數是什么意思,該如何設定呢?在此介紹一些: 藍牙的廣播類型(Advertising Type) 可連接廣播(ADV_IND):允許
    發表于 06-25 18:25

    嵌入式AI技術漫談 如何組建AI項目開發小組

    解決具體的問題,每個問題出的場景各有不同,難有成例,都需要投入必要的人手執行開發工作。 嵌入式AI項目當中,幾乎所有的開發任務都將圍繞數據展開。數據來源的差異性決定了每個AI項目的開
    的頭像 發表于 06-11 16:34 ?1395次閱讀

    使用CY7C65213開發過程中,應該用哪個interface進行uart通信?

    在使用CY7C65213開發過程中,我想用CyUartRead讀數據,但是好像沒有接口的deviceType是CY_TYPE_UART,想請問我應該用哪個interface進行uart通信? 是否有相關指導文件,或描述符指導?
    發表于 06-03 07:04

    調試ADPD188芯片的過程中用I2C調試過程出現一些問題,求解決

    我在調試ADPD188芯片的過程中用I2C調試過程出現一些問題,參考官方提供的代碼調試中發現,初始化過不去,抓取波形發現芯片型號對不上了,從芯片外觀看ADPD188bi這個芯片,請問是是芯片回的問題還是軟件上需要調整還是什么原因
    發表于 04-16 06:57

    開關電源設計過程中主要元件選擇指南(全333頁)

    該書講解了在開關電源的制作過程中一些關鍵的選型與參數計算方法 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內容有幫助可以關注、點贊、評論支持下哦~)
    發表于 03-25 16:34

    樹莓派在自動化控制項目中的一些潛在應用

    自動化控制項目中的一些潛在應用。之前,我們已經為Arduino平臺探討了相同的話題。我們確定Arduino是個出色的教育工具,但由于一些限制,它無法在工業環境
    的頭像 發表于 03-25 09:45 ?614次閱讀
    樹莓派在自動化控制<b class='flag-5'>項目</b>中的<b class='flag-5'>一些</b>潛在應用