国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

數據標注是人類與AI合作最完美的途徑之一

lhl545545 ? 來源:自動駕駛說 ? 作者:自動駕駛說 ? 2020-06-18 14:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

眾所周知,機器學習主要分為兩類:監督學習(supervised learning)與無監督學習(unsupervised learning)。而監督學習離不開數據標注(data labeling),也就是依靠人工找到groundtruth。燒錢速度有多快?近年來,我們注意到,數據標注創業公司層出不窮。只要在圖片中標注一輛汽車,只需一秒鐘,就能輕輕松松一美元進賬。標注一段幾十秒視頻中的汽車,就能幾百美元進賬。數據標注的成本與需求都在節節攀升。據市場研究預測,到2023年,數據標注市場將達到10億美元的規模。這些數據標注公司一般會開發出基本的物體識別算法,然后在人工成本較低的地區招人,培訓他們,讓他們找到機器識別中的錯誤,改正之后提交。比如,一些總部在硅谷的公司會在比較偏遠的州建立分部,進行數據標注。也有很多公司將業務外包給數據標注公司,這些公司的員工一般在非洲國家、印度或者其他人工成本較低的國家。對數據需求量大的公司,每個月支付給外包公司上百萬美元,才能滿足開發需求。數據標注不僅消耗資金,也是訓練模型中最耗時的環節。從數據采集到最終標識,很可能要等待一個月的時間。嚴重影響了開發進度。因此,很多無人駕駛公司開始研究數據標識,希望不再依賴人力與第三方公司。

印度數據標注公司iMerit數據標注無處不在訓練無人駕駛的模型就需要理解各種障礙物的含義,就離不開數據標識。無人駕駛的數據標識主要可以用兩個維度來看。第一個維度是2D和3D的分別。2D一般指通過攝像頭捕捉到的數據,3D指激光雷達捕捉到的數據。第二個維度是語義分割(semantic segmentation)與畫框(bounding box)的分別。

3D語義分割的例子魚和熊掌不可兼得數據標注的難點主要來源于兩個方面:速度與質量。速度慢了就滿足不了模型訓練的需求,而太快就會影響質量,質量低了就會影響模型的準確性。在資源有限的情況下,速度與質量往往魚和熊掌不可兼得。我們可以通過兩種手段來解決這一矛盾:合理的流程和更自動化的機器學習技術。首先來看流程。數據標識速度慢,或是質量低,其實很多時候不是技術的問題,而是流程的問題。數據從采集到產出,首先要被“篩選”,分發到數據標識人員的手上,然后被標識,標識的結果再被傳回來,最后需要抽檢,保證質量。這些步驟中很多地方需要改進。比如,哪類數據應該被篩選?質量不合格的標識該怎么辦?是否要退回重做?重做又需要時間,不重做就意味著需要更多的數據。對于資金不夠充足的公司,改進流程往往是最合適的手段。從技術方面來看,近年來,AutoML(Automated Machine Learning)的概念越來越火,即端到端的全自動機器學習技術,可以自主調參,自主評估模型,從而縮短模型訓練的周期。但是,AutoML不是萬能的。至少在未來幾年里,我們都無法擺脫對人工數據標識的依賴。我們需要找到一種人機共生的方式,將人類對機器的幫助最大化。

歐洲數據標識市場中,人工標識的占比始終占大多數人機共生(Human-in-the-Loop)2020-2030這十年,將是人類探索與AI合作機會的十年。數據標注就是人類與AI合作最完美的途徑之一。利用機器學習技術進行視覺探測,雖然成本低、速度快,但是往往有一定的錯誤率。這時,就需要人類介入,告訴機器錯在了哪里。機器會記住這些人類提供的回饋信息,進一步訓練自己的模型,避免下次在類似場景中犯同樣的錯誤,從而形成了一個循環。比如,AI探測結果是,某個交通信號燈的顏色是紅色,而人類檢查后發現應該是綠色,就通過某個前端工具點擊“錯誤”。開發團隊要盡快找到模型最需要的反饋信息,為人類標注員提供一個工具,將人類的反饋快速分享給機器。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7335

    瀏覽量

    94809
  • AI
    AI
    +關注

    關注

    91

    文章

    39868

    瀏覽量

    301528
  • 無人駕駛
    +關注

    關注

    100

    文章

    4297

    瀏覽量

    126856
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自動駕駛數據標注是所有信息都要標注嗎?

    [首發于智駕最前沿微信公眾號]數據標注對于自動駕駛來說,就像是老師教小朋友知識,數據標注可以讓車輛學習辨別道路交通信息的能力。攝像頭、雷達、激光雷達(LiDAR)拍下來的只是
    的頭像 發表于 12-04 09:05 ?885次閱讀
    自動駕駛<b class='flag-5'>數據</b><b class='flag-5'>標注</b>是所有信息都要<b class='flag-5'>標注</b>嗎?

    算法工程師不愿做標注工作,怎么辦?

    對于算法而言,圖像標注項關鍵性工作,越是大量的新數據標注,對于算法的性能提升越有幫助。但是圖像標注
    的頭像 發表于 12-02 17:56 ?554次閱讀
    算法工程師不愿做<b class='flag-5'>標注</b>工作,怎么辦?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅動科學被認為是科學發現的第五個范式了,與實驗科學、理論科學、計算科學、
    發表于 09-17 11:45

    AI Cube如何導入數據集?

    我從在線平臺標注完并且下載了數據集,也按照ai cube的要求修改了文件夾名稱,但是導入提示 不知道是什么原因,我該怎么辦? 以下是我修改后的文件夾目錄
    發表于 08-11 08:12

    自動駕駛數據標注主要是標注什么?

    [首發于智駕最前沿微信公眾號]在自動駕駛系統的研發過程中,數據標注是實現高性能感知模型的基礎環節,其核心目標是將車輛從環境中采集到的原始感知數據(主要包括圖像、點云、視頻序列等)轉化為具有語義信息
    的頭像 發表于 07-30 11:54 ?1358次閱讀
    自動駕駛<b class='flag-5'>數據</b><b class='flag-5'>標注</b>主要是<b class='flag-5'>標注</b>什么?

    什么是自動駕駛數據標注?如何好做數據標注

    [首發于智駕最前沿微信公眾號]在自動駕駛系統的開發過程中,數據標注項至關重要的工作。它不僅決定了模型訓練的質量,也直接影響了車輛感知、決策與控制的性能表現。隨著傳感器種類和數據量的
    的頭像 發表于 07-09 09:19 ?1395次閱讀
    什么是自動駕駛<b class='flag-5'>數據</b><b class='flag-5'>標注</b>?如何好做<b class='flag-5'>數據</b><b class='flag-5'>標注</b>?

    任正非說 AI已經確定是第四次工業革命 那么如何從容地加入進來呢?

    GitHub等平臺上尋找感興趣的AI開源項目。例如,可以參與些小型的深度學習框架改進項目,或者數據標注工具的開發項目。通過參與這些項目,可以學習到實際的代碼開發規范,與其他開發者交流
    發表于 07-08 17:44

    AI時代 圖像標注不要沒苦硬吃

    識別算法的性能提升依靠大量的圖像標注,傳統模式下,需要人工對同類型數據集進行步步手動拉框,這個過程的痛苦只有做過的人才知道。越多素材的數據集對于算法的提升越有幫助,常規情況下,
    的頭像 發表于 05-20 17:54 ?560次閱讀
    <b class='flag-5'>AI</b>時代   圖像<b class='flag-5'>標注</b>不要沒苦硬吃

    東軟集團入選國家數據數據標注優秀案例

    近日,東軟飛標醫學影像標注平臺在國家數據局發布數據標注優秀案例集名單中排名第(案例名稱“多模態醫學影像智能
    的頭像 發表于 05-09 14:37 ?1251次閱讀

    海信集團與美的集團簽訂戰略合作協議

    近日,海信集團與美的集團簽訂戰略合作協議,雙方將圍繞AI應用、全球先進制造、智慧物流等多領域開展全面戰略合作,以資源共享、互惠互利與協同創新為基礎,開啟
    的頭像 發表于 05-08 15:59 ?966次閱讀

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署
    發表于 04-01 00:00

    數據標注服務—奠定大模型訓練的數據基石

    數據標注是大模型訓練過程中不可或缺的基礎環節,其質量直接影響著模型的性能表現。在大模型訓練中,數據標注承擔著將原始數據轉化為機器可理解、可學
    的頭像 發表于 03-21 10:30 ?3348次閱讀

    標貝數據標注服務:奠定大模型訓練的數據基石

    數據標注是大模型訓練過程中不可或缺的基礎環節,其質量直接影響著模型的性能表現。在大模型訓練中,數據標注承擔著將原始數據轉化為機器可理解、可學
    的頭像 發表于 03-21 10:27 ?1124次閱讀
    標貝<b class='flag-5'>數據</b><b class='flag-5'>標注</b>服務:奠定大模型訓練的<b class='flag-5'>數據</b>基石

    自動化標注技術推動AI數據訓練革新

    結果的高準確率,相對純人工標注效率可提升70%以上,為用戶提供更性價比的數據方案和服務。本文將就自動化標注平臺是什么以及為AI數據訓練帶來哪
    的頭像 發表于 03-14 16:46 ?1378次閱讀

    標貝自動化數據標注平臺推動AI數據訓練革新

    結果的高準確率,相對純人工標注效率可提升70%以上,為用戶提供更性價比的數據方案和服務。本文將就自動化標注平臺是什么以及為AI數據訓練帶來哪
    的頭像 發表于 03-14 16:42 ?1677次閱讀
    標貝自動化<b class='flag-5'>數據</b><b class='flag-5'>標注</b>平臺推動<b class='flag-5'>AI</b><b class='flag-5'>數據</b>訓練革新