国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

教機器用計算機視覺閱讀樂高手冊

星星科技指導員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-10-11 09:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

樂高愛好者抓撓他們的頭,閱讀組裝說明,可能很快有助于復雜的建設,感謝一個新的 學習 來自斯坦福大學、麻省理工學院和 Autodesk 。研究人員設計了一個深度學習框架,將 2D 手冊翻譯成機器可以理解的步驟,以構建 3D 樂高套件。這項工作可以推動專注于制造機器的研究,幫助人們組裝物體。

“樂高手冊提供了一個獨立的環(huán)境,展示了人類的一項核心技能:在指導下學習完成任務。利用視覺場景解析和程序合成的最新進展,我們旨在構建具有類似技能的機器,從樂高開始,最終以現(xiàn)實世界場景為目標,”該研究資深作者吳家軍說,斯坦福大學計算機科學助理教授。

研究人員表示,用人工智能翻譯 2D 手冊面臨兩大挑戰(zhàn)。首先, AI 必須基于 2D 手動圖像在每個裝配步驟中學習和理解 3D 形狀之間的對應關系。這包括考慮工件的方向和對齊。

它還必須能夠對磚塊進行分類,并在半組裝模型中推斷出磚塊的三維姿態(tài)。作為樂高積木制作過程的一部分,小部件被組合成更大的部件,如吉他的頭部、頸部和身體。當這些較大的部分組合在一起時,將創(chuàng)建一個完整的項目。這增加了難度,因為機器必須解析出所有的樂高積木,甚至是那些可能不可見的積木,如樂高釘和反積木。

該團隊致力于創(chuàng)建一個模型,該模型可以將 2D 手冊轉化為機器可執(zhí)行計劃,以構建定義的對象。雖然目前有兩種執(zhí)行此任務的方法:基于搜索的方法和基于學習的方法,但都存在局限性。

基于搜索的方法尋找工件和手動圖像的可能三維姿態(tài),尋找正確的姿態(tài)。該方法計算量大,速度慢,但精度高。

基于學習的模型依賴于神經(jīng)網(wǎng)絡來預測部件的 3D 姿態(tài)。它們速度快,但精度不高,尤其是在使用看不見的 3D 形狀時。

為了解決這一局限性,研究人員開發(fā)了手冊到可執(zhí)行計劃網(wǎng)絡 ( MEPNet ) ,根據(jù)研究,它使用深度學習和 計算機視覺 集成“神經(jīng) 2D 關鍵點檢測模塊和 2D-3D 投影算法

??根據(jù)一系列預測,在每一步,模型都會閱讀手冊,定位要添加的零件,并推導出 3D 定位。在模型預測了每一塊和每一步的姿勢后,它可以從頭開始解析手冊,創(chuàng)建一個機器人可以遵循的建筑計劃來建造樂高對象。

研究人員在研究中寫道:“對于每個步驟,輸入包括 1 )一組在之前的步驟中構建的原始磚塊和零件,以 3D 表示; 2 )一個顯示組件應如何連接的目標 2D 圖像。預期輸出是該步驟中涉及的所有組件的(相對)姿態(tài)?!薄?/p>

他們從一個包含 72 種磚塊的樂高工具包中創(chuàng)建了第一個合成訓練數(shù)據(jù),并使用了來自 LPub3D ,一個用于“創(chuàng)建樂高風格的數(shù)字建筑說明”的開源應用程序

研究人員總共生成了 8000 份培訓手冊,其中 10 套用于驗證, 20 套用于測試。每個數(shù)據(jù)集中有大約 200 個單獨的步驟,約占培訓中的 200000 個單獨步驟。

他們在研究中寫道:“我們在綜合生成的數(shù)據(jù)集上對 MEPNet 進行全面監(jiān)控,在該數(shù)據(jù)集中,我們有基本真相關鍵點、掩碼和旋轉信息?!薄?MEPNet 模型在四個點上訓練 5 天 NVIDIA Titan RTX GPU 由 NVIDIA 圖靈架構提供支持。

他們還在 Minecraft house 數(shù)據(jù)集上測試了該模型,該數(shù)據(jù)集具有與樂高類似的構建風格。

通過將 MEPNet 與現(xiàn)有模型進行比較,研究人員發(fā)現(xiàn),它在現(xiàn)實世界的樂高積木、合成手冊和 Minecraft 示例中的表現(xiàn)優(yōu)于其他模型。

MEPNet 在姿勢估計方面更準確,甚至在識別不可見片段的構建方面也更好。研究人員還發(fā)現(xiàn),該模型能夠將從合成手冊中獲得的知識應用于現(xiàn)實世界的樂高手冊。

雖然還需要制造一個能夠執(zhí)行計劃的機器人,但研究人員將這項工作視為一個起點。

“我們的長期目標是制造能夠幫助人類構造和組裝復雜物體的機器。我們正在考慮將我們的方法擴展到其他組裝領域,如宜家家具,”斯坦福大學計算機科學博士生王若成( Ruocheng Wang )說。

關于作者

Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術的多種方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7809

    瀏覽量

    93230
  • AI
    AI
    +關注

    關注

    91

    文章

    39859

    瀏覽量

    301506
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    上海計算機視覺企業(yè)行學術沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(下簡稱“青工委”)、上海市計算機學會計算機視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?594次閱讀

    使用代理式AI激活傳統(tǒng)計算機視覺系統(tǒng)的三種方法

    當前的計算機視覺系統(tǒng)擅長于識別物理空間與流程中的事件,卻難以詮釋場景細節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?649次閱讀

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強大的硬件集,可處理多種計算機視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1304次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術解析

    什么是機器視覺及其功能?

    機器視覺本質上是一個系統(tǒng)(例如一臺計算機)查看的能力。系統(tǒng)通過該能力分析圖像,然后作出決策或進行分類。
    的頭像 發(fā)表于 09-10 17:23 ?758次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>及其功能?

    【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評

    賽昉科技VisionFive 2單板計算機開發(fā)板測評作品合集 產(chǎn)品介紹: 昉·星光 2是全球首款集成了3D GPU的高性能量產(chǎn)RISC-V單板計算機,搭載昉·驚鴻-7110(型號:JH-7110
    發(fā)表于 09-04 09:08

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1226次閱讀

    工業(yè)計算機的重要性

    工業(yè)計算機對某些行業(yè)至關重要。我們將在下面詳細解釋這些行業(yè)中的工業(yè)計算機應用。1.制造與工業(yè)自動化工業(yè)級計算機非常適合制造工廠,特別是那些想要自動化裝配過程的工廠。在這樣的環(huán)境中,工業(yè)計算機
    的頭像 發(fā)表于 07-28 16:07 ?582次閱讀
    工業(yè)<b class='flag-5'>計算機</b>的重要性

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環(huán)境中運行。自動化計算機能夠
    的頭像 發(fā)表于 07-21 16:44 ?628次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?751次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?758次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商<b class='flag-5'>用計算機</b>的區(qū)別有哪些

    工業(yè)相機圖像采集卡:機器視覺的核心樞紐

    工業(yè)相機圖像采集卡是用于連接工業(yè)相機與計算機的關鍵硬件設備,主要負責將相機輸出的圖像信號轉換為計算機可處理的數(shù)字信號,并實現(xiàn)高速、穩(wěn)定的數(shù)據(jù)傳輸。它在工業(yè)自動化、機器視覺、醫(yī)學影像、科
    的頭像 發(fā)表于 05-21 12:13 ?866次閱讀
    工業(yè)相機圖像采集卡:<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>的核心樞紐

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎算法的應用

    必須嚴謹,并定期重新校準。 OpenCV與ROS2的無縫結合 OpenCV是計算機視覺的核心工具,書中介紹了如何在ROS2中調用OpenCV進行圖像處理(如邊緣檢測、顏色空間轉換等)。 通過ROS2
    發(fā)表于 05-03 19:41

    一文帶你了解工業(yè)計算機尺寸

    工業(yè)計算機是現(xiàn)代自動化、人工智能(AI)和邊緣計算的支柱。這些堅固耐用的系統(tǒng)旨在承受惡劣的環(huán)境,同時為關鍵應用提供可靠的性能。然而,由于有這么多可用的外形尺寸,為您的工業(yè)計算機選擇合適的尺寸可能是
    的頭像 發(fā)表于 04-24 13:35 ?1058次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸

    計算機網(wǎng)絡入門指南

    計算機網(wǎng)絡是指將地理位置不同且具有獨立功能的多臺計算機及其外部設備,通過通信線路連接起來,在網(wǎng)絡操作系統(tǒng)、網(wǎng)絡管理軟件及網(wǎng)絡通信協(xié)議的管理和協(xié)調下,實現(xiàn)資源共享和信息傳遞的計算機系統(tǒng)。
    的頭像 發(fā)表于 04-22 14:29 ?2274次閱讀
    <b class='flag-5'>計算機</b>網(wǎng)絡入門指南

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數(shù)據(jù)的支持范圍。在增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應用領域的機器學習開發(fā)人員
    的頭像 發(fā)表于 03-11 15:11 ?821次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持