国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌AI研發(fā)TensorFlow3D操作速度竟提高二十倍

新機(jī)器視覺 ? 來源:Google AI ? 作者:Google AI ? 2021-03-12 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

Google AI發(fā)布了TensorFlow 3D,將3D深度學(xué)習(xí)能力引入TensorFlow,加入3D稀疏卷積網(wǎng)絡(luò),在Waymo Open數(shù)據(jù)集上的實(shí)驗(yàn)表明,這種實(shí)現(xiàn)比預(yù)先設(shè)計(jì)好的TensorFlow操作提速「20倍」。隨著自動(dòng)駕駛汽車與機(jī)器人的深入發(fā)展,激光雷達(dá)、深度傳感攝像機(jī)、雷達(dá)等3D傳感器已經(jīng)成為了獲取道路數(shù)據(jù)的必要設(shè)備。而利用這些傳感器的機(jī)器學(xué)習(xí)系統(tǒng)則顯得尤為重要,因?yàn)樗梢詭椭布诂F(xiàn)實(shí)世界中進(jìn)行導(dǎo)航等操作。

近期,包括目標(biāo)檢測、透明目標(biāo)檢測等模型的3D場景理解方面取得了很大進(jìn)展,但是由于3D數(shù)據(jù)可用的工具和資源有限,這個(gè)領(lǐng)域仍面臨挑戰(zhàn)。

TensorFlow 3D:TensorFlow與3D深度學(xué)習(xí)合體

為了進(jìn)一步提高對(duì)3D場景的建模,簡化研究人員的工作,Google AI發(fā)布了TensorFlow 3D (TF 3D) ,一個(gè)高度模塊化、高效的庫,旨在將3D深度學(xué)習(xí)能力引入TensorFlow. TF 3D提供了一系列當(dāng)下常用的操作、損失函數(shù)、數(shù)據(jù)處理工具、模型和度量,使更多的研究團(tuán)隊(duì)能夠開發(fā)、培訓(xùn)和部署最先進(jìn)的3D場景理解模型。TF 3D包含用于最先進(jìn)的3D語義分割、3D目標(biāo)檢測和3D實(shí)例分割的培訓(xùn)和評(píng)估任務(wù),還支持分布式訓(xùn)練。

另外,TF 3D還支持其他潛在的應(yīng)用,如三維物體形狀預(yù)測、點(diǎn)云配準(zhǔn)和點(diǎn)云增密。此外,它提供了一個(gè)統(tǒng)一的數(shù)據(jù)集規(guī)范和訓(xùn)練、評(píng)價(jià)標(biāo)準(zhǔn)三維場景理解數(shù)據(jù)集的配置。

目前,TF 3D支持Waymo Open、 ScanNet和Rio數(shù)據(jù)集。然而,用戶可以自由地將其他流行的數(shù)據(jù)集,如NuScenes和Kitti,轉(zhuǎn)換成類似的格式,并將其用于已有或自定義的pipeline模型中,還可以利用TF 3D進(jìn)行各種3D深度學(xué)習(xí)研究和應(yīng)用,從快速原型設(shè)計(jì)到部署實(shí)時(shí)推理系統(tǒng)。

左邊顯示的是TF 3D中3D物體檢測模型在Waymo Open Dataset的一幀畫面上的輸出示例。右邊是ScanNet數(shù)據(jù)集上3D實(shí)例分割模型的輸出示例。

在這里,我們將介紹在TF 3D中提供的高效且可配置的稀疏卷積骨干,這是在各種3D場景理解任務(wù)中獲得最先進(jìn)結(jié)果的關(guān)鍵。此外,我們將逐一介紹TF 3D目前支持的3個(gè)流水線任務(wù): 3D語義分割、3D目標(biāo)檢測分割和3D實(shí)例分割。

3D稀疏卷積網(wǎng)絡(luò)

傳感器采集到的3D數(shù)據(jù)通常包含一個(gè)場景,該場景包含一組感興趣的物體(如汽車、行人等),其周圍大多是開放空間。所以,3D數(shù)據(jù)本質(zhì)上是稀疏的。在這樣的環(huán)境中,卷積的標(biāo)準(zhǔn)實(shí)現(xiàn)將需要大量的計(jì)算、消耗大量的內(nèi)存。因此,在TF 3D 中,我們采用了流形稀疏卷積(submanifold sparse convolution)和池操作,這些操作可以更有效地處理3D稀疏數(shù)據(jù)。稀疏卷積模型是大多數(shù)戶外自動(dòng)駕駛(如Waymo,NuScenes)和室內(nèi)基準(zhǔn)測試(如 ScanNet)中應(yīng)用的sota方法的關(guān)鍵。

谷歌還應(yīng)用了各種CUDA技術(shù)來加快計(jì)算速度(如hash、在共享內(nèi)存中分區(qū)/緩存過濾器以及使用位操作)。在Waymo Open數(shù)據(jù)集上的實(shí)驗(yàn)表明,這種實(shí)現(xiàn)比預(yù)先設(shè)計(jì)好的TensorFlow操作要快「20倍」左右。

圖源:Waymo Open Dataset on GitHub

然后,TF 3D使用3D流形稀疏U-Net架構(gòu)來提取每個(gè)voxel的特征。通過讓網(wǎng)絡(luò)提取粗細(xì)特征并將它們組合起來進(jìn)行預(yù)測,U-Net架構(gòu)已被證明是有效的。

U-Net網(wǎng)絡(luò)由編碼器、瓶頸和解碼器三個(gè)模塊組成,每個(gè)模塊都由許多稀疏卷積塊組成,并可能進(jìn)行池化或非池化操作。

一個(gè)3D稀疏體素U-Net架構(gòu)。注意,一個(gè)水平的箭頭接收體素特征,并對(duì)其應(yīng)用流形稀疏卷積。向下移動(dòng)的箭頭會(huì)執(zhí)行流形稀疏池化。向上移動(dòng)的箭頭將收集池化的特征,與水平方向箭頭的特征進(jìn)行concat,并對(duì)concat后的特征進(jìn)行流形稀疏卷積。

上述稀疏卷積網(wǎng)絡(luò)是TF 3D提供的3D場景理解pipeline模型的backbone。

下面描述的每個(gè)模型使用這個(gè)骨干網(wǎng)絡(luò)提取稀疏體素特征,然后添加一個(gè)或多個(gè)額外的預(yù)測頭來推斷感興趣的任務(wù)。

用戶可以通過改變編碼器/解碼器層數(shù)和每層卷積的數(shù)量來配置U-Net網(wǎng)絡(luò),并通過修改卷積濾波器的尺寸,從而能夠通過不同的網(wǎng)絡(luò)配置來權(quán)衡的速度和精度。

三維語義分割

三維語義分割模型只有一個(gè)輸出,用于預(yù)測每一個(gè)點(diǎn)的語義分?jǐn)?shù),將其映射回點(diǎn),預(yù)測每一個(gè)點(diǎn)的語義標(biāo)簽從ScanNet數(shù)據(jù)集對(duì)室內(nèi)場景進(jìn)行3D語義分割。

三維實(shí)例分割

在三維實(shí)例分割中,除了要預(yù)測語義,更重要的是將同一對(duì)象的體素組合在一起。在TF 3D中使用的3D實(shí)例分割算法是基于用深度度量學(xué)習(xí)方法進(jìn)行的2D圖像分割工作。這種模型預(yù)測能預(yù)測每個(gè)體素的實(shí)例嵌入向量以及每個(gè)體素的語義評(píng)分。

實(shí)例嵌入向量將體素映射到一個(gè)嵌入空間,其中對(duì)應(yīng)于同一對(duì)象實(shí)例的體素相距很近,而對(duì)應(yīng)于不同對(duì)象的體素相距很遠(yuǎn)。在這種情況下,輸入是一個(gè)點(diǎn)云而不是一個(gè)圖像,并且他將使用一個(gè)三維稀疏網(wǎng)絡(luò)而不是一個(gè)二維圖像網(wǎng)絡(luò)。在推理過程中利用貪心算法選取實(shí)例種子,并利用體素嵌入的距離函數(shù)將不同的體素聚合到對(duì)應(yīng)的實(shí)例上去。

三維目標(biāo)檢測

目標(biāo)檢測模型可以預(yù)測每個(gè)體素的大小、中心和旋轉(zhuǎn)矩陣以及對(duì)象的語義評(píng)分。在推理時(shí),推選機(jī)制將給出的多個(gè)候選框處理為少數(shù)幾個(gè)精確的3D目標(biāo)框。在訓(xùn)練時(shí)使用了預(yù)測與GT間的Huber Loss距離來計(jì)算損失。由于利用大小、中心和旋轉(zhuǎn)矩陣估算框邊角是可差分過程,損失可以自然地傳遞到預(yù)測過程的權(quán)重中。研究人員利用動(dòng)態(tài)框分類損失來對(duì)預(yù)測的框進(jìn)行正例和負(fù)例進(jìn)行區(qū)分。

ScanNet數(shù)據(jù)集上的3D物體檢測結(jié)果

TF 3D只是市場上的3D深度學(xué)習(xí)擴(kuò)展之一。2020年,F(xiàn)acebook推出了PyTorch3D,專注于3D渲染和虛擬現(xiàn)實(shí)。另一個(gè)是英偉達(dá)的Kaolin,這是一個(gè)模塊化的可分辨渲染的應(yīng)用,如高分辨率模擬環(huán)境。

從這個(gè)概述來看,TF 3D應(yīng)用程序似乎更專注于機(jī)器人感知和映射,而其他選項(xiàng)則更專注于3D模擬和渲染。為了實(shí)現(xiàn)3D渲染,Google推出了TensorFlow Graphics.

參考資料:

https://ai.googleblog.com/2021/02/3d-scene-understanding-with-tensorflow.html

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 3D
    3D
    +關(guān)注

    關(guān)注

    9

    文章

    3011

    瀏覽量

    115053
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    334

    瀏覽量

    62182

原文標(biāo)題:提速20倍!谷歌AI發(fā)布TensorFlow 3D,智能汽車場景親測好用

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    使用NORDIC AI的好處

    × 在 CPU 上運(yùn)行時(shí)可快 10×、更省電,平均模型體積 <5 KB。[Edge AI 軟件頁] Axon NPU 對(duì)同一 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    AI設(shè)計(jì)+3D打印:火箭發(fā)動(dòng)機(jī)研發(fā)的“新范式革命”

    最近幾年,一種全新的研發(fā)模式正在悄然顛覆這一“重工業(yè)”邏輯——人工智能(AI)自主設(shè)計(jì)發(fā)動(dòng)機(jī)結(jié)構(gòu),金屬3D打印直接制造整機(jī),短短幾周內(nèi)完成從零到成功點(diǎn)火的全過程。這場由算法與打印機(jī)驅(qū)動(dòng)的“新范式革命”,正讓火箭發(fā)
    的頭像 發(fā)表于 01-20 18:16 ?452次閱讀

    谷歌評(píng)論卡,碰一碰即可完成谷歌評(píng)論 #谷歌評(píng)論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    如何在TensorFlow Lite Micro中添加自定義操作符(1)

    相信大家在部署嵌入式端的AI應(yīng)用時(shí),一定使用過TensorFlow Lite Micro,以下簡稱TFLm。TFLm 是專為微控制器和嵌入式設(shè)備設(shè)計(jì)的輕量級(jí)機(jī)器學(xué)習(xí)推理框架,它通過模塊化的操作符系統(tǒng)
    的頭像 發(fā)表于 12-26 10:34 ?5338次閱讀

    谷歌正式推出最新Gemini 3 AI模型

    今天我們正式推出 Gemini 3,這是我們迄今為止最智能的模型,能夠幫助用戶實(shí)現(xiàn)任何創(chuàng)意。Gemini 3 Pro 基于最先進(jìn)的推理技術(shù),與之前的版本相比,它在所有主要的 AI 基準(zhǔn)測試中都取得了無與倫比的結(jié)果,尤其是在編程方
    的頭像 發(fā)表于 11-24 11:10 ?1223次閱讀
    <b class='flag-5'>谷歌</b>正式推出最新Gemini <b class='flag-5'>3</b> <b class='flag-5'>AI</b>模型

    突破傳統(tǒng)!AI3D相機(jī)與邊緣計(jì)算打造智能運(yùn)動(dòng)系統(tǒng)

    ,一個(gè)新的維度變得至關(guān)重要:智能。要實(shí)現(xiàn)真正智能的運(yùn)動(dòng)系統(tǒng),必須融合三項(xiàng)關(guān)鍵技術(shù):人工智能(AI)、3D相機(jī)和邊緣計(jì)算。三者結(jié)合,使機(jī)器不僅能精準(zhǔn)移動(dòng),還能實(shí)時(shí)感知
    的頭像 發(fā)表于 10-31 17:02 ?566次閱讀
    突破傳統(tǒng)!<b class='flag-5'>AI</b>、<b class='flag-5'>3D</b>相機(jī)與邊緣計(jì)算打造智能運(yùn)動(dòng)系統(tǒng)

    【CPKCOR-RA8D1】AI人臉檢測

    在瑞薩 RA8D1 開發(fā)板上集成 AI 人臉檢測功能 1. 項(xiàng)目概述 該項(xiàng)目是根據(jù)官方AI人臉檢測代碼,在官方顯示屏顯示代碼的基礎(chǔ)上進(jìn)行修改而得。由于本人實(shí)力有限,最后的結(jié)果并不理想,無法實(shí)現(xiàn)檢測
    發(fā)表于 10-29 17:59

    華曦達(dá)亮相谷歌AI亞洲峰會(huì),AI Home業(yè)務(wù)高增長引領(lǐng)發(fā)展新征程

    AI亞洲峰會(huì)現(xiàn)場 華曦達(dá)基于谷歌云技術(shù)底座打造的AIHome解決方案及其自主研發(fā)的HomeAIAgent——Cedar成為關(guān)注焦點(diǎn)。該系統(tǒng)通過AI驅(qū)動(dòng)的學(xué)習(xí)與自適應(yīng),實(shí)時(shí)理解并預(yù)測用戶
    的頭像 發(fā)表于 09-10 10:22 ?544次閱讀

    Zivid3D相機(jī)安裝使用教程

    Zivid3D相機(jī)小巧便攜,重量輕,分辨率高,速度快,適合高反光透明物體。本文介紹Zivid 3D相機(jī)的操作流程,幫助用戶掌握其功能。從硬件連接、軟件安裝到參數(shù)設(shè)置,重點(diǎn)涵蓋點(diǎn)云生成、
    的頭像 發(fā)表于 08-26 15:34 ?660次閱讀
    Zivid<b class='flag-5'>3D</b>相機(jī)安裝使用教程

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    生成比傳統(tǒng)框架(如 TensorFlow、PyTorch 等)小 10 倍的模型,模型體積可低至個(gè)位數(shù) KB,并且推理速度更快、功耗更低。此次收購將 Neuton 的自動(dòng)化 TinyML 平臺(tái)
    發(fā)表于 06-28 14:18

    自制一個(gè)支持AI 控制的無刷平衡車機(jī)器人:開源項(xiàng)目D-BOT全攻略

    今天給大家介紹一款創(chuàng)意桌面機(jī)器人——D-BOT!它不僅是一個(gè)功能強(qiáng)大的平衡車機(jī)器人,也是一個(gè)融合了AI控制、3D建模與PCB設(shè)計(jì)的開源項(xiàng)目。 D-BOT 被作者稱為“小探險(xiǎn)家”(Di
    發(fā)表于 04-28 11:45

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3) 序列 課程名稱 視頻課程時(shí)長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南------Docker Desktop環(huán)境
    發(fā)表于 04-16 18:30

    用樹莓派搞深度學(xué)習(xí)?TensorFlow啟動(dòng)!

    介紹本頁面將指導(dǎo)您在搭載64位Bullseye操作系統(tǒng)的RaspberryPi4上安裝TensorFlowTensorFlow是一個(gè)專為深度學(xué)習(xí)開發(fā)的大型軟件庫,它消耗大量資源。您可以在
    的頭像 發(fā)表于 03-25 09:33 ?1209次閱讀
    用樹莓派搞深度學(xué)習(xí)?<b class='flag-5'>TensorFlow</b>啟動(dòng)!

    英偉達(dá)GTC2025亮點(diǎn):NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    聯(lián)合計(jì)劃涵蓋基礎(chǔ)設(shè)施和開源模型優(yōu)化,在機(jī)器人、藥物研發(fā)等領(lǐng)域取得巨大進(jìn)展 具有長期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項(xiàng)新計(jì)劃,旨在推動(dòng) AI 發(fā)展、普及 AI
    的頭像 發(fā)表于 03-21 15:10 ?2034次閱讀
    英偉達(dá)GTC2025亮點(diǎn):NVIDIA、Alphabet 和<b class='flag-5'>谷歌</b>攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來

    西門子Innovator3D IC平臺(tái)榮獲3D InCites技術(shù)賦能獎(jiǎng)

    此前,2025年33日至6日,第二十一屆年度設(shè)備封裝會(huì)議(Annual Device Packaging Conference,簡稱DPC 2025)在美國亞利桑那州鳳凰城成功舉辦。會(huì)上,西門子 Innovator
    的頭像 發(fā)表于 03-11 14:11 ?1557次閱讀
    西門子Innovator<b class='flag-5'>3D</b> IC平臺(tái)榮獲<b class='flag-5'>3D</b> InCites技術(shù)賦能獎(jiǎng)