国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫療電子

人工智能

可穿戴設備

軍用/航空電子

工業控制

觸控感測

智能電網

音視頻及家電

通信網絡

機器人

vr|ar|虛擬現實

安全設備/系統

移動通信

便攜設備

物聯網

區塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區

論壇

問答

小組

技術專欄

社區之星

試用中心

HarmonyOS技術社區

2023電子工程師大會
研究院
活動

設計大賽

硬創大賽

社區活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

機器人接入大模型直接聽懂人話，日常操作輕松完成！

李飛飛團隊具身智能最新成果來了：

大模型接入機器人，把復雜指令轉化成具體行動規劃，無需額外數據和訓練。

從此，人類可以很隨意地用自然語言給機器人下達指令，如：

打開上面的抽屜，小心花瓶！

大語言模型+視覺語言模型就能從3D空間中分析出目標和需要繞過的障礙，幫助機器人做行動規劃。

然后重點來了，真實世界中的機器人在未經“訓練”的情況下，就能直接執行這個任務。

新方法實現了零樣本的日常操作任務軌跡合成，也就是機器人從沒見過的任務也能一次執行，連給他做個示范都不需要。

可操作的物體也是開放的，不用事先劃定范圍，開瓶子、按開關、拔充電線都能完成。

目前項目主頁和論文都已上線，代碼即將推出，并且已經引起學術界廣泛興趣。

論文地址：
https://voxposer.github.io/voxposer.pdf
項目主頁：
https://voxposer.github.io/

一位前微軟研究員評價到：這項研究走在了人工智能系統最重要和最復雜的前沿。

具體到機器人研究界也有同行表示：給運動規劃領域開辟了新世界。

還有本來沒看到AI危險性的人，因為這項AI結合機器人的研究而改變看法。

機器人如何直接聽懂人話？

李飛飛團隊將該系統命名為VoxPoser，如下圖所示，它的原理非常簡單。

首先，給定環境信息（用相機采集RGB-D圖像）和我們要執行的自然語言指令。

接著，LLM（大語言模型）根據這些內容編寫代碼，所生成代碼與VLM（視覺語言模型）進行交互，指導系統生成相應的操作指示地圖，即3D Value Map。

所謂3D Value Map，它是Affordance Map和Constraint Map的總稱，既標記了“在哪里行動”，也標記了“如何行動”。

如此一來，再搬出動作規劃器，將生成的3D地圖作為其目標函數，便能夠合成最終要執行的操作軌跡了。

而從這個過程我們可以看到，相比傳統方法需要進行額外的預訓練，這個方法用大模型指導機器人如何與環境進行交互，所以直接解決了機器人訓練數據稀缺的問題。

更進一步，正是由于這個特點，它也實現了零樣本能力，只要掌握了以上基本流程，就能hold任何給定任務。

在具體實現中，作者將VoxPoser的思路轉化為一個優化問題，即下面這樣一個復雜的公式：

它考慮到了人類下達的指令可能范圍很大，并且需要上下文理解，于是將指令拆解成很多子任務，比如開頭第一個示例就由“抓住抽屜把手”和“拉開抽屜”組成。

VoxPoser要實現的就是優化每一個子任務，獲得一系列機器人軌跡，最終最小化總的工作量和工作時間。

而在用LLM和VLM將語言指令映射為3D地圖的過程中，系統考慮到語言可以傳達豐富的語義空間，便利用“感興趣的實體(entity of interest)”來引導機器人進行操作，也就是通過3DValue Map中標記的值來反應哪個物體是對它具有“吸引力”的，那些物體是具有“排斥性”。

還是以開頭的例子舉，抽屜就是“吸引”的，花瓶是“排斥”的。

當然，這些值如何生成，就靠大語言模型的理解能力了。

而在最后的軌跡合成過程中，由于語言模型的輸出在整個任務中保持不變，所以我們可以通過緩存其輸出，并使用閉環視覺反饋重新評估生成的代碼，從而在遇到干擾時快速進行重新規劃。

因此，VoxPoser有著很強的抗干擾能力。

?

?△ 將廢紙放進藍色托盤

以下分別是VoxPoser在真實和模擬環境中的表現（衡量指標為平均成功率）：

可以看到，無論是哪種環境哪種情況（有無干擾、指令是否可見），它都顯著高于基于原語的基線任務。

最后，作者還驚喜地發現，VoxPoser產生了4個“涌現能力”：

（1）評估物理特性，比如給定兩個質量未知的方塊，讓機器人使用工具進行物理實驗，確定哪個塊更重；

（2）行為常識推理，比如在擺餐具的任務中，告訴機器人“我是左撇子”，它就能通過上下文理解其含義；

（3）細粒度校正，比如執行“給茶壺蓋上蓋子”這種精度要求較高的任務時，我們可以向機器人發出“你偏離了1厘米”等精確指令來校正它的操作；

（4）基于視覺的多步操作，比如叫機器人將抽屜精準地打開成一半，由于沒有對象模型導致的信息不足可能讓機器人無法執行這樣的任務，但VoxPoser可以根據視覺反饋提出多步操作策略，即首先完全打開抽屜同時記錄手柄位移，然后將其推回至中點就可以滿足要求了。

李飛飛：計算機視覺的3顆北極星

大約一年前，李飛飛在美國文理學會會刊上撰文，指出計算機視覺發展的三個方向：

具身智能（Embodied AI）

視覺推理（Visual Reasoning）

場景理解（Scene Understanding）

李飛飛認為，具身智能不單指人形機器人，任何能在空間中移動的有形智能機器都是人工智能的一種形式。

正如ImageNet旨在表示廣泛且多樣化的現實世界圖像一樣，具身智能研究也需要解決復雜多樣的人類任務，從疊衣服到探索新城市。

遵循指令執行這些任務需要視覺，但需要的不僅僅是視覺，也需要視覺推理理解場景中的三維關系。

最后機器還要做到理解場景中的人，包括人類意圖和社會關系。比如看到一個人打開冰箱能判斷出他餓了，或者看到一個小孩坐在大人腿上能判斷出他們是親子關系。

機器人結合大模型可能正是解決這些問題的一個途徑。

除李飛飛外，參與本次研究的還有清華姚班校友吳佳俊，博士畢業于MIT，現為斯坦福大學助理教授。

論文一作Wenlong Huang現為斯坦福博士生，在谷歌實習期間參與了PaLM-E研究。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器人

機器人

+關注

關注
213

文章
31073

瀏覽量
222169
語言模型

語言模型

+關注

關注
0

文章
571

瀏覽量
11310
大模型

大模型

+關注

關注
2

文章
3648

瀏覽量
5179

原文標題：李飛飛團隊「具身智能」新成果！機器人接入大模型直接聽懂人話，日常操作輕松完成！

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

評論

CVer
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot DDFM：首個使用擴散模型進行多模態圖像融合的方法
Hot DepGraph：任意架構的結構化剪枝，CNN、Transformer、GNN等都適用！

New SegVG視覺定位方法的各個組件
New 詳解E2E-MFD多模態融合檢測端到端算法

精選推薦
更多

文章

資料

帖子

匠芯創D213ECV實現PicoClaw極簡部署（附體驗過程）

匠芯創ArtInChip
13小時前

562 閱讀

從點云到圖像級！華為新一代896線激光雷達來襲，分辨率提升4倍

章鷹觀察
8小時前

925 閱讀

睿擎派3562快速上手體驗

RT-Thread官方賬號
1天前

665 閱讀

MWC2026:6G狂飆！華為、高通、英偉達等五大巨頭，亮出哪些突破性技術

章鷹觀察
14小時前

1791 閱讀

中科芯CKS32F107XX系列MCU的以太網介紹（二）

中科芯MCU
13小時前

986 閱讀

基于LT4321_Typical Application直流到直流單輸出電源的參考設計

ytrwv
0.17 MB

2積分

6下載

K8s Vault Webhook Kubernetes權限管理工具

djelje
3.92 MB

免費

0下載

docker-client Docker客戶端API

姬盼希
0.03 MB

免費

0下載

AppStorestyleHorizontalScrollView iOS滑動控件

符籌榮
1.35 MB

免費

0下載

Fkreport數據報表可視化

賈飛小
0.74 MB

免費

0下載

【飛凌嵌入式RV1126B開發板】+基本功能測試篇（1）

jennyzhaojie
23小時前

100 閱讀

【飛凌嵌入式RV1126B開發板】+初識篇

jennyzhaojie
1天前

146 閱讀

樹莓派5還是香橙派5 Pro？兩款熱門開發板的詳細對比

行走的小派
1天前

367 閱讀

OrangePi RV2 深度技術評測：RISC-V AI融合架構的先行者

行走的小派
2天前

726 閱讀

lab view NI6003搭建電路

jf_73763743
2天前

722 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

電子發燒友

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產品地圖

品牌地圖

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

電子發燒友

關于我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發燒友 （電路圖） 湘公網安備43011202000918 工商網監湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
伦伦影院久久影视