電子發燒友網報道(文/梁浩斌)在近年來,在關節材料和電機技術的進步下,人形機器人的運動能力越來越強,在機器人“小腦”,也就是平衡、運動算法上取得了突破,讓人形機器人能夠實現接近于人類的動作流暢度,甚至能完成一般人無法完成的雜技動作。
而在機器人硬件基礎逐步提高的前提下,也就成為了機器人“大腦”開發的基石,真正讓人形機器人走向“具身智能”。最近有消息稱,特斯拉正在利用一支數據采集團隊,來訓練Optimus機器人像人類一樣自主行動。那么具體是如何做的?
延續純視覺路線,百人團隊采集訓練數據
根據報道,特斯拉數據采集團隊在鼎盛時期擁有超過100名員工,在8小時的輪班中,數據采集員需要根據任務指派文件和操作手冊,重復數百次包括奔跑、蹲下、舞蹈、拿杯子、擦桌子、拉窗簾等動作,以確保數據采集工作正確完成。
值得一提的是,特斯拉在此前是使用動作捕捉服或是遠程手動控制機器人來采集數據。而今年6月,特斯拉開始改用純攝像頭采集數據,這與其自動駕駛的技術路線相同。團隊成員被告知,不采用動作捕抓服后,數據采集的工作效率會更高。除了環境周圍的攝像頭外,數據采集員工需要穿戴頭盔和背包,搭載5臺攝像頭記錄全程的動作。
特斯拉數據采集團隊的前員工表示,目前遠程操控功能主要被用于接待投資者參觀時使用。“投資者們希望看到這些機器人實際運行起來,演示時我們會使用動作捕抓手動控制這些機
器人,這樣整個操作過程看起來才會更加流暢自然”。
與自動駕駛類似,人形機器人實際上也需要海量的數據訓練,數據是泛化能力的核心。但問題在于,相比自動駕駛能夠通過路測和仿真來采集數據,目前針對人類動作記錄的數據獲取要麻煩得多。人形機器人的路線規劃可以與發展多年的自動駕駛類似,但動作、觸覺等仍需要大量真實數據,因為不同材料、不同形狀的物體需要機器人靈巧手對其施加不同的力,以及不同的抓取方式。
目前機器人主要的數據采集方式有幾大類,包括真實場景采集、仿真環境、多模態融合采集、人機協作與自主生成等。
真實場景采集是通過在實際環境中部署機器人,直接收集傳感器數據。例如上海智元數據采集中心構建了家居、工業、商超等五大類真實場景,利用 100 余臺機器人每日采集超萬條數據。這類數據能提供最真實的環境反饋,解決仿真數據與現實的 “域差距” 問題,但成本較高。為提升效率,智元采用模仿學習與強化學習結合的路徑:前者通過人類示范總結規律(如機械臂分揀動作),后者通過獎勵機制讓機器人在試錯中優化策略。
仿真環境是利用物理引擎構建虛擬世界,生成包含傳感器信號(視覺、力覺等)的訓練數據,批量生成低成本數據。這種數據采集技術,依賴精確的物理建模(如關節剛度、摩擦系數)和渲染引擎;需要支持大規模參數隨機化以增強數據多樣性;最終輸出為可直接用于模型訓練的原始傳感器數據或標注數據集。
多模態融合采集則是整合多種傳感器數據以提升環境感知精度,其中也有幾種技術路線。
數據級融合:直接對齊原始信號,如將 LiDAR 點云與攝像頭圖像投影到同一坐標系;
特征級融合:在神經網絡中層融合視覺特征與 IMU 運動數據,例如 MVX-Net 通過注意力機制混合圖像紋理與點云幾何信息;
決策級融合:獨立運行單模態模型后整合結果,如百度 Apollo 結合攝像頭 YOLO 模型與 LiDAR 檢測進行障礙物判斷。
人機協作與自主生成則分別是兩種數據采集方式,首先人機協作是類似于使用動捕裝置生成動作軌跡,將人的動作映射到機器人上;自主生成則是機器人根據模型不確定性自主選擇高價值數據點,減少對人類標注的依賴。
但總體來看,多模態融合采集是當前主流的數據采集方案。
當前機器人仍離不開遠程操控
另一家最近在網上爆火的挪威人形機器人公司1X Technologies,他們宣布了旗下NEO人形機器人將會在2026年出貨,并開始預售,售價僅2萬美元,甚至公司還提供了6個月499美元的租賃計劃。
而NEO機器人的定位是家庭服務機器人,在宣傳片中NEO能夠自動完成打掃、開門、整理衣服、將衣物放入洗衣機、將餐具放入洗碗機并啟動、拿飲料等工作。許多人看完后已經開始想象未來所有家務交給機器人的場景。
然而最近WJS的記者在體驗以及采訪了1X CEO Bernt B?rnich之后,卻發現實際情況要遠遠落后于人們預期。目前,NEO的所有動作,都由戴著VR眼鏡和操作手柄的工作人員在遠程控制。另一方面,機器人的行走速度緩慢、動作同樣較為拖沓,工作效率低下。而更重要的是,利用VR控制機器人的工作人員,將會獲得用戶房間內的視頻信息,這對用戶個人隱私造成很大的威脅。
當然1X表示預計到2026年,Neo將自主執行大多數家務,通過人工指導的過程來讓機器人收集真實世界數據,并進行學習。但也有可能跟很多超前的科技產品一樣,2026年只是一個目標,實際的量產落地時間還是未知數。
小結:
綜合來看,當前人形機器人的發展正處在硬件基礎發展迅速,與數據采集、AI訓練起步的關鍵交匯期。關節材料、電機技術的突破與平衡算法的升級,為機器人賦予了接近人類的動作潛力;而行業內多樣化的數據采集模式,共同構成了機器人向“具身智能”邁進的核心支撐。未來人形機器人真正要走進家庭,還需要面臨大量的現實問題,包括安全、隱私、自主決策等,從演示級產品到實用產品,可能還要等待很長的時間。
而在機器人硬件基礎逐步提高的前提下,也就成為了機器人“大腦”開發的基石,真正讓人形機器人走向“具身智能”。最近有消息稱,特斯拉正在利用一支數據采集團隊,來訓練Optimus機器人像人類一樣自主行動。那么具體是如何做的?
延續純視覺路線,百人團隊采集訓練數據
根據報道,特斯拉數據采集團隊在鼎盛時期擁有超過100名員工,在8小時的輪班中,數據采集員需要根據任務指派文件和操作手冊,重復數百次包括奔跑、蹲下、舞蹈、拿杯子、擦桌子、拉窗簾等動作,以確保數據采集工作正確完成。
值得一提的是,特斯拉在此前是使用動作捕捉服或是遠程手動控制機器人來采集數據。而今年6月,特斯拉開始改用純攝像頭采集數據,這與其自動駕駛的技術路線相同。團隊成員被告知,不采用動作捕抓服后,數據采集的工作效率會更高。除了環境周圍的攝像頭外,數據采集員工需要穿戴頭盔和背包,搭載5臺攝像頭記錄全程的動作。
特斯拉數據采集團隊的前員工表示,目前遠程操控功能主要被用于接待投資者參觀時使用。“投資者們希望看到這些機器人實際運行起來,演示時我們會使用動作捕抓手動控制這些機
器人,這樣整個操作過程看起來才會更加流暢自然”。
與自動駕駛類似,人形機器人實際上也需要海量的數據訓練,數據是泛化能力的核心。但問題在于,相比自動駕駛能夠通過路測和仿真來采集數據,目前針對人類動作記錄的數據獲取要麻煩得多。人形機器人的路線規劃可以與發展多年的自動駕駛類似,但動作、觸覺等仍需要大量真實數據,因為不同材料、不同形狀的物體需要機器人靈巧手對其施加不同的力,以及不同的抓取方式。
目前機器人主要的數據采集方式有幾大類,包括真實場景采集、仿真環境、多模態融合采集、人機協作與自主生成等。
真實場景采集是通過在實際環境中部署機器人,直接收集傳感器數據。例如上海智元數據采集中心構建了家居、工業、商超等五大類真實場景,利用 100 余臺機器人每日采集超萬條數據。這類數據能提供最真實的環境反饋,解決仿真數據與現實的 “域差距” 問題,但成本較高。為提升效率,智元采用模仿學習與強化學習結合的路徑:前者通過人類示范總結規律(如機械臂分揀動作),后者通過獎勵機制讓機器人在試錯中優化策略。
仿真環境是利用物理引擎構建虛擬世界,生成包含傳感器信號(視覺、力覺等)的訓練數據,批量生成低成本數據。這種數據采集技術,依賴精確的物理建模(如關節剛度、摩擦系數)和渲染引擎;需要支持大規模參數隨機化以增強數據多樣性;最終輸出為可直接用于模型訓練的原始傳感器數據或標注數據集。
多模態融合采集則是整合多種傳感器數據以提升環境感知精度,其中也有幾種技術路線。
數據級融合:直接對齊原始信號,如將 LiDAR 點云與攝像頭圖像投影到同一坐標系;
特征級融合:在神經網絡中層融合視覺特征與 IMU 運動數據,例如 MVX-Net 通過注意力機制混合圖像紋理與點云幾何信息;
決策級融合:獨立運行單模態模型后整合結果,如百度 Apollo 結合攝像頭 YOLO 模型與 LiDAR 檢測進行障礙物判斷。
人機協作與自主生成則分別是兩種數據采集方式,首先人機協作是類似于使用動捕裝置生成動作軌跡,將人的動作映射到機器人上;自主生成則是機器人根據模型不確定性自主選擇高價值數據點,減少對人類標注的依賴。
但總體來看,多模態融合采集是當前主流的數據采集方案。
當前機器人仍離不開遠程操控
另一家最近在網上爆火的挪威人形機器人公司1X Technologies,他們宣布了旗下NEO人形機器人將會在2026年出貨,并開始預售,售價僅2萬美元,甚至公司還提供了6個月499美元的租賃計劃。

然而最近WJS的記者在體驗以及采訪了1X CEO Bernt B?rnich之后,卻發現實際情況要遠遠落后于人們預期。目前,NEO的所有動作,都由戴著VR眼鏡和操作手柄的工作人員在遠程控制。另一方面,機器人的行走速度緩慢、動作同樣較為拖沓,工作效率低下。而更重要的是,利用VR控制機器人的工作人員,將會獲得用戶房間內的視頻信息,這對用戶個人隱私造成很大的威脅。
當然1X表示預計到2026年,Neo將自主執行大多數家務,通過人工指導的過程來讓機器人收集真實世界數據,并進行學習。但也有可能跟很多超前的科技產品一樣,2026年只是一個目標,實際的量產落地時間還是未知數。
小結:
綜合來看,當前人形機器人的發展正處在硬件基礎發展迅速,與數據采集、AI訓練起步的關鍵交匯期。關節材料、電機技術的突破與平衡算法的升級,為機器人賦予了接近人類的動作潛力;而行業內多樣化的數據采集模式,共同構成了機器人向“具身智能”邁進的核心支撐。未來人形機器人真正要走進家庭,還需要面臨大量的現實問題,包括安全、隱私、自主決策等,從演示級產品到實用產品,可能還要等待很長的時間。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
特斯拉
+關注
關注
66文章
6400瀏覽量
130950 -
人形機器人
+關注
關注
7文章
859瀏覽量
18237
發布評論請先 登錄
相關推薦
熱點推薦
目標年產1000萬臺!特斯拉籌備擴建得州超級工廠用于量產Optimus人形機器人
11月11日,特斯拉確認籌備再度擴建得克薩斯超級工廠,擬建設一座面向人形機器人Optimus的專用廠房,以支撐后續量產。公司表示,Optimus
藍思科技:今年承接智元機器人全系列多款人形機器人業務
電子發燒友網綜合報道 8月4日,藍思科技在接受調研時披露公司在人形機器人領域的最新進展。藍思科技表示,2024年起已為合作伙伴交付數百臺整機,今年則承接了智元機器人全系列多款
特斯拉人形機器人,今年內在中國市場推出?
電子發燒友網綜合報道 近日有消息稱,目前特斯拉第三代人形機器人,Optimus V3已經在美國工廠實測,預計今年會面向中國C端市場推出,進入家庭等消費級場景。預計
借助OpenUSD與合成數據推動人形機器人發展
適用于合成運動數據的 NVIDIA Isaac GR00T Blueprint 大幅加快人形機器人的數據生成和訓練速度。
廣汽集團榮登全球人形機器人百強榜單
名單,廣汽集團憑借在人形機器人領域顯著的技術創新、獨特的市場定位與商業規劃,以及深厚的技術積累與成熟的供應鏈體系等優勢成功上榜,與英偉達、微軟、谷歌、特斯拉等科技公司共同入圍百強榜單。
特斯拉加速推進Optimus人形機器人量產
特斯拉近日在其位于美國弗里蒙特的超級工廠內,發布了多個關鍵工程崗位的招聘信息。這一舉動標志著特斯拉正在加速推進其備受矚目的人形機器人——Optimu
全國首個異構人形機器人訓練場啟用
,首期已部署超過100臺異構人形機器人。其設有綜合運動訓練區、通用基礎抓取操作區等多個功能區域,機器人可在此進行各種針對性訓練。
馬斯克展望人形機器人與自動駕駛未來
此為起點,于2026年將產量擴大至50,000至100,000臺,隨后在次年再實現10倍的增長。這一雄心勃勃的目標彰顯了特斯拉對于人形機器人市場的樂觀預期及強勁信心。 此外,馬斯克在一次游戲直播活動中透露,

特斯拉Optimus百人團隊采集訓練數據,人形機器人仍全靠遙控?
評論