今年消費(fèi)電子行業(yè)最顯著的創(chuàng)新來(lái)自于蘋(píng)果的MR頭戴產(chǎn)AppleVisionPro,作為極高集成度的產(chǎn)品,VisionPro配備了4K顯示屏、空間音頻、虹膜掃描等功能,在顯示、交互、主芯片等環(huán)節(jié)具有突出創(chuàng)新,要求的技術(shù)工藝復(fù)雜程度極高。
AppleVisionPro造型類(lèi)似滑雪鏡,采用鋁合金框架,配備一整塊以3D方式成型與層壓的OLED顯示面板,并集成了一系列攝像頭和傳感器。
而行業(yè)中另外一個(gè)重大的重新產(chǎn)品則是特斯拉的Optimus人形機(jī)器人。隨著特斯拉Dojo智算芯片的量產(chǎn),以及特斯拉對(duì)一些微電機(jī)的材料與工藝突破,Optimus人形機(jī)器人已經(jīng)能完成部分仿人類(lèi)的動(dòng)作,在定量操作如敲雞蛋,與一些矢量操作,如澆花,沖咖啡等,基本上能完成合格的效果。
從2021年特斯拉宣布開(kāi)發(fā)人形機(jī)器人,到翌年展示Optimus原型機(jī),再到今年宣布預(yù)計(jì)11月開(kāi)展行走測(cè)試,再到明年正式上崗新能源汽車(chē)制造生產(chǎn)線,特斯拉人形機(jī)器人產(chǎn)業(yè)化“腳步漸近”。
在普通人眼里,兩家公司的兩個(gè)產(chǎn)品好象毫不搭界,但在一些敏感的科技公司里面,已經(jīng)在對(duì)兩個(gè)產(chǎn)品之間產(chǎn)生十分緊密的聯(lián)想,兩個(gè)產(chǎn)品的結(jié)合,極有可能改變未來(lái)人們生活的工作與生活方式。
其中Apple Vision Pro 搭載了全球首個(gè)空間操作系統(tǒng)visionOS,全三維用戶界面,而控制這個(gè)界面,僅需要用戶的眼睛、雙手和語(yǔ)音——最自然、最直觀的輸入工具,讓用戶能夠以一種絕妙的方式與數(shù)字化內(nèi)容互動(dòng),可實(shí)現(xiàn)數(shù)字化內(nèi)容與真實(shí)世界的無(wú)縫融合,讓用戶在沉浸于當(dāng)下的同時(shí)還能與他人溝通交流,如同它們真的存在于現(xiàn)實(shí)世界之中。
Vision Pro 通過(guò) VST(video see through)實(shí)現(xiàn)MR(數(shù)字與現(xiàn)實(shí)的混合)。Vision Pro 通過(guò)傳感器實(shí)時(shí)感知現(xiàn)實(shí)環(huán)境,將數(shù)字化的現(xiàn)實(shí)運(yùn)算后發(fā)給顯示屏幕,通過(guò)光機(jī)系統(tǒng)真實(shí)的發(fā)送給佩戴者。通過(guò)調(diào)節(jié)VisionPro旋鈕,用戶可獲得不同的沉浸度體驗(yàn)。該設(shè)備強(qiáng)調(diào)自然的交互,用戶與設(shè)備的交互通過(guò)眼睛、手勢(shì)和聲音;用戶與環(huán)境的交互通過(guò)EyeSight 技術(shù),用戶在完全沉浸時(shí),走近的同伴也會(huì)出現(xiàn)在視野中。Vision Pro是一款真正意義上實(shí)現(xiàn)了虛擬和顯示融合的革命性設(shè)備。
蘋(píng)果暫時(shí)研發(fā)出了Vision Pro頭顯可以使用的6種交互手勢(shì)。
Tap:同時(shí)點(diǎn)擊拇指和食指會(huì)向頭戴顯示設(shè)備發(fā)出信號(hào),表示您要點(diǎn)擊顯示屏上的虛擬元素。用戶也將這描述為一種捏合,相當(dāng)于點(diǎn)擊iPhone的屏幕。Double Tap:?jiǎn)⒂秒p擊手勢(shì)。Pinch and Hold:類(lèi)似于點(diǎn)擊并按住手勢(shì),執(zhí)行突出顯示文本等操作。Pinch and Drag:可用于滾動(dòng)和移動(dòng)窗口。您可以水平或垂直滾動(dòng),如果用戶加快手勢(shì)速度,交互界面也會(huì)相應(yīng)地調(diào)整速度。Zoom:雙手手勢(shì)之一,可以把手指捏在一起,通過(guò)拉開(kāi)手勢(shì)進(jìn)行放大,窗口大小也可以通過(guò)在角落拖動(dòng)來(lái)調(diào)整。Rotate:另一個(gè)雙手手勢(shì)之一,它將涉及將手指捏在一起并旋轉(zhuǎn)雙手以操縱虛擬對(duì)象。
手勢(shì)將與眼球運(yùn)動(dòng)協(xié)同工作,Vision Pro中的許多攝像頭將非常準(zhǔn)確地跟蹤您的視線。眼睛位置將是使用手勢(shì)定位您想要與之交互的關(guān)鍵因素。
蘋(píng)果還為Vision Pro提供了兩種文字輸入方式,分別為藍(lán)牙連接外部鍵盤(pán)與頭顯提供的虛擬鍵盤(pán)。而蘋(píng)果Vision Pro提供的虛擬鍵盤(pán)看去是有體積的,而不是只有一個(gè)平面。通過(guò)光線與陰影變化,用戶能夠分辨是否按下,空間音效還能給予反饋,以此來(lái)彌補(bǔ)缺少的觸覺(jué)信息。
對(duì)于虛擬鍵盤(pán)來(lái)說(shuō),距離信息相當(dāng)重要。在用戶指尖靠近按鍵時(shí),鍵盤(pán)會(huì)提供一個(gè)高亮效果,這樣就能夠幫助用戶更好感受與鍵盤(pán)的距離感,按鍵的狀態(tài)變化配合空間音效,或能讓虛擬鍵盤(pán)提供更真實(shí)地輸入體驗(yàn)。
Vision Pro擁有6顆SLAM+手勢(shì)攝像頭,其中有兩顆向下的攝像頭專(zhuān)門(mén)捕捉手垂放在腿上的視角。另外,還有兩顆斜向下的攝像頭同時(shí)兼顧SLAM和手勢(shì)。甚至為了弱光環(huán)境下手勢(shì)識(shí)別準(zhǔn)確性,蘋(píng)果還加入了兩顆紅外LED進(jìn)行輔助。
Vision Pro專(zhuān)門(mén)為攝像頭、傳感器準(zhǔn)備的R1芯片,是為了低延遲處理這些視覺(jué)數(shù)據(jù),從而實(shí)現(xiàn)更精準(zhǔn)交互方案,可以說(shuō)Vision Pro的交互邏輯從軟件、硬件、芯片、算法等多方位于一體,是一個(gè)鴻溝式的差異。
這種垂直視角的攝像頭,專(zhuān)門(mén)用于捕捉大部分時(shí)間、不抬手的時(shí)候的手勢(shì),因?yàn)楹芏鄷r(shí)候雙手應(yīng)該自然垂放在腿或桌子上,符合人體工學(xué)邏輯。
眼球追蹤方面,Vision Pro凝視+手勢(shì)捏合包括文字選中、菜單選擇都可以通過(guò)眼球+手勢(shì)來(lái)完成,這其中眼球+手勢(shì)融合交互就非常重要。
另外在其它科技公司的相關(guān)研究中也證明,基于凝視射線+捏合(蘋(píng)果Vision Pro的方案,只不過(guò)它隱藏了凝視射線,但在UI中結(jié)合了高光等進(jìn)行提示)在速度、效率上更高,也最受歡迎。
那么這跟特斯拉的Optimus人形機(jī)器人又有什么關(guān)系呢?
在特斯拉最新發(fā)布的視頻中,我們可以發(fā)現(xiàn)特斯拉利用一些技術(shù)方法改進(jìn)了人形機(jī)器人的動(dòng)作和控制,包括電機(jī)扭矩控制、環(huán)境發(fā)現(xiàn)與記憶、基于人類(lèi)演示訓(xùn)練機(jī)器人。
研究團(tuán)隊(duì)使用電機(jī)扭矩控制(motor torque control)操縱人形機(jī)器人腿部的運(yùn)動(dòng),讓機(jī)器人「落腳」力度保持輕緩。
對(duì)于一個(gè)機(jī)器人來(lái)說(shuō),觀察或感知周?chē)h(huán)境是非常重要的。特斯拉為人形機(jī)器人添加了環(huán)境發(fā)現(xiàn)與記憶的能力。現(xiàn)在,該人形機(jī)器人已經(jīng)可以對(duì)周?chē)h(huán)境進(jìn)行大致建模。
特斯拉的人形機(jī)器人具備與人類(lèi)相似的身體結(jié)構(gòu)。特斯拉的研究團(tuán)隊(duì)使用大量人類(lèi)演示訓(xùn)練了機(jī)器人,特別是在手部動(dòng)作方面,旨在讓其具備與人類(lèi)似的物體抓取能力。
目前特斯拉的Optimus人形機(jī)器人除了制造困難外,另外一個(gè)就是使用場(chǎng)景的擴(kuò)展。如果僅憑特斯拉一家企業(yè)來(lái)研發(fā)其每一個(gè)具體的應(yīng)用場(chǎng)景,那么肯定局限性較大。
但如果給特斯拉的Optimus人形機(jī)器人加上一個(gè)蘋(píng)果的Vision Pro頭顯,再通過(guò)基于凝視射線+捏合的空間操作系統(tǒng),并與人們自己佩戴的Vision Pro頭顯進(jìn)行實(shí)時(shí)同步,是不是除了讓人形機(jī)器人自主完成特斯拉自己定義的簡(jiǎn)單場(chǎng)景作業(yè)外,還能真正的實(shí)現(xiàn)人類(lèi)自己的具身智能分身功能,而不一定要把一個(gè)高風(fēng)險(xiǎn)的腦機(jī)接口真正的把自己跟機(jī)器人連接上。
即便是不跟使用者自己的Vision Pro頭顯進(jìn)行實(shí)時(shí)同步,把Vision Pro頭顯作為特斯拉人形機(jī)器人的另一個(gè)主控操作系統(tǒng),來(lái)指揮人形機(jī)器人完成日常的一些工作內(nèi)容與生活動(dòng)作,是不是也能讓人形機(jī)器人基本上實(shí)現(xiàn)了虛擬現(xiàn)實(shí)的生產(chǎn)力融合。事實(shí)上,特斯拉在基于人類(lèi)演示訓(xùn)練機(jī)器人時(shí),就已經(jīng)完成了這一步。
人類(lèi)的動(dòng)作在現(xiàn)實(shí)生活中,是屬于很低級(jí)的低速運(yùn)作,并且所使用的力量相對(duì)工業(yè)機(jī)械來(lái)說(shuō)也極小,定位精度要求也極低,所以特斯拉才會(huì)說(shuō)人形機(jī)器人的量產(chǎn)成本會(huì)很低。
從某種意義上來(lái)說(shuō),設(shè)計(jì)或制造人形機(jī)器人,只要搞懂其底層邏輯,把人類(lèi)基本動(dòng)作進(jìn)行相對(duì)簡(jiǎn)單的分類(lèi)后再分解,找到與之相配的操作力能量轉(zhuǎn)換與控制方式,對(duì)于已經(jīng)生產(chǎn)制造出了各種電子產(chǎn)品的科技企業(yè)來(lái)講,困難度并不高。
加上蘋(píng)果的空間操作系統(tǒng)出現(xiàn),實(shí)現(xiàn)上對(duì)于整個(gè)科技行業(yè)來(lái)講,人形機(jī)器人的整個(gè)產(chǎn)業(yè)思維已經(jīng)變得十分完整了。
責(zé)任編輯:彭菁
-
傳感器
+關(guān)注
關(guān)注
2576文章
55069瀏覽量
791553 -
蘋(píng)果
+關(guān)注
關(guān)注
61文章
24600瀏覽量
208410 -
攝像頭
+關(guān)注
關(guān)注
61文章
5093瀏覽量
103168 -
MR
+關(guān)注
關(guān)注
2文章
339瀏覽量
44361 -
人形機(jī)器人
+關(guān)注
關(guān)注
7文章
982瀏覽量
18508
原文標(biāo)題:蘋(píng)果MR頭盔在人形機(jī)器人上的意義
文章出處:【微信號(hào):AIOT大數(shù)據(jù),微信公眾號(hào):AIOT大數(shù)據(jù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
人形機(jī)器人爆發(fā)背后,一個(gè)被忽視的核心技術(shù):機(jī)器人運(yùn)動(dòng)學(xué)控制
Faraday Future發(fā)布三大系列具身智能人形與仿生機(jī)器人產(chǎn)品
走進(jìn)廣汽!圖為科技揭秘人形機(jī)器人
國(guó)民技術(shù)亮相2025人形機(jī)器人國(guó)際峰會(huì)
深度解讀人形機(jī)器人電感產(chǎn)品需求及應(yīng)用選型技巧
領(lǐng)益智造:人形機(jī)器人業(yè)務(wù)已產(chǎn)生收入
最新發(fā)布!泰科機(jī)器人發(fā)布首款自研雙足人形機(jī)器人
發(fā)力人形機(jī)器人賽道,傅利葉重磅推出陪伴機(jī)器人GR-3
藍(lán)思科技:今年承接智元機(jī)器人全系列多款人形機(jī)器人業(yè)務(wù)
聚焦“靈巧手”和“智能感知”,中科新松發(fā)布兩款仿生人形機(jī)器人
一文了解人形機(jī)器人
灝存科技:通過(guò)穿戴傳感器設(shè)備,隔空操控人形機(jī)器人
破解數(shù)據(jù)與泛化難題,通用人形機(jī)器人研發(fā)全面提速
特斯拉 Optimus 人形機(jī)器人試產(chǎn)線亮相 #人形機(jī)器人 #特斯拉#
EtherCAT科普系列(4):EtherCAT技術(shù)在人形機(jī)器人靈巧手領(lǐng)域應(yīng)用
蘋(píng)果MR頭戴產(chǎn)品與人形機(jī)器人有什么關(guān)聯(lián)
評(píng)論