機(jī)器視覺解決方案層出不窮,呈現(xiàn)百花齊放之勢。雖然機(jī)器視覺賦予了機(jī)器人感知和認(rèn)知世界的能力,而且變得越來越簡單易用,但是還有很多因素影響機(jī)器人在環(huán)境中的視覺效果,還是有一些棘手的挑戰(zhàn)亟待解決。
以下是我們總結(jié)出機(jī)器人視覺目前面臨的9個挑戰(zhàn):
1
照明
如果有過在低光照下拍攝數(shù)碼照片的經(jīng)驗,就會知道照明至關(guān)重要。糟糕的照明會毀掉一切。
成像傳感器不像人眼那樣適應(yīng)性強(qiáng)或敏感。如果照明類型錯誤,視覺傳感器將無法可靠地檢測到物體。
有各種克服照明挑戰(zhàn)的方法。一種方法是將有源照明結(jié)合到視覺傳感器本身中。
其他解決方案包括使用紅外照明,環(huán)境中的固定照明或使用其他形式的光的技術(shù),例如激光。
2
變形或鉸接
球是用計算機(jī)視覺設(shè)置來檢測的簡單對象。你可能只是檢測它的圓形輪廓,也許使用模板匹配算法。
但是,如果球被壓扁,它會改變形狀,同樣的方法將不再起作用。這是變形。它會導(dǎo)致一些機(jī)器人視覺技術(shù)相當(dāng)大的問題。
鉸接類似,是指由可移動關(guān)節(jié)引起的變形。例如,當(dāng)您在肘部彎曲手臂時,手臂的形狀會發(fā)生變化。
各個鏈接(骨骼)保持相同的形狀,但輪廓變形。由于許多視覺算法使用形狀輪廓,因此清晰度使得物體識別更加困難。
3
職位和方向
機(jī)器人視覺系統(tǒng)最常見的功能是檢測已知物體的位置和方向。因此,大多數(shù)集成視覺解決方案通常都克服了這兩者面臨的挑戰(zhàn)。
只要整個物體可以在攝像機(jī)圖像內(nèi)被查看,檢測物體的位置通常是直截了當(dāng)?shù)摹TS多系統(tǒng)對于對象方向的變化也是強(qiáng)健的。
但是,并不是所有的方向都是平等的。雖然檢測沿一個軸旋轉(zhuǎn)的物體是足夠簡單的,但是檢測物體何時3D旋轉(zhuǎn)則更為復(fù)雜。
4
背景
圖像的背景對物體檢測的容易程度有很大的影響。想象一個極端的例子,對象被放置在一張紙上,在該紙上打印同一對象的圖像。
在這種情況下,機(jī)器人視覺設(shè)置可能不可能確定哪個是真實的物體。
完美的背景是空白的,并提供與檢測到的物體良好的對比。它的確切屬性將取決于正在使用的視覺檢測算法。
如果使用邊緣檢測器,那么背景不應(yīng)該包含清晰的線條。背景的顏色和亮度也應(yīng)該與物體的顏色和亮度不同。
5
閉塞
遮擋意味著物體的一部分被遮住了。在前面的四個挑戰(zhàn)中,整個對象出現(xiàn)在相機(jī)圖像中。遮擋是不同的,因為部分對象丟失。視覺系統(tǒng)顯然不能檢測到圖像中不存在的東西。
有各種各樣的東西可能會導(dǎo)致遮擋,包括:其他物體,機(jī)器人的部分或相機(jī)的不良位置。克服遮擋的方法通常涉及將對象的可見部分與其已知模型進(jìn)行匹配,并假定對象的隱藏部分存在。
在某些情況下,人眼很容易被尺度上的差異所欺騙。機(jī)器人視覺系統(tǒng)也可能被他們弄糊涂了。
想象一下,你有兩個完全相同的物體,只是一個比另一個大。想象一下,您正在使用固定的2D視覺設(shè)置,物體的大小決定了它與機(jī)器人的距離。
如果您訓(xùn)練系統(tǒng)識別較小的物體,則會錯誤地檢測到兩個物體是相同的,并且較大的物體更接近相機(jī)。
尺度的另一個問題,也許不那么明顯,就是像素值的問題。如果將機(jī)器人相機(jī)放置得很遠(yuǎn),則圖像中的對象將由較少的像素表示。
當(dāng)有更多的像素代表對象時,圖像處理算法會更好地工作,但有一些例外。
7
照相機(jī)放置
不正確的相機(jī)位置可能會導(dǎo)致以前出現(xiàn)過的任何問題,所以重要的是要正確使用它。
嘗試將照相機(jī)放置在光線充足的區(qū)域,以便在沒有變形的情況下盡可能清楚地看到物體,盡可能靠近物體而不會造成遮擋。照相機(jī)和觀看表面之間不應(yīng)有干擾的背景或其他物體。
8
運動
移動有時會導(dǎo)致計算機(jī)視覺設(shè)置出現(xiàn)問題,特別是在圖像中出現(xiàn)模糊時。
例如,這可能發(fā)生在快速移動的傳送帶上的物體上。數(shù)字成像傳感器在短時間內(nèi)捕獲圖像,但不會瞬間捕獲整個圖像。
如果一個物體在捕捉過程中移動太快,將導(dǎo)致圖像模糊。
我們的眼睛可能不會注意到視頻中的模糊,但算法會。當(dāng)有清晰的靜態(tài)圖像時,機(jī)器人視覺效果最佳。
9
期望
機(jī)器人視野面臨的最大挑戰(zhàn)之一就是工作人員對于視覺系統(tǒng)能提供什么不切實際的期望。
通過確保期望符合技術(shù)的能力,您將從技術(shù)中獲得最大收益。您可以通過確保員工接受關(guān)于視覺系統(tǒng)的教育來實現(xiàn)這一點。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31079瀏覽量
222269 -
機(jī)器視覺
+關(guān)注
關(guān)注
165文章
4798瀏覽量
126069
原文標(biāo)題:行業(yè) | 來接招! 機(jī)器人視覺的九大挑戰(zhàn)
文章出處:【微信號:THundersoft,微信公眾號:ThunderSoft中科創(chuàng)達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
索尼FCB-EV9500M MIPI輸出:機(jī)器人視覺系統(tǒng)的革新引擎
借助ADI GMSL技術(shù)構(gòu)建機(jī)器人視覺系統(tǒng)
探索RISC-V在機(jī)器人領(lǐng)域的潛力
攻堅農(nóng)業(yè)仿真挑戰(zhàn):Robotec農(nóng)業(yè)機(jī)器人仿真平臺
變焦、高速、高清:索尼FCB-ER9500機(jī)芯如何重塑機(jī)器人視覺
復(fù)合機(jī)器人開啟血漿包“零接觸”搬運新時代
RK3576機(jī)器人核心:三屏異顯+八路攝像頭,重塑機(jī)器人交互與感知
機(jī)器人競技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”
工業(yè)機(jī)器人的特點
通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)
機(jī)器人視覺目前面臨的九個挑戰(zhàn)
評論