現(xiàn)在投身于計(jì)算機(jī)視覺(jué)是否明智?
周圍很多大佬都去深造或者工作做CV相關(guān)方向。然而看到一種言論,說(shuō)現(xiàn)在學(xué)CV無(wú)異于48年加入國(guó)民黨,求問(wèn)此話怎講。
PS 本人本科畢業(yè)正要工作,有圖像處理算法崗位offer。水平很菜,對(duì)計(jì)算機(jī)視覺(jué)方向很有興趣(也許是跟風(fēng),且自動(dòng)駕駛等等領(lǐng)域的確很容易讓人產(chǎn)生興趣)。
假設(shè)僥幸拿到CV相關(guān)offer(或者machine learning/deep learning崗位)那么是否應(yīng)該果斷加入。(因?yàn)閳D像處理算法可能相對(duì)傳統(tǒng)一些)
作者:匿名用戶
https://www.zhihu.com/question/317440183/answer/683203621
有多少人工就有多少AI,我相信各位真正的從業(yè)者是最清楚這點(diǎn)不過(guò)的,論文滿分的模型現(xiàn)實(shí)情況下基本沒(méi)法直接跑模型了事,必需跟隨大量的數(shù)據(jù)和集成工作。目前AI飽和主要在于產(chǎn)業(yè)市場(chǎng)還沒(méi)有起來(lái),但是一旦其需求大起來(lái),對(duì)應(yīng)的人才要求也會(huì)變多。至于未來(lái)市場(chǎng)怎樣,就不是我等工程師能預(yù)測(cè)的了。但按照《人類簡(jiǎn)史》中的說(shuō)法,現(xiàn)代社會(huì)經(jīng)濟(jì)建立于對(duì)未來(lái)的信用上,現(xiàn)代經(jīng)濟(jì)要繼續(xù)發(fā)展,必須有新的技術(shù)可以推動(dòng)生產(chǎn),至于這個(gè)技術(shù)是物聯(lián)網(wǎng),5G,AI,AR,基因工程中的一個(gè)還是多個(gè),也不好說(shuō)
以下是原答案
有一段時(shí)間在一家創(chuàng)業(yè)公司做CV,當(dāng)時(shí)碰壁很多,人臉市場(chǎng)由巨頭把持,基本不太可能與其競(jìng)爭(zhēng),我們當(dāng)時(shí)打算做遙感AI,農(nóng)業(yè)AI,后來(lái)發(fā)現(xiàn)處于數(shù)據(jù)精度問(wèn)題,基本無(wú)法落地,后來(lái)整個(gè)組不得不轉(zhuǎn)型做大數(shù)據(jù)外包。當(dāng)時(shí)我的想法是,CV真的是泡沫。
后來(lái)到了國(guó)內(nèi)某設(shè)備商做算法,發(fā)現(xiàn)CV可以用的地方不要太多了,降噪,定位,超分……CV從來(lái)不是單單指人臉這一塊,哪一塊都可以做,而它們又有相通之處,可以入的方向還是很多的。
之前和某些明星公司也有接觸,可以說(shuō),實(shí)在的落地效果和競(jìng)賽榜單有天囊之別,在榜上刷的接近完美的指標(biāo),落地下來(lái)不足50%也是常有的事情,外界環(huán)境稍微差一點(diǎn),算法效果非常恐怖,更別說(shuō)性能……實(shí)際上算法領(lǐng)域如何在工程界落地,還有很長(zhǎng)的路要走。實(shí)際調(diào)優(yōu)的過(guò)程,的確和經(jīng)驗(yàn)積累有關(guān)。有的時(shí)候因?yàn)樗惴鞒痰脑O(shè)計(jì),有經(jīng)驗(yàn)的工程師能夠很快發(fā)現(xiàn)哪個(gè)流程有問(wèn)題需要改進(jìn),這些慕課上是不會(huì)告訴你的。個(gè)人認(rèn)為,CV本質(zhì)上考察的是對(duì)系統(tǒng)的了解程度,對(duì)數(shù)據(jù)的了解程度,從來(lái)不是某個(gè)特定的算法。
如果能做到對(duì)系統(tǒng)了然于心,對(duì)性能優(yōu)化(這也是必須根據(jù)設(shè)備考慮的問(wèn)題)有深入了解,這樣的人才是真的很缺。
作者:CPAPCF
www.zhihu.com/question/317440183/answer/794570674
說(shuō)48年加入國(guó)民黨只因把cv限制在了2D分類/檢測(cè)/跟蹤任務(wù)里。這些傳統(tǒng)任務(wù)確實(shí)早在16年甚至更早就接近problem solved,任務(wù)明確數(shù)據(jù)標(biāo)準(zhǔn)方法成熟。現(xiàn)在刷榜也只有微小提升。畫地為牢當(dāng)然沒(méi)搞。
且不說(shuō)什么concept extraction/self-awareness/vision+language那套純煉丹的玄學(xué)意識(shí)流,vision的共同問(wèn)題是什么?是從圖像分析信息,那能從圖像里分析光照/材質(zhì)/光源位置性質(zhì)嗎?能從圖像里分析物理系統(tǒng)做受力分析判斷受力點(diǎn)支撐面嗎?能從圖像分析物體運(yùn)動(dòng)狀態(tài)嗎?能從圖像分析物體內(nèi)部結(jié)構(gòu)預(yù)測(cè)應(yīng)力形變嗎?
再?gòu)姆椒▉?lái)說(shuō),純煉丹就一定最好嗎?vision傳統(tǒng)的geometry理論和物理基礎(chǔ)規(guī)則為什么要棄之不顧拿去讓煉丹從頭approximate?
然后從輸入的角度看,雙目做過(guò)嗎?多目會(huì)有提升嗎?單目能做嗎(btw, 單目+純煉丹是邪路)?別的sensor呢?比如MRI掃描信號(hào)?電子顯微鏡掃描信號(hào)?雷達(dá)?雷達(dá)陣列?聲納?
我只是舉了一些非常片面的例子,但哪怕把上面這些暴力排列組合一下這都多少可能性了?
宏觀來(lái)說(shuō),vision在工業(yè)上的應(yīng)用絕不會(huì)停止也從沒(méi)有停止。舉個(gè)例子,我們今天能在超市里買到的整齊又便宜的紅蘋果和盒裝雞蛋,哪怕薯片,更不用說(shuō)pcb和芯片制造,都是靠70-80年代開發(fā)的vision系統(tǒng),才得以實(shí)現(xiàn)大規(guī)模流水線生產(chǎn),然后降低成本和普及。vision內(nèi)部流派可能會(huì)起起伏伏,跟不上市場(chǎng)需求的會(huì)很快暴死。但只要有外部市場(chǎng)demand,只要有資本家拿錢提出問(wèn)題,就總有人能為錢做出解決方法,vision就絕不可能停止發(fā)展。ps,煉丹可能會(huì)死但vision絕不會(huì)死 :
作者:Encoder
https://www.zhihu.com/question/317440183/answer/684387715
視覺(jué)是人類最重要的感覺(jué),人類認(rèn)識(shí)外界信息的80%來(lái)自視覺(jué),視覺(jué)的認(rèn)知機(jī)制也最復(fù)雜。因此,計(jì)算機(jī)視覺(jué)(computer vision),也就是利用各種成像系統(tǒng)代替人類的視覺(jué)器官作為輸入手段,通過(guò)分析圖像生成關(guān)于成像物體和場(chǎng)景的描述,使得計(jì)算機(jī)像人那樣觀察和理解世界,以具有自主適應(yīng)環(huán)境的能力,始終是人工智能的一個(gè)重要組成部分。
計(jì)算機(jī)視覺(jué)已經(jīng)走過(guò)了半個(gè)世紀(jì)的風(fēng)風(fēng)雨雨,從借用信號(hào)處理的概念、將圖象視作“二維信號(hào)”而進(jìn)行分析,到逐步發(fā)展出一套包含預(yù)處理、特征提取、目標(biāo)追蹤、三維重建等等方向在內(nèi)的完整的領(lǐng)域,再到機(jī)器學(xué)習(xí)、深度學(xué)習(xí)方法的廣泛運(yùn)用,可以說(shuō),無(wú)論是過(guò)去、現(xiàn)在還是未來(lái),計(jì)算機(jī)視覺(jué)領(lǐng)域都有大量的工作可以做,有大量的難題需要突破,也有大量的激動(dòng)人心的寶藏、尚待我們?nèi)グl(fā)掘。刷臉支付、無(wú)人駕駛、無(wú)人機(jī)航拍、手術(shù)機(jī)器人等等我們耳熟能詳?shù)膽?yīng)用,都與計(jì)算機(jī)視覺(jué)息息相關(guān)。

計(jì)算機(jī)視覺(jué)發(fā)展史

Faster R-CNN 用于目標(biāo)檢測(cè),see https://arxiv.org/pdf/1506.01497.pdf
是否投身于計(jì)算機(jī)視覺(jué)的科研和工作,當(dāng)然首先有賴于自己的興趣。另一方面,“全民AI”“全民CS”甚至“全民CV”的確是造成了計(jì)算機(jī)視覺(jué)方向人才供過(guò)于求的情形,大量的學(xué)生和從業(yè)者的涌入,很有可能會(huì)造成內(nèi)卷的情況;人才飽和、甚至所謂的“泡沫破滅”也并不是不會(huì)發(fā)生。然而從普遍意義上說(shuō),在人工智能時(shí)代的浪潮中,作為計(jì)算機(jī)相關(guān)專業(yè)的學(xué)生,無(wú)論是選擇繼續(xù)科研還是進(jìn)入工業(yè)界,計(jì)算機(jī)視覺(jué)都仍然是一個(gè)既有廣泛的應(yīng)用前景(錢景),又容易激發(fā)興趣、引人入勝的方向。
題主的擔(dān)心其實(shí)也有道理,因?yàn)椋M管智能化這個(gè)大的趨勢(shì)是不會(huì)變的,但是在這個(gè)大趨勢(shì)的過(guò)程中,起伏依然是不可預(yù)知的,甚至也是不可避免的。經(jīng)濟(jì)學(xué)告訴我們,過(guò)度擴(kuò)張就會(huì)帶來(lái)收縮,過(guò)熱就可能在未來(lái)遇冷,這是行業(yè)本身調(diào)節(jié)的結(jié)果,也是行業(yè)健康發(fā)展的保證。越是站在浪潮之巔,越要保持冷靜清醒。作為CV領(lǐng)域的研究者和從業(yè)者,我們要準(zhǔn)備好應(yīng)對(duì)未來(lái)幾年可能出現(xiàn)的轉(zhuǎn)冷局面,應(yīng)對(duì)可能出現(xiàn)的CV行業(yè)人才飽和、就業(yè)困難的窘境。我想主要的還是要做好以下幾點(diǎn)。
第一,傳統(tǒng)算法不可偏廢。
舉幾個(gè)例子:
盡管基于深度學(xué)習(xí)的特征提取方法取得了很大的成功,但傳統(tǒng)的特征提取算法,例如Harris角點(diǎn),SIFT, SURF等等,仍是需要認(rèn)真學(xué)習(xí)的。
圖像預(yù)處理的方法,包括圖像的濾波、分裂、歸并、分割以及形態(tài)學(xué)處理等等,也可以與深度學(xué)習(xí)方法相結(jié)合,例如dilated CNN就可以看做形態(tài)學(xué)操作與CNN的結(jié)合。
SVM, KNN等等經(jīng)典的機(jī)器學(xué)習(xí)算法在CV中的應(yīng)用也不可忽視。
傳統(tǒng)的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)算法依然在很多場(chǎng)景下有用武之地,這些算法不僅在工程上有穩(wěn)健的性能,而且相比于深度學(xué)習(xí)算法,在數(shù)學(xué)上也有更清晰的解釋。因此,深入理解這些經(jīng)典算法的思想,對(duì)于我們改進(jìn)既有算法和提出新算法,也是很有啟發(fā)性的。
第二,重視數(shù)學(xué)、重視編程。
我們需要有一批不滿足于import cv2, import torch, import torchvision,不滿足于機(jī)械調(diào)參,不滿足于堆砌網(wǎng)絡(luò)結(jié)構(gòu)的研究者,能夠提出一套嚴(yán)密的指導(dǎo)性的理論,改善目前深度學(xué)習(xí)中以試湊調(diào)參為主來(lái)達(dá)到目標(biāo)的訓(xùn)練方式。我們需要思考能否在底層實(shí)現(xiàn)上做出改進(jìn)或提出新的算法,而非簡(jiǎn)單地將既有算法排列組合。在數(shù)學(xué)和編程方面的積累,盡管需要下苦功夫,也不一定能夠立竿見(jiàn)影,但是最終一定會(huì)惠及你未來(lái)的發(fā)展,無(wú)論在科研還是工作上,都能讓你行穩(wěn)致遠(yuǎn)。
第三、推動(dòng)CV真正落地。
許多行業(yè)都積累了大量的圖像信息,需要借由計(jì)算機(jī)來(lái)輔助甚至部分代替人腦對(duì)圖像進(jìn)行處理和解釋,都有用計(jì)算機(jī)代替人去“看”的剛需。從圖像預(yù)處理、圖像特征提取及分割,到物體的幾何模型與圖像特性表達(dá),再到對(duì)物體和周圍環(huán)境的理解,都有廣泛的應(yīng)用場(chǎng)景。我們要避免空對(duì)空的灌水,要讓CV更好地從實(shí)驗(yàn)室走入千家萬(wàn)戶,真正應(yīng)用于實(shí)際的生產(chǎn)生活的場(chǎng)景之中,真正拉動(dòng)經(jīng)濟(jì)社會(huì)各個(gè)部門、各個(gè)方面的發(fā)展,真正成為我們每個(gè)人生活中不可或缺的一部分。
總之,投身于計(jì)算機(jī)視覺(jué)不失為明智之選,面對(duì)競(jìng)爭(zhēng)的關(guān)鍵不在于躑躅猶疑,而在于增強(qiáng)自身的競(jìng)爭(zhēng)力。計(jì)算機(jī)視覺(jué)的舞臺(tái)足夠廣闊,將計(jì)算機(jī)視覺(jué)的理論與應(yīng)用相對(duì)接、算法與工程相融合、精確與快速相平衡、簡(jiǎn)潔與清晰相印證、優(yōu)美與實(shí)用相增益,始終激勵(lì)著一批又一批有熱情、有韌勁、有定力、有決心、有才華的研究者,扎扎實(shí)實(shí)地做出成果,特別是讓計(jì)算機(jī)視覺(jué)更好地與各行各業(yè)相結(jié)合,真正助力經(jīng)濟(jì)社會(huì)發(fā)展,也使得我們的生活更加便捷。
作者:JohnMason
https://www.zhihu.com/question/317440183/answer/688971077
不邀自來(lái)。
計(jì)算機(jī)視覺(jué)方面的現(xiàn)狀:工程師很多,研究人才稀缺
這可能是現(xiàn)在計(jì)算機(jī)方面的整體情況,大部分領(lǐng)域都是這樣,研究人才稀缺。
那么造成這種情況的原因是因?yàn)椋?/p>
1、相對(duì)其他行業(yè)來(lái)講資薪較高。
2、熱度高,人氣盛。
3、入門相對(duì)其他方面來(lái)講較容易。
如果拿到CV相關(guān)的offer,可以考慮按照這樣的方式來(lái):
1、學(xué)習(xí)有關(guān)類的編程(python、Cpp)。
2、大概有一定的基礎(chǔ)后可以開始考慮框架(TensorFlow、Keras、Caffe、PyTroch等),具體的框架可以自己進(jìn)行比較。
3、學(xué)習(xí)關(guān)于《機(jī)器學(xué)習(xí)》、《深度學(xué)習(xí)》的知識(shí)。
4、可以嘗試做一些簡(jiǎn)單的項(xiàng)目。
5、確定方向,閱讀該方面的論文,實(shí)現(xiàn)該論文的網(wǎng)絡(luò)結(jié)構(gòu)。
但是,入門相對(duì)來(lái)說(shuō)比較簡(jiǎn)單,而且工程師的人才過(guò)剩。缺少的是相關(guān)的研究人才。如果想要進(jìn)入研究方面,需要一定的數(shù)學(xué)知識(shí)和邏輯基礎(chǔ)。在數(shù)學(xué)和邏輯之上要多閱讀論文,講最新論文中的結(jié)構(gòu)復(fù)現(xiàn),理解其中的原理。
-
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47625
原文標(biāo)題:現(xiàn)在投身于計(jì)算機(jī)視覺(jué)是否明智?
文章出處:【微信號(hào):AI_shequ,微信公眾號(hào):人工智能愛(ài)好者社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
十進(jìn)制計(jì)算機(jī)硬件體系結(jié)構(gòu)及“獨(dú)值”量化邏輯運(yùn)算革命(一)
上海計(jì)算機(jī)視覺(jué)企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技
使用代理式AI激活傳統(tǒng)計(jì)算機(jī)視覺(jué)系統(tǒng)的三種方法
工控機(jī)與普通計(jì)算機(jī)的核心差異解析
STM32計(jì)算機(jī)視覺(jué)開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析
【作品合集】賽昉科技VisionFive 2單板計(jì)算機(jī)開發(fā)板測(cè)評(píng)
易控智駕榮獲計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2025認(rèn)可
工業(yè)計(jì)算機(jī)的重要性
自動(dòng)化計(jì)算機(jī)經(jīng)過(guò)加固后有什么好處?
自動(dòng)化計(jì)算機(jī)的功能與用途
工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些
如何選擇合適的外形尺寸的工業(yè)計(jì)算機(jī)
一文帶你了解工業(yè)計(jì)算機(jī)尺寸
計(jì)算機(jī)網(wǎng)絡(luò)入門指南
Raspberry Pi 是單板計(jì)算機(jī)之王?
選擇計(jì)算機(jī)視覺(jué),是否是個(gè)錯(cuò)誤的決定
評(píng)論