国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么說三維重建才是計算機視覺的靈魂?

WpOh_rgznai100 ? 來源:YXQ ? 2019-07-02 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:在“全民計算機視覺”的今天,其發展歷程卻鮮少有人追溯。梳理研究的過去將能讓我們更好地探索未來。權龍教授為我們介紹了三維重建的歷史發展與應用前景,也為大家在研究學習、職業選擇等方面給出了一些實用建議。

王井東:您的主要研究方向是三維重建,它的發展現狀和應用前景如何,您為什么看好它?

權龍:說三維重建首先要從計算機視覺講起。計算機視覺包含兩個基本方向,物體識別和三維重建。圖像識別的突破性進展源自于2012年卷積神經網絡(CNN)的興起。在此之前,計算機視覺的核心研究方向是三維重建。因為在當時,對于圖像的特征提取主要是通過三維重建的方法來定義和實現的。自2012年以來,圖像的特征便逐漸由神經網絡來自動學習。

三維重建的應用是很廣泛的,對于自動駕駛、VR、AR等應用領域應用來講,三維重建是核心技術,并且實時三維重建是必然趨勢,因為我們生活在三維空間里,必須將虛擬世界恢復到三維,我們才可以和環境進行交互。所以僅僅研究識別肯定是不夠的,計算機視覺下一步必須走向三維重建,并且把三維重建和識別融為一體。

古建筑修復與重建是三維重建的一個具有代表性的應用,比如近期被燒毀的巴黎圣母院,如果通過三維模型(https://www.altizure.cn/project-model?pid=57f8d9bbe73f6760f10e916a)進行數字重建,應該能夠達到原汁原味還原其真實面貌的目的。目前在我們的三維重建項目中,名勝古跡的三維電子存檔是很重要的一部分。從表面上看,三維重建似乎沒有自動駕駛那么復雜,其實它比自動駕駛更難,因為自動駕駛的三維感知是給車識別,而VR、AR中的三維重建場景是提供給人類感知的,所以對三維重建的結果要求非常高??傮w來講,三維重建是計算機視覺的靈魂。

權龍教授(左)和王井東博士(右)合影

王井東:三維重建在計算機視覺中確實非常重要,您可以帶大家回顧一下計算機視覺和三維重建的發展歷程嗎?

權龍:1987年在倫敦舉辦的第一屆國際計算機視覺大會ICCV可以作為現代計算機視覺研究的一個開端。之前很多人認為做圖像處理就是計算機視覺,其實是二者是有區別的。

計算機視覺的目標是對圖像進行理解。準確來講,計算機無法做到“理解”,只能做到“認知”。我們的研究目的是從圖像中獲取視覺特征,有了視覺特征才能開展一系列的工作。因此回顧計算機視覺的發展歷程,根據算力條件的不同,我們可以看到一個特征提取的演化過程。

80年代,人人都在做以edge為主的邊緣提取,有了edge之后,再把它高層化后的線段元做簡單的統計分類或者三維重建。Edge在數學上很容易定義,在定義了很多優化準則后,到1986年John Canny提出了Canny edge detection之后,這個研究方向就到頭了。

90年代,人們對三維重建愈加重視,當時歐洲比美國要領先。幾何也追求特征提取,但一維的edge不適合幾何計算,幾何最本質的元素是點,所以很多工作開始圍繞點的特征去展開,對點的特征進行描述,然后就可以把很多東西變成矢量的無序集合,再做統計。三維重建的終極目標是用非標定相機(uncalibrated camera)進行重建。

1992年,Oliver Faugeras和Richard Hartley各自獨立地解決了非標定相機兩張圖像下的三維重建問題,引入了基于七點算法的基礎矩陣(Fundamental Matrix)概念,這標志著三維視覺的崛起。

1994年,我提出了六點算法(Invariants of six points and projective reconstruction from three uncalibrated images),解決了非標定相機三張圖像下的三維重建,進而在理論上徹底解決了多視重建的幾何問題(multi-view geometry)。這兩項工作共同奠定了三維重建的理論基礎,對計算機視覺的發展起到了決定性的作用。

到了2012年,卷積神經網絡(CNN)的出現對于特征提取和圖像識別都是一個顛覆性的飛躍,從而觸發了新一波人工智能高速發展的浪潮。事實上,卷積神經網絡在1989年就應用于圖像識別問題,它是今天所有卷積神經網絡的鼻祖模型。

從誕生到2012年的十幾年之間,發生變化的并非卷積神經網絡的架構,而是:(一)GPU的出現提升了計算力;(二)斯坦福大學教授李飛飛創建的ImageNet,她把上百萬張照片發到網絡上進行標注。這兩件事促成了卷積神經網絡在2012年的復活。CNN的本質其實是兩點,第一點是提取特征,第二點是標準分類器。所以本質上還是提取特征,只不過特征的表達能力比之前的手工定義要高得多。

所以從特征提取這條線索上看,雖然目前計算機視覺看似處于一輪新的熱潮,但事實上一直以來大家都在做同樣的事情,只不過在不同的階段,提取的特征和采用的方式有所不同。

王井東:現在主流的計算機視覺研究主要集中在歐洲、美國和中國。您認為這三者的發展現狀和未來將如何?

權龍:確實是三足鼎立。上個世紀八九十年代,歐洲的計算機視覺發展迅速,研究人員在一定意義上把計算機視覺當作一個應用數學的問題。三維重建需要大量傳統數學知識,這批研究人員都有非常好的應用數學基礎,那就用數學工具去解決這些視覺問題。

同期,美國計算機視覺的研究人員也非?;钴S,但主要集中在應用領域,研究方向并不是非常清晰。隨著2012年這一波由卷積神經網絡引發的人工智能的再次崛起,美國在應用方面突飛猛進,歐洲依然保持扎實的基礎研究的風格。后起之秀就是中國了,飛速發展的經濟和創新氣氛使得計算機視覺的研究和商業應用在極短的時間內快速發展起來了。

王井東:您不僅在計算機視覺的研究上一如既往,也創立了專注三維重建的公司Altizure,那么關于學術和產業的選擇,您能為同學們分享一些經驗和建議嗎?

權龍:每個人都有不同的理想和發展方向,有的人可能更適合做應用,有的人更適合做學術研究,這是因人而異的。沒必要每個人都要去做科研當教授,也沒必要每個人都去創業,只要能發揮自己的特長,選擇哪一條路都是非常好的。在這個多元化的社會,大家都在從不同的角度推進科技的進步。

王井東:當時是什么促使您從學術界“跨界”進入產業界?

權龍:很簡單,我一直在研究計算機視覺三維重建,以前的結果還不成熟,而到了某一個時機它終于能投入應用了,那我們當然要做應用,這是研究的最高境界。研究就是這樣,可能在很長時間里效果都不夠理想,那我們就要繼續研究,但當它有了用武之地時,我覺得投入實踐是順理成章的。

王井東:您認為一個計算機視覺方向的學生應該學好哪些知識,才能做更好的研究?

權龍:我對所有的人的建議是,打好應用數學和計算機的功底。應用數學是理論基礎,計算機是實現手段,兩方面的能力缺一不可。我不太贊同大學開設人工智能專業的做法,其實人工智能在一定意義上就是應用數學,尤其是卷積神經網絡,本質上是數學優化和統計,你要有很好的應用數學功底。

王井東:很多人說深度學習和計算機視覺到了瓶頸期,您認為目前最大的問題是什么?您最期待的突破又在哪里?

權龍:“瓶頸期”不是一個合適的詞匯。因為它本質上是一個應用科學,現在有了卷積神經網絡這樣強大的工具,所有的應用方向都可以重新去摸索。剛才講到特征提取,提取完特征后去做具體的應用,很多東西是可以繼續改進的,差別在于進步有多大。

卷積神經網絡的特征提取已經是一個很大的突破了,在這個基礎之上,我想會有一系列新的應用出現。如果實在要說突破,那就是硬件和算力的突破。目前大熱的自動駕駛領域將很大力度地推進算力的發展,VR、AR也是同樣。有朝一日,如果算力能夠有一個顯著的突破性進展,很多無法想象的事情將會發生。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴

原文標題:港科大教授權龍:為什么三維重建才是計算機視覺的靈魂?| 對話

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    上海計算機視覺企業行學術沙龍走進西井科技

    12月5日,由中國圖象圖形學學會青年工作委員會(下簡稱“青工委”)、上海市計算機學會計算機視覺專委會(下簡稱“專委會”)聯合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發表于 12-16 15:39 ?578次閱讀

    一文讀懂 | 三維視覺領域國家級制造業單項冠軍——先臨三維的品牌布局

    先臨三維科技股份有限公司成立于2004年,是三維視覺領域國家級制造業單項冠軍、國家專精特新“小巨人”企業。公司專注于高精度三維視覺軟、硬件的
    的頭像 發表于 11-11 14:55 ?691次閱讀
    一文讀懂 | <b class='flag-5'>三維</b><b class='flag-5'>視覺</b>領域國家級制造業單項冠軍——先臨<b class='flag-5'>三維</b>的品牌布局

    機器視覺三維成像技術簡介(一)

    本文討論了機器視覺三維成像技術,涵蓋了各種成像技術的原理、特點、優缺點及應用場景等內容。關鍵要點包括: 1. 三維成像技術分類 2. 飛行時間法(ToF) 3. 結構光 4. 激光
    的頭像 發表于 10-20 14:04 ?596次閱讀
    機器<b class='flag-5'>視覺</b><b class='flag-5'>三維</b>成像技術簡介(一)

    一種基于多次觀測融合的可交互三維高斯場景重建框架

    計算機視覺和機器人領域,如何完整、真實地重建一個可交互的三維場景,一直是一個難題。傳統方法往往依賴復雜的多階段流程,比如先做分割,再進行背景補全或修復,或者需要對每個物體進行密集掃描
    的頭像 發表于 09-29 11:12 ?658次閱讀
    一種基于多次觀測融合的可交互<b class='flag-5'>三維</b>高斯場景<b class='flag-5'>重建</b>框架

    NVIDIA助力湯元科技突破智能駕駛數據獲取與生成瓶頸

    蘇州湯元科技有限公司(以下簡稱“湯元科技”)是一家專注于三維重建與世界模型的科技公司,為自動駕駛與具身智能提供高質量、多樣化的訓練數據。通過將自研的世界模型技術與 NVIDIA Cosmos 結合,實現真實物理世界的三維重建、場景泛化,并提升數據生成的效率與擬真度。
    的頭像 發表于 09-06 15:16 ?1478次閱讀

    導遠科技收獲三維視覺技術客戶批量訂單

    導遠科技近期成功獲得國內知名三維視覺技術客戶的批量訂單。該客戶旗下三維掃描儀產品已在三維設計、工業檢測、文物保護、醫療健康等全球市場擁有卓越口碑。
    的頭像 發表于 09-03 17:16 ?789次閱讀

    無人機航測三維建模遇難題?索尼FCB-EV9520L來破局!

    無人機航測三維建模的“視覺引擎”。 無人機航測三維建模技術的核心在于通過無人機搭載的高清相機,從不同角度拍攝地面目標,獲取大量重疊的圖像數據。這些數據經過計算機
    的頭像 發表于 08-13 15:24 ?571次閱讀

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什爾召開。
    的頭像 發表于 07-29 16:54 ?1208次閱讀

    航天宏圖全棧式3DGS實景三維重建系統解決方案

    表達的核心技術,通過相機、傳感器等設備獲取物理空間數據,并結合計算機視覺與圖形學算法,將二圖像轉換為三維模型。目前,主流的三維重建方法包括
    的頭像 發表于 06-27 09:28 ?1650次閱讀
    航天宏圖全棧式3DGS實景<b class='flag-5'>三維重建</b>系統解決方案

    激光三維掃描技術:無噴粉條件下高反光表面三維重建的光學原理與應用

    高反光表面的三維重建是工業檢測、文化遺產保護等領域的關鍵技術瓶頸。傳統激光掃描依賴噴粉增強漫反射,但會對精密器件或文物造成不可逆損傷。本文通過融合結構光調制、偏振分析及多視角協同技術,構建無噴粉測量
    的頭像 發表于 06-25 10:19 ?893次閱讀

    非接觸式激光三維掃描應對鏡面反射表面的無噴粉測量方案:原理與創新

    偏折術、多角度偏振編碼與結構光動態調制的無噴粉測量方案,通過光學原理創新與算法優化,實現鏡面表面的高精度三維重建。 測量原理與技術挑戰 非接觸式激光三維掃描的核心基于角測距原理,當激光束投射到鏡面表面時,
    的頭像 發表于 06-24 13:10 ?613次閱讀
    非接觸式激光<b class='flag-5'>三維</b>掃描應對鏡面反射表面的無噴粉測量方案:原理與創新

    三維高斯潑濺大規模視覺SLAM系統解析

    近期興起的神經輻射場(NeRF)與三維高斯潑濺(3DGS)技術在視覺SLAM中展現出令人鼓舞的突破性成果。然而,當前主流方法多依賴RGBD傳感器,并且僅適用于室內環境。在大規模室外場景中的重建魯棒性
    的頭像 發表于 05-27 14:13 ?1567次閱讀
    <b class='flag-5'>三維</b>高斯潑濺大規模<b class='flag-5'>視覺</b>SLAM系統解析

    索尼FCB-ER8530:三維建模與視覺感知的跨界融合

    的“視覺基石”? 三維建模依賴高精度視覺數據實現虛擬場景重構,而索尼FCB-ER8530的4K分辨率(3840×2160)與20倍光學變焦能力,為建模提供毫米級細節捕捉能力。例如,在
    的頭像 發表于 05-19 17:30 ?604次閱讀

    奧比中光亮相第四屆中國三維視覺大會

    近日,奧比中光攜最新技術成果亮相第四屆中國三維視覺大會(China3DV 2025)。作為國內三維視覺領域最高規格的學術研討盛會,本屆中國三維
    的頭像 發表于 04-15 09:18 ?1170次閱讀

    奧比中光助力創想三維登頂世界消費級3D掃描儀市場

    Lite及Raptor Pro提供基于自研多核異構三維重建芯片技術的軟硬件引擎,助力戰略合作伙伴創想三維登頂世界消費級3D掃描儀市場。
    的頭像 發表于 04-11 11:38 ?1522次閱讀