我們看到了智能技術(shù)在影像辨識(shí)、偵測(cè)上的突破,甚至落地為產(chǎn)品。很多人問(wèn),這些深度學(xué)習(xí)為核心的計(jì)算機(jī)視覺(jué)技術(shù)也可以具有人類的美感—具有評(píng)判、編修、甚至美學(xué)創(chuàng)作的能力嗎?
智能視覺(jué)美感技術(shù)大致可以區(qū)分為三類:首先為影像(或視訊)編修強(qiáng)化,包括修圖(對(duì)比、亮度、景深等)、超高分辨率成像、突破壓縮技術(shù)、改善電視顯像質(zhì)量、加速電影(內(nèi)容)特效制作、甚至主動(dòng)改善車輛安全駕駛在低亮度下的視訊質(zhì)量;其次為照片美學(xué)評(píng)分、取景,自動(dòng)挑選具美感的照片或是畫(huà)面;第三為自動(dòng)生成不存在的影像。而這些核心技術(shù)所啟發(fā)的應(yīng)用都已經(jīng)是進(jìn)行式,或是即將落地為產(chǎn)品。
相關(guān)技術(shù)大大改變數(shù)位內(nèi)容產(chǎn)業(yè)。梵谷油畫(huà)電影《梵谷:星夜之謎(Loving Vincent)》耗時(shí)6年,動(dòng)員超過(guò)百位來(lái)自世界各地的畫(huà)家才完成這個(gè)耗時(shí)、耗資的工作。目前已經(jīng)有軟件服務(wù)完成類似的功能,可以讓一般人自動(dòng)將影片轉(zhuǎn)換為特定畫(huà)家的風(fēng)格,透過(guò)畫(huà)家的經(jīng)典創(chuàng)作,讓卷積網(wǎng)絡(luò)(CNN)的數(shù)千萬(wàn)個(gè)參數(shù),學(xué)習(xí)到影像轉(zhuǎn)換的方式,均衡風(fēng)格跟影片內(nèi)容。我們?cè)趦赡昵皡⑴c的IBM華生研究中心預(yù)告片自動(dòng)剪輯研究,也同樣帶來(lái)類似產(chǎn)業(yè)的突破。
一般的卷積網(wǎng)絡(luò)架構(gòu)為設(shè)計(jì)適合的編碼器以及相對(duì)的譯碼器;前者將畫(huà)面內(nèi)容解析之后,透過(guò)后者生成適切的影像(強(qiáng)化或是編修),大量的卷積網(wǎng)絡(luò)參數(shù)透過(guò)事前的訓(xùn)練數(shù)據(jù)來(lái)達(dá)成目的。而時(shí)常被忽略的是適合的目標(biāo)函數(shù),通常得同時(shí)使用多個(gè),并將領(lǐng)域知識(shí)吸納其中,這是成功與否的重要關(guān)鍵!
在美學(xué)評(píng)分方面,一般利用卷積網(wǎng)絡(luò)加上回歸函式來(lái)逼近美感分?jǐn)?shù)。最大的挑戰(zhàn)在于訓(xùn)練的數(shù)據(jù)。因?yàn)閲?yán)謹(jǐn)?shù)拿栏袪可娴轿幕?、社?huì)、以及個(gè)人的差異,可以取得的訓(xùn)練數(shù)據(jù)─不管是透過(guò)人工標(biāo)注或是社群網(wǎng)絡(luò)下載—不全具代表性,很難學(xué)習(xí)到通用的美感。不過(guò)在特定家用照片上,透過(guò)自動(dòng)評(píng)分,甚至修正照片(旋轉(zhuǎn)、取景、飽和度等)等都已經(jīng)落地在國(guó)內(nèi)外的各種應(yīng)用當(dāng)中。如果能進(jìn)一步熟悉應(yīng)用場(chǎng)域,個(gè)人化適性學(xué)習(xí),將有更大發(fā)揮的空間。
最具挑戰(zhàn)的是從無(wú)到有生成具美感的影像,一般都嘗試?yán)蒙蓪?duì)抗網(wǎng)絡(luò)(GAN)來(lái)實(shí)現(xiàn),但是目前在速度、分辨率、生成質(zhì)量控制上都還有相當(dāng)努力的空間。
值得產(chǎn)業(yè)注意的是,我們觀察到這些視覺(jué)美感智能突破也逐漸由云端走入本地端。相機(jī)、攝影機(jī)、電視等相關(guān)芯片都已經(jīng)看到國(guó)內(nèi)外的公司正逐漸布局。因?yàn)樘峁┚呙栏械纳铙w驗(yàn),不正也是智能時(shí)代的新產(chǎn)品嗎?
-
計(jì)算機(jī)視覺(jué)
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47623 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5598瀏覽量
124396
原文標(biāo)題:【椽經(jīng)閣】智能技術(shù)可以具有人類的視覺(jué)美感嗎?
文章出處:【微信號(hào):DIGITIMES,微信公眾號(hào):DIGITIMES】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
機(jī)器視覺(jué)的核心技術(shù)和應(yīng)用場(chǎng)景
上海計(jì)算機(jī)視覺(jué)企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技
【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺(jué)深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)
【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺(jué)深度學(xué)習(xí)實(shí)戰(zhàn)課程(11大系列課程,共5000+分鐘)
使用代理式AI激活傳統(tǒng)計(jì)算機(jī)視覺(jué)系統(tǒng)的三種方法
圖像采集卡:機(jī)器視覺(jué)時(shí)代的圖像數(shù)據(jù)核心樞紐
2025中國(guó)計(jì)算機(jī)大會(huì)DPU技術(shù)論壇成功舉辦
STM32計(jì)算機(jī)視覺(jué)開(kāi)發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析
高能計(jì)算機(jī):以工控產(chǎn)品為核心,為各行業(yè)發(fā)展落實(shí)解決方案
基于事件相機(jī)的隱私保護(hù)跌倒檢測(cè)案例 #事件相機(jī) #跌倒檢測(cè) #EVS #人工智能 #計(jì)算機(jī)視覺(jué)
如何在機(jī)器視覺(jué)中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
易控智駕榮獲計(jì)算機(jī)視覺(jué)頂會(huì)CVPR 2025認(rèn)可
工業(yè)相機(jī)圖像采集卡:機(jī)器視覺(jué)的核心樞紐
【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
英飛凌邊緣AI平臺(tái)通過(guò)Ultralytics YOLO模型增加對(duì)計(jì)算機(jī)視覺(jué)的支持
以深度學(xué)習(xí)為核心的計(jì)算機(jī)視覺(jué)技術(shù)具有視覺(jué)美感嗎
評(píng)論