国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NeurIPS 2023 | 清華ETH提出首個二值化光譜重建算法

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-12-03 20:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgaomVsc56ANMSQAAC3ITqhUNk915.png論文鏈接:https://arxiv.org/abs/2305.10299

代碼鏈接1:

https://github.com/caiyuanhao1998/BiSCI

代碼鏈接2:

https://github.com/caiyuanhao1998/MSTwKgaomVsc56ADjR6AAFs8X4VRDo646.png

▲ 圖1 BiSRNet 與當前最先進的二值網(wǎng)絡(luò)的性能對比

目前所有的代碼,預(yù)訓(xùn)練模型和測試結(jié)果均已開源在我們開發(fā)的一個二值化光譜壓縮重建工具包 BiSCI 內(nèi),該工具包支持八類最主要的二值網(wǎng)絡(luò),歡迎大家來使用。同時,我們還將 BiSRNet 嵌入到了我們之前開發(fā)的光譜重建工具箱 MST 當中。目前 MST 工具包已支持超過 12 類深度學(xué)習算法,并包含各種配套的可視化函數(shù),歡迎大家來對比。

wKgaomVsc56AHhoZAAAl6LOgh3c585.png光譜壓縮重建任務(wù)介紹

相比于常規(guī)的三通道 RGB 圖像,高光譜圖像包含幾十上百個波段,從而捕獲了關(guān)于成像場景更豐富的信息。也正因為這一重要特性,高光譜圖像被廣泛地應(yīng)用于醫(yī)療,地形勘探,農(nóng)業(yè)等領(lǐng)域。如圖 2 所示,在醫(yī)院進行檢查時,如果只看常規(guī)的 RGB 圖像可能很難診斷病因,但是如果采用高光譜圖像捕獲并在特定波長下渲染的話,就可以看清楚各類血管,骨骼結(jié)構(gòu)等,從而輔助醫(yī)生診斷。同樣的原理也可應(yīng)用在遙感地形勘探和農(nóng)業(yè)病蟲害檢測。

wKgaomVsc5-AO7A6AAZHNQUitzI972.png

▲圖2 高光譜圖像的應(yīng)用

然而高光譜圖像并容易獲取,傳統(tǒng)的成像設(shè)備采用光譜儀對成像場景進行逐波段的掃描,費時費力,難以捕捉運動場景。近些年,科學(xué)家們專門設(shè)計了單曝光壓縮成像(Snapshot Compressive Imaging,SCI)系統(tǒng)來解決這一問題。其光路結(jié)構(gòu)如圖 3 所示。

該系統(tǒng)首先通過一個編碼孔徑掩膜對成像場景的各光譜通道進行調(diào)制,然后通過一個三棱鏡進行色散后在相機上捕獲到一個二維的快照估計圖(compressive measurement)。通過這個光路系統(tǒng),我們便可將三維的光譜立方塊壓縮成一個二維的圖像。而光譜壓縮重建的任務(wù)便是從這個二維的壓縮估計圖上恢復(fù)出三維的高光譜數(shù)據(jù)。

wKgaomVsc5-ABFdEAARU9M4SX2I257.png

▲圖3 單曝光壓縮成像系統(tǒng)

當前的主流方法是采用的是全精度模型如 CNN 或者 Transformer 來學(xué)一個從壓縮估計圖到三維光譜立方塊的映射。幾個比較經(jīng)典算法有我們之前的工作 MST,MST++,CST,DAUHST,HDNet 等(這些方法全部都開源在我們的工具箱 MST 當中)。

這類方法雖然取得了很好的重建效果,但卻難以部署到移動端設(shè)備(如智能手機、相機、無人機等)上,因為移動端設(shè)備的內(nèi)存空間,計算資源和電力均有限,無法運轉(zhuǎn)全精度模型。另一方面,全精度模型的一些計算單元如深度展開算子和多頭自注意力機制等相對復(fù)雜,移動端設(shè)備無法支持。為了推動光譜重建算法的實際應(yīng)用,本文做了如下貢獻:

(1)提出了光譜壓縮重建領(lǐng)域內(nèi)首個基于二值神經(jīng)網(wǎng)絡(luò)(Binarized Neural Network,BNN)的算法——二值化光譜重分布網(wǎng)絡(luò)(Binarized Spectral-Redistribution Network,BiSRNet)。

(2)設(shè)計了一個新的二值化卷積單元——二值化光譜重分布卷積(Binarized Spectral-Redistribution Convolution,BiSR-Conv)。該卷積單元可以調(diào)整光譜表征的強度和分布,同時在反向傳播中更好地逼近二值化符號(Sign)函數(shù),從而讓求得的梯度更加準確。

(3)制作了四個二值化卷積模塊來解決特征圖形變過程中的維度不匹配問題,從而讓全精度信息能流通整個模型的每一層卷積單元以彌補二值卷積造成的信息損失。

(4)我們的 BiSRNet 顯著地超越了當前最先進的二值化算法,甚至取得了能與全精度 CNN 比肩的效果,然而我們的 BiSRNet 算法卻只需要極低的存儲空間(約 0.06 %)和計算代價(約 1 %)。

wKgaomVsc5-AfHKrAAAtJ0fTuoM470.png

本文方法

2.1 基礎(chǔ)模型

一般來說,用于二值化的全精度模型應(yīng)該是比較輕量的且它的計算單元可以再移動端設(shè)備上運行。然而,現(xiàn)存的 CNN 或 Transformer 模型均不滿足這一要求。為此,我們重新設(shè)計了一個簡單,輕量,易于部署的基礎(chǔ)模型(Base Model)。

受到之前工作 MST,MST++,CST,DAUHST 的啟發(fā),我們設(shè)計的基礎(chǔ)模型也采用一個 U 形結(jié)構(gòu),如圖 4 所示。

wKgaomVsc5-AP5IkAASFDtpAqCk484.png

▲圖4 基礎(chǔ)模型的網(wǎng)絡(luò)結(jié)構(gòu)

在這個基礎(chǔ)模型中,采用的所有計算單元都可以被移動端設(shè)備支持,同時也不涉及計算復(fù)雜度高的操作。

2.2 二值化光譜重分布卷積單元

二值化光譜重分布卷積的細節(jié)如圖 4(c)所示。將輸入的全精度激活信號記為 。我們注意到,受到特定成像波長的限制,高光譜信號沿著光譜維度有著不同的強度與分布。為了適應(yīng)光譜圖像的這一特性,我們提議在二值化激活之前,按通道對高光譜圖像表示進行重分布:

wKgaomVsc5-AKqqgAAAQUCI-D0c210.png

其中的 表示重分布后的激活。 表示可學(xué)習參數(shù)。然后 經(jīng)過一個符號函數(shù)后被量化到 1 位的激活

wKgaomVsc6CAY4mGAAAmhlDOkGU686.png

如圖 5(b)和(c)所示,由于符號函數(shù)是不可導(dǎo)的,之前的方法大都采用一個分段線性函數(shù) Clip(x)或者二次函數(shù) Quad(x)來在反向傳播中擬合符號函數(shù)。

wKgaomVsc6CACZJrAAFMLlcBEqs399.png

▲圖 5 符號函數(shù)與各類逼近函數(shù)的對比圖

Clip(x)與 Quad(x)的具體表達式如下:

wKgaomVsc6CAZ6o-AABAxK7AE-k034.png

然而分段線性函數(shù)知識一個粗略的估計,它與符號函數(shù)之間依舊有著很大的誤差。圖 5 中的陰影部分面積就表示這個誤差的大小,Clip(x)的誤差是 1。此外,一旦激活或者權(quán)重的值落在了 [-1,1] 之外,他們就不會再被更新。盡管分段二次函數(shù)是一個更精確的逼近(誤差為 2/3),上述的兩個問題依舊存在。為此,我們設(shè)計了一個可縮放的雙曲正切函數(shù)來在反向傳播中擬合符號函數(shù):

wKgaomVsc6GAOTt-AAAvB_4yjbk974.png

其中 是一個可學(xué)習的參數(shù),自適應(yīng)地調(diào)整 Tanh()與 Sign()之間的距離。我們證明當 時,Tanh()→ Sign()如下:

wKgaomVsc6GAYSWWAABmZOuOrgM511.png

我們仿照之前的二值化算法,定義然后我們可以得到:

wKgaomVsc6GAeJM2AAAd6rj5uxc468.png

我們計算圖 5(d)中的陰影面積:

wKgaomVsc6GAHxBPAABm9UvZ2Cg495.png

由此可見,當 足夠大時,Tanh()可以任意地逼近 Sign()。同時,我們的 Tanh()既不是分段函數(shù),也不會因為 x 落在 [-1,1] 之外而無法更新。

更進一步,我們比較三個逼近函數(shù)的一階導(dǎo)數(shù)。如圖 5 下邊一行所示取值范圍均為 ,這著本質(zhì)的區(qū)別。而我們以通過改變參數(shù) 來調(diào)整它的取值范圍 和形狀,從而更加靈活地逼

在二值化卷積層當中,32 位的權(quán)重 也被二值化到一位的權(quán)重

wKgaomVsc6GAaEVrAAAgEOvSUNc118.png

其中的 表示取均值。由此,計算繁重的全精度卷積操作便可由純邏輯異或非運算(XNOR)與位計數(shù)(bit-count)操作替換如下:

wKgaomVsc6GAVa4vAAAoaSWeh8I209.png

因為全精度信息 的取值范圍與二值卷積的輸出 差別較大,直接引入殘差連接將兩者相加容易導(dǎo)致 的信息被淹沒掉,所以先采用一個 RPReLU 激活函數(shù)來重塑 的取值范圍:

wKgaomVsc6GAcfHtAAA0Ol_z078790.png

然后再引入殘差鏈接:

wKgaomVsc6KAQmKUAAAc1nmtwfE996.png

通過我們的設(shè)計,全精度信息流就不會被二值卷積給阻斷,從而能夠順暢地流過我們設(shè)計的 BiSR-Conv 單元,如圖 4 (c) 中的紅色箭頭所示。

wKgaomVsc6KALu6jAAPXzkRMOgw342.png

▲圖6 本文卷積二值卷積塊與普通二值卷積塊在處理特征圖維度變化時的對比

全精度信息流在二值化算法中非常重要,因為它在一定程度上彌補了量化導(dǎo)致的信息損失。然而在特征圖的上下采樣過程中,由于維度發(fā)生了變化,難以直接引入殘差鏈接以補充全精度信息,如圖 6 中每個子圖的左半部分所示。藍色箭頭表示二值信號,紅色箭頭表示全精度信息流。普通的二值卷積模塊會在特征度維度改變的同時阻斷全精度信息流的傳遞。然而我們的二值卷積模塊通過采用分割合并的技巧,讓全精度信息流不被阻斷,從而在整個二值模型中流通。

wKgaomVsc5-AfHKrAAAtJ0fTuoM470.png

實驗結(jié)果

3.1 量化指標

wKgaomVsc6KAQcy9AAau48xfLoQ304.png

▲表1 BiSRNet 與 SOTA BNN,傳統(tǒng)方法,全精度CNN方法的量化指標對比 表 1 展示了我們的 BiSRNet 與 SOTA BNN,傳統(tǒng)方法,全精度 CNN 方法的量化指標對比。可以看到,我們的 BiSRNet 顯著超越了當前最先進的 BNN 算法 BTM 2.55 dB。同時超越了所有的 64 位傳統(tǒng)算法,增幅超過了 4.49 dB。值得注意的是,我們的 BiSRNet 取得了能與全精度 CNN 方法比肩的性能,比如超過了 1.23 dB,然而卻只占用了 0.06 % 的存儲空間和 1 % 計算代價。

3.2 視覺對比

wKgaomVsc6KAQvF7AAZ04FQhqmw396.png▲圖7 BiSRNet 與其他 BNN 方法在仿真數(shù)據(jù)及上的視覺對比wKgaomVsc6KAclbJAAVJ0W-RZIU240.png??圖8 BiSRNet 與其他 BNN 方法在真實數(shù)據(jù)集上的視覺對比

wKgaomVsc6OAfjN5AAAr2pbNr48215.png

總結(jié)

本文首次探索了壓縮量化在光譜壓縮重建領(lǐng)域的應(yīng)用,提出了該領(lǐng)域首個二值化卷積神經(jīng)網(wǎng)絡(luò) BiSRNet,在量化指標和視覺結(jié)果上都顯著地超越了當前最先進的二值化模型。代碼,預(yù)訓(xùn)練權(quán)重,重建結(jié)果均開源在:https://github.com/caiyuanhao1998/BiSCI ·


原文標題:NeurIPS 2023 | 清華ETH提出首個二值化光譜重建算法

文章出處:【微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:NeurIPS 2023 | 清華ETH提出首個二值化光譜重建算法

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    光譜成像:分析波長,可視細微的色彩、材質(zhì)差異和異物

    在機器視覺系統(tǒng)成像過程中,光源起著重要作用,合適的光源方案可以極大降低圖像處理算法的復(fù)雜度,提高系統(tǒng)的穩(wěn)定性、精度和速度。近年來,各領(lǐng)域利用高光譜成像技術(shù)進行檢測的市場規(guī)模不斷擴大,對高光譜相機
    的頭像 發(fā)表于 12-26 17:02 ?606次閱讀
    高<b class='flag-5'>光譜</b>成像:分析波長,可視<b class='flag-5'>化</b>細微的色彩、材質(zhì)差異和異物

    AQ24ETH - 02HTG雙向TVS極管:汽車電子ESD防護新選擇

    AQ24ETH - 02HTG雙向TVS極管:汽車電子ESD防護新選擇 在汽車電子領(lǐng)域,靜電放電(ESD)對敏感電子設(shè)備的威脅不容小覷。為了有效保護汽車電子系統(tǒng),一款高性能的ESD防護器件至關(guān)重要
    的頭像 發(fā)表于 12-15 16:25 ?562次閱讀

    地平線五篇論文入選NeurIPS 2025與AAAI 2026

    近日,兩大頂級學(xué)術(shù)會議錄用結(jié)果相繼揭曉,地平線憑借在機器人算法領(lǐng)域的深度鉆研,共有5篇論文從全球數(shù)萬份投稿中脫穎而出,分別入選NeurIPS 2025與AAAI 2026。
    的頭像 發(fā)表于 11-27 11:39 ?1087次閱讀
    地平線五篇論文入選<b class='flag-5'>NeurIPS</b> 2025與AAAI 2026

    使用Otsu閾值算法將灰度圖像

    Otsu 算法是由日本學(xué)者OTSU于1979年提出的一種對圖像進行的高效算法,又稱“最大類
    發(fā)表于 10-28 06:49

    思必馳與上海交大聯(lián)合實驗室五篇論文入選NeurIPS 2025

    近日,機器學(xué)習與計算神經(jīng)科學(xué)領(lǐng)域全球頂級學(xué)術(shù)頂級會議NeurIPS 2025公布論文錄用結(jié)果,思必馳-上海交大聯(lián)合實驗室共有5篇論文被收錄。NeurIPS(Conference on Neural
    的頭像 發(fā)表于 10-23 15:24 ?860次閱讀
    思必馳與上海交大聯(lián)合實驗室五篇論文入選<b class='flag-5'>NeurIPS</b> 2025

    PPEC電源DIY套件:圖形算法編程,解鎖電力電子底層算法實踐

    智能設(shè)計平臺,為用戶提供了一個接觸和操作底層算法的便捷途徑。 用戶無需進行復(fù)雜的代碼編寫,可以一鍵套用工程模版,也可以通過圖形界面自定義控制算法,就能夠輕松在實驗室有限的環(huán)境中制
    發(fā)表于 08-14 11:30

    光譜與高光譜工業(yè)相機的區(qū)別

    光譜相機可應(yīng)用于自動檢測、質(zhì)量管理、回收分類、醫(yī)療診斷等多個領(lǐng)域
    的頭像 發(fā)表于 08-08 16:28 ?1014次閱讀
    多<b class='flag-5'>光譜</b>與高<b class='flag-5'>光譜</b>工業(yè)相機的區(qū)別

    機載高光譜系統(tǒng)與機器學(xué)習算法結(jié)合實踐丨雙利合譜機載高光譜相機在小麥監(jiān)測應(yīng)用

    板校正、大氣校正和 NDVI 計算來增強植被與背景的區(qū)分度。在 FVC 提取方面,對比了像素分法、DPK-means 算法和支持向量機(SVM)分類,最終,研究通過誤差分析(EF、RMSE)、擬合度(R2)和誤差分布圖評估不同方法的表現(xiàn),驗證 DPK-means
    的頭像 發(fā)表于 07-24 16:36 ?733次閱讀
    機載高<b class='flag-5'>光譜</b>系統(tǒng)與機器學(xué)習<b class='flag-5'>算法</b>結(jié)合實踐丨雙利合譜機載高<b class='flag-5'>光譜</b>相機在小麥監(jiān)測應(yīng)用

    太陽光模擬器性能的影響參數(shù):光譜匹配度、光譜覆蓋率及光譜偏離率

    A?級匹配度時,各波段輻照度占比與標準光譜的偏差可控制在 10% 以內(nèi),反之,低匹配度將導(dǎo)致測試結(jié)果出現(xiàn)系統(tǒng)性偏差。 光譜覆蓋率SPC:量化光譜完整性的指標AM1.5G 標準
    發(fā)表于 07-21 15:35

    航天宏圖全棧式3DGS實景三維重建系統(tǒng)解決方案

    表達的核心技術(shù),通過相機、傳感器等設(shè)備獲取物理空間數(shù)據(jù),并結(jié)合計算機視覺與圖形學(xué)算法,將維圖像轉(zhuǎn)換為三維模型。目前,主流的三維重建方法包括傾斜攝影(多視角立體重建)、激光掃描和神經(jīng)輻
    的頭像 發(fā)表于 06-27 09:28 ?1650次閱讀
    航天宏圖全棧式3DGS實景三維<b class='flag-5'>重建</b>系統(tǒng)解決方案

    清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)智能體

    清華大學(xué)響應(yīng)國家教育新基建戰(zhàn)略,正在加速推進網(wǎng)絡(luò)管理平臺升級:為滿足在線教育、協(xié)同創(chuàng)新及智慧校園的發(fā)展需求,為清華大學(xué)躋身世界一流大學(xué)創(chuàng)造基礎(chǔ)條件,清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-07 09:51 ?848次閱讀

    立儀點光譜共焦原理

    光譜
    立儀科技
    發(fā)布于 :2025年04月18日 16:34:27

    如何利用高光譜相機實現(xiàn)精確的光譜分析?

    光譜相機是一種能夠獲取物體在連續(xù)多個窄波段上反射或輻射信息的先進成像設(shè)備。與普通RGB相機僅記錄紅、綠、藍三個寬波段不同,高光譜相機可以捕獲數(shù)百個連續(xù)的窄波段,形成所謂的"光譜立方體"——即在
    的頭像 發(fā)表于 03-28 17:05 ?1073次閱讀
    如何利用高<b class='flag-5'>光譜</b>相機實現(xiàn)精確的<b class='flag-5'>光譜</b>分析?

    凝視式高光譜相機:高光譜成像技術(shù)與多元應(yīng)用

    是一種基于 液晶可調(diào)諧濾波器(LCTF) 的成像設(shè)備,能夠同時捕捉多個光譜波段的圖像。與普通相機只能捕捉可見光不同,高光譜相機可以捕捉從可見光到近紅外甚至短波紅外的光譜信息。 、凝
    的頭像 發(fā)表于 03-10 16:26 ?1065次閱讀

    清華大學(xué)-濰柴動力智能制造聯(lián)合研究院資助項目(三狀態(tài) PWM 的電動汽車電機驅(qū)動系統(tǒng))

    的相電流幅動態(tài)地改變 TSPWM 不連續(xù)調(diào)制的鉗位模式,使電流幅較大的相保持在鉗位狀態(tài)以減小損耗。為了解決不同模式切換時相位突變導(dǎo)致電流或轉(zhuǎn)矩沖擊的問題,提出一種基于載波周期角度計算的電壓矢量相位
    發(fā)表于 03-07 14:57