国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

4種神經網絡不確定性估計方法對比與代碼實現

穎脈Imgtec ? 2025-11-10 10:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文轉自:DeepHub IMBA


回歸任務在實際應用中隨處可見——天氣預報、自動駕駛、醫療診斷、經濟預測、能耗分析,但大部分回歸模型只給出一個預測值,對這個值到底有多靠譜卻只字不提。這在某些應用場景下會造成很多問題,比如用模型預測患者血壓,假設輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實對這個預測很不確定呢?這時候光看數值就不夠了。

神經網絡有幾種方法可以在給出預測的同時估計不確定性。


回歸中的不確定性問題

分類任務里,每個類別都有對應的預測分數,經過softmax之后就是概率值,可以直接當作置信度來看——概率高說明模型比較有把握。

回歸就沒這么簡單了。用MSE(均方誤差)訓練回歸模型時,模型對那些難擬合的樣本會傾向于預測平均值。比如說訓練集里有幾個輸入特征幾乎一樣、但目標值差異很大的樣本,模型為了降低MSE,會把預測往它們的均值靠攏。

這就帶來一個問題:當預測值接近訓練集的整體均值時,很難判斷模型是真的有把握,還是純粹為了優化損失函數在"混日子"。而如果預測值偏離均值較遠,可能說明模型比較確信——因為預測錯了的話MSE懲罰會更重。

假設目標值在-1到1之間,訓練集均值接近0。模型預測0.1時,不好說它是有信心還是在敷衍;但預測0.8時,大部分情況說明它確實掌握了某些模式,當然這個現象也不是在所有情況下都成立。

這里涉及兩類不確定性的概念:

任意不確定性(Aleatoric uncertainty)來自數據本身的隨機性和噪聲,比如測量誤差、自然界的隨機過程。這種不確定性沒法通過增加數據來消除,它就是客觀存在的。

認知不確定性(Epistemic uncertainty)源于知識或數據的缺乏。弄日三級片訓練數據太少或者測試樣本落在從沒見過的區域,模型就會產生這類不確定性。但是這種不確定性是可以通過改進模型結構、收集更多樣化的數據來降低的。

前面提到的那個例子主要說的就是任意不確定性。但即便預測0.8,如果是在數據稀疏的區域,模型也可能因為認知不確定性而不靠譜。


四種不確定性估計方法

這里對比了四種在神經網絡回歸中估計不確定性的方法。

1、均值 + 對數標準差(Mean + LogStd)

模型輸出兩個值:均值作為預測值,對數標準差表示不確定性——值越大說明越不確定。損失函數用的是負對數似然,假設目標值服從正態分布,參數就是預測的均值和標準差。

x='input features'
y='targets'
mu,log_std=mean_logstd_model(x)
dist_obj=torch.distributions.Normal(loc=mu,scale=log_std.exp())
loss=-dist_obj.log_prob(y).mean()

2、均值 + 對數方差(Mean + LogVariance)

跟上一個類似,只是把標準差換成了方差。對數方差越大不確定性越高。損失計算方式如下:

bf889b4c-bdde-11f0-8ce9-92fbcf53809c.jpg

x='input features'
y='targets'
mu,log_variance=mean_logvariance_model(x)
loss=(0.5*log_variance)+(((y-mu)**2)/(2*torch.exp(log_variance)))
loss=loss.mean()

3、蒙特卡洛Dropout(MC Dropout)

訓練時用dropout,但預測階段的時候不關閉它。對同一個樣本預測多次,由于dropout的隨機性,每次結果會略有差異。把這些預測值的均值當作最終預測,標準差就是不確定性的度量。

4、簡化版PPO方法

PPO本來是強化學習里的算法,這里做了簡化改造用到監督學習上。Actor網絡預測均值和標準差,獎勵定義為采樣預測的負MSE。跟標準PPO的主要區別在于優勢(advantage)的計算——監督回歸可以看作單步環境不需要GAE,優勢就是reward減去value。

bf9ca614-bdde-11f0-8ce9-92fbcf53809c.jpg


實驗設置

數據集

混凝土抗壓強度數據集包含1030個樣本,8個特征,1個目標值。按7:3隨機劃分訓練集和測試集。輸入特征標準化到均值0、標準差1,目標值除以100歸一化到(0,1)區間。

模型結構

基礎架構都是全連接網絡,4個隱藏層,每層64個神經元。輸出層根據不同方法有各自的設計。

訓練參數

統一訓練2000個epoch,batch size 256,學習率0.0001。


實驗結果分析

bfac3750-bdde-11f0-8ce9-92fbcf53809c.jpg

圖1展示了各方法在訓練集和測試集上的MSE。基線方法(不估計不確定性的普通回歸)測試集MSE最低,均值對數方差最高。均值對數標準差和MC Dropout在測試集上表現相當,排第二,PPO排第三。

bfbb3cfa-bdde-11f0-8ce9-92fbcf53809c.jpg

圖2畫出了真實值和預測值的散點圖,x軸是真值,y軸是預測。點越靠近對角線,預測越準。

bfd1952c-bdde-11f0-8ce9-92fbcf53809c.jpg

圖3展示了不確定性估計的實際效果。x軸是確定性閾值,比如0.3表示過濾掉30%最不確定的預測,只保留70%最有把握的,y軸是這些篩選后樣本的MSE。

基線方法沒有不確定性估計,所以MSE是條平線。PPO的表現比較奇怪——按理說高標準差應該對應高不確定性,但這里似乎反過來了,篩掉低標準差的預測后MSE反而上升。這可能跟PPO用標準差控制探索有關,那些被分配低標準差的樣本探索不夠充分反而預測不準。

均值對數標準差、均值方差和MC Dropout三者表現接近。均值對數標準差稍微好一點,在0.55閾值之后還能繼續降低MSE,而均值方差已經平了。

bfdeef4c-bdde-11f0-8ce9-92fbcf53809c.jpg

圖4把PPO的不確定性順序反過來試了試——最確定的當最不確定,最不確定的當最確定。雖然在0到0.2的區間MSE有所下降,但0.2之后又回升了。說明即便反著用,PPO的不確定性估計也不太對。


總結

在混凝土強度這個數據集上,均值對數標準差和均值對數方差兩種方法在估計預測不確定性方面效果最好。MC Dropout也不錯,但PPO的簡化版本表現不佳,即使反轉其不確定性指標也無法獲得可靠的估計。

代碼倉庫:https://github.com/navid-bamdad-roshan/regression-with-uncertainty-methods-comparison

作者:Navid Bamdad Roshan


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107747
  • 模型
    +關注

    關注

    1

    文章

    3751

    瀏覽量

    52099
  • MSE
    MSE
    +關注

    關注

    0

    文章

    7

    瀏覽量

    6699
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    去嵌入和不確定性是否使用了正確的設置

    大家好,所以我遇到的問題是確定用于測試夾具糾錯過程的適配器特征的不確定性。我們將使用適配器及其s2p文件對測試夾具中的所有信號路徑進行路徑表征,然后移除以進行性能測試。這個過程在不確定性計算器中被
    發表于 09-27 15:47

    E8364C PNA的不確定性和跟蹤是什么?

    在中斷后,我回到網絡分析儀,并提出一個簡單的問題。我正在閱讀E8364C PNA的數據表,并遇到了E8364C PNA,不確定性和跟蹤,但沒有解釋這些術語。我的猜測是,不確定性是與公認標準相比的誤差
    發表于 10-18 17:03

    是否可以使用全雙端口校準中的S11不確定性來覆蓋單端口校準的不確定性

    我們一直在使用Agilent VNA不確定度計算器電子表格,讓我們了解我們測量的設備的不確定性。有關單端口校準的問題:目前您必須從電子表格中選擇您的VNA(帶寬和平均值),然后選擇校準類型(全雙端口
    發表于 12-29 16:32

    N5531S TRFL不確定性

    我正在嘗試使用N5531S(選擇550傳感器)測量接收器系統測量0到-130dBm的絕對功率水平,然后計算它的不確定性。安捷倫的應用筆記已經提到,不確定度可以使用公式+/-計算(功率計范圍2-4
    發表于 02-19 15:40

    容差模擬電路軟故障診斷的小波與量子神經網絡方法設計

    能力是無法解決的。而量子神經網絡被認為是一具有固有模糊性的網絡,它的隱層單元采用多量子能級變換函數,每個多能級變換函數是一系列具有量子間隔偏移的S型函數之和,能將決策的不確定性數據合
    發表于 07-05 08:06

    測試系統不確定性分析

    測試系統不確定性分析
    發表于 09-18 09:19

    5G網絡架構的不確定性及其對承載網的影響

    運營商若想在5G網絡部署領先世界,必須考慮上述不確定性的風險因素,建議適度把握5G部署節奏,降低上述風險的負面影響。  4 結束語  本文通過對LTE和5G網絡架構的
    發表于 12-03 16:03

    傅里葉變換與不確定性看了就知道

    傅里葉變換與不確定性
    發表于 12-30 06:41

    求解動態及不確定性優化問題的新方法

    求解動態及不確定性優化問題的新方法_劉曉
    發表于 01-07 18:56 ?0次下載

    LUCT工具主要特性及不確定性時鐘樹設計方法和算法的介紹

    時鐘樹設計及其設計方式是引起系統芯片性能差異的主要原因。 低不確定性時鐘樹[LUCT]設計及算法與在系統芯片上實現的第一層時鐘樹的物理定義有關,能夠讓設計人員克服傳統設計方法的所有低效率問題。 從
    發表于 11-29 10:58 ?6次下載
    LUCT工具主要特性及<b class='flag-5'>不確定性</b>時鐘樹設計<b class='flag-5'>方法</b>和算法的介紹

    如何用不確定性解決模型問題

    再比如,你想搭建一個模型,要在一系列動物圖片中預測哪種動物會吃掉你。假設你在訓練時給模型提供的都是獅子和長頸鹿的照片,現在模型看到了一張僵尸照片。由于之前它沒有見過僵尸,所以這里的不確定性就非常高。如果在訓練時能提供足夠的僵尸照片,那么模型的不確定性會隨之減少。
    的頭像 發表于 09-07 09:45 ?5939次閱讀

    針對自閉癥輔助的不確定性聯合組稀疏建模方法

    自閉癥是一神經發育障礙類疾病,其診斷過程存在著很大的不確定性。目前已有的面向自閉癥診斷的建模方法沒有針對診斷過程的不確定性進行有效硏究。為
    發表于 04-07 11:23 ?2次下載
    針對自閉癥輔助的<b class='flag-5'>不確定性</b>聯合組稀疏建模<b class='flag-5'>方法</b>

    深部目標姿態估計不確定性量化研究

      FastUQ 是一新的用于深部目標姿態估計的快速不確定性量化方法,具有高效、即插即用的特點,支持一類通用的姿態估計任務。這項研究在自主
    的頭像 發表于 04-26 16:18 ?1742次閱讀

    不確定性感知和姿態回歸結合用于自動駕駛車輛定位

    提出了一聯合訓練姿態估計不確定性方法,其具有可靠的不確定性估計和改進的訓練穩
    的頭像 發表于 01-30 11:30 ?2132次閱讀

    科技云報到:數字化轉型,從不確定性確定性的關鍵路徑

    科技云報到:數字化轉型,從不確定性確定性的關鍵路徑
    的頭像 發表于 11-16 16:52 ?1196次閱讀
    科技云報到:數字化轉型,從<b class='flag-5'>不確定性</b>到<b class='flag-5'>確定性</b>的關鍵路徑