国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種基于能量模型的神經網絡架構受限玻爾茲曼機

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-07-26 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

受限玻爾茲曼機是一種基于能量模型的神經網絡架構,雖然不像通常的卷積神經網絡一樣被人熟知,但近年來在推薦系統中受到了越來越多的關注,在協同過濾推薦等領域表現出越來越重要的作用。在這篇文章中,我們將從基礎理論和基本結構方面梳理受限玻爾茲曼機的原理,以便對受限玻爾茲曼機(RBM: Restricted Boltzmann Machine)有更深的了解。

最典型的受限玻爾茲曼機如下圖所示,在兩層簡單的結構中分布式的輸入的可見層(visible layer)和隱含層結構。

和通常的前饋神經網絡不同的是,受限玻爾茲曼機可以通過可見層的狀態預測對應隱含層的狀態,相反亦可以由隱含層預測可見層對應單元的狀態。同時,它與玻爾茲曼機不同在于同一層內的單元之間沒有相互連接。

能量模型

為了更好地理解RBM是如何工作的,我們需要引入基于能量的模型來進行解釋。在重力場中,不同高度的物體具有不同的重力勢能,我們可以利用能量來描述物體所具有潛在做功的能力。基于這樣的啟發,科學家們將這一觀點應用到深度學習中,來度量模型質量。

深度學習模型的目的之一便是對變量之間的依賴關系進行編碼,將變量組合與一個標量能量聯系起來,而這一能量就作為模型能力的度量。通常情況下,較小的能量意味著更加合理的變量組合。所以基于能量的模型在訓練過程中會不斷最小化事先定義好的能量函數從而實現變量間的最優組合,RBM的能量函數定義為如下的形式:

可以看到能量函數與可見層、隱含層的狀態以及對應的權重和偏置都有關系。RBM的訓練過程就是最小化這一能量函數的過程。

概率模型

RBM同時也是一種典型的概率模型,模型中的狀態通過概率來表示。在每一個時間點上受限玻爾茲曼機的狀態由可見層和隱含層單元決定,其可被觀測到的狀態可由以下聯合概率分布來表示:

其中p為可見層和隱藏層的聯合概率分布函數,Z為配分函數,用于表示系統所有可能的狀態。這一聯合概率分布在物理上就是著名的玻爾茲曼分布——在給定能量E上粒子在某個狀態上被觀測到的概率。但由于Z中h和v的組合情況十分龐大,使得這一聯合概率分布難以計算,但幸運的是對于對于給定隱含層或者可見層狀態下的概率卻是更加容易計算的:

需要注意的是在RBM中每一個單元都是0/1的二值狀態,實際使用中通常會計算出每個單元處于1,也就是被激活的概率。在給定可見層v的條件下,隱含層單元j被激活的概率可以寫成下圖的表示,同樣給定隱含層的狀態下,可見層單元i的概率也可以被寫成下面的表示形式。

上式通過前述的條件概率推導得到,求得的值為對應單元取1激活的概率。其中σ是Sigmoid函數。

訓練

RBM的訓練與通常神經網絡的訓練有很大的區別,研究人員們使用了吉布斯采樣(GibbsSampling)和對比散度(Contrastive Divergence,CD)兩個數學手段來對訓練過程進行處理。簡單來說吉布斯采樣利用了上述的條件概率公式,通過輸入v可以計算得到隱含層的條件概率h,隨后根據這一h反過來預測輸入層的值v,經過k次迭代后的輸出vk分布將會收斂于v0的分布,從而得到了可見層的聯合概率。

為了更新權重,還需要計算出每次訓練過后誤差,這時候就需要使用對比散度來進行計算:

基于RBM的協同過濾系統

在推薦系統中RBM常常被用于識別數據的隱含因素。例如在電影推薦系統中,人們常常將不同的電影按照不同的潛在變量進行分析,例如速度與激情會被歸并到動作片里,而玩具總動員和瓦力則會更多的包含皮克斯的因素。模型通過對用戶打分數據進行學習,在多個循環后將得出用戶的個性化偏好以及用戶群體的整體偏好。

在電影推薦的例子中,受限玻爾茲曼機面對的數據是二進制的0/1而不是連續的打分數據。這意味著用于對于電影的評價要么是喜歡(1)要么是不喜歡(0)。這些評價值作為輸入層/可見層被送入模型。在給定的數據下,RBM會發掘數據中能解釋用戶偏好的隱含因素,并在隱含層中用不同的單元表示出來。

圖中是一個用戶對于幾部電影評分的簡單例子,其中霍比特人由于用戶沒有評分,數據中使用-1來標注,由于電影的數量龐大,某個用戶只對小部分電影進行了評價,需要告訴模型哪些是沒有用戶評價的輸入從而可以忽略這些因素的影響。

上圖就對應了給定可見層狀態,求出隱含層單元激活概率的情況。圖中可以看出只有Fantasy類型是被激活的,在給定用戶評分的情況下,RBM正確地識別出這一用戶喜歡的類型更多的偏向于科幻電影。

在另一種情況下,在知道了用戶的偏好后(hidden),如果要為用戶推薦電影(visible)就可以利用已知隱含層求得可見層單元被激活的條件概率,從而為用戶推薦偏好類型的電影。

上圖中可以看到,RBM計算出被激活的電影除了輸入數據中指環王和哈利波特,還為用戶推薦了原來沒有看過的霍比特人。模型認為喜歡科幻的用戶很有可能也喜歡霍比特人。

總結來看,在推薦系統中使用RBM主要分為以下幾個步驟:

1.在所有用戶數據上訓練模型;

2.使用特定用戶的數據來進行預測;

3.得到隱含層的激活情況;

4.基于隱含層的激活來計算輸出層的激活情況;

5.可見層的新激活單元表示了用戶對未看過的電影/節目/音樂的評價,并選取其中大概率的激活單元向用戶推薦。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107852
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124417

原文標題:簡單明了地告訴你不明覺厲的「受限玻爾茲曼機」到底是個啥?

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    面向嵌入式部署的神經網絡優化:模型壓縮深度解析

    1.為什么需要神經網絡模型壓縮? 神經網絡已經成為解決復雜機器學習問題的強大工具。然而,這種能力往往伴隨著模型規模和計算復雜度的增加。當輸入維度較大(例如長時序窗口、高分辨率特征空間)
    的頭像 發表于 02-24 15:37 ?5051次閱讀
    面向嵌入式部署的<b class='flag-5'>神經網絡</b>優化:<b class='flag-5'>模型</b>壓縮深度解析

    自動駕駛中常提的卷積神經網絡是個啥?

    在自動駕駛領域,經常會聽到卷積神經網絡技術。卷積神經網絡,簡稱為CNN,是一種專門用來處理網格狀數據(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像
    的頭像 發表于 11-19 18:15 ?2086次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經網絡</b>是個啥?

    激活函數ReLU的理解與總結

    限制玻爾茲曼(restricted Boltzmann machines)提出的,并且首次成功地應用于神經網絡(Glorot,2011)。除了產生稀疏代碼,主要優勢是ReLUs緩解了消失的梯度
    發表于 10-31 06:16

    NMSIS神經網絡庫使用介紹

    NMSIS NN 軟件庫是組高效的神經網絡內核,旨在最大限度地提高 Nuclei N 處理器內核上的神經網絡的性能并最??大限度地減少其內存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發表于 10-29 06:08

    構建CNN網絡模型并優化的般化建議

    :Dropout層隨機跳過神經網絡模型中某些神經元之間的連接,通過隨機制造缺陷進行訓練提升整個神經網絡的魯棒性。 6)指定合理的學習率策略:
    發表于 10-28 08:02

    在Ubuntu20.04系統中訓練神經網絡模型些經驗

    本帖欲分享在Ubuntu20.04系統中訓練神經網絡模型些經驗。我們采用jupyter notebook作為開發IDE,以TensorFlow2為訓練框架,目標是訓練個手寫數字識
    發表于 10-22 07:03

    液態神經網絡(LNN):時間連續性與動態適應性的神經網絡

    1.算法簡介液態神經網絡(LiquidNeuralNetworks,LNN)是一種新型的神經網絡架構,其設計理念借鑒自生物神經系統,特別是秀
    的頭像 發表于 09-28 10:03 ?1247次閱讀
    液態<b class='flag-5'>神經網絡</b>(LNN):時間連續性與動態適應性的<b class='flag-5'>神經網絡</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經形態計算、類腦芯片

    AI芯片不僅包括深度學細AI加速器,還有另外個主要列別:類腦芯片。類腦芯片是模擬人腦神經網絡架構的芯片。它結合微電子技術和新型神經形態器件,模仿人腦
    發表于 09-17 16:43

    神經網絡的并行計算與加速技術

    隨著人工智能技術的飛速發展,神經網絡在眾多領域展現出了巨大的潛力和廣泛的應用前景。然而,神經網絡模型的復雜度和規模也在不斷增加,這使得傳統的串行計算方式面臨著巨大的挑戰,如計算速度慢、訓練時間長等
    的頭像 發表于 09-17 13:31 ?1143次閱讀
    <b class='flag-5'>神經網絡</b>的并行計算與加速技術

    基于神經網絡的數字預失真模型解決方案

    在基于神經網絡的數字預失真(DPD)模型中,使用不同的激活函數對整個系統性能和能效有何影響?
    的頭像 發表于 08-29 14:01 ?3478次閱讀

    小白學大模型:國外主流大模型匯總

    )領域。論文的核心是提出了一種名為Transformer的全新模型架構,它完全舍棄了以往序列模型(如循環神經網絡RNNs和卷積
    的頭像 發表于 08-27 14:06 ?987次閱讀
    小白學大<b class='flag-5'>模型</b>:國外主流大<b class='flag-5'>模型</b>匯總

    無刷電機小波神經網絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了個以三相相電壓為輸人,轉角為輸出的小波神經網絡來實現轉角預測,并采用改進遺傳算法來訓練網絡
    發表于 06-25 13:06

    神經網絡專家系統在電機故障診斷中的應用

    摘要:針對傳統專家系統不能進行自學習、自適應的問題,本文提出了基于網絡專家系統的并步電機故障診斷方法。本文將小波神經網絡和專家系統相結合,充分發揮了二者故障診斷的優點,很大程度上降低了對電機
    發表于 06-16 22:09

    基于FPGA搭建神經網絡的步驟解析

    本文的目的是在神經網絡已經通過python或者MATLAB訓練好的神經網絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后
    的頭像 發表于 06-03 15:51 ?1240次閱讀
    基于FPGA搭建<b class='flag-5'>神經網絡</b>的步驟解析

    【「芯片通識課:本書讀懂芯片技術」閱讀體驗】從deepseek看今天芯片發展

    的: 神經網絡處理器(NPU)是一種模仿人腦神經網絡的電路系統,是實現人工智能中神經網絡計算的專用處理器,主要用于人工智能深度學習模型的加速
    發表于 04-02 17:25