国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一篇文章講清楚交叉熵和KL散度

深度學習自然語言處理 ? 來源:PaperWeekly ? 作者:康斯坦丁 ? 2022-11-16 15:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

看了很多講交叉熵的文章,感覺都是拾人牙慧,又不得要領。還是分享一下自己的理解,如果看完這篇文章你還不懂這倆概念就來掐死我吧。

1

『先翻譯翻譯,什么叫驚喜』

我們用 表示事件 發生的概率。這里我們先不討論概率的內涵, 只需要遵循直覺: 可以衡量事件 發生時會造成的驚喜(行文需要,請按照中性理解)程度: 概率越低的事件發生所造成的驚喜程度高;概率越高的事件發生所造成的驚喜程度低。 但是概率倒數這一運算的性質不是很好,所以在不改變單調性的情況下,可以將驚喜度(surprisal)定義為:

10ee981e-64f1-11ed-8abf-dac502259ad0.png

這樣定義后產生了另外兩個好處: 1. 確定性事件的驚喜度 = 0; 2. 如果有多個獨立事件同時發生,他們產生的驚喜度可以直接相加。是的,一個事件發生概率的倒數再取對數就是驚喜。

2

『信息熵,不過只是驚喜的期望』

驚喜度,在大部分文章里,都叫做信息量,但這個命名只是香農根據他研究對象的需要而做的,對于很多其它的場景,要生搬硬套就會變得非常不好理解了。 信息量 = 驚喜度,那么信息熵呢?看看公式不言自明:

11065166-64f1-11ed-8abf-dac502259ad0.png

或是連續形式:

111e3ccc-64f1-11ed-8abf-dac502259ad0.png

這不就是驚喜度的期望嗎? 換句話說,信息熵描述的是整個事件空間會產生的平均驚喜。 什么情況下,平均驚喜最低呢?確定事件。以某個離散隨機分布為例,整個分布在特定值 為 1,其它處均為 0,此時的信息熵/平均驚喜也為 0。 什么情況下產生的平均驚喜最高呢?自然是不確定越高平均驚喜越高。對于給定均值和方差的連續分布,正態分布(高斯分布)具有最大的信息熵(也就是平均驚喜)。所以再想想為什么大量生活中會看到的隨機事件分布都服從正態分布呢?說明大自然有著創造最大驚喜的傾向,或者說,就是要讓你猜不透。這也是理解熱力學中的熵增定律的另一個角度。

3

『交叉熵,交叉的是古典和貝葉斯學派』

對于概率,比較經典的理解是看做是重復試驗無限次后事件頻率會逼近的值,是一個客觀存在的值;但是貝葉斯學派提出了另一種理解方式:即將概率理解為我們主觀上對事件發生的確信程度。針對同一個隨機變量空間有兩個分布,分別記作和; 是我們主觀認為會發生的概率,下標代表 subjective; 是客觀上會發生的概率,下標 ○ 代表 objective。 這種情況下,客觀上這個隨機事件會給我們造成驚喜的期望應該是:

1132fa68-64f1-11ed-8abf-dac502259ad0.png

這個量 is a.k.a 交叉熵。 再翻譯一下,交叉熵是什么?可以理解為:我們帶著某個主觀認知去接觸某個客觀隨機現象的時候,會產生的平均驚喜度。 那什么時候交叉熵(也就是我們會獲得的平均驚喜度)會大?就是當我們主觀上認為一個事情發生的概率很低很大),但是客觀上發生概率很高很大) 的時候,也就是主觀認知和客觀現實非常不匹配的時候。機器學習當中為啥用交叉熵來當作損失函數應該也就不言自明了。

4

『相對熵,K-L散度』

交叉熵可以衡量我們基于某種主觀認識去感受客觀世界時,會產生的平均驚喜。但是根據上面的分析,即使主觀和客觀完全匹配,這時交叉熵等于信息熵,只要事件仍然隨機而非確定,就一定會給我們造成一定程度的驚喜。那我們要怎么度量主觀認識和客觀之間差異呢?可以用應該用以當前對“世界觀”產生的驚喜期望和完全正確認識事件時產生的驚喜期望的差值來衡量,這個就是相對熵(常稱作 KL-散度),通常寫作:

11443508-64f1-11ed-8abf-dac502259ad0.png

當我們的主觀認知完全匹配客觀現實的時候,KL-散度應該等于 0,其它任何時候都會大于 0。由于存在恒為正這一性質,KL-散度經常用于描述兩個分布是否接近,也就是作為兩個分布之間“距離”的度量;不過由于運算不滿足交換律,所以又不能完全等同于“距離”來理解。 機器學習中通常用交叉熵作為損失函數的原因在與,客觀分布并不隨參數變化,所以即使是優化 KL-散度,對參數求導的時候也只有交叉熵的導數了。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136948
  • 交叉熵
    +關注

    關注

    0

    文章

    4

    瀏覽量

    2499

原文標題:一篇文章講清楚交叉熵和KL散度

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智能保溫杯CE認證辦理指南

    隨著智能穿戴與智能家居產品的發展,智能保溫杯逐漸成為跨境電商熱門產品。若產品出口至 歐盟 市場,必須符合CE認證要求,否則無法合法銷售。 那么,智能保溫杯需要做哪些CE認證項目?下面講清楚
    的頭像 發表于 02-27 16:08 ?63次閱讀
    智能保溫杯CE認證辦理指南

    MTBF測試對電子產品的重要性

    MTBF 不只是個?“小時數”,它是產品可靠性的身份證,直接決定能不能賣、好不好賣、賣完穩不穩。下面用最直白的邏輯講清楚它為什么重要。
    的頭像 發表于 02-25 11:28 ?75次閱讀
    MTBF測試對電子產品的重要性

    什么是新能源移動充電車?文章講清楚它的類型和原理

    隨著全球新能源汽車市場高速發展,傳統的固定充電基礎設施在城市高密度區域、老舊小區以及配電網承載力方面面臨著嚴峻挑戰。在此背景下,新能源 移動充電車 作為種創新的解決方案快速崛起,其核心優勢在于
    的頭像 發表于 01-20 14:36 ?528次閱讀

    什么是交流狀態采集模塊?隔離RS485+AC輸入隔離雙隔離設計講清楚

    在工業自動化、工業物聯網(IIoT)領域,交流狀態采集模塊是專門用于實時監測、采集交流電氣回路運行狀態的硬件單元,你可以把它理解為工業現場里,盯著交流電路“一舉一動”的智能偵察兵——核心作用是把交流
    的頭像 發表于 01-12 17:46 ?70次閱讀

    壓接款連接器優勢有哪些?講清楚

    突破接線瓶頸,凌科電氣M20系列壓接款工業連接器全新上市——以卓越的可靠性與極致便捷,重新定義工業連接標準。
    的頭像 發表于 01-06 13:57 ?793次閱讀

    企業為什么開始換用 RFID智能硬盤柜?選型標準講清楚

    在企業的數據資產管理體系中,硬盤直是非常特殊的類介質。它體積小、價值高、存儲密度大,旦丟失或流轉不規范,風險遠高于紙質檔案。本文結合業內廣泛采用斯科兩款機型——CK-GYP?和?CK-GYP1,把企業在選型時真正需要關注的
    的頭像 發表于 12-10 09:38 ?270次閱讀

    單模 vs 多模:光纖選擇終極指南

    很多朋友在組建網絡時都會遇到個核心問題:我到底該用多模光纖還是單模光纖?今天,小易就為大家徹底講清楚這兩者的區別,幫助您做出最經濟、高效的選擇。
    的頭像 發表于 12-08 14:12 ?969次閱讀
    單模 vs 多模:光纖選擇終極指南

    別再迷糊了!Linux交叉編譯到底是個啥?講清楚

    就用 不繞彎子、接地氣、工程師能看懂 的方式,把交叉編譯講得明明白白。 而且結合我們鋇錸技術(BaileiTech)那些跑在 ARM、RISC-V、國產嵌入式 Linux 的產品,告訴你交叉編譯在工業場景里究竟為什么重要。
    的頭像 發表于 12-03 16:28 ?1002次閱讀
    別再迷糊了!Linux<b class='flag-5'>交叉</b>編譯到底是個啥?<b class='flag-5'>一</b>文<b class='flag-5'>講清楚</b>

    講清楚TVS二極管的作用和分類

    TVS二極管(Transient Voltage Suppression Diode,瞬態電壓抑制二極管)是種專門用于抑制電路中瞬態過電壓的半導體器件,其核心作用是通過快速響應和低鉗位電壓保護
    的頭像 發表于 11-18 16:41 ?2265次閱讀
    <b class='flag-5'>一</b>文<b class='flag-5'>講清楚</b>TVS二極管的作用和分類

    講清楚線性霍爾靈敏和輸出關系

    線性霍爾靈敏與輸出范圍的關系解析 、核心定義與物理基礎 靈敏(Sensitivity) 線性霍爾傳感器的靈敏(單位:mV/mT 或 mV/G)表示單位磁場強度變化時輸出電壓的變
    的頭像 發表于 11-18 16:38 ?937次閱讀

    工業級防爆型PDA手持終端(化工/石油/礦場等場景)的實操指南

    今天講防爆型PDA手持終端,主要會講到:為什么要用防爆PDA、它們到底怎么防爆、要看哪些證書與參數、不同場景的選型與落地注意點、以及采購/驗收/運維清單”都會盡量講清楚
    的頭像 發表于 11-04 15:02 ?558次閱讀
    工業級防爆型PDA手持終端(化工/石油/礦場等場景)的實操指南

    高壓放大器穩定性與振鈴

    在實際的操作使用中,高壓驅動電路時遇到了穩定性問題:輸出波形出現 振蕩或振鈴。且高壓放大器本身帶寬有限、壓擺率受限,驅動容性負載時矛盾 會更突出。從物理本質講清楚:相位裕不足是根源。 首先相位裕
    的頭像 發表于 10-10 11:38 ?483次閱讀

    阿里云設備的物模型數據里面始終沒有值是哪里的問題?

    如上圖,不知道講清楚沒有。 IG502自定義TOPIC 上發到阿里云沒問題。采用阿里云物模型的格式來上發就不行。請大佬指教!
    發表于 08-05 06:43

    文了解什么是 BQB 認證

    講清楚、什么是BQB認證?BQB是BluetoothQualificationBody的縮寫,即“藍牙資格認證”。它是由**藍牙技術聯盟(BluetoothSI
    的頭像 發表于 07-18 14:53 ?1893次閱讀
    <b class='flag-5'>一</b>文了解什么是 BQB 認證

    講清楚芯片的分類-多個維度

    芯片作為現代電子設備的核心組件,其分類方式多樣,以下從功能、應用領域、制造工藝、集成、設計架構、用途、數據類型、工作方式、材料及封裝形式十個維度進行詳細闡述: 、按功能分類 1. 處理器芯片
    的頭像 發表于 05-06 15:04 ?6330次閱讀