国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

介紹機器學習中常用的三種優化算法

汽車玩家 ? 來源:人工智能遇見磐創 ? 作者:Walker ? 2020-05-04 18:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文主要介紹了常用的一些機器學習中常用的優化算法

在機器學習的世界中,通常我們會發現有很多問題并沒有最優的解,或是要計算出最優的解要花費很大的計算量,面對這類問題一般的做法是利用迭代的思想盡可能的逼近問題的最優解。我們把解決此類優化問題的方法叫做優化算法,優化算法本質上是一種數學方法,常見的優化算法包括梯度下降法、牛頓法、Momentum,Nesterov Momentum,Adagrad,Adam等。其實大部分機器學習算法的本質都是建立優化模型,通過優化算法對損失函數(優化的目標函數)進行優化,從而訓練出最好的模型。

(1)梯度下降法

梯度下降法是最常用的一種優化算法。其核心思想是:在當前位置尋找梯度下降最快的方向,來逐漸逼近優化的目標函數。且離目標函數越近,逼近的“步伐”也就越小。梯度下降法本質是一種迭代方法,常用于機器學習算法的模型參數求解。其示意圖如下圖1所示:

圖1梯度下降法

梯度下降法的更新公式為:

介紹機器學習中常用的三種優化算法

其中α為梯度上每次逼近的步長,前邊的“-”表示搜索方向為負梯度的方向,L我損失函數。算法更新終止的條件是梯度向量接近于0即可。此外需要特別注意的是,梯度下降法不一定能夠找到全局的最優解,很有可能找到的是一個局部最優解。

(2)梯度下降法的變式

通常基于梯度的下降方法又有很多變式,我們主要為大家介紹:隨機梯度下降法(SGD), Momentum, Nesterov Momentum, Adagrad, Adam。

隨機梯度下降法是每次使用一批數據進行梯度的計算,而非計算全部數據的梯度,因為如果每次計算全部數據的梯度,會導致運算量加大,運算時間變長,容易陷入局部最優解,而隨機梯度下降可能每次不是朝著真正最小的方向,這樣反而可以跳出局部的最優解。

Momentum是在隨機梯度下降法的基礎上,增加了動量(Momentum)的技術。其核心是通過優化相關方向的訓練和弱化無關方向的振蕩,來加速SGD訓練。Momentum的方法能夠在一定程度上緩解隨機梯度下降法收斂不穩定的問題,并且有一定的擺脫陷入局部最優解的能力。

Nesterov Momentum是基于Momentum的加速算法,相比于傳統的動量算法,最大的優化是計算經過動量更新之后的位置梯度。

Adagrad即adaptive gradient,是一種自適應學習率的梯度法。它通過記錄并調整每次迭代過程中的前進方向和距離,使得針對不同問題都有一套自適應學習率的方法。Adagrad最大的優勢是不需要手動來調整學習率,但與此同時會降低學習率。

Adam即Adaptive Moment Estimation,是能夠自適應時刻的估計方法,能夠針對每個參數,計算自適應學習率。這是一種綜合性的優化方法,在機器學習實際訓練中,往往能夠取得不錯的效果。

(3)牛頓法和擬牛頓法

與上述梯度類型的優化算法最大的不同是,牛頓法是一種二階收斂算法,所以它的收斂速度相較于一階算法會更快。牛頓法二階的意義在于它不僅會沿著梯度最大的方向下降,還會考慮走的下一步坡度是不是也很大,它能夠以較遠的目光全局的逼近目標函數。其算法的具體步驟為:

1)首先選擇接近于函數f(x)的零點x0,并計算f(x0)處的斜率f’(x0)。然后我們求解以下方程,得到比剛剛的x0更加準確的解x1。

2)接下來我們利用x1進行下一輪的迭代,迭代公式如下所示。這樣經過反復的迭代過程,我們便能取得函數f(x)的最優解。

介紹機器學習中常用的三種優化算法

牛頓法的迭代示意圖如下所示:

介紹機器學習中常用的三種優化算法

圖2 牛頓法

雖然牛頓法相較于梯度下降法等優化算法收斂速度更快,但每一步都需要求解復雜的Hessian矩陣,計算非常不易。所以后來美國Argonne國家實驗室的物理學家W.C.Davidon又針對牛頓法計算復雜的缺陷提出了擬牛頓法。它的核心思想是使用正定矩陣來近似Hessian矩陣的逆,從而簡化了運算的復雜。另外,因為擬牛頓法不需要二階導數的信息,所以現在擬牛頓法在機器學習實際問題中應用更加的廣泛。

【總結】:除了以上幾類較為常見的優化算法以外,還有共軛梯度法、啟發式優化算法等。在實際的機器學習問題中,往往需要具體問題具體分析,根據每類優化問題的特征,選擇合適的優化算法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98060
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136951
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    請問CW32芯片的三種工作模式是什么?

    CW32芯片的三種工作模式是什么?
    發表于 12-26 06:48

    單片機開發中常用三種軟件架構介紹

    消息的顯示} 4.事件驅動架構事件驅動架構是一編程范式,其中程序的執行流程由事件(如用戶輸入、傳感器變化、定時器到期等)觸發。 在單片機開發中,事件驅動架構通常用于響應外部硬件中斷或軟件中斷。 以下
    發表于 11-26 08:05

    8常用的CRC算法分享

    CRC 計算單元可按所選擇的算法和參數配置來生成數據流的 CRC 碼。有些應用中,可利用 CRC 技術來驗證數據的傳輸和存儲的完整性。 8 常用的 CRC 算法,包括: CRC16_
    發表于 11-13 07:25

    量子機器學習入門:三種數據編碼方法對比與應用

    在傳統機器學習中數據編碼確實相對直觀:獨熱編碼處理類別變量,標準化調整數值范圍,然后直接輸入模型訓練。整個過程更像是數據清洗,而非核心算法組件。量子機器
    的頭像 發表于 09-15 10:27 ?773次閱讀
    量子<b class='flag-5'>機器</b><b class='flag-5'>學習</b>入門:<b class='flag-5'>三種</b>數據編碼方法對比與應用

    三種SPWM波形生成算法的分析與實現

    摘要:變頻技術作為現代電力電子的核心技術,集現代電子、信息和智能技術于一體。而SPW(正弦波脈寬調制)波的產生和控制則是變頻技術的核心之一。本文對SPI波形生成的三種算法-對稱規則采樣法、不對稱規則
    發表于 07-31 13:34

    FPGA在機器學習中的具體應用

    ,越來越多地被應用于機器學習任務中。本文將探討 FPGA 在機器學習中的應用,特別是在加速神經網絡推理、優化
    的頭像 發表于 07-16 15:34 ?2891次閱讀

    MEMS中的三種測溫方式

    在集成MEMS芯片的環境溫度測量領域,熱阻、熱電堆和PN結原理是三種主流技術。熱阻是利用熱敏電阻,如金屬鉑或注入硅的溫度電阻系數恒定,即電阻隨溫度線性變化的特性測溫,電阻變化直接對應絕對溫度,需恒流源供電。
    的頭像 發表于 07-16 13:58 ?1667次閱讀
    MEMS中的<b class='flag-5'>三種</b>測溫方式

    開關電源三種控制模式:PWM/PFM/PSM

    摘要 本文詳細介紹了開關電源的三種主要調制方式:PWM(脈沖寬度調制)、PFM(脈沖頻率調制)和PSM(脈沖跨周期調制)。PWM通過調整脈沖寬度保持恒定頻率,適用于重負載,但輕負載效率低。PFM則在
    發表于 06-09 16:11

    HarmonyOS基礎組件:Button三種類型的使用

    中的Button相較于Android原生來說,功能比較豐富,擴展性高,減少了開發者的代碼數量,簡化了使用方式。不僅可以自定義圓角還支持三種樣式。 常用屬性 名稱 參數類型 描述 type
    的頭像 發表于 06-09 15:48 ?2614次閱讀
    HarmonyOS基礎組件:Button<b class='flag-5'>三種</b>類型的使用

    介紹三種常見的MySQL高可用方案

    在生產環境中,為了確保數據庫系統的連續可用性、降低故障恢復時間以及實現業務的無縫切換,高可用(High Availability, HA)方案至關重要。本文將詳細介紹三種常見的 MySQL 高可用
    的頭像 發表于 05-28 17:16 ?1241次閱讀

    【「# ROS 2智能機器人開發實踐」閱讀體驗】視覺實現的基礎算法的應用

    : 一、機器人視覺:從理論到實踐 第7章詳細介紹了ROS2在機器視覺領域的應用,涵蓋了相機標定、OpenCV集成、視覺巡線、二維碼識別以及深度學習目標檢測等內容。通過
    發表于 05-03 19:41

    雙極型極管放大電路的三種基本組態的學習課件免費下載

      本文檔的主要內容詳細介紹的是雙極型極管放大電路的三種基本組態的學習課件免費下載包括了:共集電極放大電路,共基極放大電路,三種基本組態
    發表于 04-11 16:39 ?37次下載

    redis三種集群方案詳解

    在Redis中提供的集群方案總共有三種(一般一個redis節點不超過10G內存)。
    的頭像 發表于 03-31 10:46 ?1534次閱讀
    redis<b class='flag-5'>三種</b>集群方案詳解

    GaN、超級SI、SiC這三種MOS器件的用途區別

    如果想要說明白GaN、超級SI、SiC這三種MOS器件的用途區別,首先要做的是搞清楚這三種功率器件的特性,然后再根據材料特性分析具體應用。
    的頭像 發表于 03-14 18:05 ?2723次閱讀

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發表于 03-13 07:34