国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從四個經典角度看機器學習的本質

DPVg_AI_era ? 來源:cc ? 2019-02-13 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

何謂“機器學習”,學界尚未有統一的定義。本文摘取Tom Mitchell、Christopher M. Bishop、去年出版的《深度學習》和側重實戰的《數據挖掘》,總結了四種機器學習主流定義。更好地研究“機器學習”,并繼續擴展和完善它的定義,也有助于我們理解機器學習的本質。

你或許已經讀過許多關于機器學習的深度和和半深度的文章,并探討了機器學習與眾多其他主題的關系。在討論如此復雜的概念時,回到最初的一些共同參考資料總是一個好主意;問題是,對于機器學習這樣的主題,存在無數這樣的參考資料。

所以我想,為什么不研究一下這些參考點呢?

這是一篇不那么嚴肅的帖子,旨在探討機器學習的本質。

話不多說,作為一個看似屬于語義學的練習,讓我們來探索一下關于機器學習的定義。

Tom Mitchell:根據優化過程抽象定義機器學習

第一個定義,是我個人最喜歡的,來自著名的計算機科學家、機器學習研究者,卡內基梅隆大學的 Tom Mitchell 教授。

對于某類任務 T 和性能度量 P,如果一個計算機程序在 T 上以 P 衡量的性能隨著經驗 E 而自我完善,那么我們稱這個計算機程序在從經驗 E 中學習。[1]

Mitchell 的這個定義在機器學習領域是眾所周知的,并且經受了時間的考驗。這句話首次出現在他 1997 年出版的Machine Learning一書中。

這句話對我個人產生了很大的影響,多年來我多次提到它,并在碩士論文中引用了這個定義。在 Goodfellow, Bengio & Courville 最近出版的權威著作《深度學習》(Deep Learning) 的第 5 章中,這段引文也占據了突出位置,成為該書對學習算法的解釋的出發點。

下圖是 Mitchell 定義的圖示:

圖 1:The Mitchell Paradigm

“花書”《深度學習》:論計算在機器學習中的重要性

說到 Goodfellow、Bengio 和 Courville,就不得不提他們合著的《深度學習》,這本書對機器學習是這樣定義的:

機器學習本質上屬于應用統計學,更多地關注如何用計算機統計地估計復雜函數,不太關注為這些函數提供置信區間。[2]

Mitchell 對機器學習的定義在應用中不再適用;它側重于優化過程的具體組成部分,這些組成部分通常與機器學習有關,但它沒有規定應該如何在實踐中接近它。

《深度學習》中對機器學習的定義在本質上要規范得多,它指出計算能力得到了利用 (實際上強調了對計算能力的使用),而傳統的統計概念置信區間則不再強調。

實戰數據挖掘:“學習”必須是有意地去學習

在我看來,另一個特別值得注意的關于機器學習的定義來自 Witten, Frank & Hall 所著的《數據挖掘:實用機器學習工具與技術》,這是我第一本完整閱讀了的關于這個主題的書。

《數據挖掘》這本書很少涉及數學,但有很多實用性的解釋。對于剛進入機器學習領域的人,“數據挖掘” 很長一段時間是我的首選推薦。

作者對機器學習最初定義有點零散,他們試圖在機器學習和數據挖掘的背景中將學習、性能和知識這些概念編織在一起。但其中一些語句值得注意:

我們感興趣的是在新的情況下得到性能的改進,或至少有性能改進的潛力。

當系統以一種使它們在未來表現更好的方式改變自己的行為時,它們就會學習。

學習意味著思考和目標。學習必須是有意地去學習。

經驗表明,在機器學習和數據挖掘的許多應用中,所獲得的顯式知識結構、結構描述,至少與在新實例中表現良好的能力同等重要。人們經常使用數據挖掘來獲取知識,而不僅僅是用來預測。

“數據挖掘”這個術語被用作機器學習的補充術語。上面引用的語句出自這本書的第三版,出版于 2011 年,當時數據挖掘這個詞比現在更有吸引力;即使不說是引用自數據挖掘的書,上面所寫的內容對機器學習本身也適用。

Witten, Frank & Hall 為機器學習的定義提供了一個不同的角度:Mitchell 專注于優化過程的特定組成部分,Goodfellow, Bengio & Courville 傾向于一種更規范的定義,并強調計算能力的相對重要性,這個定義則嘗試側重 “learning” 的哪些方面在機器學習過程中是類似和重要的。

上面引用的語句還提供了一個重要的點,兼具實用性和哲學性,即最后一段,指出獲得知識和使用這些知識的能力都是機器學習的重要方面。

Christopher Bishop:從算法的角度定義

最后,讓我們來看 Christopher Bishop 在《模式識別和機器學習》一書中對機器學習的定義。值得注意的是,Bishop 沒有開門見山地定義這個術語,但是很好地隱式地提供了以算法為中心的機器學習的定義 (在一個數字分類任務中討論到):

機器學習算法的結果表示為一個函數 y (x),它以一個新的數字的圖像 x 作為為輸入,產生向量 y,與 target vector 的形式相同。

函數 y (x) 的精確形式是在訓練階段(trainingphase) 確定的,也稱為學習階段 (learningphase),以訓練數據為基礎。

一旦模型被訓練出來,就可以用來判斷新的數字圖像 (新樣本) 對應的標簽,這些新樣本的集合被稱為測試集。

正確分類與訓練集不同的新樣本的能力叫做泛化(generalization)。在實際應用中,輸入向量的可變性使得訓練數據只能包含所有可能輸入向量的很小一部分,因此泛化是模式識別的一個中心目標。[4]

首先,除了我們討論的機器學習是有監督學習,而不是無監督學習或強化學習 (或其他形式的機器學習) 外,上面的引用對 “模式識別” 沒有更多的解釋。

其次,也是更重要的一點,這是唯一對機器學習所需步驟逐步處理的定義,無論這些步驟在這個例子中可能多么簡短。

同樣有趣的是,隨后的頁面,以及 Bishop 的書一半的篇幅概述了許多額外的機器學習概念,并將它們很好地結合在一起,提供了具有可讀性的介紹,而不至于陷入數學的困境 (書中的其余部分解釋了數學)。

這樣,我們已經有四種方法來定義機器學習:一種是根據它的優化過程,抽象地定義它機器學習;第二種更有規范性,并指出計算在機器學習中的重要性;第三定義側重于“學習”的哪些方面在機器學習過程中是類似的和重要的;最后一個定義從算法的角度概述了機器學習。

這些定義都不是不正確,但都不完整。探討先驅者和受人尊敬的研究人員所認為的 “機器學習”,將擴展我們自己對機器學習的定義。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136931
  • 深度學習
    +關注

    關注

    73

    文章

    5598

    瀏覽量

    124396

原文標題:機器學習的本質是什么?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PCBA生產過程的四個主要環節?

    PCBA生產過程的四個主要環節 PCBA(Printed Circuit Board Assembly)生產過程是將電子元器件組裝到印刷電路板(PCB)上,形成完整電子產品的過程。雖然直接參考資料
    的頭像 發表于 03-05 11:13 ?123次閱讀

    再談低溫燒結銀的應用:春晚機器人出鏡的幕后推手說起

    戴:10萬次彎折電阻穩定,適配柔性基材。 光伏逆變器:壽命10萬小時延至15萬小時,多發電5季度。 、春晚機器人與低溫燒結銀:產業共振 1技術驗證:春晚高動態、高可靠場景,是低溫
    發表于 02-17 14:07

    架構到驅動:這三本經典書,承包了我的嵌入式Linux入門與進階

    私房菜(基礎學習篇 第版)》《Linux 設備驅動開發(第 2 版)》,這三本書恰好構成了 “底層架構” 到 “系統基礎” 再到 “驅動開發” 的完整學習鏈路。
    的頭像 發表于 02-09 17:02 ?1152次閱讀

    合科泰MOSFET選型的四個核心步驟

    面對數據手冊中繁雜的參數,如何快速鎖定適合應用的 MOSFET?遵循以下四個核心步驟,您能系統化地完成選型,避免因關鍵參數遺漏導致的設計風險。
    的頭像 發表于 12-19 10:33 ?725次閱讀

    自動駕駛中常提的“強化學習”是啥?

    下,就是一智能體在環境里行動,它能觀察到環境的一些信息,并做出一動作,然后環境會給出一反饋(獎勵或懲罰),智能體的目標是把長期得到的獎勵累積到最大。和監督學習不同,強化
    的頭像 發表于 10-23 09:00 ?662次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學習</b>”是<b class='flag-5'>個</b>啥?

    如何 MCU/MPU 角度保護物聯網應用?

    如何 MCU/MPU 角度保護物聯網應用?
    發表于 09-08 07:33

    多個角度分析什么是自承式光纜

    自承式光纜是一種無需額外支撐結構即可自行承受自身重量及外部負荷的特殊光纜,其核心在于通過內置承重元件實現架空敷設的獨立性。以下結構、類型、應用場景及優勢四個方面進行詳細說明: 一、結構設計 自承式
    的頭像 發表于 08-22 09:48 ?2488次閱讀

    技術角度,一款優秀的煮蛋器 PCBA 方案能帶來哪些體驗升級?

    作為一每天早餐離不開雞蛋的人,用過不下十款煮蛋器后發現:決定產品體驗的核心,往往藏在看不見的 PCBA 方案里。最近入手的新款煮蛋器,讓我真切感受到了技術迭代帶來的差異。 一、溫控精度:
    的頭像 發表于 07-14 11:10 ?456次閱讀

    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關端口 skyworksinc

    電子發燒友網為你提供()用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關端口相關產品參數、數據手冊,更有
    發表于 05-28 18:33
    用于 GSM/ GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個</b>線性 TRx 開關端口 skyworksinc

    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關端口 skyworksinc

    電子發燒友網為你提供()用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx 頻前端模塊,帶四個線性 TRx 開關端口相關產品參數、數據手冊,更有
    發表于 05-28 18:33
    用于 GSM/GPRS (824-915 MHz) (1710-1910 MHz) 的 Tx-Rx <b class='flag-5'>四</b>頻前端模塊,帶<b class='flag-5'>四個</b>線性 TRx 開關端口 skyworksinc

    用于頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有四個線性 TRx 開關端口和雙頻 TD-SCDMA skyworksinc

    電子發燒友網為你提供()用于頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有四個線性 TRx 開關端口和雙頻 TD-SCDMA相關產品參數、數據手冊,更有用于頻 GSM
    發表于 05-28 18:31
    用于<b class='flag-5'>四</b>頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,具有<b class='flag-5'>四個</b>線性 TRx 開關端口和雙頻 TD-SCDMA skyworksinc

    ADAU1787四個ADC、兩DAC、帶音頻DSP的低功耗編解碼器技術手冊

    ADAU1787 是一款具有四個輸入和兩輸出的編解碼器,其中整合了兩個數字信號處理器 (DSP)。模擬輸入到 DSP 內核再到模擬輸出的路徑已針對低延遲進行優化,適用于噪聲消除耳機。通過加入少量無源組件,ADAU1787 提
    的頭像 發表于 05-12 14:57 ?1513次閱讀
    ADAU1787<b class='flag-5'>四個</b>ADC、兩<b class='flag-5'>個</b>DAC、帶音頻DSP的低功耗編解碼器技術手冊

    PLC產品故障問題測試的四個部分

    ,必須對故障問題進行系統化測試。本文將詳細介紹PLC產品故障問題測試的四個關鍵部分,幫助技術人員快速定位和解決問題。 一、硬件測試 硬件測試是PLC故障診斷的首要環節,主要針對PLC設備的物理部件進行檢查。首先,需要檢查電源模塊是否
    的頭像 發表于 05-11 17:00 ?1765次閱讀
    PLC產品故障問題測試的<b class='flag-5'>四個</b>部分

    四個方面深入剖析富捷電阻的優勢

    理成本的電阻產品系列,為電子行業提供了一可靠的選擇。本文將從產品結構、同業對比、成本分析以及品質保障四個方面深入剖析富捷電阻的優勢,展現其如何在激烈的市場競爭中脫穎而出。
    的頭像 發表于 05-09 10:47 ?1090次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>四個</b>方面深入剖析富捷電阻的優勢

    四個輪子到兩條腿:汽車工廠的 “新工人”

    在全球汽車產業加速向電動化、智能化轉型的浪潮中,一令人矚目的跨界趨勢正悄然興起 —— 車企紛紛涉足人形機器人領域。這一轉變絕非偶然的跟風之舉,而是在產業變革壓力下,車企為尋求新的增長曲線、重構核心
    的頭像 發表于 04-24 09:57 ?882次閱讀
    <b class='flag-5'>從</b><b class='flag-5'>四個</b>輪子到兩條腿:汽車工廠的 “新工人”