国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

LSTM之父再次炮轟LeCun:你那5點

CVer ? 來源:新智元 ? 作者:新智元 ? 2022-11-30 14:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

【導讀】看起來,繼Gary Marcus之后,LeCun的「一生之敵」可能又要多上一個了!

最近,LSTM之父Jürgen Schmidhuber一言不合又跟LeCun干上了! 其實之前稍微熟悉這位暴脾氣大爺的同學都知道,特立獨行的Jürgen Schmidhuber和機器學習社區的幾位大佬級人物之間都有過不愉快。 尤其是當「那三個人」一起拿了個圖靈獎,而Schmidhuber卻沒有之后,這位老爺子就更氣了……

說到底Schmidhuber一直認為,現在這幾個ML領軍人物,什么Bengio、Hinton、LeCun,包括「GAN」之父Goodfellow等人,他們的很多所謂「開創性成果」都是自己先提出來的,而這些人在論文中根本就沒提過他。

0dc9283e-706d-11ed-8abf-dac502259ad0.png

為此,Schmidhuber曾經專門撰文把Bengio、Hinton、LeCun于2015年發在Nature上的綜述性文章「Deep Learning」一文拿出來批判過一番。

主要是說這篇文章里的成果,哪些東西是他先提的,哪些東西是別的前輩先提的,反正不是這仨作者先提的。 怎么又吵起來了?

回到這次事件起因,實際上是LeCun在9月份發的一條推文。 內容是對David Chalmers教授提問的回答:「在過去十年中,AI最重要的智力突破(新想法)是什么?」

0deb5ae4-706d-11ed-8abf-dac502259ad0.png

10月4日,Schmidhuber在他的博客上撰文怒斥:這5個「best idea」大部分都來自于我的實驗室,而且提出的時間要遠遠早于「10年」這個時間節點。 文中Schmidhuber詳細列舉了六大證據來支撐自己的論述。

0e027fbc-706d-11ed-8abf-dac502259ad0.png

但估計是因為看到的人太少,Schmidhuber又在11月22日發推,重新把這個「冷飯」炒了一遍。 然而,相比于上一次還算激烈的爭辯,這回LeCun連理都沒理……

0e1284fc-706d-11ed-8abf-dac502259ad0.png

LSTM之父擺出「六大證據」

1. 通過神經網絡(NN)自動生成標注的「自監督學習」:至少可以追溯到我1990-91年的工作。 (I) 通過預測編碼在一個循環神經網絡(RNN)中進行自監督的目標生成,來學習在多個時間尺度和抽象層次上壓縮數據序列。

在這里,一個「自動機」RNN學會了「預測下一個輸入」的前置任務,并將傳入數據流中的意外觀察作為目標發送給「分塊機」RNN,后者學習更高層次的規律性,隨后通過適當的訓練目標將其獲得的預測知識提煉回自動機中。 這大大促進了以前無法解決的序列分類的下游深度學習任務。

0e3db0e6-706d-11ed-8abf-dac502259ad0.png

(II) 通過GAN類型的內在動機進行自監督的標注生成,其中一個世界模型NN學習預測對抗性的、標注生成的、實驗發明的控制器NN的行為后果。

0e5c1edc-706d-11ed-8abf-dac502259ad0.png

此外,我于1990年發表的論文標題中,就已經出現了「自監督」的說法。

0e7d1d9e-706d-11ed-8abf-dac502259ad0.png

但是吧,在更早期(1978年)的論文中,也用到了這個詞……

0e9701b4-706d-11ed-8abf-dac502259ad0.png

2. 「ResNets」:實際上就是我早期提出的Highway Nets。但LeCun卻認為ResNets的智力「不深」,這讓我非常傷心。 在我提出Highway Nets之前,前饋網絡最多只有幾十層(20-30層),而Highway Nets是第一個真正的深度前饋神經網絡,有數百層。

0ec93d3c-706d-11ed-8abf-dac502259ad0.png

在1990年代,我的LSTM給有監督的遞歸NN帶來了基本無限的深度。在2000年代,LSTM啟發的Highway Nets給前饋NN帶來了深度。 由此帶來的是,LSTM已經成為20世紀被引用最多的NN,而Highway Nets(ResNet)是21世紀被引用最多的NN。 可以說,它們代表了深度學習的精髓,而深度學習就是關于NN的深度。

3. 「門控-》注意力-》動態連通圖」:至少可以追溯到我的Fast Weight Programmers和1991-93年的Key-Value Memory Networks(其中的「Key-Value」被稱為「FROM-TO」)。 1993年,我引入了現在使用的術語「注意力」。

0ef1d602-706d-11ed-8abf-dac502259ad0.png

不過值得注意的是,NN中的第一個乘法門可以追溯到1965年Ivakhnenko & Lapa的深度學習機。 4. 「Differentiable memory」:同樣可以追溯到我的Fast Weight Programmers或1991年的Key-Value Memory Networks。 像傳統計算機中那樣分離存儲和控制,但以端到端差分、自適應、完全神經的方式(而不是以混合方式)。

0f017e68-706d-11ed-8abf-dac502259ad0.png

5. 「置換等變模塊,例如多頭自注意力-》Transformer」:我在1991年發表了帶有線性化自注意的Transformer。相應的「注意力」術語(internal spotlights of attention)可以追溯到1993年。

0f15d994-706d-11ed-8abf-dac502259ad0.png

6. 「GAN是過去10年中最好的機器學習理念」 你提到的這個GAN(2014年)的原理,實際上是我在1990年以人工智能好奇心的名義提出的。

0f770b2e-706d-11ed-8abf-dac502259ad0.png

上一次,還是在幾個月之前

其實這已經不是Schmidhuber和LeCun之間今年第一次發生爭執了。 在六七月間,兩人就關于LeCun發表的一篇「自主機器智能未來方向」的展望報告有來有回地吵了一番。 6月27日,Yann LeCun發表了自己積蓄幾年的論文「A Path Towards Autonomous Machine Intelligence」,并稱其為「指明AI未來發展方向之作」。

0fac9d5c-706d-11ed-8abf-dac502259ad0.png

這篇論文系統講述了關于「機器如何能像動物和人類一樣學習」的問題,長達60多頁。 LeCun表示,此文不僅是自己關于未來5-10年內關于AI發展大方向的思考,也是自己未來幾年打算研究的內容,并希望能夠啟發AI界的更多人來一起研究。

0fbf7440-706d-11ed-8abf-dac502259ad0.png

而Schmidhuber大概提前十幾天就得知這個消息,并拿到了這篇論文,當即就寫了一篇文章反駁。 按照Schmidhuber自己在博客上文章的說法,當時事情是這樣的: 2022年6月14日,一家科學媒體發布消息,說LeCun在6月27日要發布一篇報告,給我發了一份報告的草稿(當時還在保密期),并要求我發表評論。 我寫了一篇評論,告訴他們這基本上是我們以前工作的翻版,而LeCun的文章中并沒有提到。 然而,我的意見被置若罔聞。

0fd45112-706d-11ed-8abf-dac502259ad0.png

實際上,早在他這篇東西發表以前,我們就提出了LeCun在這篇文中所謂的「主要原創貢獻」的大部分內容,主要有: (1) 「認知架構,其中所有模塊都是可分的,而且許多模塊是可訓練的」(我們在1990年提出)。 (2) 「預測世界模型的分層結構,在多個抽象層次和多個時間尺度上學習表征」 (我們在1991年提出)。 (3) 「自我監督的學習范式,產生同時具有信息性和可預測性的表征」(我們的模型自1997年起就用于強化學習和世界建模了) (4) 「用于不確定性下的分層規劃」的預測模型,包括基于梯度的神經子目標生成器(1990年)、抽象概念空間的推理(1997年)、「主要通過觀察學習行動」的神經網絡(2015年),以及學習思考(2015年),都是我們先提出的。 7月14日,Yann LeCun回應,說討論要有建設性,他是這么說的:

我不想陷入一場關于「某個概念是誰發明的」這種無謂爭論中,也不想在你的回應文章中列出的160個參考文獻中深究。我認為更有建設性的做法是,指出你認為可能包含我列出的4項貢獻中的觀點和方法的4篇出版物。 正如我在論文的開頭所說,有許多概念已經存在了很長時間,你和我都不是這些概念的發明人:比如,可微調世界模型的概念,可以追溯到早期的優化控制工作。 訓練世界模型利用神經網絡學習世界模型的系統識別,這個想法可以追溯到80年代末,由Michael Jordan, Bernie Widrow, Robinson & Fallside, Kumpathi Narendra, Paul Werbos進行的工作,都比你的工作早。

在我看來,這個稻草人式的回答似乎是LeCun在轉移話題,對他的所謂「主要原創貢獻」中貪他人之功的問題避而不談。 我在7月14日回復: 關于你說的「你我都沒有發明的東西」:你的論文聲稱,用神經網絡進行系統識別可以追溯到20世紀90年代初。然而,在你的之前的回應中,你似乎同意我的觀點:這方面的第一篇論文出現在1980年代。 至于你的「主要原創貢獻」,實際上都用了我早年間的工作成果。 (一) 關于你提出的「認知架構,其中所有模塊都是可分化的,且許多模塊都是可訓練的」,「通過內在動機驅動行為」: 我在1990年就提出了用于在線學習和規劃的可分化架構,這是第一個具有 「內在動機」的控制器,用以改善世界模型,它既是生成性的,也是對抗性的;你文中引用的2014年的GAN是這個模型的一個衍生版本。 (二)關于你提出的 「在多個抽象層次和時間尺度上學習表征的預測性世界模型的分層結構」: 這是由我1991年的神經歷史壓縮機實現的。它使用預測編碼,以自監督的方式學習長序列數據的分層內部表征,大大促進了下游的學習。使用我1991年的神經網絡提煉程序,這些表征可以被折疊成一個單一的循環神經網絡(RNN)。 (三)關于你在控制方面的「自監督學習范式,產生同時具有信息性和可預測性的表征」: 這一點我在1997年提出構建的系統中已經提出。它不是預測未來輸入的所有細節,而是可以提出任意的抽象問題,并在你所說的「表征空間」中給出可計算的答案。在這個系統中,兩個名為「左腦」和「右腦」的學習模型,選擇獎勵最大化的對手進行零和博弈,偶爾還會在這種計算實驗的結果上打賭。 (四)關于你的可用于不確定情況下的分層規劃預測性可微分模型,你的文章里是這么寫的: 「一個尚未回答的問題是,配置器如何學習將一個復雜的任務分解為一連串可以由智能體單獨完成的子目標。我將把這個問題留給未來的調查。」 就別說什么未來了,實際上我在30多年前就發表過這樣的文章: 一個控制器神經網絡負責獲得額外的命令輸入,其形式為(開始,目標)。一個評估器神經網絡負責學習預測從開始到目標的預期成本。一個基于可微調循環神經網絡的子目標生成器看到了這個(開始,目標)的輸入,并使用評估器神經網絡,通過梯度下降學習一系列成本最小的中間子目標。 (五)你還強調了 「主要通過觀察來學習行為」的神經網絡。實際上我們很早就解決了這個問題,比2015年這篇文章,討論了部分可觀察環境中強化學習(RL)的一般問題。

1005b9aa-706d-11ed-8abf-dac502259ad0.png

世界模型M可能擅長預測一些事情,但對其他事情不確定。控制器C通過學習通過自我發明的問題序列(激活模式)來查詢并解釋答案(更多的激活模式)來最大化其目標函數。 C可以從學習從M中提取任何類型的算法信息中獲益,比如用于分層規劃和推理,利用M中編碼的被動觀察等等。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107779
  • LSTM
    +關注

    關注

    0

    文章

    63

    瀏覽量

    4382

原文標題:LSTM之父再次炮轟LeCun:你那5點"創新"都是抄我的!卻慘遭「已讀不回」...

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    用 1024 顆 LED 點亮像素創意!涂鴉 T5 AI 像素屏方案,高密度·高兼容·全開源

    在嵌入式開發中,一塊可高度自定義的智能顯示屏,無疑是許多開發者的夢想畫布。如果熱愛像素藝術的復古趣味,又想玩轉AI語音交互,這款高密度像素屏絕對是的理想項目。涂鴉T5AI像素屏
    的頭像 發表于 01-29 18:11 ?192次閱讀
    用 1024 顆 LED 點亮像素創意!涂鴉 T<b class='flag-5'>5</b> AI 像素屏方案,高密度·高兼容·全開源

    激光雷達云為什么會出現吸現象?

    相信各位在開車時一定遇到過這么一個場景,有一個很小的障礙物在車前,當障礙物非常靠近車輛時,在駕駛位置上是完全看不到的,這就是俗稱的“盲區”。對于激光雷達來說,也會出現類似的問題,當障礙物離激光雷達足夠近時,它也會出現“盲區”,這一現象被稱為“吸”。
    的頭像 發表于 12-31 16:28 ?3445次閱讀

    一文讀懂LSTM與RNN:從原理到實戰,掌握序列建模核心技術

    在AI領域,文本翻譯、語音識別、股價預測等場景都離不開序列數據處理。循環神經網絡(RNN)作為最早的序列建模工具,開創了“記憶歷史信息”的先河;而長短期記憶網絡(LSTM)則通過創新設計,突破
    的頭像 發表于 12-09 13:56 ?1382次閱讀
    一文讀懂<b class='flag-5'>LSTM</b>與RNN:從原理到實戰,掌握序列建模核心技術

    5G網絡通信有哪些技術痛

    ,這些技術使得5G網絡能夠滿足未來物聯網、智能制造、自動駕駛等領域對高速、低時延、高可靠性的通信需求。 5G網絡通信有哪些技術痛5G網絡通信經過多年的高速發展,仍有一些技術痛
    發表于 12-02 06:05

    電流傳感器上0.7%的精度,到底在爭什么?

    行業競相追逐組件效率百分之零幾提升的今天,電流傳感器這個看似普通的元器件,正在經歷一場靜悄悄的技術變革。從一個具體問題開始事情發生在華東某分布式光伏項目。技術
    的頭像 發表于 11-19 11:43 ?818次閱讀
    電流傳感器上<b class='flag-5'>那</b>0.7%的精度,到底在爭什么?

    避坑指南!RK3568開發板選型,這5沒看清千萬別下手!(附迅為驅動開發指南資源)

    避坑指南!RK3568開發板選型,這5沒看清千萬別下手!(附迅為驅動開發指南資源)
    的頭像 發表于 10-30 15:49 ?783次閱讀
    避坑指南!RK3568開發板選型,這<b class='flag-5'>5</b><b class='flag-5'>點</b>沒看清千萬別下手!(附迅為驅動開發指南資源)

    libmodbus庫問題:TCP模式下客戶端超時斷開后無法再次重連怎么解決?

    進行一次收發后斷開連接,再次啟動短連接進行通訊時被提示:”服務器拒絕“ 綜上2種情況,libmodbus該如何修改才能讓支持讓斷開的客戶端再次連接? =
    發表于 10-14 08:17

    華為重磅發布5G-AxAI樣板

    近日,華為在上海練秋湖研發中心發布5G-AxAI樣板。該樣板全方位展示了基于5G-A大上行、大下行、低時延和大物聯等能力的五智聯商業成果—人智聯、家智聯、物智聯、車智聯、行業智聯,
    的頭像 發表于 10-11 11:28 ?988次閱讀

    Mark的防呆設計

    什么是Mark?Mark是PCB加工和貼片過程中用于機器視覺定位的一種標記。它幫助貼片機、焊接機等設備準確識別電路板的位置和方向,確保組裝精度。Mark的防呆設計Mark
    的頭像 發表于 08-01 18:32 ?1454次閱讀
    Mark<b class='flag-5'>點</b>的防呆設計

    如何監聽組件再次顯示的事件?

    能是預覽器的問題……不過這個方案終究還是不可取的,因為還要考慮到,子組件里不光是動畫,還會有數據加載頁面渲染等等一堆事情,不可能每次切換過來都把這些事情執行一遍的。 最后我在文檔里發現了這么一個東西
    發表于 06-30 18:02

    世界模型:多模態融合+因果推理,解鎖AI認知邊界

    ,自然地學習世界運作方式的知識。深度學習之父 Yann LeCun 認為,世界模型是通往通用人工智能(AGI)的重要路徑之一。 ? 世界模型 的 關鍵技術 和應用場景 ? 世界模型是智能體對環境的內部表征,其核心在于通過多模態數據構建動態系統
    的頭像 發表于 06-23 04:49 ?4055次閱讀

    默默無聞的是否想創業

    心有余而力不足,故特發此信。 不管你是電子領域的大佬,還是初出學堂的小白,只要你在電子方面有足夠的自信,不甘默默無聞,三一線了此一生,請聯系我微電同號15286651822;如果現在身價百萬
    發表于 06-08 12:21

    華為攜手兩大運營商再次刷新5G上行速率

    1.1Gbps,再次刷新了5G上行速率的高度。此前,2024年8月廣東電信測試的5G單用戶上行速率達到1.0Gbps,此次突破標志著華為5G基站的上行鏈路能力達到一個新的高峰。
    的頭像 發表于 05-21 16:17 ?1141次閱讀

    自動駕駛中常提的“云”是個啥?

    [首發于智駕最前沿微信公眾號]在自動駕駛系統中,云技術作為三維空間感知的核心手段,為車輛提供了精確的距離和形狀信息,從而實現目標檢測、環境建模、定位與地圖構建等關鍵功能。所謂的“云”,到底是個
    的頭像 發表于 05-21 09:04 ?1139次閱讀
    自動駕駛中常提的“<b class='flag-5'>點</b>云”是個啥?

    天合光能再次獲得法國碳足跡認證

    近日,天合光能再次獲得法國權威機構Certisolis頒發的碳足跡認證,產品碳足跡低至300 kg eq CO?/kWc,達到了目前晶硅組件碳足跡的最低水平,全面符合法國能源監管委員會(CRE)對光
    的頭像 發表于 05-16 11:12 ?800次閱讀