国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機領域三巨頭聯手再發萬字長文

新機器視覺 ? 來源:新智元 ? 作者:ACM ? 2021-07-05 10:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

極市導讀2018圖靈獎獲得者Yoshua Bengio, Yann LeCun和Geoffrey Hinton再次受ACM邀請共聚一堂,共同回顧了深度學習的基本概念和一些突破性成果,講述了深度學習的起源、發展及未來的發展面臨的挑戰。

2018年,ACM(國際計算機學會)決定將計算機領域的最高獎項圖靈獎頒給Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton,以表彰他們在計算機深度學習領域的貢獻。

這也是圖靈獎第三次同時頒給三位獲獎者。 用于計算機深度學習的人工神經網絡在上世紀80年代就已經被提出,但是在當時科研界由于其缺乏理論支撐,且計算力算力有限,導致其一直沒有得到相應的重視。

是這三巨頭一直在堅持使用深度學習的方法,并在相關領域進行了深入研究。通過實驗發現了許多驚人的成果,并為證明深度神經網絡的實際優勢做出了貢獻。

所以說他們是深度學習之父毫不夸張。 在AI界,當Yoshua Bengio、Yann LeCun 和 Geoffrey Hinton 這三位大神同時出場的時候,一定會有什么大事發生。 最近,深度學習三巨頭受ACM通訊雜志之邀,共同針對深度學習的話題進行了一次深度專訪,提綱挈領地回顧了深度學習的基本概念、最新的進展,以及未來的挑戰。 廣大的AI開發者們,看了高人指點之后是不是對于未來之路更加明晰了?下面我們來看看他們都聊了些什么。

深度學習的興起

在2000年代早期,深度學習引入的一些元素,讓更深層的網絡的訓練變得更加容易,也因此重新激發了神經網絡的研究。

GPU和大型數據集的可用性是深度學習的關鍵因素,也得到了具有自動區分功能、開源、靈活的軟件平臺(如Theano、Torch、Caffe、TensorFlow等)的增強作用。訓練復雜的深度網絡、重新使用最新模型及其構建塊也變得更加容易。而更多層網絡的組合允許更復雜的非線性,在感知任務中取得了意料之外的結果。

深度學習深在哪里?有人認為,更深層次的神經網絡可能更加強大,而這種想法在現代深度學習技術出現之前就有了。但是,這樣的想法其實是由架構和訓練程序的不斷進步而得來的,并帶來了與深度學習興起相關的顯著進步。 更深層的網絡能夠更好地概括「輸入-輸出關系類型」,而這不僅只是因為參數變多了。

深度網絡通常比具有相同參數數量的淺層網絡具有更好的泛化能力。例如,時下流行的計算機視覺卷積網絡架構類別是ResNet系列,其中最常見的是ResNet-50,有50層。

深度網絡之所以能夠脫穎而出,是因為它利用了一種特定形式的組合性,其中一層的特征以多種不同的方式組合,這樣在下一層就能夠創建更多的抽象特征。 無監督的預訓練。當標記訓練示例的數量較小,執行任務所需的神經網絡的復雜性也較小時,能夠使用一些其他信息源來創建特征檢測器層,再對這些具有有限標簽的特征檢測器進行微調。

在遷移學習中,信息源是另一種監督學習任務,具有大量標簽。但是也可以通過堆疊自動編碼器來創建多層特征檢測器,無需使用任何標簽。

線性整流單元的成功之謎。早期,深度網絡的成功,是因為使用了邏輯sigmoid非線性函數或與之密切相關的雙曲正切函數,對隱藏層進行無監督的預訓練。 長期以來,神經科學一直假設線性整流單元,并且已經在 RBM 和卷積神經網絡的某些變體中使用。

讓人意想不到的是,人們驚喜地發現,非線性整流通過反向傳播和隨機梯度下降,讓訓練深度網絡變得更加便捷,無需進行逐層預訓練。這是深度學習優于以往對象識別方法的技術進步之一。 語音和物體識別方面的突破。聲學模型將聲波轉換為音素片段的概率分布。Robinson、Morgan 等人分別使用了晶片機和DSP芯片,他們的嘗試均表明,如果有足夠的處理能力,神經網絡可以與最先進的聲學建模技術相媲美。

2009年,兩位研究生使用 NVIDIA GPU ,證明了預訓練的深度神經網絡在 TIMIT 數據集上的表現略優于 SOTA。這一結果重新激起了神經網絡中幾個主要語音識別小組的興趣。

2010 年,在不需要依賴說話者訓練的情況下,基本一致的深度網絡能在大量詞匯語音識別方面擊敗了 SOTA 。2012 年,谷歌顯著改善了 Android 上的語音搜索。這是深度學習顛覆性力量的早期證明。

大約在同一時間,深度學習在 2012 年 ImageNet 競賽中取得了戲劇性的勝利,在識別自然圖像中的一千種不同類別的物體時,其錯誤率幾乎減半。這場勝利的關鍵在于,李飛飛及其合作者為訓練集收集了超過一百萬張帶標簽的圖像,以及Alex Krizhevsky 對多個 GPU 的高效使用。

深度卷積神經網絡具有新穎性,例如,ReLU能加快學習,dropout能防止過度擬合,但它基本上只是一種前饋卷積神經網絡,Yann LeCun 和合作者多年來一直都在研究。 計算機視覺社區對這一突破的反應令人欽佩。證明卷積神經網絡優越性的證據無可爭議,社區很快就放棄了以前的手工設計方法,轉而使用深度學習。

深度學習近期的主要成就

三位大神選擇性地討論了深度學習的一些最新進展,如軟注意力(soft attention)和Transformer 架構。 深度學習的一個重大發展,尤其是在順序處理方面,是乘法交互的使用,尤其是軟注意力的形式。這是對神經網絡工具箱的變革性補充,因為它將神經網絡從純粹的矢量轉換機器,轉變為能夠動態選擇對哪些輸入進行操作的架構,并且將信息存儲在關聯存儲器中。

這種架構的關鍵特性是,它們能有效地對不同類型的數據結構進行操作。 軟注意力可用于某一層的模塊,可以動態選擇它們來自前一層的哪些向量,從而組合,計算輸出。這可以使輸出獨立于輸入的呈現順序(將它們視為一組),或者利用不同輸入之間的關系(將它們視為圖形)。

Transformer 架構已經成為許多應用中的主導架構,它堆疊了許多層“self-attention”模塊。同一層中對每個模塊使用標量積來計算其查詢向量與該層中其他模塊的關鍵向量之間的匹配。匹配被歸一化為總和1,然后使用產生的標量系數來形成前一層中其他模塊產生的值向量的凸組合。結果向量形成下一計算階段的模塊的輸入。

模塊可以是多向的,以便每個模塊計算幾個不同的查詢、鍵和值向量,從而使每個模塊有可能有幾個不同的輸入,每個輸入都以不同的方式從前一階段的模塊中選擇。在此操作中,模塊的順序和數量無關緊要,因此可以對向量集進行操作,而不是像傳統神經網絡中那樣對單個向量進行操作。例如,語言翻譯系統在輸出的句子中生成一個單詞時,可以選擇關注輸入句子中對應的一組單詞,與其在文本中的位置無關。

未來的挑戰

深度學習的重要性以及適用性在不斷地被驗證,并且正在被越來越多的領域采用。對于深度學習而言,提升它的性能表現有簡單直接的辦法——提升模型規模。 通過更多的數據和計算,它通常就會變得更聰明。比如有1750億參數的GPT-3大模型(但相比人腦中的神經元突觸而言仍是一個小數目)相比只有15億參數的GPT-2而言就取得了顯著的提升。

但是三巨頭在討論中也透露到,對于深度學習而言仍然存在著靠提升參數模型和計算無法解決的缺陷。 比如說與人類的學習過程而言,如今的機器學習仍然需要在以下幾個方向取得突破: 1、監督學習需要太多的數據標注,而無模型強化學習又需要太多試錯。對于人類而言,像要學習某項技能肯定不需要這么多的練習。

2、如今的系統對于分布變化適應的魯棒性比人類差的太遠,人類只需要幾個范例,就能夠快速適應類似的變化。

3、如今的深度學習對于感知而言無疑是最為成功的,也就是所謂的系統1類任務,如何通過深度學習進行系統2類任務,則需要審慎的通用步驟。在這方面的研究令人期待。 在早期,機器學習的理論學家們始終關注于獨立相似分布假設,也就是說測試模型與訓練模型服從相同的分布。

而不幸的是,在現實世界中這種假設并不成立:比如說由于各種代理的行為給世界帶來的變化,就會引發不平穩性;又比如說總要有新事物去學習和發現的學習代理,其智力的界限就在不斷提升。 所以現實往往是即便如今最厲害的人工智能,從實驗室投入到實際應用中時,其性能仍然會大打折扣。

所以三位大神對于深度學習未來的重要期待之一,就是當分布發生變化時能夠迅速適應并提升魯棒性(所謂的不依賴于分布的泛化學習),從而在面對新的學習任務時能夠降低樣本數量。 如今的監督式學習系統相比人類而言,在學習新事物的時候需要更多的事例,而對于無模型強化學習而言,這樣的情況更加糟糕——因為相比標注的數據而言,獎勵機制能夠反饋的信息太少了。

所以,我們該如何設計一套全新的機械學習系統,能夠面對分布變化時具備更好的適應性呢? 從同質層到代表實體的神經元組 如今的證據顯示,相鄰的神經元組可能代表了更高級別的向量單元,不僅能夠傳遞標量,而且能夠傳遞一組坐標值。這樣的想法正是膠囊架構的核心,在單元中的元素與一個向量相關聯,從中可以讀取關鍵向量、數值向量(有時也可能是一個查詢向量)。

適應多個時間尺度 大多數神經網絡只有兩個時間尺度:權重在許多示例中適應得非常慢,而行為卻在每個新輸入中對于變化適應得非常快速。通過添加快速適應和快速衰減的“快速權重”的疊加層,則會讓計算機具備非常有趣的新能力。

尤其是它創建了一個高容量的短期存儲,可以允許神經網絡執行真正的遞歸,,其中相同的神經元可以在遞歸調用中重復使用,因為它們在更高級別調用中的活動向量可以重建稍后使用快速權重中的信息。 多時間尺度適應的功能在元學習(meta-learning)中正在逐漸被采納。

更高層次的認知 在考慮新的任務時,例如在具有不一樣的交通規則的城市中駕駛,甚至想象在月球上駕駛車輛時,我們可以利用我們已經掌握的知識和通用技能,并以新的方式動態地重新組合它們。 但是當我們采用已知的知識來適應一個新的設置時,如何避免已知知識對于新任務帶來的噪音干擾?

開始步驟可以采用Transformer架構和復發獨立機制Recurrent Independent Mechanisms)。 對于系統1的處理能力允許我們在計劃或者推測時猜測潛在的好處或者危險。但是在更高級的系統級別上,可能就需要AlphaGo的蒙特卡羅樹搜索的價值函數了。

機械學習依賴于歸納偏差或者先驗經驗,以鼓勵在關于世界假設的兼容方向上學習。系統2處理處理的性質和他們認知的神經科學理論,提出了幾個這樣的歸納偏差和架構,可以來設計更加新穎的深度學習系統。那么如何訓練神經網絡,能夠讓它們發現這個世界潛在的一些因果屬性呢?

在20世紀提出的幾個代表性的AI研究項目為我們指出了哪些研究方向?顯然,這些AI項目都想要實現系統2的能力,比如推理能力、將知識能夠迅速分解為簡單的計算機運算步驟,并且能夠控制抽象變量或者示例。這也是未來AI技術前進的重要方向。 聽完三位的探討,大家是不是覺得在AI之路上,光明無限呢?

參考資料:https://cacm.acm.org/magazines/2021/7/253464-deep-learning-for-ai/fulltext

本文亮點總結

1.深度學習的一個重大發展,尤其是在順序處理方面,是乘法交互的使用,尤其是軟注意力的形式。這是對神經網絡工具箱的變革性補充,因為它將神經網絡從純粹的矢量轉換機器,轉變為能夠動態選擇對哪些輸入進行操作的架構,并且將信息存儲在關聯存儲器中。這種架構的關鍵特性是,它們能有效地對不同類型的數據結構進行操作。

2.三位大神對于深度學習未來的重要期待之一,就是當分布發生變化時能夠迅速適應并提升魯棒性(所謂的不依賴于分布的泛化學習),從而在面對新的學習任務時能夠降低樣本數量。

—版權聲明—

來源:新智元

僅用于學術分享,版權屬于原作者。

若有侵權,請聯系微信號刪除或修改!

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5194

    瀏覽量

    135474
  • 計算機
    +關注

    關注

    19

    文章

    7807

    瀏覽量

    93204
  • 人工神經網絡

    關注

    1

    文章

    120

    瀏覽量

    15126
  • 深度學習
    +關注

    關注

    73

    文章

    5599

    瀏覽量

    124400

原文標題:Hinton,Lecun和Bengio三巨頭聯手再發萬字長文:深度學習的昨天、今天和明天

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    工控機與普通計算機的核心差異解析

    在工業自動化和智能制造領域計算機設備作為核心控制單元,其選擇直接影響整個系統的穩定性與可靠性。工控機與普通計算機雖同屬計算設備,但其設計目標、性能側重和應用場景存在根本性差異。準確理
    的頭像 發表于 11-25 14:45 ?1786次閱讀
    工控機與普通<b class='flag-5'>計算機</b>的核心差異解析

    李飛飛萬字長文:空間智能是AI的下一個十年

    1950年,當計算機不過是自動化算術和簡單邏輯的代名詞時,艾倫·圖靈提出了一個至今仍有回響的問題:機器能思考嗎?他以非凡
    的頭像 發表于 11-19 21:20 ?1045次閱讀
    李飛飛<b class='flag-5'>萬字長文</b>:空間智能是AI的下一個十年

    萬字長文AI智能體:17種體架構詳細實現

    數據科學AI智能體領域發展迅猛,但許多資源仍然過于抽象和理論化。創建此項目的目的是為開發者、研究人員和AI愛好者提供一條結構化、實用且深入的學習路徑,以掌握構建智能系統的藝術。
    的頭像 發表于 11-07 13:16 ?559次閱讀
    <b class='flag-5'>萬字長文</b>AI智能體:17種體架構詳細實現

    2025中國計算機大會DPU技術論壇成功舉辦

    近日,備受矚目的第22屆中國計算機大會(CNCC2025)在哈爾濱開幕。本屆大會注冊人數突破1.2人,匯聚了來自全球計算機領域的頂尖學者、產業領袖、青年學子及國際組織代表。大會以“數
    的頭像 發表于 11-02 09:29 ?715次閱讀

    Redis Sentinel和Cluster模式如何選擇

    在我十年的運維生涯中,見過太多團隊在Redis集群方案選擇上踩坑。有的團隊盲目追求"高大上"的Cluster模式,結果運維復雜度爆表;有的團隊死守Sentinel不放,最后擴展性成了瓶頸。今天,我想通過這篇萬字長文,把我在生產環境中積累的經驗全部分享給你。
    的頭像 發表于 09-08 09:31 ?585次閱讀

    【作品合集】賽昉科技VisionFive 2單板計算機開發板測評

    適配款lcd(ST7735|GC9306|ILI9488)【VisionFive 2單板計算機試用體驗】5. 電子相冊日歷【VisionFive 2單板計算機試用體驗】6. 日歷相冊開機自啟動設置
    發表于 09-04 09:08

    3萬字長文!深度解析大語言模型LLM原理

    我們正在參加全球電子成就獎的評選,歡迎大家幫我們投票~~~謝謝支持本文轉自:騰訊技術工程作者:royceshao大語言模型LLM的精妙之處在于很好地利用數學解決了工業場景的問題,筆者基于過往工程經驗繼續追本溯源,與騰訊學堂合作撰寫本文,嘗試讓人人都能懂大語言模型的基礎原理。1、大語言模型簡述截止到2025年“大模型”一般泛指“超大參數模型”,參數是指深度神經
    的頭像 發表于 09-02 13:34 ?3461次閱讀
    3<b class='flag-5'>萬字長文</b>!深度解析大語言模型LLM原理

    工業計算機的重要性

    工業計算機對某些行業至關重要。我們將在下面詳細解釋這些行業中的工業計算機應用。1.制造與工業自動化工業級計算機非常適合制造工廠,特別是那些想要自動化裝配過程的工廠。在這樣的環境中,工業計算機
    的頭像 發表于 07-28 16:07 ?576次閱讀
    工業<b class='flag-5'>計算機</b>的重要性

    自動化計算機經過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經過工程設計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環境中運行。自動化計算機能夠
    的頭像 發表于 07-21 16:44 ?627次閱讀
    自動化<b class='flag-5'>計算機</b>經過加固后有什么好處?

    自動化計算機的功能與用途

    工業自動化是指利用自動化計算機來控制工業環境中的流程、機器人和機械,以制造產品或其部件。工業自動化的目的是提高生產率、增加靈活性,并提升制造過程的質量。工業自動化在汽車制造中體現得最為明顯,其中許多
    的頭像 發表于 07-15 16:32 ?747次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業計算機與商用計算機的區別有哪些

    工業計算機是一種專為工廠和工業環境設計的計算系統,具有高可靠性和穩定性,能夠應對惡劣環境下的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業自動化場景中
    的頭像 發表于 07-10 16:36 ?752次閱讀
    工業<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區別有哪些

    萬字長文】物聯網的激蕩二十年

    2005年11月,在突尼斯舉辦的信息社會世界峰會(WSIS)上,國際電信聯盟(ITU)發布了一份名為《ITU互聯網報告2005:物聯網》,正式向世人展示了什么是“物聯網(InternetofThings)”。雖然業界一致認為,1999年,麻省理工學院的KevinAshton首次提出”物聯網”這一術語,但僅僅只是一個理念,沒有成體系的解釋,也無法形成共識。而I
    的頭像 發表于 06-27 13:42 ?1603次閱讀
    【<b class='flag-5'>萬字長文</b>】物聯網的激蕩二十年

    工業計算機如何設計用于沖擊和振動

    工業計算機是為挑戰消費級系統耐用性的環境而構建的。在制造業、運輸業、國防和采礦業等領域計算機面臨著持續的沖擊、振動和其他物理壓力。設計這些系統以在這種條件下保持可靠需要卓越的工程和創新技術。本文
    的頭像 發表于 05-19 15:27 ?502次閱讀
    工業<b class='flag-5'>計算機</b>如何設計用于沖擊和振動

    一文帶你了解工業計算機尺寸

    工業計算機是現代自動化、人工智能(AI)和邊緣計算的支柱。這些堅固耐用的系統旨在承受惡劣的環境,同時為關鍵應用提供可靠的性能。然而,由于有這么多可用的外形尺寸,為您的工業計算機選擇合適的尺寸可能是
    的頭像 發表于 04-24 13:35 ?1046次閱讀
    一文帶你了解工業<b class='flag-5'>計算機</b>尺寸

    計算機網絡入門指南

    計算機網絡是指將地理位置不同且具有獨立功能的多臺計算機及其外部設備,通過通信線路連接起來,在網絡操作系統、網絡管理軟件及網絡通信協議的管理和協調下,實現資源共享和信息傳遞的計算機系統。
    的頭像 發表于 04-22 14:29 ?2255次閱讀
    <b class='flag-5'>計算機</b>網絡入門指南