国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

告別調參煉丹,使用隨機共享權重足矣!

2E1k_gh_baf5b3c ? 來源:陳年麗 ? 2019-08-28 17:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌大腦備受關注的“權重無關神經網絡”終于開源了!其關鍵思想是通過不再強調權重來搜索網絡結構,僅使用隨機共享的權重,也可以執行各種任務的神經網絡。終于可以不用調參煉丹了嗎?快來復現看看!

神經網絡訓練中 “權重” 有多重要不言而喻。但谷歌前段時間發表的研究表明,即使拋棄神經網絡權重訓練,使用隨機共享權重,也可以執行各種任務。

他們提出一種新的神經網絡結構的搜索方法——權重無關神經網絡(Weight Agnostic Neural Networks,WANN),其關鍵思想是通過不再強調權重來搜索網絡結構。

今天,該研究的兩位作者、谷歌大腦學生研究員 Adam Gaier和研究科學家David Ha在Google AI博客上撰文,介紹了該研究的核心思想和重要細節,并宣布WANN的代碼已經在GitHub上開源,以便讓廣泛的研究社區重現WANN實驗。

告別調參煉丹,使用隨機共享權重足矣!

當訓練神經網絡完成一項給定任務時,無論是圖像分類還是強化學習,通常都需要調優與網絡中每個連接相關的一組權重。另一種已經取得實質性進展的成功的神經網絡創建方法是神經架構搜索,它利用人工設計的組件(如卷積網絡組件或transformer blocks)來構建神經網絡架構。

研究表明,利用這些組件構建的神經網絡結構,如深度卷積網絡,對圖像處理任務具有很強的歸納偏差,甚至可以在權重隨機初始化的情況下執行。雖然神經架構搜索提供了一些新的方法,可以為當前的任務域安排具有已知歸納偏差的手工工程組件,但在自動發現具有此類歸納偏差的新神經網絡架構(用于不同的任務域)方面幾乎沒有進展。

我們可以用一個先天和后天的例子作為類比。正如生物學中某些從出生起就具有反捕食行為的物種一樣,他們無需學習就能執行復雜的運動和感官任務,或許我們可以構建一個不需要訓練就能很好地完成任務的神經網絡。當然,這些自然物種(作為類比,人工神經網絡)通過訓練可以得到進一步的改善,但它們即使不學習也能執行任務的能力表明,它們包含使它們非常適合于這些任務的偏差。

在“權重無關神經網絡”(WANN)論文中,我們提出了搜索具有這類偏差的網絡的第一步:即使使用隨機共享的權重,也可以執行各種任務的神經網絡架構。

我們在這項工作中的動機是,在不學習任何權重參數的情況下,僅神經網絡架構能在多大程度上編碼給定任務的解決方案。通過探索這樣的神經網絡架構,我們提出了一種無需學習權重參數就能在其環境中運行良好的智能體。

此外,為了促進該領域的進步,我們還開放了源代碼,以便更廣泛的研究社區重現我們的WANN實驗。

左圖:一個手工設計的、完全連接的深度神經網絡,有2760個權重連接。利用一種學習算法,我們可以求解2760個權重參數的集合,使該網絡能夠執行一個雙足步行任務(BipedalWalker-v2)。

右圖:一個權重無關的神經網絡架構,只有44個連接,但同樣能夠執行雙足步行任務。與完全連接網絡不同的是, WANN仍然可以執行任務,而不需要訓練每個連接的權重參數。實際上,為了簡化訓練,WANN被設計成在每個權重連接的值相同或共享時執行,甚至就算共享權重參數是隨機采樣的,也會起作用。

搜索權重無關神經網絡

我們從一組最小的神經網絡架構候選對象開始,每個候選對象只有很少的連接,并使用一個完善的拓撲搜索算法(NEAT),通過逐個地添加單個連接和單個節點來演化架構。

WANN背后的關鍵思想是通過不再強調權重來搜索架構。與傳統的神經架構搜索方法不同,新架構的所有權重參數都需要使用學習算法進行訓練,我們采用了一種更簡單、更有效的方法。

在搜索過程中,首先在每次迭代中為所有候選架構分配一個共享權重值,然后進行優化,以便在更寬的共享權重值范圍內執行良好。

用于搜索網絡拓撲空間的運算符

左:一個最小的網絡拓撲結構,輸入和輸出僅部分連接。

中間:網絡的改變有三種方式:

(1)插入節點:通過分割現有連接插入新節點。

(2)添加連接:通過連接兩個先前未連接的節點來添加一個新連接。

(3)更改激活:重新分配隱藏節點的激活函數。

右:可能的激活函數(線性,階躍,正弦, 余弦,高斯,tanh, sigmoid,inverse,絕對值,ReLU)

除了探索一系列與權重無關的神經網絡之外,重要的是還要尋找只需要復雜到它們所需的程度的網絡架構。我們利用多目標優化技術( multi-objective optimization),同時對網絡的性能和復雜度進行優化。

權重無關神經網絡搜索的概述,及其相應的網絡拓撲空間搜索算子。

訓練WANN架構

與傳統網絡不同的是,我們可以通過簡單地找到最佳的單個共享權重參數來訓練WANN,從而最大限度地提高其性能。在下面的例子中,可以看到我們的架構(在某種程度上)使用恒定的權重來完成一個 swing-up cartpole 任務:

WANN在不同的權重參數下執行 swing-up cartpole 任務,也使用微調的權重參數。

正如我們在上面的圖中看到的,雖然WANN可以使用一系列共享權重參數來執行其任務,但是其性能仍然無法與學習每個連接的權重的網絡相比較。

如果我們想進一步提高它的性能,我們可以使用WANN架構和最佳共享權重作為起點,使用學習算法微調每個連接的權重,就像通常訓練神經網絡的方法一樣。以網絡架構的權重無關特性為出發點,通過學習微調網絡的性能,可能有助于為理解動物如何學習提供有洞察力的類比。

通過在性能和網絡簡單性方面的多目標優化,我們的方法找到了一個簡單的WANN,用于賽車任務,它不需要顯式地訓練網絡的權重。

使用隨機權重的網絡架構不僅易于訓練,還具有其他優勢。例如,通過使用相同WANN架構的副本,但是為WANN的每個副本都分配不同的權重值,我們可以為同一任務創建多個不同模型的集合。這種集合通常比單個模型能獲得更好的性能。下面是一個MNIST分類器處理隨機權重的例子,可以說明這一點:

MNIST分類器進化為處理隨機權重。

具有隨機初始化的傳統網絡在 MNIST 上的精度約為 10%,但這種隨機權重的特殊網絡架構在 MNIST 上的精度 (》 80%) 明顯優于隨機初始化網絡。當使用一組WANNs,為每個WANN分配一個不同的共享權重時,精度提高到 》 90%。

即使不使用集成方法,也可以將網絡中的權重值壓縮到一個網絡,從而使網絡能夠快速調整??焖僬{整權重的能力可能在持續的終身學習(lifelong learning)中很有用,在這種學習中,agent在整個生命周期中獲得、適應和轉移技能。這使得WANN特別適合利用 Baldwin效應, Baldwin效應是一種進化壓力,即獎勵那些傾向于學習有用行為的個體,而不會陷入“learning to learn”這個昂貴的計算陷阱。

結論

我們希望這項工作可以作為一個墊腳石,幫助發現新的基礎神經網絡組件,如卷積網絡,其發現和應用已經在深度學習領域取得了令人難以置信的進展。自卷積神經網絡被發現以來,研究界可用的計算資源顯著增加。如果我們將這些資源投入到自動發現神經網絡架構中,并希望實現網絡架構的突破性改進,那么我們相信,使用新的構建塊來搜索也是值得的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111415
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107805

原文標題:“互聯網 + 海關”背景下,企業關務系統的選擇和應用以及與合規內控的結合

文章出處:【微信號:gh_baf5b3c5005b,微信公眾號:通關機器人】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    tFUS如何精準調實現神經活動的雙向調節?

    HUIYING經顱聚焦超聲刺激(tFUS)參數效應概述經顱聚焦超聲刺激(tFUS)作為一種非侵入性神經調節技術,其核心優勢在于通過精確調控超聲參數實現對神經活動的雙向調節(興奮或抑制)。參數選擇直接決定聲波在顱內的傳播效率、空間靶向性及生理效應。研究表明,tFUS的神經調制效果并非由單一參數主導,而是多參數協同作用的結果。例如,高頻脈沖重復頻率(PRF)和高
    的頭像 發表于 02-22 17:22 ?91次閱讀
    tFUS如何精準<b class='flag-5'>調</b><b class='flag-5'>參</b>實現神經活動的雙向調節?

    值傳遞、指針傳遞、引用傳遞介紹

    進行操作,也就是說,即使形的值發生改變,實參的值也完全不受影響。   2、指針傳遞:指針傳遞其實是值傳遞的一種,它傳遞的是地址。值傳遞過程中,被調函數的形作為被調函數的局部變量來處
    發表于 01-21 06:48

    快速切換多通道微波源:APMS系列相信號源提供高達40GHz的4通道相輸出

    安鉑克APMS系列多通道相微波信號發生器將多通道相輸出、微波頻率覆蓋與快速切換能力三者高度集成于一個僅1U高的標準機箱內,為核心研發與生產測試提供了高效、緊湊的激勵工具。
    的頭像 發表于 01-13 16:23 ?168次閱讀
    快速切換多通道微波源:APMS系列相<b class='flag-5'>參</b>信號源提供高達40GHz的4通道相<b class='flag-5'>參</b>輸出

    如何在LTspice仿真中實現偽隨機數和真隨機數的生成

    本文討論如何在LTspice仿真中利用flat()、gauss()和mc()函數來實現偽隨機數和真隨機數的生成,并介紹如何使用設置面板的Hacks部分中的 Use the clock
    的頭像 發表于 01-09 14:08 ?4691次閱讀
    如何在LTspice仿真中實現偽<b class='flag-5'>隨機</b>數和真<b class='flag-5'>隨機</b>數的生成

    PID調實用方法

    ) 周圍抖動 在講了PI和PD系統的調節方式后,下面分享一下PID系統的調節方式,首先我們先按照PI系統進行調節,先調P在調I,讓系統有一定的過沖后達到穩定. 在出現了上面的 PI 波形之后,下面就開始調節D,慢慢增加D,將過沖補償掉,直到系統穩定,最終效果如下圖,PID系統就基本調節完成了
    發表于 11-28 07:17

    安信可雷達模組如何快速配網和調

    安信可配網助手app介紹 安信可配網助手app是由安信可開發的一款 可拿來對安信可模組進行配網以及對雷達模組進行調的APP 。 下面將對APP搭配安信可雷達模組Rd-01、Rd-03_V2
    的頭像 發表于 10-31 08:59 ?629次閱讀
    安信可雷達模組如何快速配網和<b class='flag-5'>調</b><b class='flag-5'>參</b>?

    微店關鍵詞搜索接口核心突破:動態權重算法與語義引擎的實戰落地

    本文詳解微店搜索接口從基礎匹配到智能推薦的技術進階路徑,涵蓋動態權重、語義理解與行為閉環三大創新,助力商家提升搜索轉化率、商品曝光與用戶留存,實現技術驅動的業績增長。
    的頭像 發表于 10-15 14:38 ?439次閱讀

    告別數月等待:數字孿生場景生成從此進入“日級”時代

    告別數月等待:數字孿生場景生成從此進入“日級”時代
    的頭像 發表于 09-05 17:33 ?2571次閱讀
    <b class='flag-5'>告別</b>數月等待:數字孿生場景生成從此進入“日級”時代

    隨機數和偽隨機數的區別

    隨機數在當前程序運行環境中是一種常用參數,目前主要分為兩種,偽隨機數和真隨機數,本期我們就來講一下二者的區別。
    的頭像 發表于 08-27 17:46 ?2647次閱讀

    用拼多多 API 實現拼多多店鋪商品搜索權重提升

    ? 在電商平臺如拼多多上,商品搜索權重直接影響曝光率和銷量。權重高的商品更容易出現在搜索結果前列,吸引更多用戶點擊。通過拼多多 API(應用程序接口),賣家可以自動化優化商品信息,提升搜索權重。本文
    的頭像 發表于 08-19 17:23 ?799次閱讀
    用拼多多 API 實現拼多多店鋪商品搜索<b class='flag-5'>權重</b>提升

    亞馬遜云科技現已上線OpenAI開放權重模型

    客戶現可通過Amazon Bedrock和Amazon SageMaker AI使用OpenAI開放權重模型,實現將先進的開放權重模型與全球最廣泛云服務的深度集成。 亞馬遜云科技首次上線OpenAI
    的頭像 發表于 08-06 19:29 ?849次閱讀

    穩壓器分調與穩壓器統調的區別

    在電力與電氣設備的運行過程中,電壓的穩定至關重要。自動調壓器作為一種關鍵設備,能夠有效調節電壓,確保設備在合適的電壓環境下運行。而在自動調壓器(穩壓器)的應用中,分調與統調是兩種常見的調節模式。理解
    的頭像 發表于 07-26 14:54 ?909次閱讀

    微電機關鍵零部件制造誤差對其質量的影響權重分析

    質量影響的權值,最后綜合計算出微電機關鍵零部件制造誤差對微電機質量影響的權重。該方法能很好解決不存在尺寸鏈或復雜尺寸鏈關系的零部件制造誤差對產品質量影響的權值計算問題。 純分享帖,需要者可點擊附件免費
    發表于 06-23 07:16

    告別延遲!Ethernetip轉modbustcp網關在熔煉車間監控的極速時代

    告別延遲!Ethernetip轉modbustcp網關在熔煉車間監控的極速時代
    的頭像 發表于 05-20 19:20 ?427次閱讀
    <b class='flag-5'>告別</b>延遲!Ethernetip轉modbustcp網關在熔煉車間監控的極速時代

    HJ55系列三相變頻電源 電壓可分調可統調

    HJ55系列三相變頻電源是一種高性能的電源設備,廣泛應用于工業、科研、測試等領域。它具備分調和統調功能,能夠滿足不同場景下的電壓和頻率調節需求。以下是關于HJ55系列三相變頻電源的分調和統調功能
    的頭像 發表于 03-26 11:55 ?2603次閱讀
    HJ55系列三相變頻電源 電壓可分<b class='flag-5'>調</b>可統<b class='flag-5'>調</b>