国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PEMN:參數集約型掩碼網絡

CVer ? 來源:CVer ? 作者:CVer ? 2022-12-15 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeurIPS 2022 | Parameter-Efficient Masking Networks,美國東北大學,羅切斯特理工等,提出參數集約型掩碼網絡,探索有限數量隨機數的表征能力并提升神經網絡儲存和傳輸效率。

為了處理更復雜的任務,近年來神經網絡的規模也在不斷變大,如何高效的儲存和傳輸神經網絡變得十分重要。另一方面,隨著彩票假說(Lottery Ticket Hypothesis (LTH))的提出,隨機稀疏神經網絡最近展現出很強的潛力,如何利用這種潛力來提高網絡的存儲和傳輸效率也很值得探索。

來自美國東北大學和羅切斯特理工的研究者提出參數集約型掩碼網絡(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限數量隨機數生成的隨機網絡的表征能力。實驗表明,即使網絡由有限數量的隨機數生成,通過選擇不同的子網絡結構,其依然具有很好的表征能力。通過這種探索性實驗,作者自然地提出使用一組有限數量隨機數作為prototype,結合一組mask來表達一個神經網絡。因為有限數量的隨機數和二值的mask占用很少的儲存空間,作者以此來提出一種新的思路來進行網絡壓縮。文章已被NeurIPS 2022 接受。代碼已開源。

1a33b5fe-7c3d-11ed-8abf-dac502259ad0.png

Parameter-Efficient Masking Networks

論文地址: https://arxiv.org/abs/2210.06699

論文代碼: https://github.com/yueb17/PEMN

1. 相關研究

MIT研究人員提出彩票假說 Lottery Ticket Hypothesis (ICLR’19):在一個隨機初始化網絡中,存在一個彩票子網絡(winning ticket)在被單獨訓練的情況下達到很好的效果。彩票假說探索了隨機稀疏網絡的可訓練性。Uber研究人員提出Supermask (NeurIPS’19):在一個隨機初始化網絡中,存在一個子網絡,可以直接用來做推斷而不需要訓練。Supermask探索了隨機稀疏網絡的可用性。華盛頓大學研究人員提出Edge-Popup (CVPR’20):通過反向傳播學習子網絡的mask,大幅提升了隨機稀疏網絡的可用性。

2. 研究動機/流程

以上相關研究從不同角度探索了隨機稀疏網絡的潛力,如可訓練性和可用性,其中可用性也可以理解為表征能力。在此工作中,作者感興趣的是由隨機數生成的神經網絡在不訓練權重的情況下有多強的表征能力。隨著對該問題的探索,作者提出了Parameter-Efficient Masking Networks (PEMN)。自然地,作者運用PEMN為網絡壓縮提供了一種新的思路,并作為一個例子對PEMN的潛在應用場景進行探索。

3. 探索隨機數構成的神經網絡的表征能力

給定一個隨機網絡,作者選擇Edge-Popup算法在其中選擇子網絡來探索其表征能力。不同的是,相對于對整個網絡進行隨機初始化,作者提出了三種參數集約型的網絡生成策略來使用一個prototype構建隨機網絡。

One-layer: 選擇網絡中重復結構的權重作為prototype來填充其他的與之結構相同的網絡層。

Max-layer padding (MP): 選擇參數量最多的網絡層作為prototype并且截斷相應的參數量來填充其他網絡層。

Random vector padding (RP): 選擇一定長度的隨機向量作為prototype并對其進行復制來填充整個網絡。

1a5d0a6c-7c3d-11ed-8abf-dac502259ad0.png

三種不同的隨機網絡生成策略把網絡中不重復參數值(unique values)的數量逐步變小,我們基于不同策略得到的隨機網絡來選擇子網絡,從而探索了有限數量隨機數生成的隨機網絡的表征潛力。

1a86ae1c-7c3d-11ed-8abf-dac502259ad0.png

上圖展示了使用ConvMixer 和 ViT 網絡CIFAR10圖像分類的實驗結果。Y軸為準確率,X軸為使用不同策略得到的隨機網絡。隨之X軸的變大,隨機網絡中不重復隨機數數量逐漸變小 (RP后的數字表示相比較于MP,RP中不重復隨機數數量的比例)。根據實驗結果,我們觀察到即使隨機網絡只有非常有限的不重復隨機數(比如PR_1e-3),依然可以很好的維持選擇出來的子網絡的表征能力。至此,作者通過不同的隨機網絡生成策略,探索了有限數量隨機數構成的神經網絡的表征能力并觀察到即使不重復隨機數非常有限,其對應的隨機網絡依然可以很好地對數據進行表征。同時作者基于這些隨機網絡生成策略,結合所得到的子網絡掩碼,提出了Parameter-Efficient Masking Networks(PEMN)這種新的神經網絡類型。

4. 一種新的網絡壓縮思路

本文選擇了神經網路壓縮為例來拓展PEMN的潛在應用。具體來說,文中所提出的不同隨機網絡生成策略可以高效的使用prototype來代表完整的隨機網絡,尤其是最細粒度的random vector padding (RP)策略。作者使用RP策略中的隨機向量prototype和與之對應的一組子網絡掩碼來表示一個隨機網絡。在其中prototype需要保存浮點數格式,而掩碼只需要保存成二值格式。因為RP中的prototype長度可以很短(因為有限數量的不重復隨機數仍有很強的表征能力),所以表示一個神經網絡的開銷會變得很小,即儲存一個長度有限的浮點數格式的隨機向量和一組二值格式的掩碼。相比較于傳統的稀疏網絡儲存子網絡的浮點值,本文提出了一種新的網絡壓縮思路用來高效的儲存和傳輸神經網絡。

1aa0ec96-7c3d-11ed-8abf-dac502259ad0.png

在上圖中,作者使用PEMN對網絡進行壓縮并與傳統的網絡剪枝方法進行對比。實驗使用ResNet網絡在CIFAR數據集做圖像分類任務。我們觀察到,新的壓縮方案表現普遍優于傳統的網絡剪枝,尤其是在很高的壓縮率下,PEMN仍然可以維持較好的準確率。

5. 結論

本文受近來隨機網絡展現出來的潛力所啟發,提出不同種參數集約策略來構建隨機神經網絡,進而探索了在只有有限的不重復隨機數的情況下所生成的隨機神經網絡的表征潛力,并提出參數集約型掩碼網絡Parameter-Efficient Masking Networks (PEMN)。作者將PEMN應用到網絡壓縮的場景中探索了其在實際應用方面的潛力并且為網絡壓縮提供了一種新的思路。作者提供了廣泛的實驗,表明了即使隨機網絡中只有非常有限的不重復隨機數,通過子網絡的選擇,其依然有較好的表征能力。此外,相比較于傳統剪枝算法,實驗表明新提出的方法可以取得更好的網絡壓縮效果,驗證了PEMN在該場景下的應用潛力。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4838

    瀏覽量

    107799
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98072

原文標題:NeurIPS 2022 | PEMN:參數集約型掩碼網絡

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電壓驅動PHY vs. 電流驅動PHY:如何正確連接網絡變壓器?

    的疑問。本文將圍繞電壓驅動PHY和電流驅動PHY,解析其與網絡變壓器的連接差異,幫助大家在設計中避免常見誤區。
    的頭像 發表于 01-20 18:15 ?294次閱讀
    電壓驅動<b class='flag-5'>型</b>PHY vs. 電流驅動<b class='flag-5'>型</b>PHY:如何正確連接<b class='flag-5'>網絡</b>變壓器?

    Vlan、三層交換機、網關、DNS、子網掩碼、MAC地址等網絡知識

    我們現在做的弱電工程,經常用到網絡知識,比如vlan、三層交換機、網關、DNS、子網掩碼、MAC地址等方面的知識,作為從業人員,我們對這些知識了解并熟知的。 正文: 一、什么是VLAN VLAN中文
    的頭像 發表于 12-18 10:16 ?366次閱讀
    Vlan、三層交換機、網關、DNS、子網<b class='flag-5'>掩碼</b>、MAC地址等<b class='flag-5'>網絡</b>知識

    讀懂高效通信的星組網

    一、什么是星組網?一種網絡拓撲,所有設備直接連接至一個中心節點,形成“中心發散”的星形結構,實現集中管理、高效通信。二、三大核心特點1.高可靠易維護節點獨立連接,單點故障不影響全網;中心化管理,運
    發表于 12-09 14:17

    緊湊網絡運動控制卡ECI1808/ECI1A08

    緊湊網絡運動控制卡ECI1808/ECI1A08
    的頭像 發表于 11-28 11:17 ?763次閱讀
    緊湊<b class='flag-5'>型</b><b class='flag-5'>網絡</b>運動控制卡ECI1808/ECI1A08

    智慧供熱物聯網數字化改造方案

    近年來,越來越多企業加快供熱生產管理信息化、自動化、智慧化步伐,通過提高自動化水平與管理效率,實現了供熱運行管理模式由粗放集約型、智能化、精細化的轉變。 某大型供熱企業擔負該地集中供熱、供熱設施
    的頭像 發表于 11-18 13:47 ?450次閱讀
    智慧供熱物聯網數字化改造方案

    廣州郵科管理匯聚光纖交換機:企業網絡升級的“智慧引擎”

    升級戰中, 廣州郵科管理匯聚光纖交換機 憑借其“高帶寬、低延遲、強管理”的特性,成為眾多企業網絡架構中的“智慧引擎”。 為什么企業需要管理匯聚交換機? 傳統非管理交換機如同“傻瓜
    的頭像 發表于 10-20 10:00 ?530次閱讀
    廣州郵科管理<b class='flag-5'>型</b>匯聚光纖交換機:企業<b class='flag-5'>網絡</b>升級的“智慧引擎”

    飛凌嵌入式ElfBoard-Linux系統基礎入門-網絡相關shell命令之網絡基礎知識

    網絡地址 (二)主機號全為1的IP地址,不分配給任何主機,僅用作廣播地址 (三)IP地址127.0.0.1為回環結構,用于本地進行軟件測試 4.子網掩碼 子網掩碼是一個32位的二進制地址,用來屏蔽原來
    發表于 10-09 09:30

    管理 vs 非管理,工業網絡如何選擇以太網交換機?

    在工業網絡建設中,很多人會糾結該選管理還是非管理交換機。非管理交換機即插即用、價格實惠,適合小型場景;而管理交換機功能強大,可監控、
    的頭像 發表于 08-25 15:37 ?771次閱讀
    管理<b class='flag-5'>型</b> vs 非管理<b class='flag-5'>型</b>,工業<b class='flag-5'>網絡</b>如何選擇以太網交換機?

    Linux系統中網絡配置詳解

    網絡配置是Linux系統運維中的核心技能之一。正確理解和配置子網掩碼、網關等網絡參數,直接影響系統的網絡連通性和性能。本文將深入探討Linu
    的頭像 發表于 07-17 11:01 ?1202次閱讀

    飛凌嵌入式ElfBoard ELF 1板卡-文件系統之配置網絡參數

    我們可以在系統啟動之后,通過ifconfig命令配置網絡參數。root@ELF1:~# ifconfig eth0 192.168.0.232root@ELF1:~# ifconfig eth0
    發表于 07-01 17:49

    ON Semiconductor MC14013BDTR2G 雙D觸發器參數特性 EDA模型 數據手冊

    ON Semiconductor MC14013BDTR2G 雙D觸發器參數特性 EDA模型 數據手冊
    的頭像 發表于 05-29 14:41 ?1436次閱讀
    ON Semiconductor MC14013BDTR2G  雙D<b class='flag-5'>型</b>觸發器<b class='flag-5'>參數</b>特性 EDA模型 數據手冊

    手把手教你如何調優Linux網絡參數

    在高并發網絡服務場景中,Linux內核的默認網絡參數往往無法滿足需求,導致性能瓶頸、連接超時甚至服務崩潰。本文基于真實案例分析,從參數解讀、問題診斷到優化實踐,手把手教你如何調優Lin
    的頭像 發表于 05-29 09:21 ?972次閱讀

    愛立信如何構建意圖驅動自主網絡

    意圖驅動服務編排與AI相互協同,正在徹底改變網絡和服務的管理方式。這種協同究竟會如何革新OSS服務管理方式?又將如何發掘自動化和可編程網絡的全部潛能?
    的頭像 發表于 04-12 15:00 ?1.6w次閱讀
    愛立信如何構建意圖驅動<b class='flag-5'>型</b>自主<b class='flag-5'>網絡</b>

    關于三菱PLC的網絡通訊時的‘生存確認’參數

    最近項目用到三菱PLC的網絡通訊,終于理解了PLC的以太網通訊時,有個網絡端口生存確認,原來是一個非常重要的參數。 生成確認決定了網絡參數
    發表于 03-31 11:26

    STM32G0B1VE芯片的CAN過濾器分為掩碼模式和列表模式,在列表模式下,可過濾多少個ID呢?

    STM32G0B1VE芯片的CAN過濾器分為掩碼模式和列表模式,在列表模式下,可過濾多少個ID呢?芯片手冊中未有詳細說明
    發表于 03-12 07:16