国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

開辟新篇章!谷歌機器學習又有新進展!

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-22 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在谷歌最新的論文中,研究人員提出了“非政策強化學習”算法OPC,它是強化學習的一種變體,它能夠評估哪種機器學習模型將產生最好的結果。數據顯示,OPC比基線機器學習算法有著顯著的提高,更加穩健可靠。

在谷歌AI研究團隊一篇新發表的論文《通過非政策分類進行非政策評估》(Off-PolicyEvaluation via Off-Policy Classification)和博客文章中,他們提出了所稱的“非政策分類”,即OPC(off-policy classification)。它能夠評估AI的表現,通過將評估視為一個分類問題來驅動代理性能。

研究人員認為他們的方法是強化學習的一種變體,它利用獎勵來推動軟件政策實現與圖像輸入協同工作這個目標,并擴展到包括基于視覺的機器人抓取在內的任務。

“完全脫離政策強化學習是一種變體。代理完全從舊數據中學習,對于工程師來說這是很有吸引力的,因為它可以在不需要物理機器人的情況下進行模型迭代?!?/p>

Robotics at Google(專注機器學的的谷歌新團隊)的軟件工程師Alexa Irpan寫道,“完全脫離政策的RL,可以在先前代理收集的同一固定數據集上訓練多個模型,然后選擇出最佳的那個模型?!?/p>

但是OPC并不像聽起來那么容易,正如Irpan在論文中所描述的,非政策性強化學習可以通過機器人進行人工智能模型培訓,但不能進行評估。并且在需要評估大量模型的方法中,地面實況評估通常效率太低。

OPC在假設任務狀態變化方面幾乎沒有隨機性,同時假設代理在實驗結束時用“成功或失敗”來解決這個問題。兩個假設中第二個假設的二元性質,允許為每個操作分配兩個分類標簽(“有效”表示成功或“災難性”表示失?。?。

另外,OPC還依賴Q函數(通過Q學習算法學習)來估計行為的未來總回報。代理商選擇具有最大預期回報的行動,其績效通過所選行動的有效頻率來衡量(這取決于Q函數如何正確地將行動分類為有效與災難性),并以分類準確性作為非政策評估分數。

(左圖為基線,右圖為建議的方法之一,SoftOpC)

谷歌AI團隊使用完全非策略強化學習對機器學習策略進行了模擬培訓,然后使用從以前的實際數據中列出的非策略分數對其進行評估。

在機器人抓取任務時,他們報告OPC的一種變體SoftOPC在預測最終成功率方面表現最佳。假設有15種模型(其中7種純粹在模擬中訓練)具有不同的穩健性,SoftOPC產生的分數與與真正的抓取成功密切相關,并且相比于基線方法更加穩定可靠。

在未來的研究中,研究人員打算用“噪聲”(noisier)和非二進制動力學來探索機器學習任務。“我們認為這個結果有希望應用于許多現實世界的RL問題,”Irpan在論文結尾寫道。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111395
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136951
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國資入主聯創電子開啟企業發展嶄新篇章

    冬日暖陽耀贛江,聯創電子譜新章。2025年12月25日,聯創電子科技股份有限公司(證券簡稱:聯創電子,股票代碼:002036)股票復牌,正式書寫企業發展歷程中的嶄新篇章。
    的頭像 發表于 01-09 14:47 ?555次閱讀

    從協議到實踐——EtherNet/IP與NetStaX的最新進展

    從協議到實踐——EtherNet/IP與NetStaX的最新進展
    的頭像 發表于 12-19 15:26 ?1509次閱讀
    從協議到實踐——EtherNet/IP與NetStaX的最<b class='flag-5'>新進展</b>

    迅為Hi3403開發板驅動教程全面上線,開啟嵌入式Linux開發新篇章!

    迅為iTOP-Hi3403開發板linux驅動教程全面上線,開啟嵌入式Linux開發新篇章
    的頭像 發表于 12-18 14:23 ?682次閱讀
    迅為Hi3403開發板驅動教程全面上線,開啟嵌入式Linux開發<b class='flag-5'>新篇章</b>!

    廣汽集團與華為數字能源開啟深度協同新篇章

    和充電表現、整車駕乘體驗提升,圍繞動力域相關系統和整車產品的設計、制造、銷售服務展開深入合作,開啟深度協同新篇章。
    的頭像 發表于 11-11 15:22 ?522次閱讀

    西班牙工程與技術公司攜手FLIR開啟高溫檢測新篇章

    在鋼鐵制造這一傳統而充滿挑戰的領域,高溫與惡劣環境如同兩道難以逾越的鴻溝,橫亙在提升生產效率與質量的道路上。然而,西班牙工程與技術先鋒BcB Informatica y Control攜手Flir公司,構建了創新的技術解決方案,正為這一行業注入智能化升級的新動力,開啟高溫檢測的新篇章。
    的頭像 發表于 11-02 11:37 ?921次閱讀

    NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎設施,為機器人領域開啟新篇章

    NVIDIA 通過全新 Omniverse 庫、Cosmos 物理 AI 模型及 AI 計算基礎設施,為機器人領域開啟新篇章 ? ·?全新 NVIDIA Omniverse NuRec 3D
    的頭像 發表于 08-12 11:29 ?1779次閱讀
    NVIDIA通過全新 Omniverse庫、Cosmos物理AI模型及AI計算基礎設施,為<b class='flag-5'>機器</b>人領域開啟<b class='flag-5'>新篇章</b>

    云臺電機驅動:開啟智能化時代的新篇章

    在科技飛速發展的今天,智能化已經滲透到我們生活的方方面面。而在眾多科技領域中,云臺電機驅動技術正以其獨特的魅力,開啟著智能化時代的新篇章。
    的頭像 發表于 07-23 18:16 ?972次閱讀

    東風汽車轉型突破取得新進展

    上半年,東風汽車堅定高質量發展步伐,整體銷量逐月回升,經營質量持續改善,自主品牌和新能源滲透率和收益性進一步提升,半年累計終端銷售汽車111.6萬輛,轉型突破取得新進展。
    的頭像 發表于 07-10 15:29 ?912次閱讀

    編碼器線:精準連接,高效傳動,引領科技新篇章

    在日新月異的科技時代,每一個微小的進步都可能成為推動行業變革的關鍵。編碼器線,這一看似不起眼的組件,卻在自動化、智能制造、機器人技術等眾多高科技領域中扮演著至關重要的角色。今天,就讓我們一起走進編碼器線的世界,探索它如何以精準連接和高效傳動,引領科技新篇章。
    的頭像 發表于 06-27 16:57 ?971次閱讀

    恭賀全球購檢測榮獲CBTL資質,邁向國際檢測認證新篇章

    恭賀全球通檢測榮獲CBTL資質!邁向國際檢測認證新篇章賦能中國企業全球化近日,中國檢測認證領域迎來里程碑時刻——全球通檢測(GlobalTestingServices)正式通過國際電工
    的頭像 發表于 05-27 10:41 ?405次閱讀
    恭賀全球購檢測榮獲CBTL資質,邁向國際檢測認證<b class='flag-5'>新篇章</b>!

    百度在AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度在AI領域的新進展。
    的頭像 發表于 04-30 10:14 ?1334次閱讀

    松下攜手深圳廣電集團開啟視聽傳播新篇章

    在2025年深圳廣播電影電視集團(以下簡稱“深圳廣電集團”)的4K超高清采購項目中,松下憑借卓越的技術實力與豐富的行業經驗,成功中標“新聞演播室群”、“外拍設備”等核心項目,標志著松下的新媒體技術與專業視音頻產品在深圳廣電集團實現了全面落地應用,雙方攜手開啟視聽傳播新篇章
    的頭像 發表于 04-15 15:16 ?1029次閱讀

    谷歌Gemini API最新進展

    體驗的 Live API 的最新進展,以及正式面向開發者開放的高質量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發表于 04-12 16:10 ?1681次閱讀

    華為公布AI基礎設施架構突破性新進展

    近日,華為公司常務董事、華為云計算CEO張平安在華為云生態大會2025上公布了AI基礎設施架構突破性新進展——推出基于新型高速總線架構的CloudMatrix 384超節點集群,并宣布已在蕪湖數據中心規模上線。
    的頭像 發表于 04-12 15:09 ?1963次閱讀

    國產首款量產型七位半萬用表!青島漢泰開啟國產高精度測量新篇章。

    國產首款量產型七位半萬用表!青島漢泰開啟國產高精度測量新篇章。 2025年3月18日,青島漢泰推出全新HDM3075系列7位半數字萬用表。HDM3075系列是國產首款實現量產的七位半萬用表產品,它
    發表于 04-01 13:15