国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌大腦的“世界模型”簡述與啟發

mK5P_AItists ? 來源:lq ? 2019-01-30 09:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

摘要:我們的視覺看到什么,部分取決于大腦預測未來會看到什么。

我們的視覺看到什么,部分取決于大腦預測未來會看到什么,例如下圖中,如果你預計要看到突出的球體,那也許你就會看到,如果讓機器也具有了這樣的能力,會帶來什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復雜的環境中通過自我學習產生相應的策略,例如玩賽車游戲。

下面是世界模型的整體架構:

整個模型分為3個組件:視覺組件(V),記憶組件(M),控制組件(C)。視覺組件V用來壓縮圖片信息到一個隱變量z上(其實只是一個VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個rollout),輸出是預測下一幀圖像的可能分布,其實就是比一般LSTM更高級一些的MDN-RNN:

最后控制組件C的目標,就是把前面視覺組件V和記憶組件M的輸出一起作為輸入,并輸出這個時刻智能體agent應該做出的動作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒有是谷歌大腦自己創新研制的。但世界模型會很大提高強化學習訓練穩定性和成績 從而使其與其他強化學習相比有一些明顯優勢,如下表所示;

世界模型有如下的3個特點

1. 模型拼接得足夠巧妙,這個巧妙的拼接模型做到所謂的世界想象能力,就是模型在學習時,自身對環境假想一個模擬的環境,甚至可以在沒有環境訓練的情況下,自己想象一個環境去訓練。其實就是我們人類鏡像神經元的功能。

2. 抓住了一些“強視覺”游戲的“痛點”。記憶組件M中的RNN是生成序列的能手,所以根據之前游戲圖像再“想象”一些圖像幀應該不成問題(RNN生成一些隱變量z,再根據隱變量z,由視覺組件VAE的decode生成的圖像幀即可)。所以對于“強視覺”的游戲,把RNN的記憶能力用在視覺預測和控制上是個好主意 。

3不同于我們常見的“不可生”智能算法,例如遺傳算法和進化策略只是強調了基因的“變異”與在解空間中進行搜索,神經網絡只是固定網絡結構;而生物界的基因卻可以指導蛋白質構成并且“生長”。如果基因可以構造自身個體,外部環境和個體情況也可以反過來影響基因,而我們的模型都太固定呆板了,模型結構不能隨內部隱變量改進,當然最佳的設計形式也許誰也不知道。而世界模型做到了讓在內部”幻想“的環境中產生的策略轉移到外部世界中。

最后簡單看一下世界模型的訓練過程:

world models代碼基于chainer計算框架,步驟如下:

1. 準備數據集,隨機玩游戲生成訓練幀(rollouts意思應該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓練視覺組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓練控制組件C,即前面提到的CMA-ES算法(其實就是支持更復雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測試訓練結果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111404
  • 機器
    +關注

    關注

    0

    文章

    798

    瀏覽量

    41877
  • 智能體
    +關注

    關注

    1

    文章

    476

    瀏覽量

    11605

原文標題:谷歌大腦的“世界模型”簡述與啟發

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Evermem 突破大模型記憶瓶頸實現低耗高效

    測試的“花架子”,實際部署后效果照樣能打。而且團隊有底氣有信心,技術代碼全部開源。 為了方便開發者使用,他們剛剛還專門上線了云服務——現在只需一個最簡單的API,就能直接將最前沿的大模型記憶能力裝進自己的應用。 學習大腦記憶機制,成了。
    的頭像 發表于 03-03 13:44 ?96次閱讀
    Evermem 突破大<b class='flag-5'>模型</b>記憶瓶頸實現低耗高效

    如何構建適合自動駕駛的世界模型

    提出的。那世界模型是自動駕駛落地的正解嗎? 什么是世界模型世界模型對于自動駕駛汽車來說,更像
    的頭像 發表于 02-18 08:14 ?1w次閱讀
    如何構建適合自動駕駛的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>?

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發布于 :2026年01月15日 17:02:00

    每年10億美元,蘋果與谷歌官宣合作,Gemini大模型注入Siri

    該協議,下一代蘋果基礎模型(Apple Foundation Models)將基于谷歌的Gemini模型和云技術。 ? 蘋果:借Gemini之力,加速AI追趕 ? 長期以來,蘋果在AI領域的發展相對滯后,其語音助手Siri的功能
    的頭像 發表于 01-13 14:59 ?1553次閱讀

    自動駕駛中常提的世界模型是什么?

    在很多廠家的技術方案中,會提到世界模型的介紹。世界模型,就是自動駕駛系統內部用來表示外部世界并預測未來演變的一組
    的頭像 發表于 01-05 16:23 ?906次閱讀

    大曉機器人發布開悟3.0,國產世界模型讓機器人擁有“超級大腦

    機器人的使命就是讓每個機器人都擁有一個聰明的大腦,洞察萬物,學會與視覺精準交互。 ? 在此背景下,大曉機器人憑借其原創的“世界模型”技術體系,正快速崛起為具身智能領域的關鍵推動者。就在12月,大曉機器人正式發布“開悟
    的頭像 發表于 12-25 09:25 ?2520次閱讀
    大曉機器人發布開悟3.0,國產<b class='flag-5'>世界</b><b class='flag-5'>模型</b>讓機器人擁有“超級<b class='flag-5'>大腦</b>”

    VLA與世界模型有什么不同?

    Language Action,VLA),另一些則致力于構建并應用世界模型(World Model)。這兩種路徑有什么不同? 什么是VLA,什么是世界模型 先說說VLA。VLA是英文
    的頭像 發表于 12-17 09:13 ?635次閱讀
    VLA與<b class='flag-5'>世界</b><b class='flag-5'>模型</b>有什么不同?

    構建生態新范式!開源大腦+小腦,地平線發布兩款具身智能模型

    在2025地平線技術生態大會上,地平線創始人兼CEO余凱正式發布兩大具身智能開源模型——具身智能小腦基座模型HoloMotion和具身智能大腦基座模型HoloBrain。
    的頭像 發表于 12-16 15:01 ?1.2w次閱讀
    構建生態新范式!開源<b class='flag-5'>大腦</b>+小腦,地平線發布兩款具身智能<b class='flag-5'>模型</b>

    世界模型是讓自動駕駛汽車理解世界還是預測未來?

    ? [首發于智駕最前沿微信公眾號]世界模型在自動駕駛技術中已有廣泛應用。但當談及它對自動駕駛的作用時,難免會出現分歧。它到底是讓自動駕駛汽車得以理解世界,還是為其提供了預測未來的視角? 世界
    的頭像 發表于 12-16 09:27 ?872次閱讀
    <b class='flag-5'>世界</b><b class='flag-5'>模型</b>是讓自動駕駛汽車理解<b class='flag-5'>世界</b>還是預測未來?

    泰凌微:布局端側AI,產品支持谷歌LiteRT、TVM開源模型

    。 ? 公司發布的基于TL721X系列芯片的TL-EdgeAI平臺,支持谷歌LiteRT、TVM等開源模型,是目前世界上功耗最低的智能物聯網連接協議平臺。其芯片已在谷歌(Google)
    的頭像 發表于 12-15 08:21 ?1w次閱讀

    谷歌AlphaEarth和維智時空AI大模型的核心差異

    谷歌AlphaEarth和維智時空AI大模型在技術理念上存在諸多共性,但兩者在目標尺度、數據來源、技術實現和應用模式上存在顯著差異。
    的頭像 發表于 10-22 14:50 ?883次閱讀

    谷歌AlphaEarth和維智時空AI大模型的技術路徑

    谷歌AlphaEarth和維智時空AI大模型在應用場景和技術實現上各有側重,但兩者在底層技術理念上存在顯著共性。
    的頭像 發表于 10-22 14:48 ?911次閱讀

    谷歌DeepMind重磅發布Genie 3,首次實現世界模型實時交互

    電子發燒友網綜合報道 當地時間2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。這款被英偉達科學家Jim Fan譽為“游戲引擎2.0”的模型,通過單文本提
    的頭像 發表于 08-13 08:27 ?6877次閱讀

    自動駕駛中常提的世界模型是個啥?

    [首發于智駕最前沿微信公眾號]隨著自動駕駛技術的不斷成熟,車輛需要在復雜多變的道路環境中安全地行駛,這就要求系統不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種
    的頭像 發表于 06-24 08:53 ?1129次閱讀
    自動駕駛中常提的<b class='flag-5'>世界</b><b class='flag-5'>模型</b>是個啥?

    世界模型:多模態融合+因果推理,解鎖AI認知邊界

    電子發燒友網綜合報道 在人工智能的蓬勃發展進程中,世界模型正嶄露頭角,成為推動其邁向更高智能水平的關鍵力量。世界模型作為 AI 系統對外部世界
    的頭像 發表于 06-23 04:49 ?4055次閱讀