根據(jù)《自然》最新發(fā)表的一項研究,一類增強學(xué)習(xí)算法在雅達利經(jīng)典游戲中的得分超過了人類玩家和已有的人工智能系統(tǒng)。這類算法被統(tǒng)稱為Go-Explore,它改善了對復(fù)雜環(huán)境的探索方式,或有望朝著實現(xiàn)真正智能學(xué)習(xí)體邁出重要一步。
增強學(xué)習(xí)可以讓人工智能系統(tǒng)通過探索和理解復(fù)雜環(huán)境來進行決策,并學(xué)習(xí)如何以最優(yōu)的方式獲得獎勵。然而,當(dāng)遇到很少給予反饋的復(fù)雜環(huán)境時,目前的加強學(xué)習(xí)算法似乎很容易碰壁。
但Go-Explore突破了這些障礙。它可以對環(huán)境進行全面探索,同時構(gòu)建一個檔案庫來記住它去過的地方,確保自己不會忘記通往有望成功的中期階段或是最終勝利(獎勵)的路線。
利用這類算法,論文作者解決了之前未能解決的2600個雅達利游戲,驗證了這類算法的潛力。作者指出,記住并回到有望成功的探索區(qū)域的簡單原則,是一種強大、通用的探索方法。他們認(rèn)為論文所報道的算法有望應(yīng)用于機器人、語言理解和藥物設(shè)計。
責(zé)任編輯:YYX
-
人工智能
+關(guān)注
關(guān)注
1817文章
50095瀏覽量
265307 -
學(xué)習(xí)算法
+關(guān)注
關(guān)注
0文章
16瀏覽量
7617
發(fā)布評論請先 登錄
人工智能與機器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用
嵌入式系統(tǒng)中的人工智能
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
兆芯攜手合作伙伴在WAIC 2025展示人工智能計算與決策解決方案
超小型Neuton機器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
光伏電站智能分析決策的系統(tǒng)化應(yīng)用工具
增強學(xué)習(xí)可讓人工智能通過探索和理解來進行決策
評論