2019年開啟之際,美國(guó)加州大學(xué)伯克利分校教授、機(jī)器人與強(qiáng)化學(xué)習(xí)領(lǐng)域?qū)<?Pieter Abbeel 發(fā)布了一份資源大禮:《深度學(xué)習(xí)與機(jī)器人學(xué)》105頁(yè)P(yáng)PT。這份PPT整理自Abbeel教授2018年受邀參加的69個(gè)演講,內(nèi)容涵蓋監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的重要進(jìn)展,以及深度學(xué)習(xí)的主要應(yīng)用等方面,有助于讀者對(duì)深度學(xué)習(xí)和機(jī)器人學(xué)有一個(gè)宏觀的理解。
Pieter Abbeel教授從AI近年的一些“熱論”講起,從馬斯克認(rèn)為AI是人類文明面臨的最大威脅、普京說“誰能成為AI領(lǐng)域的領(lǐng)袖,誰就將成為世界的主宰者”,概述了近年來AI的熱潮:NIPS等頂會(huì)的參會(huì)人數(shù)達(dá)到史上最高、arxiv上AI領(lǐng)域的論文翻倍增長(zhǎng)。
報(bào)告的主體部分是“深度學(xué)習(xí)成功”,詳細(xì)介紹了監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的重要進(jìn)展。Pieter Abbeel教授對(duì)這三個(gè)概念的解釋如下:
監(jiān)督學(xué)習(xí):模式識(shí)別,如果有足夠多的數(shù)據(jù)(input -> output pairs),那么神經(jīng)網(wǎng)絡(luò)就能夠?qū)W習(xí)模式;
強(qiáng)化學(xué)習(xí):通過試錯(cuò)的過程,學(xué)習(xí)目標(biāo)導(dǎo)向的行為
無監(jiān)督學(xué)習(xí):沒有明確的監(jiān)督的條件下,學(xué)習(xí)世界的結(jié)構(gòu)
最后,報(bào)告展示了深度學(xué)習(xí)的一系列應(yīng)用。

PPT下載地址:
https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0
Pieter Abbeel教授簡(jiǎn)介

Pieter Abbeel,加州大學(xué)伯克利分校教授、機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室主任,伯克利人工智能研究(BAIR)實(shí)驗(yàn)室聯(lián)合主任。
Pieter Abbeel是機(jī)器人和強(qiáng)化學(xué)習(xí)領(lǐng)域的大牛。Pieter Abbeel 2008年從斯坦福大學(xué)獲得博士學(xué)位,師從百度前首席科學(xué)家 Andrew Ng(吳恩達(dá)),畢業(yè)后在UC Berkeley任教。
2016~2017年,Pieter Abbeel加入Open AI,任研究科學(xué)家。現(xiàn)在則是Open AI顧問。
Pieter Abbeel還是兩家AI公司的創(chuàng)始人,Gradescope和covariant.ai。Gradescope開發(fā)為家庭作業(yè)、課題研究、試卷等打分的AI系統(tǒng);covariant.ai開發(fā)機(jī)器人自動(dòng)化的AI系統(tǒng),在制造/倉(cāng)儲(chǔ)/電子商務(wù)/物流等領(lǐng)域應(yīng)用。
Pieter Abbeel 的研究重點(diǎn)特別集中于如何讓機(jī)器人向人類學(xué)習(xí)(學(xué)徒學(xué)習(xí)),如何讓機(jī)器人通過自己的試錯(cuò)過程學(xué)習(xí)(強(qiáng)化學(xué)習(xí)),以及如何通過從learning-to-learn(元學(xué)習(xí))過程中加快技能獲取。他開發(fā)的機(jī)器人已經(jīng)學(xué)會(huì)了先進(jìn)的直升機(jī)特技飛行、打結(jié)、基本裝配、疊衣服、移動(dòng)、以及基于視覺的機(jī)器人操作。
機(jī)器人疊毛巾
Pieter Abbeel目前的主要研究方向:機(jī)器人和機(jī)器學(xué)習(xí),特別關(guān)注深度強(qiáng)化學(xué)習(xí)、深度模仿學(xué)習(xí)、深度無監(jiān)督學(xué)習(xí)、元學(xué)習(xí)、learning-to-learn、以及AI安全。
PPT全文














































-
機(jī)器人
+關(guān)注
關(guān)注
213文章
31093瀏覽量
222355 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4838瀏覽量
107836 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124411
原文標(biāo)題:【強(qiáng)化學(xué)習(xí)干貨】《深度學(xué)習(xí)與機(jī)器人學(xué)》大牛Pieter Abbeel 105頁(yè)P(yáng)PT下載
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
基于NVIDIA Isaac Lab拓展多模態(tài)機(jī)器人學(xué)習(xí)
NVIDIA開源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)
NVIDIA 發(fā)布三大利器,推動(dòng)人形機(jī)器人邁向新紀(jì)元
易控智駕與中科院端到端自動(dòng)駕駛方案入選CoRL 2025
NVIDIA展示機(jī)器人領(lǐng)域的研究成果
NVIDIA Isaac Lab可用環(huán)境與強(qiáng)化學(xué)習(xí)腳本使用指南
通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)
NVIDIA Isaac Sim和Isaac Lab現(xiàn)已推出早期開發(fā)者預(yù)覽版
M1A AI迷你電腦加持,5分鐘搞定PPT制作
NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例
構(gòu)建人形機(jī)器人學(xué)習(xí)的合成運(yùn)動(dòng)生成流程
深度解讀英偉達(dá)Newton機(jī)器人平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建
AgiBot World Colosseo:構(gòu)建通用機(jī)器人智能的規(guī)模化數(shù)據(jù)平臺(tái)
Pieter Abbeel發(fā)布了一份資源大禮:《深度學(xué)習(xí)與機(jī)器人學(xué)》105頁(yè)P(yáng)PT
評(píng)論