爱吧机器人网 » 技术 > 机器学习 > 正文

【强化学习干货】《深度学习与机器人学》大牛Pieter Abbeel 105页PPT下载

2019-01-02 新智元浏览量：

作者：Pieter Abbeel
编辑：肖琴

【新智元导读】2019年开启之际，美国加州大学伯克利分校教授、机器人与强化学习领域专家 Pieter Abbeel 发布了一份资源大礼：《深度学习与机器人学》105页PPT。这份PPT整理自Abbeel教授2018年受邀参加的69个演讲，内容涵盖监督学习、强化学习和无监督学习的重要进展，以及深度学习的主要应用等方面，有助于读者对深度学习和机器人学有一个宏观的理解。

Pieter Abbeel教授从AI近年的一些“热论”讲起，从马斯克认为AI是人类文明面临的最大威胁、普京说“谁能成为 AI 领域的领袖，谁就将成为世界的主宰者”，概述了近年来AI的热潮：NIPS等顶会的参会人数达到史上最高、arxiv上AI领域的论文翻倍增长。

报告的主体部分是“深度学习成功”，详细介绍了监督学习、强化学习和无监督学习的重要进展。Pieter Abbeel教授对这三个概念的解释如下：

监督学习：模式识别，如果有足够多的数据(input -> output pairs)，那么神经网络就能够学习模式；
强化学习：通过试错的过程，学习目标导向的行为
无监督学习：没有明确的监督的条件下，学习世界的结构

最后，报告展示了深度学习的一系列应用。

PPT下载地址：

https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0

Pieter Abbeel教授简介

Pieter Abbeel，加州大学伯克利分校教授、机器人学习实验室主任，伯克利人工智能研究(BAIR)实验室联合主任。

Pieter Abbeel是机器人和强化学习领域的大牛。Pieter Abbeel 2008年从斯坦福大学获得博士学位，师从百度前首席科学家 Andrew Ng（吴恩达），毕业后在UC Berkeley任教。

2016~2017年，Pieter Abbeel加入Open AI，任研究科学家。现在则是Open AI顾问。

Pieter Abbeel还是两家AI公司的创始人，Gradescope和covariant.ai。Gradescope开发为家庭作业、课题研究、试卷等打分的AI系统；covariant.ai开发机器人自动化的AI系统，在制造/仓储/电子商务/物流等领域应用。

Pieter Abbeel 的研究重点特别集中于如何让机器人向人类学习（学徒学习），如何让机器人通过自己的试错过程学习(强化学习)，以及如何通过从learning-to-learn(元学习)过程中加快技能获取。他开发的机器人已经学会了先进的直升机特技飞行、打结、基本装配、叠衣服、移动、以及基于视觉的机器人操作。

机器人叠毛巾

Pieter Abbeel目前的主要研究方向：机器人和机器学习，特别关注深度强化学习、深度模仿学习、深度无监督学习、元学习、learning-to-learn、以及AI安全。

PPT全文

PPT下载地址：

https://www.dropbox.com/s/dw4kmxkrv3orujd/2018_12_xx_Abbeel--AI.pdf?dl=0

相关阅读

上一篇：2018机器学习和AI最大突破没找到，但我发现了最大障碍！
下一篇：恶意的机器学习如何破坏人工智能？

精选推荐

2018年企业数字化转型的五大趋势

2018年企业数字化转型的五大趋势

[2017-12-16] 据2016年哈佛商学院研究表明，选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升，相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊，也曾是收入处于......

人工神经网络技术解码人类行为和想象时的大脑活动信号

人工神经网络技术解码人类行为和想象时的大脑活动信号

[2017-08-23] 为搜索引擎过滤信息，棋盘游戏对弈，识别图像人工智能在某些任务中远远超过了人类智能。来自弗莱堡由神经科学家私人讲师Tonio Ball博士领导的几个杰出的BrainLinks-Bra......

从AI中窥探人性

从AI中窥探人性

[2018-01-03] 人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在，一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

2022年全球工业机器人市场将达到790亿美元

2022年全球工业机器人市场将达到790亿美元

[2017-09-04] 预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

九台“猎豹”机器人组队踢球，麻省理工高材生们的高级趣味

九台“猎豹”机器人组队踢球，麻省理工高材生们的高级趣味

[2019-11-09] 本周，在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上，一群由人工智能驱动的机器人就是这场比赛的 ...

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

[2019-10-26] 谷歌刚刚宣布，其搜索引擎的核心算法正在进行一项重大升级，这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术（BERT ...

美国Natilus公司试飞水上无人货机设计简单成本降低

美国Natilus公司试飞水上无人货机设计简单成本降低

[2017-12-28] Natilus创业公司成立于2014年，其梦想是建造大型无人机，以半价提供比船舶快得多国际货运。在十二月份，Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

MIT研制出可以像植物一样生长的机器人

MIT研制出可以像植物一样生长的机器人

[2019-11-09] 麻省理工学院开发了一种新型机器人，这种机器人可以本质上自我延伸，其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是，研究人员 ...

版权声明：

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

顶级AI会议NIPS压轴2017（附PPT、视频、代码大汇总）

顶级AI会议NIPS压轴2017（附PPT、视频、代码大汇总）

[2017-12-19] NIPS，全称神经信息处理系统大会(Conference and Workshop on Neural Information Processing Systems)，是一个关于机器学习和计算神经科学的国际会议。该会议固定在每年的12月举行...

机器学习选择深层模型的原因

机器学习选择深层模型的原因

[1970-01-01] 深度学习采用的模型为深层神经网络（Deep Neural Networks，DNN）模型，即包含多个隐藏层（Hidden Layer，也称隐含层）的神经网络（Ne ...

机器学习—自由编码器

机器学习—自由编码器

[1970-01-01] 一种常见的深层模型是由自编码器（Auto-Encoder）构造的。自编码器可以利用一组无标签的训练数据{x(1), x(2), &hellip }（其中x(i)是一个n ...

【NIPS最佳论文出炉】冷扑大师能战胜AlphaZero吗？No（Science论文）

【NIPS最佳论文出炉】冷扑大师能战胜AlphaZero吗？No（Science论文）

[2017-12-19] 拿下NIPS2017 最佳论文，登上Science，“冷扑大师”最近有点热。18日，两位作者，CMU博士生Noam Brown和Tuomas Sandholm教授在Reddit上回答问题。对“为什么不使用深度学习......

日本开发团队给机器人嵌入神经网络

日本开发团队给机器人嵌入神经网络

[2016-08-18] 　　近日在日本国立科学博物馆展出的机器人 Alter，可谓是目前世界上最为先进的机器人之一，因为它是一款嵌入了神经网络的机器人，来自日本 ...

最新资讯
热点图片

“CDR第一股” 九号机器人三年亏损近29亿背靠小米好乘凉？

“CDR第一股” 九号机器人三年亏损近29亿背靠小米好乘凉？

高通宣布推出全球首款支持5G和AI的机器人平台RB5

高通宣布推出全球首款支持5G和AI的机器人平台RB5