人工智能：什么是强化学习？-人工智能-技术-爱吧机器人网

人工智能：什么是强化学习？

2018-09-29 Fintech看世界浏览量：

强化学习是人工智能（AI）中讨论最多、关注最多和考虑最多的话题之一，因为它有可能改变大多数企业。什么是强化学习？强化学习的核心是一个概念，即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化学习算法，通过以环境的反馈为基础来确定理想行为，这是机器学习的一种形式，也是人工智能的一个分支。

人工智能：什么是强化学习？

根据问题的复杂性，强化学习算法可以在必要时随时间保持适应环境，以便长期获得最大的回报。一个通过强化学习来学会行走的机器人将通过尝试不同的方法实现目标，获得有关这些方式成功的反馈，然后进行调整直到达到行走的目标。大步伐会让机器人摔倒，通过调整步距来判断这是否是保持直立的原因，通过不同的变化持续学习，最终能够行走。以上说明，奖励是保持直立，惩罚就是摔倒，机器人基于对其动作的反馈信息进而优化并强化。强化学习需要大量的数据，这就是为什么这项技术的第一个应用领域是模拟数据，如游戏和机器人。

人工智能：什么是强化学习？

尽管处于强化学习的早期阶段，但仍有一些应用和产品开始依赖这种技术。公司开始使用强化学习解决连续性决策问题，同时强化学习支持专家决策或自动化决策处理。

机器人。强化学习为机器人学提供了“框架和一套工具”，用于处理难以设计的行为。由于强化学习可以在没有监督的情况下进行，这可以帮助机器人倍速增长。

工业自动化。得益于DeepMind（深度思维公司）的强化学习能力，谷歌能够显著降低其数据中心的能源消耗。近期被微软收购的Bonsai公司提供了一种强化学习解决方案，可以在能源、暖通空调、制造、汽车和供应链中实现自动化和“将智能构建到复杂的动态系统中”。

加强预见性维护。机器学习已经在制造业中使用了一段时间，但强化学习可以使预测性维护比现在更好。

博弈。事实上，强化学习的第一个应用是当机器学习算法AlphaGo在围棋中战胜世界上最好的人类棋手之一时一战成名，现在强化学习被用于各种游戏的竞争。

医学。强化学习非常适合于为健康状况和药物治疗找出最佳的治疗方法，还被用于临床试验以及医疗保健的其他应用。

对话系统。由于公司以客户咨询、合同、聊天机器人等形式接收大量的抽象文本，因此，将强化学习用于文本摘要的解决方案备受推崇。这些工具的内在特性是，随着时间的推移会变得更好。

个性化。无论是你使用的媒体、针对你展现的广告，还是你计划购物平台上购买的商品，都有强化学习算法在幕后发挥作用，以创造一流的客户体验。

自动驾驶。大多数自动驾驶汽车、卡车、无人驾驶飞机和船只的核心都有强化算法。英国Wayve公司设计了一款自动驾驶汽车，通过强化学习能在20分钟内学会驾驶。

人工智能：什么是强化学习？

由于强化学习运行需要大量的数据集，因此大多数公司想要利用强化学习的能力需要获取更多的数据，并且随着强化学习的价值不断上生，公司将继续对资源进行投资，以便找出在其运营、服务和产品中实现该技术的最佳方式。

精选推荐

集群机器人领域最新研究：一种用于探测未知环境的微型无人机群

[2019-10-26] （图：无人机扩散至不同方向来探索环境。当一个无人机注意到另一个无人机在它的首选方向，它将试图飞到另一个方向。若首选方向冲突，低优先 ...

谷歌《Nature》发论文称实现量子霸权 18亿倍速碾压世界最强超算

[2019-10-23] 谷歌坚称自己已经取得了量子霸权——这标志着计算研究领域的一个重要里程碑。谷歌首次发布声明是在今年9月，虽然遭到竞争对手的质疑，但就 ...

全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14] 美国Think Surgical公司已获得美国食品和药物管理局（FDA）的批准，在美国销售用于全膝关节置换（TKA）的TSolution One®全膝关节应用 ...

南加州大学机器人学家：机器人更适合粗暴的爱

[2019-11-07] 图片来自JOHN MADERE GETTY IMAGES打是疼骂是爱，当人类粗暴的将物体从机器人手中敲掉，看似残忍，实际上却能帮助机器人找到最好的握持物 ...

为未来战场创造更有效的机器人美国陆军研究人工纳米马达

[2019-10-11] 为了使机器人在战斗中更有效、更多才多艺地成为士兵的战友，美国陆军研究人员正在执行一项任务，即研究肌肉分子生命功能的价值，以及复制过 ...

谷歌宣布搜索算法重大升级，用BERT模型理解用户搜索意图

[2019-10-26] 谷歌刚刚宣布，其搜索引擎的核心算法正在进行一项重大升级，这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术（BERT ...

基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17] 很多机器人被设计应用在危险环境，如灾难现场。在这些地方，他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗？也许不是，如果它们像日本的东北和北海道大学创造的......

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系[email protected]，我们会立即处理。谢谢配合！

本周栏目热点

人工智能产业深度研究报告（二）

[2016-02-14] 　　4 人工智能生态格局展望：巨头与新贵共舞　　4 1　人工智能将催生新一轮IT ...

英特尔研发新AI技术通过照片构建虚构场景

[2017-08-21] 近日，斯坦福大学和英特尔共同研发了一项技术。在向他们的人工智能系统输入5000张德国街道照片后，该技术可在人类的辅助下，让系统构建 ...

OFO宣布进入4.0时代人工智能竟是这样找车

[2017-09-27] 9月26日，OFO小黄车召开发布会，宣布OFO将进入到用科技重新定义共享的4 0时代，作为此次发布会的重点，OFO小黄蜂也成为了众所关注的焦点， ...

人工智能领衔未来生活智能硬件或迎转折

[2016-03-03] 　　智能家电转型升级，硬件+内容双管齐下　　在国家提倡互联网+战略的大背景下 ...

人工智能革命之下你会失业还是变得富有？

[2016-07-12] 最新一期的《经济学人》杂志的封面报道，将人工智能的发展对未来世界的影响和19世纪工业革命联系起来，机器的大规模应用是否会让工 ...