爱吧机器人网 » 技术 > 人工智能 > 正文

人工智能:什么是强化学习?

强化学习是人工智能(AI)中讨论最多、关注最多和考虑最多的话题之一,因为它有可能改变大多数企业。什么是强化学习?强化学习的核心是一个概念,即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化学习算法,通过以环境的反馈为基础来确定理想行为,这是机器学习的一种形式,也是人工智能的一个分支。

人工智能:什么是强化学习?
根据问题的复杂性,强化学习算法可以在必要时随时间保持适应环境,以便长期获得最大的回报。一个通过强化学习来学会行走的机器人将通过尝试不同的方法实现目标,获得有关这些方式成功的反馈,然后进行调整直到达到行走的目标。大步伐会让机器人摔倒,通过调整步距来判断这是否是保持直立的原因,通过不同的变化持续学习,最终能够行走。以上说明,奖励是保持直立,惩罚就是摔倒,机器人基于对其动作的反馈信息进而优化并强化。强化学习需要大量的数据,这就是为什么这项技术的第一个应用领域是模拟数据,如游戏和机器人。

人工智能:什么是强化学习?
尽管处于强化学习的早期阶段,但仍有一些应用和产品开始依赖这种技术。公司开始使用强化学习解决连续性决策问题,同时强化学习支持专家决策或自动化决策处理。

机器人。强化学习为机器人学提供了“框架和一套工具”,用于处理难以设计的行为。由于强化学习可以在没有监督的情况下进行,这可以帮助机器人倍速增长。

工业自动化。得益于DeepMind(深度思维公司)的强化学习能力,谷歌能够显著降低其数据中心的能源消耗。近期被微软收购的Bonsai公司提供了一种强化学习解决方案,可以在能源、暖通空调、制造、汽车和供应链中实现自动化和“将智能构建到复杂的动态系统中”。

加强预见性维护。机器学习已经在制造业中使用了一段时间,但强化学习可以使预测性维护比现在更好。

博弈。事实上,强化学习的第一个应用是当机器学习算法AlphaGo在围棋中战胜世界上最好的人类棋手之一时一战成名,现在强化学习被用于各种游戏的竞争。

医学。强化学习非常适合于为健康状况和药物治疗找出最佳的治疗方法,还被用于临床试验以及医疗保健的其他应用。

对话系统。由于公司以客户咨询、合同、聊天机器人等形式接收大量的抽象文本,因此,将强化学习用于文本摘要的解决方案备受推崇。这些工具的内在特性是,随着时间的推移会变得更好。

个性化。无论是你使用的媒体、针对你展现的广告,还是你计划购物平台上购买的商品,都有强化学习算法在幕后发挥作用,以创造一流的客户体验。

自动驾驶。大多数自动驾驶汽车、卡车、无人驾驶飞机和船只的核心都有强化算法。英国Wayve公司设计了一款自动驾驶汽车,通过强化学习能在20分钟内学会驾驶。

人工智能:什么是强化学习?
由于强化学习运行需要大量的数据集,因此大多数公司想要利用强化学习的能力需要获取更多的数据,并且随着强化学习的价值不断上生,公司将继续对资源进行投资,以便找出在其运营、服务和产品中实现该技术的最佳方式。



上一篇:Endor(EDR)使人工智能预测惠及全人类
下一篇:人工智能的突破性和经证实的好处
精选推荐
农业将为高科技行业 农业机器人的应用领域
农业将为高科技行业 农业机器人的应用领域

[2017-12-17]  农业正在迅速成为一个令人兴奋的高科技产业,吸引了新专业人士,新公司和新投资者。技术发展迅速,不仅提高了农民的生产能力,而且促进了我们所知道的机器人和自动化技术的发展。...

机器人工程师具体都做什么?
机器人工程师具体都做什么?

[2017-12-08]  机器人工程师是幕后设计师,负责创建机器人和机器人系统,能够执行人类无法完成或不愿意完成的任务。 通过他们的创造,机器人工程师帮助工作更安全,更轻松,更高效,特别是......

新型轻便机器人套装重5kg,辅助跑步和步行
新型轻便机器人套装重5kg,辅助跑步和步行

[2019-10-23]  虽然步行对大多数人来说似乎不是负担,但对有些人来说,这项简单的运动往往会让人感到筋疲力尽。比如手术或中风后恢复的患者、帕金森氏症患 ...

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

机器人灵巧手将成为智能机器人的下一个重大突破
机器人灵巧手将成为智能机器人的下一个重大突破

[2018-01-25]  计算机科学教授兼东北地区助手机器人实验室负责人罗伯特·普拉特(Robert Platt)说:“机器人手操作是下一步要解决的问题。想象一下,一个机器人可以在现实世界中用手去做事......

一个让深度学习惨败的通用人工智能领域——语境处理
一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04]  Context是指用来解释一段给定文本或语句的来源框架,我们可以翻译为上下文或语境。维基百科将context定义为:*在符号学、语言学、社会学和 ...

这个外科手术机器人可以为患者“量身定制”
这个外科手术机器人可以为患者“量身定制”

[2019-07-12]  世界首创,来自澳大利亚机器人视觉研究中心的研究人员正在推动手术机器人的发展边界,他们创造了可定制的、小型化的手术机器人,能够唯一地 ...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

本周栏目热点

为你讲述大历史观视野下的人工智能

[2016-08-07]   人工智能 是当前科学技术发展的前沿。目前,关于 人工智能 的争论不仅在 科技 界,而且扩展到整个社会。争论围绕以下问题展开:其一, 人 ...

AISA人工智能主动防御系统—美国路演硅谷站

[2018-07-17]  26日 硅谷区块链大会。硅谷项目AISA异军凸起,首提AI人工智能威胁防御课题,引起了业界广泛关注。该项目极具创新性。参会人士对项目未来发展普遍看好,多家VC表示主动投资意向。...

从"陪练"到"赢家":人机博弈的六十年

[2016-03-11]   本报记者 常丽君自上世纪五十年代第一个博弈类计算机程序诞生以来,人机之间的博弈从未终止。60多年的 ...

人工智能机器人将要接管世界?

[1970-01-01]    人类对机器人的来临早有准备,只是化学和新陈代谢的速度极限决定了有机大脑的能力存在着极限。或许人类的大脑已经达到了那个顶峰,但对 ...

美媒:日本寄望人工智能重振科技业

[1970-01-01]   据美国《华尔街日报》12月1日报道,Daisuke Okanohara是东京 人工智能 公司Preferred Networks Inc 的 ...