爱吧机器人网 » 技术 > 人工智能 > 正文

人工智能:什么是强化学习?

强化学习是人工智能(AI)中讨论最多、关注最多和考虑最多的话题之一,因为它有可能改变大多数企业。什么是强化学习?强化学习的核心是一个概念,即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化学习算法,通过以环境的反馈为基础来确定理想行为,这是机器学习的一种形式,也是人工智能的一个分支。

人工智能:什么是强化学习?
根据问题的复杂性,强化学习算法可以在必要时随时间保持适应环境,以便长期获得最大的回报。一个通过强化学习来学会行走的机器人将通过尝试不同的方法实现目标,获得有关这些方式成功的反馈,然后进行调整直到达到行走的目标。大步伐会让机器人摔倒,通过调整步距来判断这是否是保持直立的原因,通过不同的变化持续学习,最终能够行走。以上说明,奖励是保持直立,惩罚就是摔倒,机器人基于对其动作的反馈信息进而优化并强化。强化学习需要大量的数据,这就是为什么这项技术的第一个应用领域是模拟数据,如游戏和机器人。

人工智能:什么是强化学习?
尽管处于强化学习的早期阶段,但仍有一些应用和产品开始依赖这种技术。公司开始使用强化学习解决连续性决策问题,同时强化学习支持专家决策或自动化决策处理。

机器人。强化学习为机器人学提供了“框架和一套工具”,用于处理难以设计的行为。由于强化学习可以在没有监督的情况下进行,这可以帮助机器人倍速增长。

工业自动化。得益于DeepMind(深度思维公司)的强化学习能力,谷歌能够显著降低其数据中心的能源消耗。近期被微软收购的Bonsai公司提供了一种强化学习解决方案,可以在能源、暖通空调、制造、汽车和供应链中实现自动化和“将智能构建到复杂的动态系统中”。

加强预见性维护。机器学习已经在制造业中使用了一段时间,但强化学习可以使预测性维护比现在更好。

博弈。事实上,强化学习的第一个应用是当机器学习算法AlphaGo在围棋中战胜世界上最好的人类棋手之一时一战成名,现在强化学习被用于各种游戏的竞争。

医学。强化学习非常适合于为健康状况和药物治疗找出最佳的治疗方法,还被用于临床试验以及医疗保健的其他应用。

对话系统。由于公司以客户咨询、合同、聊天机器人等形式接收大量的抽象文本,因此,将强化学习用于文本摘要的解决方案备受推崇。这些工具的内在特性是,随着时间的推移会变得更好。

个性化。无论是你使用的媒体、针对你展现的广告,还是你计划购物平台上购买的商品,都有强化学习算法在幕后发挥作用,以创造一流的客户体验。

自动驾驶。大多数自动驾驶汽车、卡车、无人驾驶飞机和船只的核心都有强化算法。英国Wayve公司设计了一款自动驾驶汽车,通过强化学习能在20分钟内学会驾驶。

人工智能:什么是强化学习?
由于强化学习运行需要大量的数据集,因此大多数公司想要利用强化学习的能力需要获取更多的数据,并且随着强化学习的价值不断上生,公司将继续对资源进行投资,以便找出在其运营、服务和产品中实现该技术的最佳方式。



上一篇:Endor(EDR)使人工智能预测惠及全人类
下一篇:人工智能的突破性和经证实的好处
精选推荐
2022年全球工业机器人市场将达到790亿美元
2022年全球工业机器人市场将达到790亿美元

[2017-09-04]  预计到 2022年, 全球工业机器人市场将达到790亿美元, 并在预测期内登记11 5% 的复合年增长率。随着发展中国家中小型企业需求的不断增长, 采用自动化技术以确保生产质量......

[2017-03-21]  虽然有很多关于机器人取代工人的担心,但哈佛经济学家James Bessen的论文指出,在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

[2018-01-26]  纽约时报的报道,德国的研究人员已经开发出一种长约七分之一英寸的机器人,首先看起来不过是一小块橡皮条。然后它开始移动。机器人走路,跳跃,爬行,滚动和游泳。它甚至爬出......

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

如何让人工智能机器人快速自我纠正错误并吃一堑长一智?
如何让人工智能机器人快速自我纠正错误并吃一堑长一智?

[2017-08-23]  莱斯特大学数学系的研究人员在《Neural Networks》杂志上发表了一篇文章,概述了新算法的数学基础,可以使人工智能收集错误报告并立即纠正,而不影响现有技能 ,同时还会积......

科学家从蟑螂获得启发 教机器人更好地走路
科学家从蟑螂获得启发 教机器人更好地走路

[2017-12-11]  Weihmann指出:“我特别感到惊讶的是,动物运动稳定机制的变化与腿部协调的变化是一致的。昆虫的慢运行非常稳定,因为它的重心很低,三条腿总是以协调的方式运动。...

九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味
九台“猎豹”机器人组队踢球,麻省理工高材生们的高级趣味

[2019-11-09]  本周,在麻省理工学院10号楼外草坪上展开了一场别开生面的足球比赛。在绿草如茵的基利安球场上,一群由人工智能驱动的机器人就是这场比赛的 ...

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

本周栏目热点

如何才能知道对方宣传的是伪AI? 只需问5个问题

[2017-03-15]  编者按:随着人工智能在图像识别、围棋、扑克等方面取得了重大突破,现在AI现在已经被炒上天去了。很多新推出的产品和服务都是言必称采用了 ...

AI人工智能:帮你测算恋爱的死亡日期

[2017-10-01]  AI是科技领域中的一个概念,而恋爱,是人类的一种情感。科技本身是没有情感的,因此,我们一般不会将AI与恋爱结合在一起,但是最近,由南加 ...

人工智能革命揭秘上篇(上)

[2016-03-09]   我们即将创造出一种新的生命形式,这个事件不仅是进化取得突破的标志,也有可能威胁到人类这个物种的生 ...

谷歌AI对弈围棋冠军李世石 3月9日看曹大元说棋

[2016-03-04]   3月9日,我们将迎来一场人机世纪大战!战书已升起,100万美元的奖金悬在空中。人工智能和人类大脑,究 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01]    无论你是否认为面部识别令人毛骨悚然,很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。  无论是微软的猜年龄机器人, ...