爱吧机器人网 » 技术 > 人工智能 > 正文

人工智能:什么是强化学习?

强化学习是人工智能(AI)中讨论最多、关注最多和考虑最多的话题之一,因为它有可能改变大多数企业。什么是强化学习?强化学习的核心是一个概念,即最佳的行为或行动是由积极的回报来强化的。机器和软件代理使用强化学习算法,通过以环境的反馈为基础来确定理想行为,这是机器学习的一种形式,也是人工智能的一个分支。

人工智能:什么是强化学习?
根据问题的复杂性,强化学习算法可以在必要时随时间保持适应环境,以便长期获得最大的回报。一个通过强化学习来学会行走的机器人将通过尝试不同的方法实现目标,获得有关这些方式成功的反馈,然后进行调整直到达到行走的目标。大步伐会让机器人摔倒,通过调整步距来判断这是否是保持直立的原因,通过不同的变化持续学习,最终能够行走。以上说明,奖励是保持直立,惩罚就是摔倒,机器人基于对其动作的反馈信息进而优化并强化。强化学习需要大量的数据,这就是为什么这项技术的第一个应用领域是模拟数据,如游戏和机器人。

人工智能:什么是强化学习?
尽管处于强化学习的早期阶段,但仍有一些应用和产品开始依赖这种技术。公司开始使用强化学习解决连续性决策问题,同时强化学习支持专家决策或自动化决策处理。

机器人。强化学习为机器人学提供了“框架和一套工具”,用于处理难以设计的行为。由于强化学习可以在没有监督的情况下进行,这可以帮助机器人倍速增长。

工业自动化。得益于DeepMind(深度思维公司)的强化学习能力,谷歌能够显著降低其数据中心的能源消耗。近期被微软收购的Bonsai公司提供了一种强化学习解决方案,可以在能源、暖通空调、制造、汽车和供应链中实现自动化和“将智能构建到复杂的动态系统中”。

加强预见性维护。机器学习已经在制造业中使用了一段时间,但强化学习可以使预测性维护比现在更好。

博弈。事实上,强化学习的第一个应用是当机器学习算法AlphaGo在围棋中战胜世界上最好的人类棋手之一时一战成名,现在强化学习被用于各种游戏的竞争。

医学。强化学习非常适合于为健康状况和药物治疗找出最佳的治疗方法,还被用于临床试验以及医疗保健的其他应用。

对话系统。由于公司以客户咨询、合同、聊天机器人等形式接收大量的抽象文本,因此,将强化学习用于文本摘要的解决方案备受推崇。这些工具的内在特性是,随着时间的推移会变得更好。

个性化。无论是你使用的媒体、针对你展现的广告,还是你计划购物平台上购买的商品,都有强化学习算法在幕后发挥作用,以创造一流的客户体验。

自动驾驶。大多数自动驾驶汽车、卡车、无人驾驶飞机和船只的核心都有强化算法。英国Wayve公司设计了一款自动驾驶汽车,通过强化学习能在20分钟内学会驾驶。

人工智能:什么是强化学习?
由于强化学习运行需要大量的数据集,因此大多数公司想要利用强化学习的能力需要获取更多的数据,并且随着强化学习的价值不断上生,公司将继续对资源进行投资,以便找出在其运营、服务和产品中实现该技术的最佳方式。



上一篇:Endor(EDR)使人工智能预测惠及全人类
下一篇:人工智能的突破性和经证实的好处
精选推荐
基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

美国人工智能公司Skymind进入福建全面开展业务
美国人工智能公司Skymind进入福建全面开展业务

[2017-12-11]  人工智能在当今这个时代对大家来说想必是非常熟悉的,这也是我国近十几年来一直追求的目标,未来的时间里这也将是全人类追求的目标。就目前来看,近年来,人工智能或在我国迎......

2018年企业数字化转型的五大趋势
2018年企业数字化转型的五大趋势

[2017-12-16]  据2016年哈佛商学院研究表明,选择进行数字化转型的企业在3年内表现出了55%的平均毛利润提升,相比之下其他企业毛利润同期降低了37%。数字化转型企业的领头羊,也曾是收入处于......

谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统
谷歌大脑发布ROBEL基准 鼓励用低成本机器人训练AI系统

[2019-10-11]  训练AI系统的机器人D& 39;Claw和D& 39;Kitty用于控制机器人的人工智能系统,测量其性能所使用的基准通常仅限于为工业环境设计的昂贵硬件, ...

深度神经网络揭示了大脑喜欢看什么
深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...

助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出
助力卷积神经网络时空特征学习 史上最大行人重识别视频数据集被提出

[2017-12-25]  本文提出了一个大型的、长序列的、用于行人重识别的视频数据集,简称LVreID。与现有的同类数据集相比,该数据集具有以下特点:1)长序列:平均每段视频序列长为200帧,包含丰......

麻省理工学院最新研究:优化软体机器人的控制和设计
麻省理工学院最新研究:优化软体机器人的控制和设计

[2019-11-24]  软体机器人属于一个新的领域,它可能在诸如外科手术等领域发挥重要作用(手术时的纳米机器人需要在人体内部移动而不损伤软组织)。软体机器 ...

MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

本周栏目热点

如何才能知道对方宣传的是伪AI? 只需问5个问题

[2017-03-15]  编者按:随着人工智能在图像识别、围棋、扑克等方面取得了重大突破,现在AI现在已经被炒上天去了。很多新推出的产品和服务都是言必称采用了 ...

AI人工智能:帮你测算恋爱的死亡日期

[2017-10-01]  AI是科技领域中的一个概念,而恋爱,是人类的一种情感。科技本身是没有情感的,因此,我们一般不会将AI与恋爱结合在一起,但是最近,由南加 ...

人工智能革命揭秘上篇(上)

[2016-03-09]   我们即将创造出一种新的生命形式,这个事件不仅是进化取得突破的标志,也有可能威胁到人类这个物种的生 ...

谷歌AI对弈围棋冠军李世石 3月9日看曹大元说棋

[2016-03-04]   3月9日,我们将迎来一场人机世纪大战!战书已升起,100万美元的奖金悬在空中。人工智能和人类大脑,究 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01]    无论你是否认为面部识别令人毛骨悚然,很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。  无论是微软的猜年龄机器人, ...