爱吧机器人网 » 技术 > 神经网络 > 正文

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射

核心提示:在计算机视觉和语音识别方面,深度神经网络(DNN)已经被广泛认为是一种非常有前景的解决方案,并且正在成为众多其他

一、论文题目
 
MAERI:可重构互联架构赋能DNN加速器灵活数据流映射

二、摘要

在计算机视觉和语音识别方面,深度神经网络(DNN)已经被广泛认为是一种非常有前景的解决方案,并且正在成为众多其他人工智能应用领域的计算基础。然而,这些算法的计算复杂度和对高能效的需求导致了对专用硬件加速器研究的激增。为了减少访问DRAM的延迟和功率消耗,大多数的DNN加速器本质上是以空间换时间,通过扩展数百个处理元件(PE)并行操作并且彼此之间直接通信。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
DNN的发展是日新月异的,并且在最近的网络结构中,大多同时包括卷积层、递归层、池化层和全连接层等,且具有不同的输入大小和滤波器尺寸。它们可能是稠密的或稀疏的。它们还可以以多种方式(层内和跨层)进行分块,以获得数据的重用(权重和中间输出)。这些计算特征都可能导致不同的加速器数据流模式。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
不幸的是,大多数的DNN加速器仅支持固定的数据流模式,因为它们对PE和片上网络(NoC)进行了精细的协同设计,以期达到最优的性能功耗比。实际上,它们中的大多数仅针对卷积层内的数据流进行了优化。这使得在结构上有效地映射任意数据流变得极具挑战性,并且可能导致可用计算资源的利用率极低。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
DNN加速器需要可编程以实现大规模部署。要使它们可编程,它们需要在内部进行重构,以支持可以映射到加速器上的各种数据流模式。为了满足这一需求,我们提供了MAERI,它是一个DNN加速器,内置一组模块化和可配置的构建块,可以通过适当配置互联架构轻松支持无数DNN分区和映射。 MAERI使用刚性NoC结构,在基准测试上的多个数据流映射中提供了8-459%的资源利用率提升。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
(MAERI的不同功能模块)

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
(不同架构下面积和功耗对比)

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
(3x3x3kernel和5x5x3input的映射实例)



Abstract

Deep neural networks (DNN) have demonstrated highly promising results across computer vision and speech recognition, and are becoming foundational for ubiquitous AI. The computational complexity of these algorithms and a need for high energy-efficiency has led to a surge in research on hardware accelerators. To reduce the latency and energy costs of accessing DRAM, most DNN accelerators are spatial in nature, with hundreds of processing elements (PE) operating in parallel and communicating with each other directly. DNNs are evolving at a rapid rate, and it is common to have convolution, recurrent, pooling, and fully-connected layers with varying input and filter sizes in the most recent topologies.They may be dense or sparse. They can also be partitioned in myriad ways (within and across layers) to exploit data reuse (weights and intermediate outputs). All of the above can lead to different dataflow patterns within the accelerator substrate. Unfortunately, most DNN accelerators support only fixed dataflow patterns internally as they perform a careful co-design of the PEs and the network-on-chip (NoC). In fact, the majority of them are only optimized for traffic within a convolutional layer. This makes it challenging to map arbitrary dataflows on the fabric efficiently, and can lead to underutilization of the available compute resources. DNN accelerators need to be programmable to enable mass deployment. For them to be programmable, they need to be configurable internally to support the various dataflow patterns that could be mapped over them. To address this need, we present MAERI, which is a DNN accelerator built with a set of modular and configurable building blocks that can easily support myriad DNN partitions and mappings by appropriately configuring tiny switches. MAERI provides 8-459% better utilization across multiple dataflow mappings over baselines with rigid NoC fabrics.



如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【AI食堂】公众号(AIStation)。



上一篇:用人工智能神经网络给黑白照片上色 复现记忆中的旧时光
下一篇:最后一页

本周栏目热点

神经网络:人工智能以及我们的未来

[2016-11-20]   作者:James Crowder翻译:王益军审校:心原文链接:techcrunch把自己想象成在一辆未来的自动驾驶汽车的乘客。这辆汽车与你以一种 ...

[2016-11-20]   BP人工 神经网络 改进 算法 C语言BP网络接受样本的顺序会对训练结果有较大的影响,基本 算法 比较偏爱较后出现的样本,因此,改进 算法 为 ...

神经网络和模糊逻辑的工作流

[2016-11-20]   行业观察 神经网络 和模糊逻辑的工作流 null 来源:神州数码erp 发布时间: 2009-10-14 9:06:01 关键词: 工作流,协同,B2B,OA  以下 ...

计算机视觉领域前沿一览

[2018-07-30]  计算机视觉研究如何让计算机可以像人类一样去理解图片、视频等多媒体资源内容。例如用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步处理成更适合人眼观察或......

生物神经网络与机器学习的碰撞,Nature论文提出DNA试管网络识别手写数字

[2018-07-05]  近日,来自加州理工学院的研究人员开发出一种由 DNA 制成的新型人工神经网络。该网络解决了一个经典的机器学习问题:正确识别手写数字。该项研究中,研究者用了 36 个手写......

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射

[2018-10-10]  在计算机视觉和语音识别方面,深度神经网络(DNN)已经被广泛认为是一种非常有前景的解决方案,并且正在成为众多其他 ...

精选推荐

机器人从工业走向家庭  库卡KUKA目标是引领中国市场
机器人从工业走向家庭 库卡KUKA目标是引领中国市场

[2017-12-08]  机器人正在改变着人们的生活方式,而库卡KUKA想要在中国这个大蛋糕中占有一块大份额,库卡公司正在引领市场...

2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

Crossbar将电阻式RAM推入嵌入式AI
Crossbar将电阻式RAM推入嵌入式AI

[2018-05-17]  电阻RAM技术开发商Crossbar表示,它已与航空航天芯片制造商Microsemi达成协议,允许后者在未来的芯片中嵌入Crossbar的非易失性存储器。此举是在先进制造业节点的领先代工厂选......

智能机器人困惑的时候知道该问什么问题
智能机器人困惑的时候知道该问什么问题

[2017-03-20]   照片:Nick Dentamaro 布朗大学 上周,我们提到了麻省理工学院的一些研究,即通过链接人的大脑来帮助机器人在他们将要犯错误的时 ...

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

人工智能民主化能否实现取决于科技巨头
人工智能民主化能否实现取决于科技巨头

[2017-12-29]  我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词,民主化。 但这些公司如何界定“民主化”还不清楚,像AI本身一样,它似乎有点炒作的味道...

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......