爱吧机器人网 » 技术 > 神经网络 > 正文

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射

一、论文题目
 
MAERI:可重构互联架构赋能DNN加速器灵活数据流映射

二、摘要

在计算机视觉和语音识别方面,深度神经网络(DNN)已经被广泛认为是一种非常有前景的解决方案,并且正在成为众多其他人工智能应用领域的计算基础。然而,这些算法的计算复杂度和对高能效的需求导致了对专用硬件加速器研究的激增。为了减少访问DRAM的延迟和功率消耗,大多数的DNN加速器本质上是以空间换时间,通过扩展数百个处理元件(PE)并行操作并且彼此之间直接通信。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
DNN的发展是日新月异的,并且在最近的网络结构中,大多同时包括卷积层、递归层、池化层和全连接层等,且具有不同的输入大小和滤波器尺寸。它们可能是稠密的或稀疏的。它们还可以以多种方式(层内和跨层)进行分块,以获得数据的重用(权重和中间输出)。这些计算特征都可能导致不同的加速器数据流模式。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
不幸的是,大多数的DNN加速器仅支持固定的数据流模式,因为它们对PE和片上网络(NoC)进行了精细的协同设计,以期达到最优的性能功耗比。实际上,它们中的大多数仅针对卷积层内的数据流进行了优化。这使得在结构上有效地映射任意数据流变得极具挑战性,并且可能导致可用计算资源的利用率极低。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
DNN加速器需要可编程以实现大规模部署。要使它们可编程,它们需要在内部进行重构,以支持可以映射到加速器上的各种数据流模式。为了满足这一需求,我们提供了MAERI,它是一个DNN加速器,内置一组模块化和可配置的构建块,可以通过适当配置互联架构轻松支持无数DNN分区和映射。 MAERI使用刚性NoC结构,在基准测试上的多个数据流映射中提供了8-459%的资源利用率提升。

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
(MAERI的不同功能模块)

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
(不同架构下面积和功耗对比)

MAERI:可重构互联架构赋能DNN加速器灵活数据流映射
(3x3x3kernel和5x5x3input的映射实例)



Abstract

Deep neural networks (DNN) have demonstrated highly promising results across computer vision and speech recognition, and are becoming foundational for ubiquitous AI. The computational complexity of these algorithms and a need for high energy-efficiency has led to a surge in research on hardware accelerators. To reduce the latency and energy costs of accessing DRAM, most DNN accelerators are spatial in nature, with hundreds of processing elements (PE) operating in parallel and communicating with each other directly. DNNs are evolving at a rapid rate, and it is common to have convolution, recurrent, pooling, and fully-connected layers with varying input and filter sizes in the most recent topologies.They may be dense or sparse. They can also be partitioned in myriad ways (within and across layers) to exploit data reuse (weights and intermediate outputs). All of the above can lead to different dataflow patterns within the accelerator substrate. Unfortunately, most DNN accelerators support only fixed dataflow patterns internally as they perform a careful co-design of the PEs and the network-on-chip (NoC). In fact, the majority of them are only optimized for traffic within a convolutional layer. This makes it challenging to map arbitrary dataflows on the fabric efficiently, and can lead to underutilization of the available compute resources. DNN accelerators need to be programmable to enable mass deployment. For them to be programmable, they need to be configurable internally to support the various dataflow patterns that could be mapped over them. To address this need, we present MAERI, which is a DNN accelerator built with a set of modular and configurable building blocks that can easily support myriad DNN partitions and mappings by appropriately configuring tiny switches. MAERI provides 8-459% better utilization across multiple dataflow mappings over baselines with rigid NoC fabrics.



如果你对本文感兴趣,想要下载完整文章进行阅读,可以关注【AI食堂】公众号(AIStation)。




上一篇:用人工智能神经网络给黑白照片上色 复现记忆中的旧时光
下一篇:可编辑神经网络,有望简化深度学习?
精选推荐
2023年服务机器人市场将超过250亿美元
2023年服务机器人市场将超过250亿美元

[2017-09-04]  全球服务机器人市场预计到2023年将达到250亿美元, 并在预测期内登记15% 的复合年增长率。短期中期回收期和投资回报率高 (ROI), 以及在教育和研究、临场感、防御、救援和安......

什么是机器人学?机器人学简介
什么是机器人学?机器人学简介

[2017-12-14]  机器人学是工程学与科学的交叉学科,包括机械工程,电气工程,计算机科学等。机器人技术涉及机器人的设计、制造、操作和应用,以及用于控制、感官反馈和信息处理的计算机系统。...

麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群
麻省理工又秀神技:推出如魔法般跳跃的方块机器人集群

[2019-10-31]  几天前,小编向大家介绍过麻省理工(MIT)研发的一种自组装机器人集群(点此阅览),它们可以用统一标准的小单元自动组装出各种大型结构。 ...

搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站
搭载人工智能的太空机器人CIMON 2乘SpaceX抵达国际空间站

[2019-12-09]  12月5日,搭载人工智能的太空机器人西蒙2号(CIMON 2)乘坐SpaceX火箭Dragon货运舱,从佛罗里达州卡纳维拉尔角空军基地升空,前往国际空间 ...

MIT研制出可以像植物一样生长的机器人
MIT研制出可以像植物一样生长的机器人

[2019-11-09]  麻省理工学院开发了一种新型机器人,这种机器人可以本质上自我延伸,其生长方式与植物幼苗向上生长的方式惊人相似。值得注意的是,研究人员 ...

揭秘达芬奇手术机器人
揭秘达芬奇手术机器人

[2018-04-19]  达芬奇手术系统是由美国Intuitive Surgical公司制造的机器人手术系统。美国食品和药物管理局(FDA)于2000年通过该标准,旨在利用微创手段 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私
英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14]  英伟达(Nvidia)和伦敦国王学院(King’s College London)的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络, ...

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

本周栏目热点

神经网络:人工智能以及我们的未来

[2016-11-20]   作者:James Crowder翻译:王益军审校:心原文链接:techcrunch把自己想象成在一辆未来的自动驾驶汽车的乘客。这辆汽车与你以一种 ...

[2016-11-20]   include "stdio h" include "stdlib h" include "time h" include "math h" *********************************************i ...

OpenAI开辟全新AI音乐领域,发布Jukebox神经网络生产歌曲

[2020-05-19]  日前,外媒报道,人工智能(AI)技术生成的音乐会给人们带来非常奇妙体验。其中有两大原因,第一,这是一个非常吸引人的全新领域;第二,这 ...

50行代码玩转生成对抗网络GAN模型!(附源码)

[2018-07-30]  本文为大家介绍了生成对抗网络(Generate Adversarial Network,GAN),以最直白的语言来讲解它,最后实现一个简单的 GAN 程序来帮助大家加深理解。...

深度神经网络揭示了大脑喜欢看什么

[2019-11-06]  爱吧机器人网编者按:近日,《自然-神经科学》发表了一篇论文,研究人员创建了一种深度人工神经网络,能够准确预测生物大脑对视觉刺激所产 ...