基于卷积神经网络的压缩与硬件加速方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

卷积神经网络（Convolution Neural Network, CNN）在图像、语音、人脸识别等领域发展迅速，尤其在图像领域表现出色。现实中对传统算法的应用往往依托于体积小、功耗低的嵌入式平台，卷积神经网络的特点是参数庞大、网络模型复杂、卷积运算耗时过多，这使得卷积神经网络不易在嵌入式端流畅运行。本文针对卷积神经网络参数庞大、网络模型复杂的特点，提出网络裁剪和权值量化，对卷积神经网络进行压缩，同时针对卷积神经网络卷积运算耗时过多的特点，使用现场可编程门阵列(FPGA)对卷积过程进行加速。　　本文研究的卷积神经网络模型为Tiny-yolo，首先，分析Tiny-yolo网络连接关系，对权值较小的连接进行裁剪，减少权值数量，实现对网络的压缩；裁剪后的权值矩阵采用稀疏化存储方式，减少网络模型对内存的占用；对稀疏网络进行重训练，达到压缩目的的同时，保证网络在裁剪前后识别精度不会出现大幅下降；其次，对权值进行量化，本文将Tiny-yolo原有数据类型进行量化，在保证精度误差范围内，进一步减小模型内存占用量和运算复杂度；最后，根据Tiny-yolo网络结构特点提出了深度并行-流水的FPGA加速优化方案，对数据缓存，以及卷积运算进行加速，最终实现Tiny-yolo网络在嵌入式端流畅运行。　　通过实验验证，网络裁剪在保证网络识别精度的前提下，参数数量减少9成，网络模型占用内存由63.5MB变为4.55MB。量化实现4倍左右的压缩比率，网络精度有所损失，mAP下降2个百分点，但对最终检测结果影响不大。硬件加速优化，相比在最大频率为667MHZ的ARM Cortex-A9上运算实现了7倍左右的运算加速。

著录项

作者
吴海华;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科工程(电子与通信工程)
授予学位硕士
导师姓名黄智勇;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
神经网络,压缩,硬件加速,可编程门阵列;

相似文献

中文文献
外文文献
专利

1. 基于压缩感知和卷积神经网络的谐波检测方法研究 [J] . 汤伟 ,栾一多 ,刘嫣 . 中国造纸 . 2021,第012期
2. 基于3D-cube结构的卷积神经网络硬件加速 [J] . 隋远峰 ,常亮 ,赵思濛 . 微电子学与计算机 . 2021,第8期
3. 基于高层次融合的卷积神经网络FPGA硬件加速 [J] . 魏楚亮 ,陈儒林 ,高谦 . 光学精密工程 . 2020,第005期
4. 基于FPGA的卷积神经网络硬件加速器设计空间探索研究 [J] . 郭谦 ,贺光辉 . 微电子学与计算机 . 2020,第8期
5. 基于FPGA的卷积神经网络硬件加速器设计 [J] . 秦华标 ,曹钦平 . 电子与信息学报 . 2019,第011期
6. 基于FPGA的宽度优先搜索硬件加速方法研究 [C] . 王强 ,邹丹 ,郭松 . 第十七届计算机工程与工艺年会暨第三届微处理器技术论坛 . 2013
7. 基于FPGA的卷积神经网络及椭圆曲线算法的硬件加速研究 [A] . 胡湘宏 . 2020

基于卷积神经网络的压缩与硬件加速方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅