声明
摘要
第1章绪论
1.1研究内容与背景
1.2研究意义
1.2.1.场景举例
1.2.2.资源受限平台运行深度模型的难点
1.3本文的主要工作及组织结构
1.3.1.本文的主要工作
1.3.2.本文的组织结构
1.4本章小结
第2章背景知识及调研综述
2.1深度模型介绍
2.1.1.人工神经网络
2.1.2.深度神经网络
2.1.3.深度卷积神经网络
2.1.4.针对物体检测的R-CNN模型
2.1.5.针对机器翻译的深度模型
2.2深度神经网络简化综述
2.2.1.工程性加速
2.2.2.参数约减
2.2.3.高维模型降维
2.3本章小结
第3章基于优化的深度模型压缩
3.1概述
3.2相关研究
3.3算法介绍
3.3.1. OLMP
3.3.2.使用OLMP进行DNN压缩
3.3.3. OLMP实现
3.4实验及分析
3.4.1.LeNet系列模型上的压缩效果对比
3.4.2.AlexNet结构上的压缩效果对比
3.4.3.δ和σ之间的敏感度分析
3.4.4.不组合迭代式压缩流程的OLMP裁剪性能
3.5本章小结
第4章针对机器翻译深度模型的压缩研究
4.1概述
4.2相关研究
4.3 NMT常用连接结构
4.3.1.反馈式模型
4.3.2.前馈式模型
4.4连接分组策略与模型裁剪
4.4.1.Time-wise连接分组策略
4.4.2.Residual-wise连接分组策略
4.4.3.其他连接分组策略
4.4.4.模型裁剪方案
4.5实验及分析
4.5.1.数据集与评价指标
4.5.2.实验设置
4.5.3.分组策略效果对比
4.5.4.不同δ值下分组策略裁剪效果的变化
4.5.5.RNNSearch和Luong-Net变体模型上的裁剪效果
4.6本章小结
第5章针对物体检测深度模型的加速研究
5.1 概述
5.2相关工作
5.2.1.加速分类过程
5.2.2.加速Rol生成过程
5.3 R2-CNN方法:Rol生成
5.3.1.步骤一:生成Integrate Feature Map
5.3.2.步骤二:生成Feature Level
5.3.3.步骤三:生成Rol
5.3.4.步骤四:Local Search
5.4 R2-CNN方法:整体框架
5.4.1.递归微调(Recursive Fine-tuning)与其实现
5.5实验及分析
5.5.1.实验设置
5.5.3物体检测的性能对比
5.5.4.Rol质量对比
5.5.5.不同卷积层选择对R2-CNN的影响
5.6本章小结
第6章总结
参考文献
致谢
在读期间发表的学术论文与取得的研究成果
中国科学技术大学;