声明
1 绪论
1.1 研究背景及意义
1.2 国内外文献综述
1.3 研究思路与方法
1.4 主要创新与不足
2 模型架构
3 模型详述
3.1 应用于图片描述的编码器——解码器架构
3.2 注意力模型
3.3 两种注意力机制的比较
4 本文的模型
4.1 空间注意力模型
4.2 动态聚焦模型
5 实验细节
5.1 编码器——CNN
5.2 解码器——RNN
5.3 词表征GloVe
5.4 数据增强
5.5 训练
5.6 推断
6 实验设置
6.1 数据集
6.2 评价方法
7.1 定量分析
7.2 定性分析
7.3 动态聚焦模型分析
8结果说明
8.1 图像描述任务
8.2 图像—句子检索任务
9 讨论
10 结论
参考文献
致谢
江西财经大学;