声明
第一章 绪论
1.1 研究背景
1.2 视觉问答研究现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 主要研究内容及创新点
1.4 章节安排
第二章 视觉问答中问句消歧方案设计
2.1 现有视觉问答方法分析
2.1.1 基于视觉文本特征点乘的视觉问答方法
2.1.2 基于双线性池化的视觉问答方法
2.1.3 基于空间注意力的视觉问答方法
2.1.4 基于特征分布之间潜在关系的贝叶斯模型的视觉问答方法
2.1.5 基于模块化神经网络的视觉问答方法
2.1.6 现有方法采用结构的总结分析
2.2 语言歧义基本概念及分类
2.2.1 语言歧义基本概念
2.2.2 词汇歧义
2.2.3 语义歧义
2.2.4 句法歧义
2.3 视觉问答消歧方案设计
2.4 本章小结
第三章视觉问答方法的算法设计与实现
3.1 基础VQA模块
3.1.1 模块生成器
3.1.2 模块处理器
3.1.3 分类器
3.1.4 算法流程
3.2 句式生成模块
3.2.1 本文的消歧方法
3.2.2 算法流程
3.3 概率分析模块
3.3.1 概率分析方法
3.3.2 算法流程
3.4 本章小结
第四章 实验与分析
4.1 实验环境与条件
4.1.1 数据集
4.1.2 实验设置
4.1.3 评价指标
4.2 实验结果与分析
4.2.1 在CLEVR数据集上的结果展示与分析
4.2.2 在CLEVR-CoGenT数据集上的结果展示与分析
4.3 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
硕士期间发表论文和参加科研情况
致谢
天津工业大学;