基于物体检测及关系推理的视觉问答方法研究

邱真娜; 张丽红; 陶云松

首页> 中文期刊> 《测试技术学报》 >基于物体检测及关系推理的视觉问答方法研究

基于物体检测及关系推理的视觉问答方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

大多数图像描述及视觉问答任务中,主要工作是对图像数据的拟合分类,而缺乏图像中物体之间的关系推理,导致描述图像或回答问题时准确率不高.为解决该问题,本文提出一种基于物体检测及关系推理的视觉问答模型.该模型由上游网络和下游网络两部分组成,上游网络采用极快速区域卷积神经网络,下游网络由多层感知机组成的多模态特征融合推理网络构成.上游网络对图像进行物体检测与特征提取,利用长短期记忆网络对提问的问题进行信息提取以嵌入下游网络;下游网络对问题和图像的特征进行融合和推理,进而得出答案.采用数据集CLEVR进行模型训练与视觉问答测试,实验结果表明,本模型与其他已有模型相比,图像中物体之间关系推理的准确率获得了提高,达到98.96％.

著录项

来源
《测试技术学报》 |2020年第5期|439-445450|共8页
作者
邱真娜; 张丽红; 陶云松;
展开▼
作者单位

山西大学物理电子工程学院山西太原 030006;

山西大学物理电子工程学院山西太原 030006;

山西大学物理电子工程学院山西太原 030006;

展开▼
原文格式 PDF
正文语种 chi
中图分类图像处理软件;
关键词
深度学习; 视觉问答; 关系推理; 长短期记忆网络; 多模态特征融合;

相似文献

中文文献
外文文献
专利

1. 基于关系推理与门控机制的视觉问答方法 [J] . 王鑫 ,陈巧红 ,孙麒 . 浙江大学学报:工学版 . 2022,第1期
2. 基于多模态推理图神经网络的场景文本视觉问答模型 [J] . 张海涛 ,郭欣雨 . 计算机应用研究 . 2022,第1期
3. 基于空间注意力推理机制的视觉问答算法研究 [J] . 李智涛 ,周之平 ,叶琴 . 计算机应用研究 . 2021,第003期
4. 基于视觉和语言的跨媒体问答与推理研究综述 [J] . 武阿明 ,姜品 ,韩亚洪 . 计算机科学 . 2021,第003期
5. 基于视觉注意的显著物体检测实验设计 [J] . 张晴 . 实验室研究与探索 . 2016,第002期
6. 基于视觉注意模型的运动物体检测 [C] . 郭禾 ,李文甲 ,马晓刚 . 第八届中国计算机图形学大会 . 2010
7. 基于关系推理网络的视觉问答系统的研究 [A] . 丁贤锋 . 2020

基于物体检测及关系推理的视觉问答方法研究

摘要

著录项

相似文献

相关主题

期刊订阅