基于联合定位和上下文推理的深度密集描述方法

孔锐; 谢玮

首页> 中文期刊> 《中南大学学报》 >基于联合定位和上下文推理的深度密集描述方法

基于联合定位和上下文推理的深度密集描述方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相关主题

摘要

图像密集描述是指自动检测图像中的感兴趣区域(region of interest,ROI),并生成自然语言短语或句子来描述这些区域中的语义内容。然而,它存在三个主要难题:第一,图像中密集且高度重叠的ROI,使得难以精确定位到目标区域;第二,图像中一些视觉模糊的ROI,使得难以仅凭借外观来识别目标区域;第三,图像特征表示的深度对视觉识别是极其重要的。针对这三个难题,本文提出了一种端到端的密集描述模型,包括三个关键模块:联合定位模块、上下文推理模块和深度卷积神经网络(convolutional neural network,CNN),其中,试验了5种深度CNN结构。在Visual Genome数据集上的实验结果显示,该模型性能显著,且优于同类其他方法。

著录项

来源
《中南大学学报》 |2021年第9期|2801-2813|共13页
作者
孔锐; 谢玮;
展开▼
作者单位

School of Intelligent Systems Science and Engineering;

Jinan University;

Zhuhai 519070;

China;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
密集描述; 联合定位; 上下文推理; 深度卷积神经网络;

基于联合定位和上下文推理的深度密集描述方法

摘要

著录项

相关主题

期刊订阅