首页> 中文期刊> 《中南大学学报》 >基于联合定位和上下文推理的深度密集描述方法

基于联合定位和上下文推理的深度密集描述方法

         

摘要

图像密集描述是指自动检测图像中的感兴趣区域(region of interest,ROI),并生成自然语言短语或句子来描述这些区域中的语义内容。然而,它存在三个主要难题:第一,图像中密集且高度重叠的ROI,使得难以精确定位到目标区域;第二,图像中一些视觉模糊的ROI,使得难以仅凭借外观来识别目标区域;第三,图像特征表示的深度对视觉识别是极其重要的。针对这三个难题,本文提出了一种端到端的密集描述模型,包括三个关键模块:联合定位模块、上下文推理模块和深度卷积神经网络(convolutional neural network,CNN),其中,试验了5种深度CNN结构。在Visual Genome数据集上的实验结果显示,该模型性能显著,且优于同类其他方法。

著录项

获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号