【24h】

VQD: Visual Query Detection in Natural Scenes

机译:VQD:自然场景中的视觉查询检测

获取原文

摘要

We propose Visual Query Detection (VQD), a new visual grounding task. In VQD, a system is guided by natural language to localize a variable number of objects in an image. VQD is related to visual referring expression recognition, where the task is to localize only one object. We describe the first dataset for VQD and we propose baseline algorithms that demonstrate the difficulty of the task compared to referring expression recognition.
机译:我们提出了视觉查询检测(VQD),这是一个新的视觉接地任务。在VQD中,一个系统由自然语言引导,以本地化图像中的可变数量的对象。 VQD与可视引用的表达式识别有关,其中任务只能本地化一个对象。我们描述了VQD的第一个DataSet,我们提出了与引用表达式识别相比,展示了任务难度的基线算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号