首页> 中国专利> 一种受阅读策略启发的跨模态视频检索方法

一种受阅读策略启发的跨模态视频检索方法

摘要

本发明涉及视频跨模态检索技术领域,尤其涉及一种受阅读策略启发的跨模态视频检索方法,对于视频编码,采用预览分支和精读分支共同学习来表示视频,预览分支旨在简要地捕捉视频的概述信息,而精读分支旨在获取更深入的信息,本发明将从预览分支生成的较早的视频特征集成到精读分支中,对精读分支的特征提取做进一步指导,使得精读分支可以感知预览分支捕获的视频概述,用于提取更细粒度的特征,将两个分支的得到特征分别与文本特征映射到两个不同的混合空间中,在混合空间中进行跨模态匹配,从而实现文本到视频的跨模态检索。本发明使用端到端的方式训练模型,并在性能和模型复杂度上达到了最佳平衡。

著录项

  • 公开/公告号CN114003770A

    专利类型发明专利

  • 公开/公告日2022-02-01

    原文格式PDF

  • 申请/专利权人 之江实验室;浙江工商大学;

    申请/专利号CN202111084182.1

  • 申请日2021-09-15

  • 分类号G06F16/783(20190101);G06K9/62(20220101);G06N3/04(20060101);

  • 代理机构33213 杭州浙科专利事务所(普通合伙);

  • 代理人孙孟辉

  • 地址 310023 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼

  • 入库时间 2023-06-19 14:05:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-01

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号