结合关键帧提取的视频-文本跨模态实体分辨双重编码方法

曾志贤; 曹建军; 翁年凤; 蒋国权; 范强

首页> 中文期刊> 《兵工学报》 >结合关键帧提取的视频-文本跨模态实体分辨双重编码方法

结合关键帧提取的视频-文本跨模态实体分辨双重编码方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

现有的视频-文本跨模态实体分辨方法在视频处理上均采用均匀取帧的方法,必然导致视频信息的丢失,增加问题的复杂度。针对这一问题,提出一种结合关键帧提取的视频-文本跨模态实体分辨双重编码方法(DEIKFE)。以充分保留视频信息表征为前提,设计关键帧提取算法提取视频中的关键帧,获得视频关键帧集合表示。对于视频关键帧集合和文本,采用多级编码的方法,分别提取表征视频和文本的全局、局部和时序的特征,将其进行拼接形成多级编码表示。将该编码表示映射至共同嵌入空间,采用强负样本跨模态三元组损失对模型参数进行优化,使得匹配的视频-文本相似度越大,而不匹配的视频-文本相似度越小。通过在MSR-VTT、VATEX两个数据集上进行实验验证,与现有方法进行对比,在总体性能R@sum上分别提升了9.22%、2.86%,证明了该方法的优越性。

著录项

来源
《兵工学报》 |2022年第5期|1107-1116|共10页
作者
曾志贤; 曹建军; 翁年凤; 蒋国权; 范强;
展开▼
作者单位

国防科技大学计算机学院;

国防科技大学第六十三研究所;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
跨模态实体分辨; 关键帧提取; 共同嵌入空间; 双重编码; 强负样本;

相似文献

中文文献
外文文献
专利

1. 基于注意力机制的细粒度语义关联视频-文本跨模态实体分辨 [J] . 曾志贤 ,曹建军 ,翁年凤 . 计算机科学 . 2022,第7期
2. 基于结构保持对抗网络的跨模态实体分辨 [J] . 吕国俊 ,曹建军 ,郑奇斌 . 南京大学学报：自然科学版 . 2020,第2期
3. 柔性姿态估计和时空特征结合的乒乓球动作视频片段关键帧提取 [J] . 蔡冠蓝 . 科学技术与工程 . 2019,第025期
4. 姿态估计和跟踪结合的运动视频关键帧提取 [J] . 石念峰 ,侯小静 ,张平 . 电视技术 . 2017,第4期
5. 对象和关键帧相结合的监控视频摘要提取方法 [J] . 王亚沛 ,李仁旺 ,刘翔 . 工业控制计算机 . 2015,第3期
6. 时空特征局部保持的运动视频关键帧提取 [C] . SHI Nianfeng ,石念峰 ,HOU Xiaojing . 第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议（CRSSC-CWI-CGrC-3WD 2017） . 2017
7. 电竞短视频的关键帧提取和多模态聚类研究 [A] . 李海龙 . 2021

结合关键帧提取的视频-文本跨模态实体分辨双重编码方法

摘要

著录项

相似文献

相关主题

期刊订阅