首页> 中国专利> 一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法

一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法。1)针对一组视频，切割构建视频片段。利用全卷积神经网络，提取视频每个镜头的视觉特征。2)利用局部自注意力机制，学习视频片段中所有镜头之间的语义关系，并生成视频镜头的视觉特征。3)利用查询相关的全局注意力机制，学习视频不同片段之间的语义关系，并生成面向查询的视频镜头的视觉特征。4)计算视频镜头和用户查询之间的相似度得分，用来生成查询相关的视频摘要。相比于一般视频摘要解决方案，本发明利用卷积多层注意力机制，能够更准确地反映查询相关的视频视觉特征，产生更加符合的视频摘要。本发明在视频摘要中所取得的效果相比于传统方法更好。

著录项

公开/公告号CN110933518B

专利类型发明专利
公开/公告日2020-10-02

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN201911266940.4
发明设计人赵洲;许亦陈;肖舒文;
展开▼

申请日2019-12-11
分类号H04N21/845(20110101);H04N21/8549(20110101);
代理机构33200 杭州求是专利事务所有限公司;
代理人郑海峰
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2022-08-23 11:15:59

相似文献

专利
中文文献
外文文献

1. 一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法 [P] . 中国专利： CN110933518B . 2020.10.02
2. 一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法 [P] . 中国专利： CN110933518A . 2020-03-27
3. A Recorded Medium for storing a Video Summary Description Scheme, An Apparatus and a Method for Generating Video Summary Descriptive Data, and An Apparatus and a Method for Browsing Video Summary Descriptive Data Using the Video Summary Description Scheme [P] . 韩国专利： KR100371813B1 . 2003-02-11

机译：用于存储视频摘要描述方案的记录介质，用于生成视频摘要描述数据的设备和方法，以及用于使用视频摘要描述方案浏览视频摘要描述数据的设备和方法
4. VIDEO DIGEST GENERATING METHOD, VIDEO DATABASE GENERATING METHOD, VIDEO DIGEST GENERATING APPARATUS, AND VIDEO DATABASE GENERATING APPARATUS [P] . 日本专利： JP2004193708A . 2004-07-08

机译：视频摘要生成方法，视频数据库生成方法，视频摘要生成装置和视频数据库生成装置
5. Content digest system, video digest system, user terminal, video digest generation method, video digest reception method and program therefor [P] . 美国专利： US7971217B2 . 2011-06-28

机译：内容摘要系统，视频摘要系统，用户终端，视频摘要生成方法，视频摘要接收方法及其程序