一种多模态融合的网络视频相关性度量方法

温有福; 贾彩燕; 陈智能

首页> 中文期刊> 《智能系统学报》 >一种多模态融合的网络视频相关性度量方法

一种多模态融合的网络视频相关性度量方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着网络和多媒体技术的发展，视频分享网站中的网络视频数量呈爆炸式增长。海量视频库中的高精度视频检索、分类、标注等任务成为亟待解决的研究问题。视频间的相关性度量是这些问题所面临的一个共性基础技术。本文从视频视觉内容，视频标题和标签文本，以及视频上传时间、类别、作者3种人与视频交互产生的社会特征等多源异构信息出发，提出一种新颖的多模态融合的网络视频相关性度量方法，并将所获相关性应用到大规模视频检索任务中。 YouTube数据上的实验结果显示：相对于传统单一文本特征、单一视觉特征的检索方案，以及文本和视觉特征相融合的检索方案，文本视觉和用户社会特征多模态融合方法表现出更好的性能。%With the advances in internet and multimedia technologies, the number of web videos on social video platforms rapidly grows. Therefore, tasks such as large⁃scale video retrieval, classification, and annotation become issues that need to be urgently addressed. Web video relatedness serves as a basic and common infrastructure for these issues. This paper investigates the measurement of web video relatedness from a multi⁃modal fusion perspec⁃tive. It proposes to measure web video relatedness based on multi⁃source heterogeneous information. The multi⁃mo⁃dal fusion simultaneously leverages videos'visual content, title, and tag text as well as social features contributed by human⁃video interactions (i.e., the upload time, channel, and author of a video). Consequently, a novel multi⁃modal fusion approach is proposed for computing web video relatedness, which serves to give a ranking criterion and is applied to the task of large⁃scale video retrieval. Experimental results using YouTube videos show that the pro⁃posed text, visual, and users' social feature multi⁃modal fusion approach performs best in comparison tests with three alternate approaches;i.e., those approaches that compute web video relatedness based just on text features, just on visual features, or jointly on text and visual features.

著录项

来源
《智能系统学报》 |2016年第3期|359-365|共7页
作者
温有福; 贾彩燕; 陈智能;
展开▼
作者单位

北京交通大学交通数据分析与数据挖掘北京市重点实验室;

北京 100044;

中国科学院自动化研究所数字内容技术与服务研究中心;

北京100190;

北京交通大学交通数据分析与数据挖掘北京市重点实验室;

北京 100044;

中国科学院自动化研究所数字内容技术与服务研究中心;

北京100190;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机网络;
关键词
网络视频; 海量视频; 社会特征; 交互; 多源异构信息; 多模态信息融合; 相关性度量; 视频检索;

相似文献

中文文献
外文文献
专利

1. 融合潜在狄利克雷分布与元路径分析的用户相关性度量方法 [J] . 徐红艳 ,王丹 ,王富海 . 计算机应用 . 2019,第011期
2. 一种融合位置信息的字符串相似度度量方法 [J] . 肖雨 ,崔荣一 ,怀丽波 . 计算机应用研究 . 2015,第011期
3. 一种深度偏最小二乘相关分析的多模态融合方法 [J] . 苏树智 ,张若楠 ,郜一玮 . 安徽理工大学学报（自然科学版） . 2021,第002期
4. 一种融合多模态特征的视频暴力检测方法 [J] . 马境远 ,刘鲲 ,傅慧源 . 重庆邮电大学学报（自然科学版） . 2021,第005期
5. 一种传感器多模态数据融合隐私保护方法 [J] . 于昕 ,率佳静 ,姜京文 . 长春师范大学学报 . 2021,第012期
6. 一种新的小波域多模态医学图像融合算法 [C] . Wang Xin ,王昕 ,Li Weilin . 第十六届全国图象图形学学术会议暨第六届立体图象技术学术研讨会 . 2012
7. 面向网络视频检索的多模态融合方法研究 [A] . 温有福 . 2017

一种多模态融合的网络视频相关性度量方法

摘要

著录项

相似文献

相关主题

期刊订阅