基于多模态特征融合的新闻视频摘要技术研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

多媒体和网络技术的发展使得视频资源变得越来越丰富，伴随而来的问题则是视频数据量的快速增长。因此如何对这些海量视频数据进行有效的处理，从而提高浏览和检索效率就成为了当前亟需解决的现实问题。视频摘要技术可以缩减视频的数据量，节省浏览时间，是解决这些问题的关键。
　　新闻视频是人们获取信息的主要来源之一，与一般的视频数据相比，它有其特殊的结构和组织特征，这都使得针对新闻视频的摘要技术成为近年来广泛研究的热点。本论文针对这一课题进行了探索和研究，并做出了一些有特色的成果。
　　 (1)研究了新闻视频中的镜头分割，提出了一种基于自适应阈值的镜头边界检测算法。针对新闻视频中多为切变镜头及经常存在闪光灯的特点，首先通过两次检测及自适应阈值调整初步确定镜头边界，然后加入闪光灯判定条件并将检测出的闪关灯事件滤除，最终确定镜头边界。实验证明，本算法对闪光灯的适应性大大增加，显著提高了镜头检测的准确率。
　　 (2)研究了主持人镜头检测，提出了一种基于音视频特征融合的主持人镜头提取方法。主持人模板是通过综合考虑静音片段的特征之后自动提取的。然后利用主持人镜头背景不变的特性，通过色矩计算和颜色模板匹配来进行主持人镜头的检测。该方法实现了主持人镜头的自动化聚焦，具有准确度高和适应性强等优点。
　　 (3)研究了关键帧提取技术，提出了一种基于镜头与标题字幕方法融合的关键帧提取方法。针对新闻节目的特点，选取两种帧作为关键帧：一是包含新闻主题字幕的帧，二是取每个镜头最接近时间中点的帧作为关键帧。实验结果表明，该方法提取的关键帧具有较好的代表性，能够较好的描述新闻内容。
　　 (4)研究了视频摘要的生成及表现形式。综合考虑新闻视频中的多种模态信息，提出了基于多模态特征融合的新闻视频摘要生成方法，视频摘要表现形式包括新闻故事板形式的静态摘要、基于比例压缩的视频缩略、基于主持人镜头的视频缩略和基于新闻标题条的视频缩略。
　　最后，设计实现了一个多特征融合的新闻视频摘要原型系统，系统集成了本文研究的主要成果，实验结果表明，用户对摘要结果的满意度较高。

著录项

作者
孟文婷;
展开▼
作者单位

华中师范大学;

展开▼
授予单位华中师范大学;
学科计算机应用技术
授予学位硕士
导师姓名刘华咏;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类图像终端、多媒体终端;
关键词
新闻视频摘要; 多模态特征融合; 表现形式; 镜头边界检测算法; 色矩计算;

相似文献

中文文献
外文文献
专利

1. 基于多模态特征融合的新闻故事单元分割 [J] . 刘嘉琦 ,封化民 ,闫建鹏 . 计算机工程 . 2012,第024期
2. 基于EDU模型的新闻视频摘要技术研究 [J] . 栾悉道 ,谢毓湘 ,应龙 . 系统仿真学报 . 2007,第16期
3. 多模态特征融合的新闻视频故事分割方法 [J] . 文军 ,曾璞 ,徐建军 . 小型微型计算机系统 . 2008,第001期
4. 融合多模态特征的社会多媒体谣言检测技术研究 [J] . 金志威 ,曹娟 ,王博 . 南京信息工程大学学报 . 2017,第006期
5. 一种基于特征级融合的多模态生物特征识别方法 [J] . 王风华 ,孟文杰 . 科学技术与工程 . 2012,第013期
6. 基于人脸和指纹特征融合的多模态识别 [C] . 王轶 ,金立左 ,潘泓 . 2009年中国智能自动化会议 . 2009
7. 基于感知信息的多模态生物特征融合技术研究 [A] . 王志芳 . 2009

基于多模态特征融合的新闻视频摘要技术研究

摘要

著录项

相似文献

相关主题

期刊订阅