通用抽取引擎框架:一种新的Web信息抽取方法的研究

宫继兵; 唐杰; 杨文军

首页> 中文期刊> 《计算机科学》 >通用抽取引擎框架:一种新的Web信息抽取方法的研究

通用抽取引擎框架:一种新的Web信息抽取方法的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

The large size of video collection not only provides an easy way for users to share information, but also brings a big challenge for managing them, in particular online monitoring.A critical requirement to monitor the video information is to accurately and adaptively identify the key information describing the video,which is also the first step for video analysis and video search.In this paper, we focused on the extraction problem of the video information from different websites.Specifically, we proposed an engine framework for information extraction.We formally defined the description model in the framework and implemented a customizable engine for information.The proposed framework has been applied to a real-world application of a national department and obtains promising results.Experimental results show that the proposed approach can effectively extract the video information and it significantly outperforms the baseline methods.%大规模的网络视频信息既为用户信息分享带来了方便,同时也为国家监管部门带来了新的挑战.考虑到效率问题,在线视频监管则主要考虑视频描述信息.主要研究了网络视频描述信息的抽取问题,提出了一种新的Web信息抽取方法:通用抽取引擎框架,其主要包括对视频描述信息抽取问题的形式化描述和用户感知的视频网站逻辑模型.该方法在国家某部委的视频监管项目中已得到应用,并取得了很好的效果.实验结果表明,该方法的扩展性、通用性和抽取准确率大大优于其他方法.

著录项

来源
《计算机科学》 |2011年第1期|198-202|共5页
作者
宫继兵; 唐杰; 杨文军;
展开▼
作者单位

燕山大学计算机科学与工程系;

秦皇岛;

066004;

清华大学计算机科学与技术系;

北京;

100084;

清华大学计算机科学与技术系;

北京;

100084;

中石油规划研究院信息中心;

北京;

100083;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
通用抽取引擎框架; 网络视频监管; 视频网站逻辑模型; Web信息抽取; 抽取模式产生算法;

相似文献

中文文献
外文文献
专利

1. 一种新的Web信息抽取方法研究 [J] . 李洋 ,栾吉华 . 科技资讯 . 2007,第035期
2. 一种DOM树标签路径和行块密度结合的Web信息抽取方法 [J] . 马晓慧 ,李泓莹 . 智能计算机与应用 . 2017,第004期
3. 一种DOM树标签路径和行块密度结合的Web信息抽取方法 [J] . 马晓慧 ,李泓莹 . 智能计算机与应用 . 2017,第004期
4. 一种基于视觉特征的Deep Web信息抽取方法 [J] . 孙璐 ,陈军华 ,廉德胜 . 计算机与数字工程 . 2016,第006期
5. 一种基于知识工程的DeepWeb信息抽取方法 [J] . 乌尔柯西 ,杨抒 ,王业 . 计算机技术与发展 . 2016,第009期
6. 一种将启发式规则和HMM相结合的web信息抽取方法 [C] . 伍丹 ,都云程 ,李渝勤 . 第二十届全国计算机信息管理学术研讨会 . 2006
7. 垂直搜索引擎中Web信息抽取技术研究 [A] . 胡国晴 . 2008

通用抽取引擎框架:一种新的Web信息抽取方法的研究

摘要

著录项

相似文献

相关主题

期刊订阅