基于HTML树和模板的文献信息提取方法研究

李文立; 王乐超; 宋春雷

首页> 中文期刊> 《计算机应用研究》 >基于HTML树和模板的文献信息提取方法研究

基于HTML树和模板的文献信息提取方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景.提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取.实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上.

著录项

来源
《计算机应用研究》 |2010年第12期|4615-4617|共3页
作者
李文立; 王乐超; 宋春雷;
展开▼
作者单位

大连理工大学;

管理学院;

系统工程研究所;

辽宁;

大连;

116024;

大连理工大学;

管理学院;

系统工程研究所;

辽宁;

大连;

116024;

大连理工大学;

管理学院;

系统工程研究所;

辽宁;

大连;

116024;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP311.13;
关键词
网页信息提取; 文档对象模型树; 模板; 文献信息搜集;

相似文献

中文文献
外文文献
专利

1. 基于HTMLParser的Web文献信息提取 [J] . 龚真平 . 人天科学研究 . 2011,第002期
2. 基于HTMLParser的Web文献信息提取 [J] . 龚真平 . 软件导刊 . 2011,第002期
3. 基于HTML和XML的信息提取方法研究 [J] . 陈红叶 . 计算机技术与发展 . 2003,第0z2期
4. 基于HTML和XML的信息提取方法研究 [J] . 陈红叶 . 微机发展 . 2003,第a02期
5. 基于模板阈值法的土地利用变化信息提取方法研究 [J] . 陈振清 ,董玉娟 ,李久刚 . 遥感信息 . 2009,第003期
6. 基于HtmlParser网页解析技术的信息提取实践 [C] . 刘小野 . 第二届中国石油石化产业“互联网+”应用发展大会 . 2016
7. 基于树模板的RDF数据关键词查询方法研究 [A] . 司马强 . 2016

基于HTML树和模板的文献信息提取方法研究

摘要

著录项

相似文献

相关主题

期刊订阅