首页> 中文会议>第三届全国搜索引擎和网上信息挖掘学术研讨会 >Deep Web爬虫研究与设计

Deep Web爬虫研究与设计

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着Web的发展,越来越多的数据可以通过表单提交来获取,这些表单提交所产生信息是由Deep Web后台数据库动态产生的.在这种情况下,信息集成就更加需要Web爬虫来自动获取这些页面以进一步地处理数据.为了帮助用户完成这样的任务,提出一种用于搜集Deep Web页面的爬虫的设计方法.此方法使用一个预定义的领域本体知识库来识别这些页面的内容,同时利用一些来自Web站点的导航模式来识别自动填写表单时所需进行的路径导航.通过对来自不同领域的Deep Web站点的大量实验,验证了此方法是非常有效的。

著录项

来源
《第三届全国搜索引擎和网上信息挖掘学术研讨会》|2005年|1896-1902|共7页
会议地点北京
作者
郑冬冬; 赵朋朋; 崔志明;
展开▼
作者单位

中国计算机学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP393.092;TP311.13;
关键词
Deep Web页面; 路径导航模式; 领域本体知识库; 爬虫; 数据库; 信息集成;

相似文献

中文文献
外文文献
专利

1. 基于主题的Deep Web聚焦爬虫研究与设计 [J] . 姚双良 . 西北师范大学学报（自然科学版） . 2013,第002期
2. 支持Ajax的Deep Web爬虫研究与设计 [J] . 周杨 . 计算机系统应用 . 2012,第002期
3. 一种Deep Web爬虫爬行策略 [J] . 刘徽 ,黄宽娜 ,余建桥 . 计算机工程 . 2012,第011期
4. Deep Web爬虫的一种增量式更新策略 [J] . 卓林 ,杨舟 ,岳亮 . 苏州大学学报（工科版） . 2011,第004期
5. 一种Deep Web聚焦爬虫 [J] . 黄昊晶 . 电脑与电信 . 2011,第003期
6. 一种Deep Web聚焦爬虫爬行策略 [C] . 蔡欣宝 ,陈洪平 ,赵朋朋 . 2009年全国开放式分布与并行计算学术年会 . 2009
7. 一种针对Deep Web深层数据获取的网络爬虫设计与实现 [A] . 陈威 . 2013

Deep Web爬虫研究与设计

摘要

著录项

相似文献

相关主题

期刊订阅