首页> 中文期刊> 《现代图书情报技术》 >应用正则式抽取Google网页内容

应用正则式抽取Google网页内容

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

正确、完整地抽取搜索网页的内容,是对检索到的信息进行处理的基本前提.本文分析了Google网页的结构特征,给出了一组匹配Google网页内容的正则式,并用Visual C#实现了一个内容抽取器.对多个Google网页的实际应用表明,本文提出的正则式匹配方法可以抽取Google网页的全部主要内容.

著录项

来源
《现代图书情报技术》 |2005年第9期|50-53|共4页
作者
张健; 欧红;
展开▼
作者单位

长沙理工大学图书馆;

长沙;

410076;

湖南图书馆;

长沙;

410011;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机情报检索系统;检索机;
关键词
正则式; 抽取; 网页; Google;

相似文献

中文文献
外文文献
专利

1. 基于正则化主题建模的隐式产品属性抽取 [J] . 仇光 ,郑淼 ,张晖 . 浙江大学学报：工学版 . 2011,第002期
2. 正则表达式在旅游突发事件信息抽取中的应用 [J] . 熊志斌 ,朱剑锋 ,尹成国 . 软件 . 2015,第011期
3. 正则表达式在论坛信息抽取整合中应用 [J] . 王雨辰 ,敬茂华 . 电脑编程技巧与维护 . 2013,第012期
4. 正则表达式在网络蜘蛛抽取问答系统信息中的应用 [J] . 汪材印 . 宿州学院学报 . 2012,第005期
5. 正则表达式在Web信息抽取中的应用 [J] . 胡军伟 ,秦奕青 ,张伟 . 北京信息科技大学学报（自然科学版） . 2011,第006期
6. 基于正则表达式的信息抽取系统在国防技术监测中的应用 [C] . 杨桢 ,赵燕平 ,朱东华 . 2005年国防科技组织创新与装备费用管理高级研讨会 . 2005
7. 基于网页内容分析的Web信息抽取技术及其应用 [A] . 杨秀丽 . 2010

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号