面向企业竞争情报的主题网络蜘蛛的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

企业竞争情报系统日益成为现代企业必不可少的工具，Internet成了企业获取情报信息的重要途径，但是Web信息分散地遍布于世界的每个角落，如何从Web资源中获得特定主题的信息，并及时地向企业提供有价值的情报，已经成信息搜集领域一个新的问题。近年来，面向主题的网络蜘蛛应运而生，已经成为解决主题搜索的重要工具。
　　本文在对国内外主题网络蜘蛛关键技术研究的基础上，在网页解析、文本特征向量提取、主题相关度计算和网络搜索算法方面做了相关工作。本文将网页解析为对应的文档树，并通过遍历树的方式获取网页文本和超链接。获取文本后对文本进行中文分词，根据Web文档的特点，改进了特征词权重的计算方法TF-IDF算法，提出了一种基于词频和标签的特征权重计算算法(FIAT算法)。在文本特征向量的基础上，结合锚文本以及所超链接所处的网页环境，提出了一种链接主题相关度计算算法(LTC算法)，保证了主题网络蜘蛛更多地下载与主题相关的页面。在网络搜索算法方面，引入非贪婪选择策略和遗传搜索策略，提出了一种非贪婪遗传搜索算法小GGS算法)，扩大了搜索空间，避免了搜索的局部最优问题。
　　在以上研究内容的基础上，设计实现了一个主题网络蜘蛛系统(BlueSpider系统)，通过大量的图片、设计类图、流程图及表格深入地描述了BlueSpider系统的设计实现细节。

著录项

作者
刘德钦;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机应用技术
授予学位硕士
导师姓名刘志镜;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类企业现代化管理;检索机;
关键词
企业竞争情报; 主题网络蜘蛛; 相关度计算; 搜索算法; 系统开发;

相似文献

中文文献
外文文献
专利

1. 面向主题的网络蜘蛛技术研究及系统实现 [J] . 张博 ,蔡皖东 . 微电子学与计算机 . 2009,第5期
2. 网络蜘蛛的研究与实现 [J] . 李浩 ,蒋蘋 . 科技信息 . 2012,第026期
3. 搜索引擎中网络蜘蛛的研究与实现 [J] . 毛晓蛟 . 电脑编程技巧与维护 . 2010,第018期
4. 面向主题的域内垂直搜索引擎系统的研究与实现 [J] . 王恒 ,王少山 ,高玉琢 . 宁夏大学学报（自然科学版） . 2013,第001期
5. 面向主题的垂直搜索引擎系统的研究与实现 [J] . 施佺 ,王恒山 ,肖仰华 . 微电子学与计算机 . 2011,第7期
6. 基于主题相似度指导网络蜘蛛穿越隧道的爬行算法 [C] . 陈小海 ,周娅 . 2009年全国理论计算机科学学术年会 . 2009
7. 面向企业竞争情报的主题搜索研究与实现 [A] . 张朝威 . 2010

面向企业竞争情报的主题网络蜘蛛的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅