首页> 中文学位 >基于内容的搜索引擎技术研究及其应用
【6h】

基于内容的搜索引擎技术研究及其应用

代理获取

目录

文摘

英文文摘

1引言

1.1搜索引擎的发展

1.2对搜索引擎的研究与分析

1.3论文研究的背景与意义

1.4论文所要研究的主要内容

2搜索引擎技术研究

2.1搜索引擎的概念与分类

2.2搜索引擎的工作原理

2.3搜索引擎中搜集信息的策略

2.4搜索引擎中信息的提取与分析

2.5搜索引擎中信息挖掘技术

2.6搜索引擎中智能代理技术

3研究开发环境

3.1硬件环境

3.2软件环境

4搜索引擎体系结构与工作过程

4.1搜索引擎体系结构的建立

4.2搜索引擎体系的工作过程

5研究开发所解决的关键问题

5.1主题相关度分析算法

5.2中文分词策略与技术

5.3 spider算法的设计

6在中国烟草科教网中信息采集的实现

6.1实现操作流程

6.2实际应用效果

7结论

致谢

参考文献

作者发表文章

展开▼

摘要

本文针对在大量网络信息中进行快速搜索所关注信息问题,对基于内容的信息搜索引擎进行了分析和研究。主要内容包括:搜索引擎的发展与研究现状、搜索引擎中采用的spider原理、信息搜集策略、以及信息的提取与分析所涉及的数据挖掘、智能代理技术等。同时根据烟草行业应用实际,在分析实现信息搜索的机制与原理、主题相关度分析算法及分词技术的基础上,在中国烟草科教网平台上采用建立SQLSERVER索引数据库和C#开发语言,设计开发了一种基于内容的信息搜索引擎。实际应用效果表明,该搜索引擎对减少工作人员的重复性劳动强度,提高工作效率和质量,促进烟草行业办公自动化水平,有良好的社会效益与经济效益。

著录项

  • 作者

    王晓华;

  • 作者单位

    郑州大学;

  • 授予单位 郑州大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 王世卿;
  • 年度 2005
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.092;TP311.12;
  • 关键词

    搜索引擎; 信息检索; 数据挖掘; 智能代理;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号