基于Web挖掘的中文专业搜索引擎设计关键技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着WWW技术的广泛应用,传统的通用搜索引擎正面临巨大的挑战,存在着查全率不高、检索的精度不高、更新不及时、不能很好地表达用户需求、提交的搜索结果中包含大量与用户无关的信息、缺乏个性化和智能化等问题.同时,越来越多的不同领域的客户群,他们急需的是能够提供高效检索其业内信息的专业搜索引擎.面向特定主题信息的专业搜索引擎(Topic-Specific Search Engine),通过采用导向词导引、定点采集、定题采集、网站结构挖掘等特有的方法来提高查全率和查准率,保证其较高的时效性、专业性并提供更好的个性化服务,从而可高效地发掘特定领域的信息,提供有特色的检索服务.本文阐述了基于Web信息挖掘技术的专业搜索引擎的设计与实现,并着重分析了基于特定主题的爬取方法、网页特征的综合描述方法、网页分类技术、专业分词词典的构造;通过对网页的按功能分类及超链接分析,研究并建立了一种网站结构挖掘的模型;提出了类别向量和特征向量的特殊构造方法,利用改进的VSM方法将结构挖掘和内容挖掘结合起来,并设计了特定主题的自动分类算法,对基于Web挖掘的中文专业搜索引擎的设计与实现具有较好的理论和实践价值.

著录项

作者
郭庚麒;
展开▼
作者单位

华南师范大学;

展开▼
授予单位华南师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名陈启买;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.092;
关键词
专业搜索引擎; WEB挖掘; 主题搜索; 自动分类; 向量空间模型;

相似文献

中文文献
外文文献
专利

1. 一个基于Web挖掘的中文专业搜索引擎的设计与实现 [J] . 郭庚麒 ,陈启买 . 计算机工程与科学 . 2004,第009期
2. 浅谈基于Web挖掘的个性化搜索引擎技术 [J] . 谢海艇 . 发明与创新（综合科技） . 2018,第006期
3. 基于Web数据挖掘的个性化搜索引擎的应用和发展趋势 [J] . 王丽 ,曹家琏 . 电脑知识与技术 . 2009,第011期
4. 基于Web挖掘的教学资源搜索引擎的模型设计研究 [J] . 蔡群力 . 福建教育学院学报 . 2008,第007期
5. 基于Web数据挖掘的个性化搜索引擎研究综述 [J] . 付晓翠 ,许盈 . 现代计算机（专业版） . 2008,第003期
6. 基于Web文本挖掘的聚类技术研究 [C] . 李凯 ,孙大鹏 ,穆筝 . 辽宁省通信学会2011年通信网络与信息技术年会 . 2011
7. 基于Web的碳素行业信息数据挖掘搜索引擎技术研究 [A] . 袁志刚 . 2013

基于Web挖掘的中文专业搜索引擎设计关键技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅