首页> 中文学位 >基于形式概念分析的主题搜索策略研究
【6h】

基于形式概念分析的主题搜索策略研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1应用背景

1.2面向主题搜索的研究现状

1.3本文的主要研究内容

第2章主题搜索策略涉及的基本问题及本文的应对策略

2.1主题搜索策略与通用搜索策略的比较

2.2主题搜索的分类

2.3主题页面在Web上的分布特征

2.4主题爬行起点的选择

2.5用户查询主题的表示

2.6 Spider研究

2.7页面分析

2.8 URL与主题的相关性判定

2.9页面与主题的相关性判定

2.10如何结束搜索

第3章形式概念分析及其在主题搜索中的应用

3.1形式概念分析研究现状

3.2概念格的构建

3.3概念格在主题搜索中的应用

3.4概念格上隐含的关系

3.5格上核心概念的定义

3.6格上概念距离的计算

3.7概念相似度的计算

第4章主题爬行策略研究

4.1主题爬行策略的定义

4.2爬行技术的分类

4.3主题爬行中几个度量指标的研究

4.4基于内容的主题爬行策略

4.5基于学习的主题爬行策略

4.6基于链接结构的主题爬行策略

4.7基于形式概念分析的主题爬行策略

第5章系统组建及实验结果分析与评价

5.1构建主题爬行系统

5.2实验过程

5.3实验结果分析与评价

总结与展望

参考文献

攻读硕士学位期间科研成果

致谢

展开▼

摘要

本文对基于形式概念分析的主题搜索策略进行了研究。主要内容如下: 1.通过研究格上概念之间隐含的各种关系以及格结构本身的特点,决定以概念格作为背景来表示用户查询主题,建立用户兴趣主题模型作为基础格。 2.研究了格上概念之间的继承关系,定义了格上的核心概念和非核心概念,给出了格上概念距离的计算,并提出了三种通过概念距离计算概念相似度的方法。 3.提出了基于属性的直接概念匹配方法,给出了虚拟概念的定义,通过在基础格上寻找虚拟概念位置来获取虚拟概念的相似度值,以此相似度值为依据,解决了待访问URL与主题的相关性判定问题,提出了本文的基于形式概念分析的主题搜索策略。 4.构建主题搜索系统,获取网络数据,通过平均收成率和F-Measure两种评价指标来检验本文的搜索策略,通过和通用的宽度优先搜索策略进行比较,得出了本文提出的策略是可行的。

著录项

  • 作者

    董占兵;

  • 作者单位

    西华大学;

  • 授予单位 西华大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 杜亚军;
  • 年度 2007
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;TP311.13;
  • 关键词

    网络服务; 数据挖掘; 信息检索; 搜索引擎;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号