首页> 中文学位 >Blog论坛搜索与排名技术
【6h】

Blog论坛搜索与排名技术

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1论文的研究背景及研究意义

1.1.1研究背景

1.1.2研究意义

1.2论文的研究内容及主要工作

1.3论文的组织结构

第二章相关技术介绍

2.1 Web挖掘理论基础

2.1.1 Web挖掘定义

2.1.2 Web挖掘分类

2.2网络爬虫

2.2.1网络爬虫的系统结构

2.2.2常用的网络爬虫搜索算法

2.3中文分词

2.4本章小节

第三章Blog搜索与排名的设计和实现

3.1系统框架

3.2功能模块设计

3.2.1爬虫模块

3.2.2信息抽取模块

3.2.3搜索排名模块

3.3本章小节

第四章Blog搜索引擎技术

4.1搜索引擎相关理论

4.1.1搜索引擎的定义及基本构成

4.1.2搜索引擎分类

4.1.3特色搜索引擎

4.2 BLOG搜索

4.2.1 RSS源搜索

4.2.2 TrackBack技术

4.2.3 Tag标签

4.3本章小节

第五章Blog排名技术

5.1概述

5.2相关工作

5.3 Blog排名

5.3.1隐式的链接

5.3.2算法

5.4实验分析

5.4.1数据集

5.4.2实验结果与用户评价

5.5本章小节

第六章总结与展望

6.1本文工作总结

6.2未来工作展望

参考文献

攻读硕士学位期间已发表论文及参加科研项目

致谢

展开▼

摘要

随着World Wide Web(简称WWW,Web)的迅速发展,Web上的信息与日俱增,互联网已成为人们获取信息的重要来源。但是,由于因特网的广泛性和开放性,在因特网上发布信息极为容易而且不受限制,无论任何单位、团体、个人只要具备上网条件便可以自由地在因特网上发布信息,从而加剧了因特网信息的急速膨胀,使得Web的使用者找到对自己有用的信息的难度越来越大。因此,如何快速、准确地从浩瀚的信息资源中寻找所需的信息已经成为困扰用户的一个难题。 目前,Blog作为Web2.0中的代表,引起了大众传播方式的一种变革。自其出现以后,持续影响和改变着互联网的交流模式。互联网中Blog的数量成指数级的增加,从九十年代的数千个增长到2005年的过亿,这样庞大的信息量,就需要一个有效的搜索方法对Blog进行搜索。现在已经有很多Blog的搜索工具了:Blogdigger,Blogpulse,和Technorati,而像Google,Yahoo!和AskJeeves这样的搜索引擎也已经提供了专门的Blog搜索。Blog搜索正处于一个发展的初级阶段,其蕴含着极大的研究潜力。 论文的主要工作包括以下方面。 1.基础理论研究:首先介绍了Web挖掘基础理论(包括Web挖掘的定义和Web挖掘的分类)、网络爬虫的系统结构和相关爬虫算法、中文分词的几种方法,然后提出了Blog搜索与排名的系统框架和三个功能模块的设计。 2.Blog搜索引擎技术:首先介绍了搜索引擎的定义及基本构成、搜索引擎的分类,然后介绍了几种特色的搜索引擎,接着针对Blog的特点,提出了几种Blog搜索技术。 3.Blog排名技术:Blog和普通Web网页的一个重要区别就是超链接,本文利用隐式链接等相关技术,提出了针对Blog的基于内容的排名算法。该算法不只考虑了Blog中的链接分析,还主要对Blog中的内容进行分析,挖掘Blog中的隐性特征,从而提高用户对Blog搜索结果的满意度。

著录项

  • 作者

    朱燕;

  • 作者单位

    扬州大学;

  • 授予单位 扬州大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 沈洁;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;TP311.13;
  • 关键词

    互联网; Blog搜索; Blog排名; 搜索引擎; Web挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号