首页> 中文学位 >基于内容分类的在线中文图书评论的挖掘研究
【6h】

基于内容分类的在线中文图书评论的挖掘研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

第一节 研究背景与意义

第二节 研究现状

第三节 本文研究的内容及目标

第四节 论文组织结构

第二章 在线图书评论的特点分析

第一节 “豆瓣读书”图书评论

第二节 评论数据收集

第三节 评论数据特点分析

第四节 本章小结

第三章 在线图书评论的内容分类

第一节 任务定义

第二节 特征设计

第三节 分类方法

第四节 实验分析

第五节 本章小结

第四章 在线图书评论的关键句抽取

第一节 任务定义

第二节 特征设计

第三节 实验分析

第四节 本章小结

第五章 图书评论挖掘系统

第一节 图书评论挖掘系统框架

第二节 各功能模块介绍

第三节 系统展示

第四节 本章小结

第六章 总结与展望

第一节 本文工作总结

第二节 展望

参考文献

致谢

个人简历 在学期间发表的学术论文及研究成果

展开▼

摘要

随着互联网的普及和发展以及国内“全民阅读”浪潮的兴起,在线图书交流平台正在被越来越多的人关注和使用,用户在其上方便地记录自己的阅读感受并发表相关的评论文章。在线图书评论数量随着时间的推移与日俱增,最终带来信息冗余和信息过载等实际问题。因此如何有效地从大量图书评论中获取有用信息逐渐成为了研究者关注的问题。
  本文以非商业化图书评论作为研究对象,以在线图书评论具有的内容特点作为研究切入点,对图书评论的信息挖掘进行初步地研究和探索。本文的主要内容如下:
  首先根据图书评论文本的特点和用户需求,依照与图书内容的关联程度,本文提出将评论句划分为“图书内容的直接引用”、“图书内容的转述、概述和论述等”以及“其他(与图书内容无关)”三个类别。接下来结合类别描述和文本特点进行特征设计,在常见的词汇特征基础上,本文提出了主题特征、标点和数字特征、元数据特征以及动词特征等领域相关特征。以支持向量机作为分类算法,以准确率、召回率、F1值和正确度作为评价指标,对图书评论集进行基于内容的分类,验证了自定义特征的有效性。
  然后本文针对在线图书评论进行关键句抽取,并将关键句抽取转化为一个分类问题,除了采用关键句抽取研究中常见的句子特征外,添加了句子的内容类别信息作为特征。实验表明,在内容分类的基础上对图书评论文本进行关键句抽取,抽取性能有了明显提升。这也说明,有效地利用评论句的内容特点有助于在线图书评论的挖掘研究。
  最后,本文设计并实现了面向在线图书评论的信息挖掘系统,用于展示研究成果并展现图书评论挖掘的应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号