首页> 中文学位 >基于浅层语义的文本倾向性分析研究
【6h】

基于浅层语义的文本倾向性分析研究

代理获取

目录

封面

声明

目录

中文摘要

英文摘要

第一章 绪论

1.1研究背景及研究意义

1.2国内外研究现状

1.3本文的主要工作

1.4本文的组织结构

第二章 相关知识介绍

2.1 引言

2.2浅层语义知识体系

2.3情感词典资源建设

2.4本章小节

第三章 融合多种语义特征的评价对象及观点句抽取

3.1 引言

3.2基于核心词和浅层语义特征的评价对象抽取

3.3融合多种语义特征的中文观点句抽取

3.4本章小节

第四章 多粒度的文本倾向性分析

4.1 引言

4.2极性短语的倾向性计算

4.3评价对象倾向性分析

4.4句子级倾向性分析

4.5篇章级倾向性分析

4.6本章小节

第五章 实验及结果分析

5.1 引言

5.2 实验语料及评测指标

5.3 评价对象及观点句抽取实验结果

5.4 多粒度文本倾向性分析实验结果

5.5本章小节

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

攻硕期间发表论文及科研成果

致谢

展开▼

摘要

随着Web2.0时代的到来,互联网不再只是人们获取信息的重要来源,而且逐渐成为人们表达自己观点和情感的的重要平台,于是互联网上出现了大量的主观性文本,比如购买产品的评论信息、微博等社交平台上表达网民观点或情感的信息等。如何从这些主观性文本中提取有意义的单元,从而实现对主观性文本的分析、处理和应用成为研究的热点,文本倾向性分析正是在这种背景下产生的。文本倾向性分析在产品评论领域、舆情分析领域以及其他诸多领域有着广泛的应用价值。 文本倾向性分析的任务主要有三个:情感信息的抽取、情感信息的分析及情感信息的应用。情感信息的抽取旨在从主观性文本中抽取有意义的单元,将非结构化的文本转变为计算机能够处理的结构化文本;情感信息的分析是从短语级、句子级和篇章级等多个粒度上对主观性文本进行分析,从而得到作者的观点、情感及态度。本文在两次参与中文信息学会组织的中文倾向性评测会议的基础上,对文本倾向性分析的前两个任务展开研究,所做主要工作和成果有: 首先,本文对情感信息抽取中的评价对象抽取和观点句抽取展开研究。通过对评价对象的不同模式进行研究,发现评价对象多包含一些出现频率较高的名词,于是本文抽取评价对象中出现频率较高的名词作为核心词,并通过引入词频、情感词、上下文、组块等浅层语义特征,提出了一种基于核心词和浅层语义特征的评价对象抽取方法。在观点句抽取方面,引入情感词、评价对象、感叹词、带情感色彩的标点符号、人称代词、主张动词等特征,提出了一种融合多特征的观点句抽取方法。 其次,本文从短语级、句子级和篇章级三个粒度对情感信息的倾向性分析展开研究。针对单纯使用情感词代表文本倾向性所存在的问题,提出使用情感词和修饰词组成极性短语作为代表文本倾向性的基本单元,并给出了极性短语的倾向性计算方法。评价对象的倾向性及倾向强度即为修饰该评价对象的极性短语的倾向性及强度;观点句的倾向性是在短语级倾向性分析的基础上,考虑了转折、递进等连词的出现对极性短语权重产生的影响,采用一种基于极性短语加权求和的句子倾向性计算方法;篇章级的倾向性分析是在观点句的倾向性分析的基础上,考虑篇章结构对观点句权重的影响,将观点句分为总结观点句、半总结观点句和一般观点句,提出了一种基于观点句的篇章倾向性加权计算方法。 最后,对本文提出的情感信息抽取及倾向性分析方法进行了实验分析,将参加评测时所用方法的实验结果、本文改进方法的实验结果及其它参赛队伍的实验结果进行了对比,证明了本文所提出方法的有效性。

著录项

  • 作者

    张成功;

  • 作者单位

    山东师范大学;

  • 授予单位 山东师范大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 解福;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 计算技术、计算机技术;
  • 关键词

    语义; 文本倾向性;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号