基于浅层语义的文本倾向性分析研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Web2.0时代的到来,互联网不再只是人们获取信息的重要来源,而且逐渐成为人们表达自己观点和情感的的重要平台,于是互联网上出现了大量的主观性文本,比如购买产品的评论信息、微博等社交平台上表达网民观点或情感的信息等。如何从这些主观性文本中提取有意义的单元,从而实现对主观性文本的分析、处理和应用成为研究的热点,文本倾向性分析正是在这种背景下产生的。文本倾向性分析在产品评论领域、舆情分析领域以及其他诸多领域有着广泛的应用价值。文本倾向性分析的任务主要有三个:情感信息的抽取、情感信息的分析及情感信息的应用。情感信息的抽取旨在从主观性文本中抽取有意义的单元,将非结构化的文本转变为计算机能够处理的结构化文本;情感信息的分析是从短语级、句子级和篇章级等多个粒度上对主观性文本进行分析,从而得到作者的观点、情感及态度。本文在两次参与中文信息学会组织的中文倾向性评测会议的基础上,对文本倾向性分析的前两个任务展开研究,所做主要工作和成果有: 首先,本文对情感信息抽取中的评价对象抽取和观点句抽取展开研究。通过对评价对象的不同模式进行研究,发现评价对象多包含一些出现频率较高的名词,于是本文抽取评价对象中出现频率较高的名词作为核心词,并通过引入词频、情感词、上下文、组块等浅层语义特征,提出了一种基于核心词和浅层语义特征的评价对象抽取方法。在观点句抽取方面,引入情感词、评价对象、感叹词、带情感色彩的标点符号、人称代词、主张动词等特征,提出了一种融合多特征的观点句抽取方法。其次,本文从短语级、句子级和篇章级三个粒度对情感信息的倾向性分析展开研究。针对单纯使用情感词代表文本倾向性所存在的问题,提出使用情感词和修饰词组成极性短语作为代表文本倾向性的基本单元,并给出了极性短语的倾向性计算方法。评价对象的倾向性及倾向强度即为修饰该评价对象的极性短语的倾向性及强度;观点句的倾向性是在短语级倾向性分析的基础上,考虑了转折、递进等连词的出现对极性短语权重产生的影响,采用一种基于极性短语加权求和的句子倾向性计算方法;篇章级的倾向性分析是在观点句的倾向性分析的基础上,考虑篇章结构对观点句权重的影响,将观点句分为总结观点句、半总结观点句和一般观点句,提出了一种基于观点句的篇章倾向性加权计算方法。最后,对本文提出的情感信息抽取及倾向性分析方法进行了实验分析,将参加评测时所用方法的实验结果、本文改进方法的实验结果及其它参赛队伍的实验结果进行了对比,证明了本文所提出方法的有效性。

著录项

作者
张成功;
展开▼
作者单位

山东师范大学;

展开▼
授予单位山东师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名解福;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;
关键词
语义; 文本倾向性;

相似文献

中文文献
外文文献
专利

1. 基于语义的微博短文本倾向性分析研究 [J] . 马力 ,刘笑 ,宫玉龙 . 计算机应用研究 . 2016,第010期
2. 基于文本特征的短文本倾向性分析研究 [J] . 程南昌 ,侯敏 ,滕永林 . 中文信息学报 . 2015,第002期
3. 基于语义块的事件倾向性分析研究 [J] . 韦向峰 ,张全 ,缪建明 . 中文信息学报 . 2012,第003期
4. 基于语义倾向性分析的不良文本检测模型研究 [J] . 崔鸿达 ,蒋朝惠 . 贵州大学学报（自然科学版） . 2013,第003期
5. 基于语义的文本话题倾向性分析 [J] . 朱平1 ,费本华1 ,范少辉1 . 计算机科学与应用 . 2012,第005期
6. 基于语义理解的文本倾向性识别机制 [C] . 徐琳宏 ,林鸿飞 ,杨志豪 . 第三届学术计算语言学研讨会 . 2006
7. 基于语义的文本倾向性分析与研究 [A] . 霍宗凡 . 2011

基于浅层语义的文本倾向性分析研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅