首页> 中文学位 >基于模糊集合的汉语主观句识别方法研究与实现
【6h】

基于模糊集合的汉语主观句识别方法研究与实现

代理获取

目录

摘要

第1章 绪论

1.1 研究的目的和意义

1.2 主观句识别研究现状

1.3 主观句识别研究存在的主要问题

1.4 本文主要研究内容

1.5 本文的组织安排

第2章 基于句子主观性强度模糊集合的汉语主观句识别

2.1 引言

2.2 主观性特征获取

2.2.1 主观性特征选择

2.2.2 基于优势比的特征抽取

2.3 主观性密度计算

2.4 模糊集合分类器

2.4.1 主观性强度模糊集合

2.4.2 三角形隶属度函数

2.4.3 基于K-MEANS算法的隶属度函数参数计算

2.4.4 最大隶属度原则

2.5 系统总体结构及流程

2.6 实验结果与分析

2.6.1 实验数据及测评方法

2.6.2 实验结果与分析

2.7 本章小结

第3章 基于主客观词汇模糊集合的汉语主观句识别

3.1 引言

3.2 主客观词汇模糊集合及其隶属度函数

3.2.1 主客观词汇模糊集合

3.2.2 基于模糊统计TF-IDF的隶属度函数构建方法

3.3 模糊IF-THEN规则

3.3.1 原子模糊命题

3.3.2 模糊IF-THEN规则

3.4 模糊推理机

3.4.1 输入模糊化模块

3.4.2 模糊推理模块

3.4.3 解模糊化模块

3.5 系统总体结构与流程

3.6 实验结果与分析

3.6.1 实验数据及测评方法

3.6.2 实验结果与分析

3.7 本章小结

结论

参考文献

致谢

攻读硕士学位期间发表的学术论文及参加的科研项目

声明

展开▼

摘要

随着Web2.0技术的兴起与迅猛发展,意见挖掘已经成为自然语言处理的一个研究热点。作为意见挖掘的一个重要子任务,主观句识别的主要目的是从网络用户生成文本中将带有主观性信息的意见句从描述客观事实的客观句中识别出来。对于意见挖掘系统,主观句识别能降低系统的复杂度并提高系统的性能,因而具有极其重要的意义。
  针对汉语主客观表示界限模糊的特点,本文在模糊集合论框架下探索不同粒度的主观性特征的模糊表示,并分别提出基于句子和词语等不同粒度特征的模糊分类模型以解决汉语主观句识别问题。具体地,本文主要研究如下两个方面的工作:
  (1)基于句子主观性强度模糊集合的汉语主观句识别方法。首先,利用优势比公式从标注语料中抽取出主观性线索。然后,以主观性线索为基础,探索汉语句子的主观性密度计算方法。最后,面向汉语主客观句,构建了相应的基于主观性密度的三角形隶属函数,并实现了一个基于模糊集合的汉语主观句分类器。实验结果表明,本文提出的模糊集合分类器能较好地识别出主观性密度在句子主客观类别之间的界限,并取得了较理想的实验结果。
  (2)基于主/客观词汇模糊集合的汉语主观句识别方法。首先,针对主观词和客观词这两个模糊概念定义了相应的两个模糊集合,并采用模糊统计TF-IDF方法从训练语料中获取隶属度函数。然后,在模糊集合论框架下制定了两个模糊IF-THEN规则,并据此实现了一个模糊推理机以识别汉语主观句。实验结果表明,与传统的主观句识别方法相比,本文提出的汉语主观句识别方法,以词汇模糊集合为基础,能更精确地识别出汉语句子在主客观性之间的细微区别,因此明显地提高了汉语主观句识别的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号