首页> 中文学位 >基于网络的自动问答系统的答案抽取方法研究
【6h】

基于网络的自动问答系统的答案抽取方法研究

代理获取

目录

文摘

英文文摘

原创性声明及版权授权说明

第1章绪论

1.1问答系统的研究背景及意义

1.2问答系统的研究现状

1.3本文的主要工作

1.4本文的组织结构

第2章问答系统相关介绍

2.1基于网络的问答系统的工作流程

2.3.1问题分类

2.3.2信息检索

2.3.3答案抽取

2.2问答系统的分类

2.3问答系统相关评测

2.4知网介绍

2.5本章小结

第3章基于知网的问题分类

3.1问题分类的数学模型

3.1.1贝叶斯模型

3.1.2最大熵模型

3.1.3支持向量机

3.2问题分类体系

3.3基于知网的问题分类的分类特征选择

3.3.1问句疑问词

3.3.2句法结构

3.3.3问句焦点词

3.3.4问句焦点词在知网中的首义原

3.4实验

3.4.1实验问题集

3.4.2评价标准

3.4.3实验结果

3.5实验结果分析

3.6本章小结

第4章基于知网的答案抽取

4.1常用的答案抽取方法

4.1.1基于向量空间模型的抽取方法

4.1.2基于句子相似的抽取方法

4.1.3基于词的语义相似度的抽取方法

4.1.4基于句子模式匹配的方法

4.2基于知网的答案抽取

4.2.1问句预处理

4.2.2命名实体识别

4.2.3关键词扩展

4.2.4关键词加权

4.2.5相似答案合并

4.2.6句法分析

4.2.7句子相似度计算

4.2.8答案验证

4.3实验

4.3.1实验问题集

4.3.2评价标准

4.3.3实验结果

4.4实验结果分析

4.5本章小结

结 论

参考文献

致谢

攻读硕士期间发表(含录用)的学术论文

展开▼

摘要

自动问答系统(Question Ariswering System,QA)与传统的依靠关键字匹配的搜索引擎相比,能够更好地满足用户的检索需求,更准确地找出用户所需的答案,具有方便、快捷、高效等特点。 问题分类是问答系统所要处理的第一步,问题分类结果的好坏直接影响后续工作的进行。答案抽取是自动问答系统所要处理的最后一步,也是非常关键的一步。如果不能在答案抽取模块准确地抽取出正确答案,将极大地降低问答系统的性能。本文在对现有问题分类和答案抽取技术进行深入调查和研究的基础上,主要进行了以下工作: 1.为了深入理解并能从整体上把握问题的语义,得到问题的答案类型等相关信息,本文以知网为知识库,提出了基于知网的中文问题自动分类,并用最大熵模型构建了一个问题分类模型。实验结果表明,分类正确率和其他方法相比有较大的提高。 2.通过借鉴前人在答案抽取方面的相关研究成果,为了在语义理解的层面上进行答案抽取,我们以知网为知识库并利用句法分析的结果,提出了句法分析和知网相结合进行答案抽取的新方法,并重点以数字类问题进行了实验,取得了较好的结果。 3.答案验证能够对答案抽取的结果进行必要的校正和反馈,在有关研究的基础上,答案抽取的最后阶段引入了答案验证机制,并进行了初步的尝试。 4.在一个简单的问答系统上,对本文提出的方法进行了实现和测试,并对实验结果进行了评价。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号