首页> 中文学位 >基于状态空间约简的政策基因组挖掘与确认方法研究
【6h】

基于状态空间约简的政策基因组挖掘与确认方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 论文主要研究内容

1.4 论文组织结构

第2章 相关工作与理论基础

2.1 政策血缘相关理论建立

2.2 文本特征降维相关理论

2.3 文本摘要的主要处理方法

2.4 基于向量空间的相似度计算

2.5 本章小结

第3章 基于自动摘要的状态空间约简方法

3.1 政策文本预处理

3.2 文本特征词权重计算

3.3 文本特征词规范化

3.4 文本状态空间约简

3.5 本章小结

第4章 政策基因组的挖掘与确认

4.1 政策基因组

4.2 基于基因组的文本相似度计算

4.3 政策隐性基因挖掘

4.4 本章小结

第5章 实验结果验证及其应用

5.1 实验环境与方案

5.2 实验结果及分析

5.3 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

随着我国法治社会的逐步发展,各个领域政策制定进一步完善,不断有新颁发的政策,与此同时旧的政策仍在沿用。因此,政策文本分析在政策研究领域受到越来越多的关注,成为我国法治社会发展需要迫切解决的重要问题。
  本文在分析和总结国内外政策研究和文本相似度计算现状及成果的基础上,提出了一种基于状态空间约简的政策基因组挖掘与确认方法。针对传统向量空间模型中的“高维稀疏”问题,该方法首先利用自然语言处理技术对政策文本进行预处理,采用基于自动摘要的状态空间约简方法,建立了合理的政策文本表征维度。在该过程中,解决了因领域专家评估而造成的特征词权重不稳定及效率低下的问题,同时为了解决政策文本中特征词之间的同义关系,提出了一种基于影响度的词汇替换算法。然后在政策文本状态空间约简的基础上,引入了政策血缘这一概念,并结合遗传学中生物基因的性质,对政策基因进行了相关的定义和获取。最后利用政策显性基因进行文本相似度计算,当基于显性基因的政策文本相似度数据和传统的政策文本相似度数据的差值超过一定的阈值,则挖掘政策隐性基因,并将政策显性基因和隐性基因共同作为政策基因组的一部分,从而达到了利用政策基因组替代政策文本进行相似度计算的目的。本研究解决了大规模海量政策文本分析中因相似度计算复杂度过高而导致效率低下的问题,为高效和准确地进行政策文本分析提供了必要的基础。
  最后,本文在实验数据集上进行了反复实验验证,并通过对比本文所提方法和传统的方法,验证了本文所提出方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号