首页> 中文期刊> 《计算机技术与发展》 >一种中国古典文学文本知识图谱构建方法

一种中国古典文学文本知识图谱构建方法

         

摘要

以中国古典文学为代表的古文是中文的重要组成部分,其语法、词汇相对于现代文而言更加复杂、讲究,给中文自然语言处理带来了机遇和挑战.针对上述问题,利用自然语言处理和知识图谱技术,以中国古典文学文本中具有代表性的《三国演义》为例,进行知识图谱构建.该方法通过语料库的网页标签匹配生成了一个分词与词性标注数据集,用来训练神经网络模型的联合分词和词性标注规则,并使用训练好的模型对《三国演义》进行测试解析;从结果中删除停用词,将内容词及其语义链接分别作为知识图谱中的节点和关系,并进行可视化展示.侧重于在古典文学文本进行联合分词与词性标注的基础上进行知识图谱构建.可视化展示的图像清晰地显示了非结构化文本中的重要信息.这项研究表明了以上工作流程的有效性,并展示了将自然语言处理和知识图谱应用于中国古典文学文本的潜力.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号