首页> 中文期刊> 《中文信息学报》 >中文句法异构蕴含语块标注和边界识别研究

中文句法异构蕴含语块标注和边界识别研究

         

摘要

文本蕴含是自然语言处理的难点,其形式 、类型复杂,知识难以概括.早期多利用词汇蕴含和逻辑推理知识识别蕴含,但该方法反对特定类型的蕴含有效.近年来,利用大规模数据训练深度学习模型的方法在句级蕴含关系识别任务上取得优异性能,但模型不可解释,尤其是无法标定引起蕴含的具体语言片段.该文研究文本蕴含成因形式,归纳为词汇 、句法异构 、常识和社会经验三类,并以句法异构蕴含为研究对象.针对上述两个问题,提出句法异构蕴含语块的概念,定义其边界识别任务.该文制定句法异构蕴含语块标注规范,建立标注数据集.在此基础上,分别建立基于规则和基于深度学习的模型,探索句法异构蕴含语块的自动识别方法.实验结果表明,该文提出的深度学习模型能有效发现蕴含语块,为下一步的研究提供可靠的基线方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号