首页> 中文期刊> 《通信技术》 >基于句法语义特征的实体关系抽取技术

基于句法语义特征的实体关系抽取技术

         

摘要

实体关系抽取将非结构化的数据转化为结构化的数据,是自然语言处理任务的重要基础.针对人与人之间的六种关系——父母、子女、夫妻、兄弟姐妹、同事、其他,在人与人之间六种关系语料库缺少的情况,采用百度百科的语料库构建五个类别(父母、子女、夫妻、兄弟姐妹、同事)的关系指示词词典,再根据关系指示词词典来判定实体对关系类型.采用上述方法,结合人工标定扩充五个类别(父母、子女、夫妻、兄弟姐妹、同事)语料库,根据中文的语法特点设计了一系列的特征,包括实体本身的词、词性标注以及实体上下文环境的词、词性特征.另外,融入实体的依存句法关系值、实体与核心谓词距离的特征,并构建二元实体对特征向量,采用logistic进行训练和测试.针对文本中含有多对二元实体对,通过统计文本中关系指示词的个数,使得句子中二元实体对不超过关系指示词的个数.实验结果证明,在人与人的关系识别中,准确率和召回率都可以达到87%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号