首页> 中文期刊> 《中国水运:下半月》 >融合多特征的老挝语人名地名命名实体识别

融合多特征的老挝语人名地名命名实体识别

         

摘要

本文依据老挝语人名地名语言学中句法与词法的相关特征,使用不同的算法进行特征间的实现与融合,形成特定的老挝语人名地名命名实体识别模型。首先,依据老挝语地名特征,将有限个省份和国家词语组建成词典。其次使用Word2vec在较大规模的老挝语训练语料中,训练具有上下文语义特征信息的词向量,依据老挝语人名地名的构词特征使用BLSTM进行词语字符级向量训练,将字符级特征向量和词向量组合拼接成组合向量。将老挝语地名做状语后置的句法特征,通过One-Hot算法进行向量化,和组合向量进行融合。再将完整的特征向量输入到最后一层CRF中进行命名实体识别训练,融合了多特征的老挝语命名实体识别模型,模型识别人名地名的准确率、F值得到4%左右的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号