首页> 中国专利> 基于别名标准化的领域专业词汇词嵌入向量训练方法、系统及介质

基于别名标准化的领域专业词汇词嵌入向量训练方法、系统及介质

摘要

本发明公开了一种基于别名标准化的领域专业词汇词嵌入向量训练方法、系统及介质,本发明领域专业词汇词嵌入向量训练方法的实施步骤包括:获取领域专业词汇的正规名称及其别名,建立别名表;对训练文献进行别名标准化;使用词嵌入向量计算工具对标准化后的训练文献进行学习得到训练文献中所有单词的词嵌入向量;将别名表中所有别名的词嵌入向量设置为其对应的正规名称的词嵌入向量。本发明能够克服领域专业词汇的词嵌入向量不准确的问题,通过别名标准化的方法将相同含义的词汇统一用标准化的词汇表示,使得专业词汇在文献中出现的次数大大增加,从而大幅度提高了专业词汇的词嵌入向量的准确性,为专业领域的命名实体识别奠定了坚实的基础。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-01

    实质审查的生效 IPC(主分类):G06F40/295 申请日:20191217

    实质审查的生效

  • 2020-04-03

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号