首页> 中文期刊> 《情报理论与实践》 >文本语义化表示对其识别准确率的影响研究——以中华美食本体库构建为例

文本语义化表示对其识别准确率的影响研究——以中华美食本体库构建为例

         

摘要

[目的 /意义]深度学习模型已经成为命名实体识别的主要方法,但当前多数模型的预处理忽略文本中词上下文的语义信息.因此,探明文本的语义化表示对于实体识别的影响具有重要意义.[方法/过程]文章以中华美食本体库构建为例,通过构建CRFs、BiLSTM-CRFs、Char2vec-BiLSTM-CRFs和BERT-BiLSTM-CRFs这4类模型,对比分析文本语义化表示对其识别效果的影响;联合比较了基于BERT-BiLSTM-CRFs模型的术语单独抽取和集合抽取的结果,并将该模型应用于美食本体库的构建.[结果/结论]实验表明,使用BERT-BiLSTM-CRFs模型的实体识别准确率要高于其他模型,整体F1值提升8.7%;并且实体单独识别抽取比集合抽取效果更好.[局限]研究的实验数据规模有限,后续研究将在更大数据集上进行.

著录项

  • 来源
    《情报理论与实践》 |2021年第10期|8-17|共10页
  • 作者单位

    南京大学信息管理学院 江苏 南京 210023;

    江苏省数据工程与知识服务重点实验室 江苏南京210023;

    南京大学信息管理学院 江苏 南京 210023;

    江苏省数据工程与知识服务重点实验室 江苏南京210023;

    南京大学信息管理学院 江苏 南京 210023;

    江苏省数据工程与知识服务重点实验室 江苏南京210023;

    南京大学信息管理学院 江苏 南京 210023;

    江苏省数据工程与知识服务重点实验室 江苏南京210023;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    文本语义化表示; 深度学习; 字向量; 美食实体识别; 本体; BERT-BiLSTM-CRFs;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号