首页> 中文期刊> 《计算机工程与设计》 >融合领域命名实体识别的查询扩展方法研究

融合领域命名实体识别的查询扩展方法研究

         

摘要

For the characteristics of domain knowledge and the current limitations of the basic query expansion method, a new query expansion method of domain text retrieval by combining special named entity recognition (SNER) and basic query expansion method is proposed. First, eighteen categories of named entities are marked, and then the theory of conditional random fields (CRFS) is adopted to establish entity recognition model, finally, recognition model is integrated into the local context analysis of query expansion method by linear interpolation method to select expansion terms. The experimental result of tourism data sets shows the proposed method is superior to the existing three basic expansion methods; the accuracy is improved by 15. 8%. In particular, the method of fusion LCA and SNER improved 21. 4%.%针对领域知识特点和当前基本查询扩展方法的局限性,提出了在特定领域问答系统中将命名实体识别与基本查询扩展方法相结合对答案文本检索进行查询扩展的方法.该方法标注旅游领域18个类别的命名实体,并使用条件随机场理论建立实体识别模型,将识别模型以线性插值方式分别融合到本文选用的基于TF-IDF、互信息和局部上下文分析3种基本查询扩展方法中,再选取出扩展词进行查询.在旅游领域数据集上的实验结果表明,该方法在3种基本查询扩展方法基础上使准确度提高15.8%以上,其中结合领域命名实体识别和局部上下文分析的查询扩展方法的准确度提高了21.4%.

著录项

  • 来源
    《计算机工程与设计》 |2012年第3期|1229-12331250|共6页
  • 作者单位

    昆明理工大学信息工程与自动化学院;

    云南昆明650051;

    昆明理工大学智能信息处理重点实验室;

    云南昆明650051;

    昆明理工大学信息工程与自动化学院;

    云南昆明650051;

    昆明理工大学智能信息处理重点实验室;

    云南昆明650051;

    昆明理工大学信息工程与自动化学院;

    云南昆明650051;

    昆明理工大学智能信息处理重点实验室;

    云南昆明650051;

    昆明理工大学信息工程与自动化学院;

    云南昆明650051;

    昆明理工大学智能信息处理重点实验室;

    云南昆明650051;

    昆明理工大学信息工程与自动化学院;

    云南昆明650051;

    昆明理工大学智能信息处理重点实验室;

    云南昆明650051;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    特定领域; 查询扩展; 命名实体识别; 局部上下文分析; 文本检索;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号