首页> 中文期刊> 《中国矿业》 >基于条件随机场的地质矿产文本分词研究

基于条件随机场的地质矿产文本分词研究

         

摘要

中文与英文不同,词与词之间没有类似空格的天然分隔符,致使中文分词成为中文信息处理中的难题.地质矿产文本中含有大量未登录地质专业术语,现阶段仍无效果较好的分词方法.本文探讨了一种基于双语料库条件随机场模型的方法对地质矿产文本进行分词,并与通用领域分词方法、单语料库条件随机场模型分词方法进行对比实验.实验表明,本文提出的方法在开放测试下分词效果明显优于其他方法,准确率为94.80%,召回率为92.68%,F-值为93.73%.本文对地质矿产文本进行了中文分词研究,既能够很好地识别未登录地质专业术语,又保证了普通词汇的识别率,为对地质领域的自然语言处理工作奠定了基础.

著录项

  • 来源
    《中国矿业》 |2018年第9期|69-74,101|共7页
  • 作者单位

    中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉430074;

    中国地质大学(武汉)紧缺矿产资源勘查协同创新中心,湖北武汉430074;

    中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉430074;

    中国地质大学(武汉)资源学院,湖北武汉430074;

    中国地质大学地质过程与矿产资源国家重点实验室,湖北武汉430074;

    中国地质大学(武汉)资源学院,湖北武汉430074;

    自然资源部地质信息技术重点实验室,北京100037;

    中国地质调查局发展研究中心,北京100037;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 地质学;
  • 关键词

    中文分词; 地质矿产文本; 条件随机场; 语料; 地质词典;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号