首页> 中国专利> 基于分词模式匹配的非标准地名地址数据清洗方法及装置

基于分词模式匹配的非标准地名地址数据清洗方法及装置

摘要

本发明提供一种基于分词模式匹配的非标准地名地址数据清洗方法及装置,通过分词模式匹配在数据库中查找标准地名地址,若存在机构内部地址数据库则再通过内部地址数据库匹配得到二次地址分类结果,将二次地址分类结果与之前的标准地名地址组合得到最终结果,否则将之前获得的标准地名地址作为最终结果。通过深度学习学习中文语境中文本标注的特征,获取待查询数据后通过分词模型输出词性标注结果进而得到分词结果,分离出国家标准行政区划要素和兴趣点内部地址要素,然后接入该兴趣点相关的数据库进行二次清洗。本发明将存在大量错误、名称混乱、信息不完整等问题的非标准地名地址通过数据清洗转换为标准的地名地址,提高了地名地址的正确率。

著录项

  • 公开/公告号CN114647639A

    专利类型发明专利

  • 公开/公告日2022-06-21

    原文格式PDF

  • 申请/专利权人 中国地质大学(武汉);

    申请/专利号CN202210277639.9

  • 申请日2022-03-21

  • 分类号G06F16/215;G06F16/29;G06F16/31;G06F16/35;G06F40/289;G06N3/08;

  • 代理机构武汉知产时代知识产权代理有限公司;

  • 代理人王佩

  • 地址 430000 湖北省武汉市洪山区鲁磨路388号

  • 入库时间 2023-06-19 15:43:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-21

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号