首页> 中国专利> 一种识别文本地域属性的方法、装置、服务器及存储介质

一种识别文本地域属性的方法、装置、服务器及存储介质

摘要

本发明公开了一种识别文本地域属性的方法、装置、服务器及存储介质,该方法包括:对待识别文本进行分词处理,得到文本词语集;根据文本词语集中词语对于待识别文本的重要程度,确定第一关键词语;将文本词语集中的词语与预置地域特征库中的地域特征进行匹配,确定文本词语集中的第二关键词语;将第一关键词语和第二关键词语作为待识别文本的文本关键词语;根据文本关键词语确定用于表征待识别文本的特征词向量序列;基于地域识别模型对特征词向量序列进行地域识别处理,得到待识别文本的地域属性;其中,地域识别模型是基于训练文本以及训练文本对应的地域属性标签进行机器学习确定的。本发明提高了对于待识别文本地域属性识别的准确性。

著录项

  • 公开/公告号CN111611801B

    专利类型发明专利

  • 公开/公告日2021-09-14

    原文格式PDF

  • 申请/专利权人 腾讯科技(深圳)有限公司;

    申请/专利号CN202010488420.4

  • 发明设计人 康战辉;

    申请日2020-06-02

  • 分类号G06F40/289(20200101);G06F40/247(20200101);G06F40/216(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构44202 广州三环专利商标代理有限公司;

  • 代理人熊永强;贾允

  • 地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层

  • 入库时间 2022-08-23 12:28:11

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号