首页> 中国专利> 合成词识别方法、装置、可读存储介质及电子设备

合成词识别方法、装置、可读存储介质及电子设备

摘要

本公开涉及一种合成词识别方法、装置、可读存储介质及电子设备。所述方法包括:分别计算目标领域与已标注文档集合中各个已标注领域之间的领域偏差,其中,已标注领域内的合成词已知;根据各个领域偏差,按照预设规则从各个已标注领域中确定出目标领域的至少一个相似领域;根据各个相似领域对应的HMM模型以及相似领域对应的权重,生成目标HMM模型;根据目标领域下的文本、目标HMM模型以及维特比算法,确定角色标注结果,角色标注结果用于指示文本中每个分词对应的角色状态;根据角色标注结果,确定目标领域下的文本中的合成词。这样,可提升合成词识别准确率,从而提升针对特定领域的分词的准确率和召回率,且可以节省人力。

著录项

  • 公开/公告号CN109815483A

    专利类型发明专利

  • 公开/公告日2019-05-28

    原文格式PDF

  • 申请/专利权人 东软集团股份有限公司;

    申请/专利号CN201811559551.6

  • 发明设计人 贾弼然;崔朝辉;赵立军;张霞;

    申请日2018-12-19

  • 分类号

  • 代理机构北京英创嘉友知识产权代理事务所(普通合伙);

  • 代理人魏嘉熹

  • 地址 110179 辽宁省沈阳市浑南新区新秀街2号

  • 入库时间 2024-02-19 10:24:21

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-21

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20181219

    实质审查的生效

  • 2019-05-28

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号