首页> 中国专利> 多方言口音普通话语音识别模型训练方法、装置及设备

多方言口音普通话语音识别模型训练方法、装置及设备

摘要

本申请提供一种多方言口音普通话语音识别模型训练方法、装置及设备,涉及语言识别技术领域。该方法包括:获取训练样本;使用带标注的标准普通话语音数据训练得到初始声学模型,使用文本数据训练得到初始语言模型;基于未标注的方言口音普通话语音数据迭代训练初始声学模型,得到目标声学模型;使用由目标声学模型和初始语言模型识别得到的待训练文本,训练得到临时语言模型,将临时语言模型与初始语言模型合并得到目标语言模型;将目标声学模型以及目标语言模型组合为多方言口音普通话语音识别模型。利用大量未标注的方言口音普通话语音数据,进行迭代训练,得到多方言口音普通话语音识别模型,提升了对方言口音普通话语音识别准确率。

著录项

  • 公开/公告号CN112233653B

    专利类型发明专利

  • 公开/公告日2021-03-12

    原文格式PDF

  • 申请/专利权人 北京远鉴信息技术有限公司;

    申请/专利号CN202011433866.3

  • 发明设计人 胡广宇;

    申请日2020-12-10

  • 分类号G10L15/00(20130101);G10L15/06(20130101);G10L15/26(20060101);G10L15/16(20060101);G10L15/14(20060101);

  • 代理机构11463 北京超凡宏宇专利代理事务所(特殊普通合伙);

  • 代理人荣颖佳

  • 地址 100000 北京市海淀区西四环北路158号1幢7层80001-2

  • 入库时间 2022-08-23 11:34:46

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号