首页> 中国专利> 基于约束的结构化稀疏注意力机制的端到端语音识别方法及存储介质

基于约束的结构化稀疏注意力机制的端到端语音识别方法及存储介质

摘要

基于约束的结构化稀疏注意力机制的端到端语音识别方法及存储介质,属于语音识别技术领域。本发明是为了解决现有的基于Softmax注意力机制的语音识别方法解码过程中存在大量预测无关信息而导致严重干扰解码器识别过程的问题。本发明首先首先对原始信号分别进行采样、量化、帧级特征提取、高层声学表示提取、匹配分计算;然后,通过匹配分排序、匹配分阈值计算、注意力得分归一化、瞥向量生成,来获得其每一解码时刻的瞥向量;最后,利用解码器进行识别,并用以训练识别器,得到语音识别模型。本发明通过产生均匀、连续且稀疏的注意力得分向量,以降低瞥向量中预测无关信息占比,进而达到提升识别性能的目的。本发明主要用于语音的识别。

著录项

  • 公开/公告号CN113380232B

    专利类型发明专利

  • 公开/公告日2022.11.15

    原文格式PDF

  • 申请/专利权人 哈尔滨工业大学;

    申请/专利号CN202110661855.9

  • 发明设计人 韩纪庆;薛嘉宾;郑贵滨;郑铁然;

    申请日2021.06.15

  • 分类号G10L15/02;G10L15/06;G10L15/16;G10L15/22;

  • 代理机构哈尔滨华夏松花江知识产权代理有限公司;

  • 代理人岳昕

  • 地址 150001 黑龙江省哈尔滨市南岗区西大直街92号

  • 入库时间 2022-11-28 17:57:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-15

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号