DFSMN-T:结合强语言模型Transformer的中文语音识别

胡章芳; 蹇芳; 唐珊珊; 明子平; 姜博文

首页> 中文期刊> 《计算机工程与应用》 >DFSMN-T:结合强语言模型Transformer的中文语音识别

DFSMN-T:结合强语言模型Transformer的中文语音识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

自动语音识别系统由声学模型和语言模型两部分构成,但传统语言模型N-gram存在忽略词条语义相似性、参数过大等问题,限制了语音识别字符错误率的进一步降低。针对上述问题,提出一种新型的语音识别系统,以中文音节(拼音)作为中间字符,以深度前馈序列记忆神经网络DFSMN作为声学模型,执行语音转中文音节任务,进而将拼音转汉字理解成翻译任务,引入Transformer作为语言模型;同时提出一种减少Transformer计算复杂度的简易方法,在计算注意力权值时引入Hadamard矩阵进行滤波,对低于阈值的参数进行丢弃,使得模型解码速度更快。在Aishell-1、Thchs30等数据集上的实验表明,相较于DFSMN结合3-gram模型,基于DFSMN和改进Transformer的语音识别系统在最优模型上的字符错误率相对下降了3.2%,达到了11.8%的字符错误率;相较于BLSTM模型语音识别系统,其字符错误率相对下降了7.1%。

著录项

来源
《计算机工程与应用》 |2022年第9期|187-194|共8页
作者
胡章芳; 蹇芳; 唐珊珊; 明子平; 姜博文;
展开▼
作者单位

重庆邮电大学光电工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;人工智能理论;
关键词
语音识别; 深度前馈序列记忆神经网络(DFSMN); Transformer; 中文音节; Hadamard矩阵;

相似文献

中文文献
外文文献
专利

1. 融合语言模型的端到端中文语音识别算法 [J] . 吕坤儒 ,吴春国 ,梁艳春 . 电子学报 . 2021,第011期
2. 基于DFCNN-CTC和Transformer的中文语音识别 [J] . 杨璐 ,郭文明 ,韩芳 . 火力与指挥控制 . 2022,第3期
3. 语音识别中统计与规则结合的语言模型 [J] . 王轩 ,王晓龙 ,张凯 . 自动化学报 . 1999,第3期
4. 基于统计与规则相结合的汉语计算语言模型及其在语音识别中的应用 [J] . 关毅 ,王晓龙 ,张凯 . 高技术通讯 . 1998,第004期
5. 特征和语言模型结合的中文文本查错 [J] . 陈笑蓉 ,秦进 . 计算机应用 . 2004,第0z2期
6. 贝叶斯与语言模型相结合的中文文本分类方法的研究 [C] . 闫涛 ,高光来 . 2008年全国模式识别学术会议 . 2008
7. 特定领域中文语音识别系统中语言模型和语义分析的研究 [A] . 孙静 . 2003

DFSMN-T:结合强语言模型Transformer的中文语音识别

摘要

著录项

相似文献

相关主题

期刊订阅