端到端流式语音识别研究综述

王澳回; 张珑; 宋文宇; 孟杰

首页> 中文期刊> 《计算机工程与应用》 >端到端流式语音识别研究综述

端到端流式语音识别研究综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语音识别是实现人机交互的一种重要途径,是自然语言处理的基础环节,随着人工智能技术的发展,人机交互等大量应用场景存在着流式语音识别的需求。流式语音识别的定义是一边输入语音一边输出结果,它能够大大减少人机交互过程中语音识别的处理时间。目前在学术研究领域,端到端语音识别已经取得了丰硕的研究成果,而流式语音识别在学术研究以及工业应用中还存在着一些挑战与困难,因此,最近两年,端到端流式语音识别逐渐成为语音领域的一个研究热点与重点。从端到端流式识别模型与性能优化等方面对近些年所展开的研究进行全面的调查与分析,具体包括以下内容:(1)详细分析和归纳了端到端流式语音识别的各种方法与模型,包括直接实现流式识别的CTC与RNN-T模型,以及对注意力机制进行改进以实现流式识别的单调注意力机制等方法;(2)介绍了端到端流式语音识别模型提高识别准确率与减少延迟的方法,在提高准确率方面,主要有最小词错率训练、知识蒸馏等方法,在降低延迟方面,主要有对齐、正则化等方法;(3)介绍了流式语音识别一些常用的中英文开源数据集以及流式识别模型的性能评价标准;(4)讨论了端到端流式语音识别模型的未来发展与展望。

著录项

来源
《计算机工程与应用》 |2023年第2期|22-33|共12页
作者
王澳回; 张珑; 宋文宇; 孟杰;
展开▼
作者单位

天津师范大学计算机与信息工程学院;

广州华立科技职业学院计算机信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
人机交互; 语音识别; 端到端; 流式; 延迟;

相似文献

中文文献
外文文献
专利

1. 端到端语音识别研究综述 [J] . 郭宗昱 ,刘博 ,吴可欣 . 科技风 . 2020,第034期
2. 基于端到端语音识别的关键词检索技术研究 [J] . 杨润延 ,程高峰 ,刘建 . 计算机科学 . 2022,第1期
3. 基于端到端的多语种语音识别研究 [J] . 胡文轩 ,王秋林 ,李松 . 信号处理 . 2021,第10期
4. 基于双通路CNN的端到端语音识别研究 [J] . 胡黎 ,黄洪全 ,梁超 . 传感器与微系统 . 2021,第11期
5. 面向端到端的情感对话生成研究综述 [J] . 王春喻 ,马志强 ,杜宝祥 . 计算机科学与探索 . 2022,第2期
6. 端弯叶片和端弯联合弯叶片对压气机静叶端区流动影响研究（一）角区分离的描述 [C] . 杜鑫 ,王松涛 ,王仲奇 . 2011年中国工程热物理学会热机气动热力学与流体机械学术会议 . 2011
7. 基于卷积神经网络的端到端语音识别研究 [A] . 张玉凯 . 2021

端到端流式语音识别研究综述

摘要

著录项

相似文献

相关主题

期刊订阅