连续语音识别
连续语音识别的相关文献在1988年到2022年内共计134篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、工业经济
等领域,其中期刊论文97篇、会议论文17篇、专利文献433809篇;相关期刊67种,包括中国经济和信息化、长春理工大学学报(自然科学版)、哈尔滨工程大学学报等;
相关会议15种,包括第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会、第十一届全国民族语言文字信息学术研讨会、第九届全国人机语言通讯学术会议等;连续语音识别的相关文献由270位作者贡献,包括孙一鸣、王作英、刘葳等。
连续语音识别—发文量
专利文献>
论文:433809篇
占比:99.97%
总计:433923篇
连续语音识别
-研究学者
- 孙一鸣
- 王作英
- 刘葳
- 吾守尔·斯拉木
- 刘刚
- 屈丹
- 曹文明
- 王守觉
- 郭军
- 刘勇
- 刘妍秀
- 张文林
- 张晴晴
- 李弼程
- 杜利民
- 杨俊安
- 杨鉴
- 沈孙园
- 游萌
- 潘接林
- 王龙
- 陈雷
- 颜永红
- 高君效
- D·俞
- G·E·达尔
- L·邓
- 丁宜栋
- 付跃文
- 冯宏伟
- 吕萍
- 吴文虎
- 唐道南
- 国玉晶
- 塞缪尔·加文·史密斯
- 张利平
- 张红伟
- 张连海
- 徐波
- 文茂平
- 方棣棠
- 曾庆宁
- 朱晓瑾
- 朱杰
- 李冠宇
- 李晋徽
- 李晓
- 李雪涛
- 欧智坚
- 沈丽琴
-
-
李玉华
-
-
摘要:
语音同步识别系统的发展方向是连续性的人机交互,采用传统系统易受到突发性噪声影响,致使识别效果较差,提出基于隐马尔可夫模型的连续语音同步识别系统.结合语音识别原理,设计系统硬件总体结构.利用JFET输入高保真运放的OPA604低通滤波器,保证信号处理结果的有效性.通过OMAP5912ZZG型号芯片对处理后的信号进行存储,使用矢量图缓冲音频,经由以太网接口移植相关语音识别序列,由此实现连续语音同步识别.由实验对比结果可知,该系统比传统系统识别效果最高值高出48%,推进了语音识别技术研究的快速发展.
-
-
周楠;
赵悦;
李要嫱;
徐晓娜;
才旺拉姆;
吴立成
-
-
摘要:
基于从深度神经网络提取的瓶颈特征具有语音长时相关性和紧凑表示的特点,将瓶颈特征及其与MFCC的复合特征用于藏语连续语音识别任务中,可以代替传统的MFCC特征进行GMM-HMM声学建模。在藏语拉萨话连续语音识别任务中的实验表明,瓶颈特征的复合特征取得比深度神经网络后验特征和单瓶颈特征更好的识别表现。
-
-
秦楚雄;
张连海
-
-
摘要:
作为一种基于深层神经网络提取的低维特征,瓶颈特征在连续语音识别中取得了很大的成功.然而训练瓶颈结构的深层神经网络时,瓶颈层的存在会降低网络输出层的帧准确率,进而反过来影响该特征的性能.针对这一问题,本文基于非负矩阵分解算法,提出一种利用不包含瓶颈层的深层神经网络提取低维特征的方法.该方法利用半非负矩阵分解和凸非负矩阵分解算法对隐含层权值矩阵分解得到基矩阵,将其作为新的特征层权值矩阵,然后在该层不设置偏移向量的情况下,通过数据前向传播提取新型特征.实验表明,该特征具有较为稳定的规律,且适用于不同的识别任务和网络结构.当使用训练数据充足的语料进行实验时,该特征表现出同瓶颈特征几乎相同的识别性能;而在低资源环境下,基于该特征识别系统的识别率明显优于深层神经网络混合识别系统和瓶颈特征识别系统.%As a type of deep neural network (DNN) based low-dimensional feature,bottleneck feature (BNF) has achieved great success in continuous speech recognition.However,the existing of bottleneck layer reduces the frame accuracy of output layer when training a bottleneck deep neural network (BNDNN),which in return has a bad impact on the performance of bottleneck feature.To solve this problem,a nonnegative matrix factorization based low-dimensional feature extraction approach using DNN without bottleneck layer is proposed in this paper.Specifically,semi-nonnegative matrix factorization and convex-nonnegative matrix factorization algorithms are applied to hidden-layer weights matrix to obtain a basis matrix as the new feature-layer weights matrix,and a new type of feature is extracted by forward passing input data without setting a bias vector in the new feature-layer.Experiments show that the feature has a relatively stable pattern around different tasks and network structures.For corpus with enough training data,the proposed features have almost the same recognition performance with conventional bottleneck feature.Under low-resource environment,the recognition accuracy of the new feature-tandem system outperforms both DNN hybrid system and bottleneck-tandem system obviously.
-
-
-
杨玄章
-
-
摘要:
新生报到季,某校刚刚入学的新同学没有像以往一样领到厚厚的一本新生指南,取而代之的是一个叫“新生助手”的小盒子或者手机“小马甲”。在这个陌生的环境下,这个“新生助手”就成为了同学们融入校园生活最可靠的伙伴了。
-
-
谈建慧;
景新幸;
杨海燕
-
-
摘要:
In order to improve the speech recognition rate,a Bottleneck feature extraction method based on deep belief net-work is proposed.The unsupervised pre-training stacking restricted Boltzmann machine is used to obtain network initializa-tion parameters by using the contrastive divergence algorithm.And then the back propagation algorithm is adopted,the frame level cross entropy is maximized as the training criterion,the inverse iteration is used to fine tune the network parame-ters.The context dependent triphone model is adopted to get the better features.The phone error rate is used to evaluate the performance of the system.Experimental results show that the Bottleneck feature is better than the traditional features.%为了提升连续语音识别系统的识别率,提出一种基于深度信念网络的 Bottleneck 特征提取方法。该方法使用对比散度算法,采用无监督的预训练堆叠限制玻尔兹曼机得到网络初始化参数,进而采用反向传播算法,以最大化帧级交叉熵作为训练准则,反向迭代对网络参数进行微调。采用上下文相关的三音素模型,以音素错误率大小作为评价系统性能的准则。实验结果表明,所提出的基于深度信念网络提取的Bottleneck特征相对于传统特征更具优越性。
-
-
胡丹;
曾庆宁;
龙超
-
-
摘要:
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法.先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别.仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力.
-
-
陈茂国
-
-
摘要:
通过分析MRCPv2协议在语音识别中的典型应用,发现其在实时连续语音识别应用场景中的不足,通过扩展MRCPv2协议解决识别模式区分以及识别内容实时连续上报问题,为电信客服领域辅助语音识别的应用打下基础.
-
-
陈雷;
杨俊安;
王龙;
李晋徽
-
-
摘要:
大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。
-
-
胡丹;
曾庆宁;
龙超;
黄桂敏
-
-
摘要:
针对大词汇量连续语音识别中识别率不高的问题,提出了将语音增强级联在识别系统前端,在语音增强中将谱减法和对数最小均方误差算法(logmmse)与用于噪声估计的最小控制递归平均算法(imcra)相结合.识别系统使用Mel频率倒谱系数(MFCC)提取特征,用隐马尔科夫模型(HMM)训练与识别.实验结果表明,该方法最高能使单词识别率提高38.9%,使句子正确率提高21.8%.该方法用于大词汇量连续语音识别是可行有效的.
-
-
Min Li;
李敏;
Zhenjiang Miao;
苗振江;
Cong Ma;
马聪
- 《第十三届全国人机语音通讯学术会议》
| 2015年
-
摘要:
本文首先介绍了连续语音识别系统的基本组成及HTK工具箱的原理与应用,然后利用HTK工具箱搭建了一个连续语音识别系统,并在TIMIT—一个非特定人的大词汇量连续语音数据库上进行了实验.在实验的过程中,讨论了如何选择不同的语言模型,如何选择不同的声学模型进行建模,并且对模型的高斯混合度等参数进行了一系列的改进.通过实验,可知语言模型选择统计语言模型,声学单元选择三音素进行建模及模型的混合高斯度适当增加,都会提高连续语音识别的识别率.
-
-
那斯尔江·吐尔逊;
吾守尔·斯拉木;
麦麦提艾力
- 《第十一届全国民族语言文字信息学术研讨会》
| 2007年
-
摘要:
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。在语音识别领域,维吾尔语是研究较少的语言,为此研究维吾尔语语音识别的第一步就是建立语音语料库。用于录制语音数据的文本来自新疆日报、维吾尔文网站、维吾尔文小说等多种媒体,选择的领域广,基本上覆盖了维吾尔语的所有语言现象。本文围绕维吾尔语大词汇量连续语音识别研究中的关键技术,重点阐述适用于大词汇量连续语音识别的维吾尔语语音语料库的设计思路和建立过程。
-
-
-
-
伊·达瓦;
黄浩;
那斯尔江;
吾守尔
- 《第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会》
| 2010年
-
摘要:
本文报告近年来新疆维吾尔自治区多语种技术重点实验室以维-哈-蒙等语言为研究对象开展的语音技术研究工作。科研项目有:电话语音说话人识别;连续语音识别及语音翻译技术等。经初步测试,基于GMM_UBM&SVM的维吾尔语自由式发话电话语音(目标人数50名)说话人识别率为94.34%;基于HTK-Julius的维吾尔语(训练语音集7.2少时)及蒙古语(训练集13少时)连续语音识别率分别为72.4和87.6%;基于ATR/NICT统计翻译技术的蒙-日语音-文本翻译系统获得0,4的Blue值。
-
-
-
文茂平;
李雪涛;
杨鉴
- 《西南三省一市仪器仪表自动化学术年会》
| 2005年
-
摘要:
本文讨论在语音识别系统中,语言模型是其中不可或缺的,以先验概率的形式发挥重要作用.而在大词汇量非特定人的连续语音识别中,又以基于统计的语言模型应用最为广泛.研究首先讨论基于词的语言模型和基于词类的语言模型的统计计算方法,然后针对互联网上的新闻、科技、小说等题材的语料使用HTK语言模型工具采用以上两种方法构建一个面向语音识别的语言模型.实验结果表明,该语言模型比单独的基于词的和基于词类的语言模型有更高的性能。
-
-
-