基于双因子高斯过程动态模型的声道谱转换方法

孙新建; 张雄伟; 杨吉斌; 曹铁勇; 钟新毅

首页> 中文期刊> 《自动化学报》 >基于双因子高斯过程动态模型的声道谱转换方法

基于双因子高斯过程动态模型的声道谱转换方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

We developed in a previous work a two-factor Gaussian process latent variable model (TF-GPLVM) to perform spectral conversion using a strategy of speaker characteristics replacement. Despite its improved performance compared with traditional mapping-based methods, the model suffers from two drawbacks: 1) it cannot capture the speech dynamical characteristics, and 2) there is a large number of parameters to estimate. To overcome these two drawbacks, we propose in this paper to combine TF-GPLVM with hidden Markov model (HMM), and develop an enhanced two-factor Gaussian process dynamic model (TF-GPDM). In the model, the speech dynamics are modeled by state transition probability of HMM, meanwhile speech frames are categorized into a limited number of phonetic content classes using HMM states. Both subjective and objective evaluations show that, compared with both traditional mapping-based methods, such as Gaussian mixture model (GMM) and FW, and TF-GPLVM based one, the proposed TF-GPDM not only improves the speech quality and identity similarity, but also reaches a better compromise between the two dimensions.%针对作者已经提出的双因子高斯过程隐变量模型(Two-factor Gaussian process latent variable model, TF-GPLVM)用于语音转换时未考虑语音的动态特征,并且模型训练时需要估计的参数较多的问题,提出引入隐马尔科夫模型(Hidden Markov model, HMM)对语音动态特征进行建模,并利用HMM 隐状态对各帧语音进行关于语义内容的概率软分类,建立了分离精度更高、运算负荷较小的双因子高斯过程动态模型(Two-factor Gaussian process dynamic model, TF-GPDM)。基于此模型,设计了一种全新的基于说话人特征替换的语音声道谱转换方案。主、客观实验结果表明,无论是与传统的统计映射和频率弯折转换方法相比,还是与双因子高斯过程隐变量模型方法相比,本文方法都获得了语音质量和转换相似度的提升,以及两项性能的更佳平衡。

著录项

来源
《自动化学报》 |2014年第6期|1198-1207|共10页
作者
孙新建; 张雄伟; 杨吉斌; 曹铁勇; 钟新毅;
展开▼
作者单位

解放军理工大学通信工程学院南京 210007;

解放军理工大学指挥信息系统学院南京 210007;

解放军理工大学指挥信息系统学院南京 210007;

解放军理工大学指挥信息系统学院南京 210007;

解放军理工大学通信工程学院南京 210007;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
声道谱转换; 高斯过程隐变量模型; 双因子模型; 隐马尔科夫模型; 语音动态特征;

相似文献

中文文献
外文文献
专利

1. 基于高斯过程回归和双滑动窗口残差处理的风电机组主轴状态监测 [J] . 郭鹏 ,王兆光 . 电力自动化设备 . 2018,第006期
2. 基于粒子群算法的高斯过程建模对双脊喇叭天线优化设计 [J] . 强哲 ,陈艺 ,许兰 . 江苏科技大学学报（自然科学版） . 2018,第003期
3. 基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 [J] . 曾歆 ,张雄伟 ,孙蒙 . 声学技术 . 2020,第4期
4. 基于计数器的双积分模数转换方法研究 [J] . 白思春 ,褚全红 ,孟长江 . 仪表技术 . 2009,第10期
5. 改进高斯过程回归的高光谱空谱联合分类算法 [J] . 陈静 ,张静 . 光学精密工程 . 2019,第007期
6. 高斯过程的功率谱仿真技术 [C] . 张惠侨 . 第三届全国振动理论及应用学术会议 . 1987
7. 基于声道谱参数的语音转换算法研究 [A] . 姚绍芹 . 2015

基于双因子高斯过程动态模型的声道谱转换方法

摘要

著录项

相似文献

相关主题

期刊订阅