首页> 中国专利> 一种融合词汇及音素发音特征的情感语音合成方法及系统

一种融合词汇及音素发音特征的情感语音合成方法及系统

摘要

本发明属于人工智能领域,具体涉及一种融合词汇及音素发音特征的情感语音合成方法及系统,该方法为:通过录音采集设备,采集文本及情感标签,对所述文本进行预处理,获取音素及音素对齐信息,生成分词及分词语义信息,分别计算并得到分词发音时长信息、分词发音语速信息、分词发音能量信息、音素基频信息,分别训练分词语速预测网络、分词能量预测网络、音素基频预测网络,获取并拼接音素隐含信息、分词语速隐含信息、分词能量隐含信息、音素基频隐含信息,合成情感语音。本发明通过将与情感发音有关的词汇及音素发音特征融合到端到端语音合成模型中去,能够使得合成的情感语音更加自然。

著录项

  • 公开/公告号CN113257225B

    专利类型发明专利

  • 公开/公告日2021-11-02

    原文格式PDF

  • 申请/专利权人 之江实验室;

    申请/专利号CN202110600732.4

  • 发明设计人 郑书凯;李太豪;裴冠雄;

    申请日2021-05-31

  • 分类号G10L13/10(20130101);G10L13/08(20130101);G06F40/289(20200101);G06F40/30(20200101);

  • 代理机构33213 杭州浙科专利事务所(普通合伙);

  • 代理人孙孟辉

  • 地址 310023 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼

  • 入库时间 2022-08-23 12:42:56

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号