首页> 中国专利> 基于长时特征和短时特征的重叠语音与单人语音区分方法

基于长时特征和短时特征的重叠语音与单人语音区分方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于长时特征和短时特征的重叠语音与单人语音区分方法，包括如下步骤：读入语音；语音预处理，包括预加重、分帧、加窗；提取短时特征参数，从每帧语音中提取各种短时特征参数；提取长时特征参数，计算短时特征参数的统计特征；训练高斯混合模型：采用期望最大化算法训练四个高斯混合模型；模型融合判决：从测试语音中提取短时特征参数和长时特征参数分别作为短时特征模型和长时特征模型的输入，将这两种模型的输出概率进行加权得到总的概率输出值，根据该概率输出值的大小将测试语音判为重叠语音或单人语音，实现两者的区分。与采用短时特征的方法相比，本方法取得了更好的区分效果，区分准确率平均提高了5.9%。

著录项

公开/公告号CN102968986B

专利类型发明专利
公开/公告日2015-01-28

原文格式PDF
申请/专利权人华南理工大学;
展开▼

申请/专利号CN201210442113.8
发明设计人李艳雄;陈祝允;贺前华;李广隆;杜佳媛;吴伟;王梓里;
展开▼

申请日2012-11-07
分类号G10L15/02(20060101);G10L15/06(20130101);G10L25/03(20130101);
代理机构44245 广州市华学知识产权代理有限公司;
代理人蔡茂略
地址 510640 广东省广州市天河区五山路381号华南理工大学
入库时间 2022-08-23 09:23:05

法律信息

法律状态公告日

法律状态信息

法律状态
2015-01-28

授权

授权
2013-04-10

实质审查的生效 IPC(主分类):G10L 15/02 申请日:20121107

实质审查的生效
2013-03-13

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于长时特征和短时特征的重叠语音与单人语音区分方法 [P] . 中国专利： CN102968986B . 2015.01.28
2. 一种基于长时帧背景噪声估计的语音情感特征提取方法 [P] . 中国专利： CN108364641A . 2018-08-03
3. METHODS AND SYSTEM FOR KOREAN LANGUAGE TEST BASED ON ITEM CHARACTERISTICS AND LANGUAGE PERFORMANCE DB AND THE USE OF ITEMS FOR LEVEL DIFFERENTIATION IN DECIDING LEVELS OF BORDERLINE SCORES [P] . 韩国专利： KR100834208B1 . 2008-06-10

机译：基于项目特征和语言性能数据库的韩国语言测试方法和系统，以及在确定边界等级时使用等级区分的项目
4. METHOD FOR PREDICTING PHRASE BREAK USING STATIC/DYNAMIC FEATURE AND TEXT-TO-SPEECH SYSTEM AND METHOD BASED ON THE SAME [P] . 韩国专利： KR20080045413A . 2008-05-23

机译：利用静态/动态特征和语音转换系统预测短语中断的方法和基于相同方法的方法
5. / / CHARACTER AND/OR VOICE SERVICE METHOD AND SYSTEM FOR PROVIDING A STOCK INFORMATION AND NEWS BASED ON INTERNET IN REAL TIME [P] . 韩国专利： KR20020015198A . 2002-02-27

机译： //基于因特网的实时提供股票信息和新闻的特征和/或语音服务方法和系统