摘要:语速变化将导致语音频谱畸变,进而导致说话人识别系统性能显著下降.本文提出一种分数域归一化方法来降低语速变化对说话人识别系统的影响.在全局归一化算法中,不同语速语音的语音数据组成一个全局参考集合,对每一个登入的说话人估计该集合中的参考语音的分数分布;在局部归一化算法中,将该全局参考集合中的语音按语速划分区间,在每个区间上估计参考语音分数分布.在测试阶段对测试语音在声称说话人模型上的识别分数进行分数归一化.为了对语速进行针对性研究,本文录制了包含快速、慢速和正常语速语音的CSLT-SPRateDGT2016语音数据库.基于该数据库在GMM-UBM框架下采用全局和局部归一化方法进行实验,实验表明两种归一化方法都显著提高了基线系统性能,等错误率相对下降17.77%和4.58%.进而,为了解决数据稀疏问题,本文对原数据库进行扩展,利用工具人为生成大量不同语速的语音数据.实验表明该数据扩展方法有效解决了数据稀疏问题,用两种归一化方法得到的等错误率比基线系统相对下降28.94%和33.33%.