首页> 中国专利> 基于多坐标序列内核的说话人识别方法和系统

基于多坐标序列内核的说话人识别方法和系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出一种基于多坐标序列内核的说话人识别方法，包括训练阶段和识别阶段。训练阶段对训练语音进行预处理；从预处理后的训练语音中提取特征矢量序列；在特征矢量空间选择多坐标系原点，在各坐标系将所述特征矢量序列进行映射；根据坐标系选择算法，将各坐标系的矢量序列进行拼接，拼接为超矢量；确定超矢量空间，支持向量机SVM的核函数，并采用支持向量机算法进行训练，得到训练好的说话人模型。识别阶段利用已训练好的模型测试超矢量，输出判决分数。本发明通过对语音信号特征序列有效建模，既利用了高维统计量蕴含的信息，又降低了在集成电路上的运算复杂度，提高了说话人识别的准确率和识别速度。

著录项

公开/公告号CN101640043A

专利类型发明专利
公开/公告日2010-02-03

原文格式PDF
申请/专利权人清华大学;
展开▼

申请/专利号CN200910092138.8
发明设计人何亮;邓妍;刘加;
展开▼

申请日2009-09-01
分类号G10L17/00;G10L15/08;
代理机构北京市立方律师事务所;
代理人张磊
地址 100084 北京市100084-82信箱
入库时间 2023-12-17 23:22:53

法律信息

法律状态公告日

法律状态信息

法律状态
2012-04-04

发明专利申请公布后的驳回 IPC(主分类):G10L17/00 公开日:20100203 申请日:20090901

发明专利申请公布后的驳回
2010-03-24

实质审查的生效

实质审查的生效
2010-02-03

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于多坐标序列内核的说话人识别方法和系统 [P] . 中国专利： CN101640043A . 2010-02-03
2. 基于连续t检验的GNSS坐标序列阶跃探测改进方法及系统 [P] . 中国专利： CN112711052A . 2021-04-27
3. Speaker Identification Method Converged with Text Dependant Speaker Recognition and Text Independant Speaker Recognition in Artificial Intelligence Secretary Service and Voice Recognition Device Used Therein [P] . 韩国专利： KR101993827B1 . 2019-06-27

机译：融合了人工智能秘书服务中基于文本的说话人识别和基于文本的说话人识别的说话人识别方法及其中使用的语音识别装置
4. Speaker recognition system, speaker recognition methods and speaker recognition program [P] . 日本专利： JP6087542B2 . 2017-03-01

机译：说话人识别系统，说话人识别方法和说话人识别程序
5. Method and system for the production of speaker recognition data, and a method and system for speaker recognition [P] . 德国专利： DE60128270T2 . 2008-01-10

机译：说话人识别数据的产生方法和系统，以及说话人识别的方法和系统