首页> 中国专利> 说话者分离模型的训练方法和说话者分离方法及相关装置

说话者分离模型的训练方法和说话者分离方法及相关装置

摘要

本申请公开了一种说话者分离模型的训练方法和说话者分离方法及相关装置,其中,说话者分离模型的训练方法包括:获取样本环境的样本数据,且样本数据包括同一时间段采集的样本语音数据和样本环境中若干说话者的样本图像序列;利用说话者分离模型,对样本数据进行处理得到各说话者的语音分离掩码,并对语音分离掩码和样本数据进行处理得到说话者分离结果,其中,说话者分离结果用于确定样本语音数据中的不同时间片段的说话者;利用语音分离掩码和说话者分离结果,调整说话者分离模型的网络参数。上述方案,能够提高说话者分离效果。

著录项

  • 公开/公告号CN114360573A

    专利类型发明专利

  • 公开/公告日2022-04-15

    原文格式PDF

  • 申请/专利权人 科大讯飞股份有限公司;

    申请/专利号CN202111660100.3

  • 发明设计人 严哲;殷保才;李渊强;

    申请日2021-12-31

  • 分类号G10L21/0272;G10L21/0308;G06K9/62;G06N3/02;

  • 代理机构深圳市威世博知识产权代理事务所(普通合伙);

  • 代理人刘希

  • 地址 230088 安徽省合肥市高新开发区望江西路666号

  • 入库时间 2023-06-19 14:57:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号