首页> 中国专利> 使用听觉注意力线索的语音音节/元音/音素边界检测

使用听觉注意力线索的语音音节/元音/音素边界检测

摘要

在讲话期间的音节或元音或音素边界检测中,可以针对声音输入窗口确定听觉频谱并且可以从所述听觉频谱中提取一个或多个多尺度特征。可以使用单独的二维频谱时间接收滤波器来提取每个多尺度特征。可以生成对应于所述一个或多个多尺度特征的一个或多个特征图,并且可以从所述一个或多个特征图中的每个提取听觉要点矢量。可以通过放大从所述一个或多个特征图所提取的每个听觉要点矢量来获得累积要点矢量。可以通过使用机器学习算法将所述累积要点矢量映射到一个或多个音节或元音或音素边界特性来检测所述声音输入窗口中的一个或多个音节或元音或音素边界。

著录项

  • 公开/公告号CN103503060B

    专利类型发明专利

  • 公开/公告日2015-07-22

    原文格式PDF

  • 申请/专利权人 索尼电脑娱乐公司;

    申请/专利号CN201180069832.3

  • 发明设计人 O.卡琳里;陈如新;

    申请日2011-11-02

  • 分类号

  • 代理机构北京市柳沈律师事务所;

  • 代理人郭定辉

  • 地址 日本东京都

  • 入库时间 2022-08-23 09:27:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-07-22

    授权

    授权

  • 2014-02-12

    实质审查的生效 IPC(主分类):G10L 15/00 申请日:20111102

    实质审查的生效

  • 2014-01-08

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号