首页> 外国专利> CASCADE ARCHITECTURE FOR NOISE-ROBUST KEYWORD SPOTTING

CASCADE ARCHITECTURE FOR NOISE-ROBUST KEYWORD SPOTTING

机译:级联架构用于噪声强度关键字斑点

摘要

A method (400) includes receiving, at a first processor (110) of a user device (102), streaming multi-channel audio (118) captured by an array of microphones (107), each channel (119) including respective audio features. For each channel, the method also includes processing, by the first processor, using a first stage hotword detector (210), the respective audio features to determine whether a hotword is detected. When the first stage hotword detector detects the hotword, the method also includes the first processor providing chomped raw audio data (212) to a second processor that processes, using a first noise cleaning algorithm (250), the chomped raw audio data to generate a clean monophonic audio chomp (260). The method also includes processing, by the second processor using a second stage hotword detector (220), the clean monophonic audio chomp to detect the hotword.
机译:一种方法(400)包括在用户设备(102)的第一处理器(110)处接收由麦克风(107)阵列捕获的流传输多声道音频(118),每个信道(119)包括相应的音频特征 。 对于每个通道,该方法还包括由第一处理器使用第一级热词检测器(210)的处理,相应的音频特征来确定是否检测到HOTWORD。 当第一阶段热词检测器检测到热字时,该方法还包括使用第一噪声清洁算法(250)的第二处理器提供Chomed RAW音频数据(212)的第一处理器,该噪声清洁算法(250)将收集的原始音频数据生成一个 清洁单声道音频Chomp(260)。 该方法还包括由第二处理器使用第二级热词检测器(220)的处理,清洁单声道音频Chomp以检测热字。

著录项

  • 公开/公告号WO2021206713A1

    专利类型

  • 公开/公告日2021-10-14

    原文格式PDF

  • 申请/专利权人 GOOGLE LLC;

    申请/专利号WO2020US27337

  • 发明设计人 HUANG YITENG;GRUENSTEIN ALEXANDER H.;

    申请日2020-04-08

  • 分类号G10L15/22;G10L15/08;G06F3/16;G10L15/05;G10L21/0208;

  • 国家 US

  • 入库时间 2022-08-24 21:43:04

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号