首页> 外国专利> LEVERAGING UNPAIRED TEXT DATA FOR TRAINING END-TO-END SPOKEN LANGUAGE UNDERSTANDING SYSTEMS

LEVERAGING UNPAIRED TEXT DATA FOR TRAINING END-TO-END SPOKEN LANGUAGE UNDERSTANDING SYSTEMS

机译:利用未配对的文本数据进行培训结束地口语理解系统

摘要

An illustrative embodiment includes a method for training an end-to-end (E2E) spoken language understanding (SLU) system. The method includes receiving a training corpus comprising a set of text classified using one or more sets of semantic labels but unpaired with speech and using the set of unpaired text to train the E2E SLU system to classify speech using at least one of the one or more sets of semantic labels. The method may include training a text-to-intent model using the set of unpaired text; and training a speech-to-intent model using the text-to-intent model. Alternatively or additionally, the method may include using a text-to-speech (TTS) system to generate synthetic speech from the unpaired text; and training the E2E SLU system using the synthetic speech.
机译:说明性实施例包括用于训练端到端(E2E)口语理解(SLU)系统的方法。 该方法包括接收培训语料库,该训练语料库包括使用一组或多组语义标签分类的一组文本,但是用语音未配对并使用该组未配对文本来训练E2E SLU系统使用一个或多个中的至少一个来分类语音。 一套语义标签。 该方法可以包括使用该组未配对文本训练文本到意图模型; 使用文本到Intent模型培训语音到意图模型。 可选地或另外地,该方法可以包括使用文本到语音(TTS)系统来生成来自未配对文本的合成语音; 使用合成语音培训E2E SLU系统。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号