首页> 外文OA文献 >Training Data Selection for Discriminative Training of Acoustic Models
【2h】

Training Data Selection for Discriminative Training of Acoustic Models

机译:声学模型判别训练的训练数据选择

摘要

[[abstract]]本論文旨在研究使用各種訓練資料選取方法來改善以最小化音素錯誤為基礎的鑑別式聲學模型訓練,並應用於中文大詞彙連續語音辨識。首先,我們汲取Boosting演算法中強調被錯誤分類的訓練樣本之精神,修改最小化音素錯誤訓練中每一句訓練語句之統計值權重,以提高易傾向於被辨識錯誤的語句對於聲學模型訓練之貢獻。同時,我們透過多種方式來結合在不同訓練資料選取機制下所訓練出的多個聲學模型,進而降低語音辨識錯誤率。其次,我們亦提出一個基於訓練語句詞圖之期望音素正確率(Expected Phone Accuracy)定義域上的訓練資料選取方法,分別藉由在語句與音素段落兩種不同單位上的訓練資料選取,以提供最小化音素錯誤訓練更具鑑別資訊的訓練樣本。再者,我們嘗試結合本論文所提出的訓練資料選取方法及前人所提出以正規化熵值為基礎之音框層次訓練資料選取方法、以及音框音素正確率函數,冀以提升最小化音素錯誤訓練之成效。最後,本論文以公視新聞語料作為實驗平台,實驗結果初步驗證了本論文所提出方法之可行性。
机译:[[abstract]]本论文旨在研究使用各种训练资料选取方法来改善以最小化音素错误为基础的鉴别式声学模型训练,并应用于中文大词汇连续语音辨识。首先,我们汲取Boosting演算法中强调被错误分类的训练样本之精神,修改最小化音素错误训练中每一句训练语句之统计值权重,以提高易倾向于被辨识错误的语句对于声学模型训练之贡献。同时,我们透过多种方式来结合在不同训练资料选取机制下所训练出的多个声学模型,进而降低语音辨识错误率。其次,我们亦提出一个基于训练语句词图之期望音素正确率(Expected Phone Accuracy)定义域上的训练资料选取方法,分别藉由在语句与音素段落两种不同单位上的训练资料选取,以提供最小化音素错误训练更具鉴别资讯的训练样本。再者,我们尝试结合本论文所提出的训练资料选取方法及前人所提出以正规化熵值为基础之音框层次训练资料选取方法、以及音框音素正确率函数,冀以提升最小化音素错误训练之成效。最后,本论文以公视新闻语料作为实验平台,实验结果初步验证了本论文所提出方法之可行性。

著录项

  • 作者

    朱芳輝; Fang-Hui Chu;

  • 作者单位
  • 年度 2011
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"en","name":"English","id":9}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号