Twitter 中の使用単語の変化に基づく未知語の発見とそれに基づく音声認識用言語モデルの適応

机译：基于使用Twitter中的改变和语言模型语言模型的改变，发现未知数未知数

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では，Twitter を用いて新しく使用されるようになった音声認識システムにとって正しく認識されないと考えられる未知語の発見手法の提案と，発見した未知語に対応した言語モデルを作成し，音声認識システムに適用する手法の提案を行った．Twitterから取得したツイートを，新しいツイートと過去のツイートとで比較することにより，ユーザー間の使用単語の変化が取得でき，そこから新しく使用されるようになった未知語の取得が可能となる．これらの未知語を基に未知語事例とBCCWJ を用いて言語モデルを作成する手法と，BCCWJ に未知語トークンを挿入する手法を用いて言語モデルを作成する手法を提案した．提案手法を用いて作成した言語モデルでは，ベースラインと比較して補正パープレキシティの改善が得られ，取得した未知語が含まれる評価セットにおいてパープレキシティ及び補正パープレキシティの改善が得られた．音声認識実験では，作成した言語モデルを適用した音声認識システムで未知語が含まれる文を認識した場合，音声認識システム全てにおいて，ベースライン音声認識システムより良い単語誤り率と未知語誤り率を得られた．BCCWJ に未知語トークンを約25,000 個挿入する手法を用いて作成した言語モデルを適用した音声認識システムが，単語認識において最も良い結果となり，ベースラインシステムと比較して相対的に約52%の単語誤り率の改善された．BCCWJ に未知語トークンを約50,000個挿入する手法を用いて作成した言語モデルを適用した音声認識システムが，未知語認識において最も良い結果となり，ベースラインシステムと比較して相対的に約91%の未知語誤り率の改善が得られた．これによって，未知語誤り率の改善が全体的な単語誤り率の改善へと繋がる結果となった．

机译：在本文中，它是使用Twitter新使用的它被正确地识别出语音识别系统被认为是未知词的发现方法的提议创建一种与未知单词兼容的语言模型，适用于系统的方法的提案。推特从新推文和过去收购的推文通过与推文进行比较来使用用户使用可以从那里获得和新使用单词的变化可以获得出现的未知单词。这些使用基于未知单词和BCCWJ的未知单词在BCCWJ中创建Dell和Unknown Token的方法使用方法创建语言模型的方法建议。在使用所提出的方法创建的语言模型中，补偿擦除局部与基线相比改善包含所得未知数的和评估集贴片城市和更正净化获得了TEE的改善。在语音识别实验中，应用语言模型的语音识别系统中的未知单词如果您识别句子，则所有语音识别系统比基线语音识别系统更好获取字错误率和未知的无状态错误率。 BCCWJ.使用一种插入约25,000个未知令牌的方法应用要创建的语言模型的语音识别系统，最好的结果词识别，基线与系统相比相对大约52％的字错误率改善。 BCCWJ中约有50,000个未知令牌应用使用该方法插入创建的语言模型语音识别系统是未知语言识别最重要的它变成了良好的结果，与基线系统相比提高未知错误率约为91％。孩子整体单词误差改善不可知的错误率这是导致速度的提高。

著录项

来源
《日本音響学会研究発表会》|2018年|xlvii 149 p.|共4页
会议地点
作者
小橋優矢; 西村良太; 北岡教英;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类声学工程;
关键词

相似文献

外文文献
中文文献
专利

1. 実環境ハンズフリー音声認識のための音響モデルと言語モデルに基づく音声区間検出と認識アルゴリズム [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第116期

机译：基于声学模型和语言模型的语音间隔检测与识别算法，用于真实环境中的免提语音识别
2. 実環境ハンズフリー音声認識のための音響モデルと言語モデルに基づく音声区間検出と認識アルゴリズム [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第116期

机译：基于语言模型和识别算法的真实环境免提语音识别和语音段检测声学模型
3. 言語モデルと発音辞書の統計的話し言葉変換に基づく国会音声認識 [J] . 秋田祐哉, 河原達也, AKITA Yuya, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第406期

机译：基于语言模型的议会语音识别和语音词典的统计口语转换
4. Twitter 中の使用単語の変化に基づく未知語の発見とそれに基づく音声認識用言語モデルの適応 [C] . 小橋優矢, 西村良太, 北岡教英日本音響学会;日本音響学会秋季研究発表会 . 2018

机译：根据Twitter中使用过的单词的变化发现未知单词，并基于它们对语音识别进行语言模型调整
5. 肝機能障害の評価法とその障害機序に関する研究; ヒト肝ミトコンドリアの日内代謝変動に基づく肝機能評価及び動物モデルを用いた肝ミトコンドリア障害機序 [D] . Iwata, Shingo 1993

机译：肝功能障碍评估方法及其机制的研究；基于人肝线粒体每日代谢变化和肝线粒体损伤机制的动物模型对肝功能的评估
6. WWWから得られる検索語重み付けと話題適応に基づく音声認識のための言語モデル [O] . 宮崎将隆 2010

机译：基于从WWW获得的搜索词加权和主题自适应的语音识别语言模型

Twitter 中の使用単語の変化に基づく未知語の発見とそれに基づく音声認識用言語モデルの適応

摘要

著录项

相似文献

相关主题

期刊订阅