日本語母語話者のための英語音声認識システム用英語言語モデルの検討

山崎　博紀; 喜多村　圭介; 山本　誠一

首页> 外文期刊>電子情報通信学会技術研究報告 >日本語母語話者のための英語音声認識システム用英語言語モデルの検討

【24h】

日本語母語話者のための英語音声認識システム用英語言語モデルの検討

机译：日语母语者英语语音识别系统的英语语言模型研究

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

English are spoken in various occasions like presentations and discussions at international conferences by a lot of people whose mother tongues are different from. Their second languages often have not only distinct accent but also different lexical and syntactic characteristics. Speech recognition performance is severely affected when the lexical, syntactic, or semantic characteristics in the training and recognition tasks differ. Language model of a speech recognition system is usually trained with transcribed speech data or text data collected in English native countries, therefore, speech recognition performance is expected to be degraded by mismatch of lexical and syntactic characteristics between native speakers and second languages speakers as well as by the distinction between their accents. This paper describes improvement of speech recognition performances when the language model are trained with the learner corpus which was created by collecting sentences translated by Japanese subjects and linearly interpolated with a language model trained with a corpus in the same domain.%国際的なビジネスの場などでの発表や交渉・議論は英語でなされることから，英語発話を認識し，検索・要約などの処理を行う英語発話のドキュメント処理技術は一層重要となる．第2言語による発音や表現は，母語の干渉を受けるため，英語を母語とする話者の音声データを用いて学習を行った英語音声認識装置では，第2言語話者による英語に対する音声認識性能は大きく低下する．このため，日本人による英語発話をドキュメント処理することは極めて困難である．本稿では，日本語母語話者による英語音声の認識率を向上させる取り組みとして，日本語母語話者の言語特性を考慮した言語モデルの採用がどの程度音声認識率を向上させるかを検討した．本稿では，旅行会話に関する英語テキストコーパス（BTEC）より選択した課題文を学習者が英訳した学習者コーパスを用いて学習を行った言語モデルにより，日本語母語話者の英語発話の認識率がどの程度認識率を向上したかを述べる．

机译：在许多场合，例如母语不同的人们都会在国际会议上的演讲和讨论中说英语。他们的第二语言通常不仅具有不同的口音，而且具有不同的词汇和句法特征。当训练和识别任务中的词汇，句法或语义特征不同时，语音识别性能会受到严重影响。语音识别系统的语言模型通常使用在英语国家/地区收集的转录语音数据或文本数据进行训练，因此，由于母语与第二语言的母语者以及第二语言的母语者之间的词汇和句法特征不匹配，预计语音识别性能会下降通过区分口音。本文介绍了使用学习者语料库训练语言模型时语音识别性能的改进，该学习器语料库是通过收集日语对象翻译的句子并在同一域中用语料库训练的语言模型进行线性插值而创建的。％国际的なビジネスの第2言语による発音や表现は，原生の干渉を受けるため，英语を原生とする话者の音声データを用いて学习を行った英语音声认识装置では，第2言语话者による英语に対する音声认识性能は大きく低下する。このため本稿，日本语母语话者英语音声の认识率认识向上させる取り组りとして，日本语母语话者の言语特性を考虑した言语モデル本稿では，旅行会话に关する英语テキストコーパス（BTEC）より选択した教程択した英が学习者が英訳した学习者コーパスを用いて学习を行った言语モデルにより，日语语初级话者の英语発话の认识率がどの程度认识率を向上したかを述べる。

著录项

来源
《電子情報通信学会技術研究報告》 |2008年第437期|p.1-6|共6页
作者
山崎　博紀; 喜多村　圭介; 山本　誠一;
展开▼
作者单位

同志社大学工学部　〒610-0321 京都府京田辺市多々羅都谷1-3;

同志社大学工学部　〒610-0321 京都府京田辺市多々羅都谷1-3;

同志社大学工学部　〒610-0321 京都府京田辺市多々羅都谷1-3;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
音声認識; ドキュメント処理; 言語モデル;

机译：语音识别;文档处理;语言模型;

相似文献

外文文献
中文文献
专利

1. 日本語母語話者のための英語音声認識システム用英語言語モデルの検討 [J] . 山崎博紀, 喜多村圭介, 山本誠一, 電子情報通信学会技術研究報告. 思考と言語. Thought and Language . 2008,第433期

机译：日语母语者英语语音识别系统的英语语言模型检查
2. 日本語母語話者のための英語音声認識システム用英語言語モデルの検討 [J] . 山崎博紀, 喜多村圭介, 山本誠一, 電子情報通信学会技術研究報告. 音声. Speech . 2008,第435期

机译：日语母语者英语语音识别系统的英语语言模型检查
3. 日本語母語話者のための英語音声認識システム用英語言語モデルの検討 [J] . 山崎　博紀, 喜多村　圭介, 山本　誠一電子情報通信学会技術研究報告 . 2008,第433期

机译：日语母语者英语语音识别系统的英语语言模型研究
4. ネイティブ日本語とネイティブ英語の音声データを活用した日本人英語向けニューラル音響モデルの検討 [C] . 増村亮, 椛島優, 森谷崇史, 日本音響学会;日本音響学会秋季研究発表会 . 2018

机译：使用日语和英语的语音数据检查日语英语的神经声学模型
5. 第二言語作文のためのプレライティング?ディスカッションにおける母語の活用とその効果 : バイリンガル?アプローチの見地から [D] . 佐野, 愛子 2019

机译：母语在第二语言写作的写作讨论中的运用及其影响：从双语方法的角度
6. WWWから得られる検索語重み付けと話題適応に基づく音声認識のための言語モデル [O] . 宮崎将隆 2010

机译：基于从WWW获得的搜索词加权和主题自适应的语音识别语言模型

日本語母語話者のための英語音声認識システム用英語言語モデルの検討

摘要

著录项

相似文献

相关主题

期刊订阅