English are spoken in various occasions like presentations and discussions at international conferences by a lot of people whose mother tongues are different from. Their second languages often have not only distinct accent but also different lexical and syntactic characteristics. Speech recognition performance is severely affected when the lexical, syntactic, or semantic characteristics in the training and recognition tasks differ. Language model of a speech recognition system is usually trained with transcribed speech data or text data collected in English native countries, therefore, speech recognition performance is expected to be degraded by mismatch of lexical and syntactic characteristics between native speakers and second languages speakers as well as by the distinction between their accents. This paper describes improvement of speech recognition performances when the language model are trained with the learner corpus which was created by collecting sentences translated by Japanese subjects and linearly interpolated with a language model trained with a corpus in the same domain.%国際的なビジネスの場などでの発表や交渉・議論は英語でなされることから,英語発話を認識し,検索・要約などの処理を行う英語発話のドキュメント処理技術は一層重要となる.第2言語による発音や表現は,母語の干渉を受けるため,英語を母語とする話者の音声データを用いて学習を行った英語音声認識装置では,第2言語話者による英語に対する音声認識性能は大きく低下する.このため,日本人による英語発話をドキュメント処理することは極めて困難である.本稿では,日本語母語話者による英語音声の認識率を向上させる取り組みとして,日本語母語話者の言語特性を考慮した言語モデルの採用がどの程度音声認識率を向上させるかを検討した.本稿では,旅行会話に関する英語テキストコーパス(BTEC)より選択した課題文を学習者が英訳した学習者コーパスを用いて学習を行った言語モデルにより,日本語母語話者の英語発話の認識率がどの程度認識率を向上したかを述べる.
展开▼