【24h】

Using Confidence Bands for Parallel Texts Alignment

机译:使用置信带进行并行文本对齐

获取原文
获取原文并翻译 | 示例

摘要

This paper describes a language independent method for alignment of parallel texts that makes use of homograph tokens for each pair of languages. In order to filter out tokens that may cause misalignment, we use confidence bands of linear regression lines instead of heuristics which are not theoretically supported. This method was originally inspired on work done by Pascale Fung and Kathleen McKeown, and Melamed, providing the statistical support those authors could not claim.
机译:本文介绍了一种与语言无关的并行文本对齐方法,该方法对每对语言使用同形异义标记。为了滤除可能导致未对准的标记,我们使用线性回归线的置信带代替理论上不受支持的启发式方法。此方法最初是由Pascale Fung和Kathleen McKeown以及Melamed所做的工作启发的,提供了作者无法声称的统计支持。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号