首页> 外文会议>Conference on empirical methods in natural language processing >Using Wikipedia Edits in Low Resource Grammatical Error Correction
【24h】

Using Wikipedia Edits in Low Resource Grammatical Error Correction

机译:在低资源语法纠错中使用维基百科编辑

获取原文

摘要

We develop a grammatical error correction (GEC) system for German using a small gold GEC corpus augmented with edits extracted from Wikipedia revision history. We extend the automatic error annotation tool ERRANT (Bryant et al., 2017) for German and use it to analyze both gold GEC corrections and Wikipedia edits (Grundkiewicz and Junczys-Dowmunt, 2014) in order to select as additional training data Wikipedia edits containing grammatical corrections similar to those in the gold corpus. Using a multilayer convo-lutional encoder-decoder neural network GEC approach (Chollampatt and Ng, 2018), we evaluate the contribution of Wikipedia edits and find that carefully selected Wikipedia edits increase performance by over 5%.
机译:我们使用小型金GEC语料库制定德国语法纠错(GEC)系统,从而用来自维基百科修订版历史中提取的编辑。我们将自动错误注释工具错误(Bryant等,2017)用于德语,并使用它来分析Gold GEC校正和维基百科编辑(Grundkiewicz和Junczys-Dowmunt,2014),以便选择额外的培训数据维基百科编辑类似于金色语料库中的语法校正。使用多层康复编码器 - 解码器神经网络GEC方法(Chollampatt和Ng,2018),我们评估维基百科编辑的贡献,并找到精心挑选的维基百科编辑的贡献增加了5%以上的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号