首页> 外文会议>Traitement automatique des langues naturelles >Peut-on bien chunker avec de mauvaises étiquettes POS?
【24h】

Peut-on bien chunker avec de mauvaises étiquettes POS?

机译:我们可以用不良的POS标签打包吗?

获取原文

摘要

Dans cet article, nous testons deux approches distinctes pour chunker un corpus oral transcrit, en cherchant à minimiser les étapes de correction manuelle. Nous ré-utilisons tout d'abord un chunker appris sur des données écrites, puis nous tentons de ré-apprendre un chunker spécifique de l'oral à partir de données annotées et corrigées manuellement, mais en faible quantité. L'objectif est d'atteindre les meilleurs résultats possibles pour le chunker en se passant autant que possible de la correction manuelle des étiquettes POS. Nos expériences montrent qu'il est possible d'apprendre un nouveau chunker performant pour l'oral à partir d'un corpus de référence annoté de petite taille, sans intervention sur les étiquettes POS.
机译:在本文中,我们测试了两种不同的方法来对已转录的口腔语料进行分块,以尽量减少手动纠正步骤。我们首先重新使用从书面数据中学到的分块器,然后尝试从人工批注和更正的数据中重新学习特定的口服分块器,但数量很少。目标是通过尽可能避免对POS标签进行手动校正的需求,为分块器获得最佳的结果。我们的经验表明,无需干预POS标签,就可以从带有注释的小型参考语料库中学习一种新型的高性能口腔分块器。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号