首页> 外文会议>International conference on asian language processing >Designing an Indonesian part of speech tagset and manually tagged Indonesian corpus
【24h】

Designing an Indonesian part of speech tagset and manually tagged Indonesian corpus

机译:设计语音标记的印度尼西亚语部分并手动标记印度尼西亚语料库

获取原文

摘要

We describe our work on designing a linguistically principled part of speech (POS) tagset for the Indonesian language. The process involves a detailed study and analysis of existing tagsets and the manual tagging of an Indonesian corpus. The results of this work are an Indonesian POS tagset consisting of 23 tags and an Indonesian corpus of over 250.000 lexical tokens that have been manually tagged using this tagset.
机译:我们描述了为印尼语设计语言原则的语音(POS)标签集的工作。该过程包括对现有标签集的详细研究和分析,以及对印度尼西亚语料库的手动标签。这项工作的结果是一个印度尼西亚POS标签集,该标签集由23个标签和一个印尼语料库组成,该语料库包含250.000个以上使用该标签集手动标记的词法标记。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号