首页> 外文会议>Workshop on Speech and Language Technologies for Dravidian Languages >CUSATNLP@DravidianLangTech-EACL2021: Language Agnostic Classification of Offensive Content in Tweets
【24h】

CUSATNLP@DravidianLangTech-EACL2021: Language Agnostic Classification of Offensive Content in Tweets

机译:Cusatnlp @ Dravidianlangtech-EACL2021:推文中的语言可靠分类进攻内容

获取原文

摘要

Identifying offensive information from tweets is a vital language processing task. This task concentrated more on English and other foreign languages these days. In this shared task on Offensive Language Identification in Dra-vidian Languages, in the First Workshop of Speech and Language Technologies for Dra-vidian Languages in EACL 2021, the aim is to identify offensive content from code mixed Dravidian Languages Kannada, Malay-alam, and Tamil. Our team used language-agnostic BERT (Bidirectional Encoder Representation from Transformers) for sentence embedding and a Softmax classifier. The language-agnostic representation based classification helped obtain good performance for all the three languages, out of which results for the Malayalam language are good enough to obtain a third position among the participating teams.
机译:识别推文中的攻击信息是一个重要的语言处理任务。 这项任务这些目前更多地集中在英语和其他外语上。 在这项共同任务中,关于DRA-Vidian语言的攻击性语言识别,在EACL 2021中的DRA-Vidian语言的第一个演讲和语言技术研讨会中,目的是从CODE MADIC DRAVIDIAN语言Kannada,Malay-Alam识别攻击内容 和泰米尔。 我们的团队使用语言 - 不可忽视的BERT(来自变压器的双向编码器表示)用于句子嵌入和软MAX分类器。 基于语言无神不可知的分类有助于获得所有三种语言的良好性能,其中MALAYALAM语言的结果足以获得参与团队中的第三位。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号