Nova-Wang at SemEval-2020 Task 12: OffensEmblert: an Ensemble of Offensive Language Classifiers

机译：Nova-Wang在Semeval-2020任务12：冒犯监魂：攻击性语言分类器的集合

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper presents our contribution to the Offensive Language Classification Task (English SubTask A) of Semeval 2020. We propose different Bert models trained on several offensive language classification and profanity datasets, and combine their output predictions in an ensemble model. We experimented with different ensemble approaches, such as SVMs, Gradient boosting, AdaBoosting and Logistic Regression. We further propose an under-sampling approach of the current SOLID dataset, which removed the most uncertain partitions of the dataset, increasing the recall of the dataset. Our best model, an average ensemble of four different Bert models, achieved 11th place out of 82 participants with a macro F1 score of 0.91344 in the English SubTask A.

机译：本文提出了对Semeval 2020的令人反感语言分类任务（英语子间A）的贡献。我们提出了在几种攻击性语言分类和亵渎数据集上培训的不同BERT模型，并将其输出预测组合在集合模型中。我们尝试了不同的集合方法，如SVM，梯度提升，adaboosting和Logistic回归。我们进一步提出了一种当前实体数据集的下采样方法，该方法删除了数据集的最不确定的分区，增加了数据集的召回。我们最好的型号，是四种不同BERT模型的平均集合，在82名参与者中实现了11个参与者，在英语子任务中的宏F1分数为0.91344。

著录项

来源
《International Workshop on Semantic Evaluation》|2020年|1587-1597|共11页
会议地点
作者
Susan Wang; Zita Marinho;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Assessment of language impairment in bilingual children using semantic tasks: two languages classify better than one [J] . Pena Elizabeth D., Bedore Lisa M., Kester Ellen S. International journal of language & communication disorders . 2016,第2期

机译：使用语义任务评估双语儿童的语言障碍：两种语言的分类效果优于一种
2. A multiobjective simulated annealing approach for classifier ensemble: Named entity recognition in Indian languages as case studies [J] . AsifEkbal, SriparnaSaha Expert Systems with Application . 2011,第12期

机译：分类器集成的多目标模拟退火方法：以印度语言中的命名实体识别为案例研究
3. Language identification from multi-lingual scene text images: a CNN based classifier ensemble approach [J] . Chakraborty Neelotpal, Kundu Soumyadeep, Paul Sayantan, Journal of ambient intelligence and humanized computing . 2021,第7期

机译：来自多语言场景文本图像的语言识别：基于CNN的分类器集合方法
4. AdelaideCyC at SemEval-2020 Task 12: Ensemble of Classifiers for Offensive Language Detection in Social Media [C] . Mahen Herath, Thushari Atapattu, Hoang Anh Dung, International Workshop on Semantic Evaluation . 2020

机译：AdelaideCyc在Semeval-2020任务12：社交媒体中攻击性语言检测的分类器组合
5. The Ensemble MeSH-Term Query Expansion Models Using Multiple LDA Topic Models and ANN Classifiers in Health Information Retrieval [D] . You, Sukjin. 2020

机译：使用多个LDA主题模型和健康信息检索的ANN分类器的集合网格术语查询型号
6. Assessment of language impairment in bilingual children using semantic tasks: two languages classify better than one [O] . Elizabeth D. Peña, Lisa M. Bedore, Ellen S. Kester -1

机译：使用语义任务评估双语儿童的语言障碍：两种语言的分类效果优于一种
7. JCTICOL at SemEval-2019 Task 6: Classifying Offensive Language in Social Media using Deep Learning Methods, Word/Character N-gram Features, and Preprocessing Methods [O] . Yaakov HaCohen-Kerner, Ziv Ben-David, Gal Didi, 2019

机译：JcTicol在Semeval-2019任务6：使用深度学习方法，单词/字符n-gram功能和预处理方法对社交媒体进行攻击语言

Nova-Wang at SemEval-2020 Task 12: OffensEmblert: an Ensemble of Offensive Language Classifiers

摘要

著录项

相似文献

相关主题

期刊订阅