首页> 外文会议>International Conference on Knowledge Discovery and Information Retrieval >Mining Tweet Data Statistic and Semantic Information for Political Tweet Classification
【24h】

Mining Tweet Data Statistic and Semantic Information for Political Tweet Classification

机译:挖掘政治推文分类的推文数据统计和语义信息

获取原文

摘要

This paper deals with the quality of textual features in messages in order to classify tweets. The aim of our study is to show how improving the representation of textual data affects the performance of learning algorithms. We will first introduce our method GENDESC. It generalizes less relevant words for tweet classification. Secondly, we compare and discuss the types of textual features given by different approaches. More precisely we discuss the semantic specificity of textual features, e.g. Named Entities, HashTags.
机译:本文涉及消息中的文本功能的质量,以便对推文进行分类。我们的研究目的是展示文本数据的表示如何影响学习算法的表现。我们将首先介绍我们的方法Gendesc。它概括了推文分类的不相关词。其次,我们比较并讨论不同方法给出的文本特征的类型。更确切地说,我们讨论了文本特征的语义特异性,例如,命名实体,hashtags。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号