中文微博情感词提取:N-Gram为特征的分类方法

刘德喜; 聂建云; 张晶; 刘晓华; 万常选; 廖国琼

首页> 中文期刊> 《中文信息学报》 >中文微博情感词提取:N-Gram为特征的分类方法

中文微博情感词提取:N-Gram为特征的分类方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

情感词典是文本情感分析的基础资源,但采用手工方式构建工作量大,且覆盖有限.一种可行的途径是从新情感词传播的重要媒介-微博数据-中自动抽取情感词.该文以COAE 2014评测任务3提供的中文微博数据为统计对象,发现传统的基于共现的方法,如点互信息等,对中文微博数据中的新情感词发现是无效的.为此,设计一组基于上下文词汇的分类特征,即N-Gram特征,以刻画情感词的用词环境和用词模式,并以已知情感词为训练数据训练分类器,对候选情感词进行分类.实验结果表明,该方法较传统基于共现的方法要好.实验还发现,与英语不同的是,中文情感词通常会以名词词性出现,而基于共现的方法无法有效地区分该类情感词,这是造成其失效的主要原因,而该文提出的分类特征能解决这一问题.

著录项

来源
《中文信息学报》 |2016年第4期|193-205,212|共14页
作者
刘德喜; 聂建云; 张晶; 刘晓华; 万常选; 廖国琼;
展开▼
作者单位

江西财经大学信息管理学院,江西南昌330013;

蒙特利尔大学计算机科学与运筹学系,蒙特利尔加拿大H3C3J7;

华南理工大学计算机科学与工程学院,广东广州510641;

蒙特利尔大学计算机科学与运筹学系,蒙特利尔加拿大H3C3J7;

江西财经大学信息管理学院,江西南昌330013;

江西财经大学信息管理学院,江西南昌330013;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
情感词提取; 中文微博; 分类方法; N-Gram特征;

相似文献

中文文献
外文文献
专利

1. 基于多样化特征的中文微博情感分类方法研究 [J] . 张志琳 ,宗成庆 . 中文信息学报 . 2015,第004期
2. 基于表情图片与情感词的中文微博情感分析 [J] . 张珊 ,于留宝 ,胡长军 . 计算机科学 . 2012,第0z3期
3. 基于中文微博的情感词典构建及分类方法磁 [J] . 周剑峰 ,阳爱民 ,周咏梅 . 计算机与数字工程 . 2014,第010期
4. 基于集成学习的中文微博情感分类方法 [J] . 吴冲冲 . 科技传播 . 2014,第016期
5. 中文微博情感分析中主客观句分类方法 [J] . 杨武 ,宋静静 ,唐继强 . 重庆理工大学学报（自然科学版） . 2013,第001期
6. 基于语义约束LDA的商品特征和情感词提取 [C] . PENG Yun ,彭云 ,WAN Chang-Xuan . 第33届中国数据库学术会议（NDBC2016 ） . 2016
7. 面向中文微博文本的情感分类方法研究 [A] . 周君强 . 2019

中文微博情感词提取:N-Gram为特征的分类方法

摘要

著录项

相似文献

相关主题

期刊订阅