首页> 中文学位 >基于词典的财经微博信息的情感态度挖掘
【6h】

基于词典的财经微博信息的情感态度挖掘

代理获取

目录

摘要

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容

1.4 论文结构组成

第2章 相关研究

2.1 国内外微博介绍

2.1.1 国外微博说明

2.1.2 国内微博发展

2.2 公司机构名称研究

2.2.1 公司机构名称组织结构

2.2.2 公司名称简称研究

2.3 微博语言特点分析

2.4 本章小结

第3章 情感分类研究

3.1 情感分类的关键技术

3.1.1 微博数据获取

3.1.2 中文分词

3.1.3 数据预处理

3.1.4 特征选择

3.2 基于机器学习方法

3.2.1 支持向量机

3.2.2 K最近邻算法

3.2.3 朴素贝叶斯算法

3.2.4 类中心向量法

3.3 基于语义的分类方法

3.3.1 语义分类方法介绍

3.3.2 构建情感词典的必要性

3.3.3 现有情感词典

3.4 情感分类流程图

3.5 本章小结

第4章 微博情感词典构建

4.1 财经领域情感词典

4.1.1 SO-PMI算法扩展

4.1.2 领域情感词典的生成

4.2 网络用语情感词典

4.3 其他词性词典

4.4 情感倾向加权计算方法

4.5 本章小结

第5章 实验结果与分析

5.1 实验数据介绍

5.2 实验结果评测指标

5.3 实验结果及分析

5.4 本章小结

第6章 总结及展望

6.1 本文主要工作

6.2 存在的问题及下一步研究

参考文献

致谢

攻读硕士期间主要的研究成果

声明

浙江师范大学学位论文诚信承诺书

展开▼

摘要

近年来,随着中国经济的快速发展,中国的股票市场发展也呈现迅猛之势。中国股市已拥有2467家上市公司,沪深股市总市值23.5万亿,股民数量已达到1.6亿,中国股市已经成为全球市值的第三大市场。对股民而言,互联网财经类消息与他们的利益息息相关。
  微博作为一种新型的社交工具,由于其简短写作,便捷发布,实时交互的特点深受大众欢迎,微博已成为国内第二大网络社交媒介,也是第二大舆情源头。面向财经类的微博信息分析,关注公众对财经市场的反应——情感,可以为市场预测提供参考,为财经行业从业人员和投资者服务。因此,以财经领域作为研究实例,分析微博舆情有现实意义和应用价值。
  在针对财经微博的情感态度分析研究中,构建了一个完整的分类模型,主要从规范化、分类、命名实体识别、情感分析、趋势预测等方面开展研究。但是本文将重心放在情感分析上,情感倾向分类也被称为观点挖掘(Opinion Mining)或者情感极性分类,可以理解为用户对某客体表达自身观点所持的态度是支持、反对、中立,也就是常说的正面情感、负面情感、中性情感。在论文的具体实施过程中,研究的主要内容包括以下几部分:
  (1)研究了公司组织机构名称全称及简称的语法构成、语义特点及组织规律,并结合金融领域特有的情感词,使用情感倾向点互信息算法(SO-PMI)构建了金融领域词典。
  (2)分析研究中文微博的特点,在结合网络语言及金融语言特点的基础上,构建了网络用语词典和否定词、程度副词及表情符词典,对深入研究情感态度挖掘具有重要帮助。
  (3)提出了情感加权计算方法,将构建的各类词典应用到情感分类之中,实现情感分类值的量化计算。
  最后通过新浪API获取一段时间内含有公司名称的财经微博,在经过预处理、分词和特征选择之后,用词典的情感分类方法对其进行分类。实验验证了金融领域词典、网络词典、和表情词典的重要性,并将各种词典都完备下的实验数据和实际股市走向进行对比,说明实验数据在实际生活中具有现实意义,通过进一步研究可运用于股票投资。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号