基于注意力机制与多元特征融合的中文文本分类方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

中文文本分类作为搜索引擎的关键基础技术，对于高效而充分地从互联网上巨量的中文文本信息中挖掘出高价值中文文本信息，以满足社会发展的需求具有十分重要的作用与价值。文本特征的提取直接地影响中文文本分类系统的性能，是文本分类中的核心技术基础之一。通过设计、实现新型的基于深度学习的文本特征提取算法模型来更好地识别中文文本特征，从而提高系统对中文文本特征的识别能力，具有十分重要的价值与意义。
　　论文以基于深度学习的中文文本分类为主线，对基于卷积神经网络、长短期记忆网络、注意力机制和多元特征融合等模型的中文文本特征提取算法进行了深入地研究。
　　针对中文文本分类任务中，不同文本特征对文本类别识别贡献不同的问题，提出一种基于语义理解的注意力算法模型。通过对相邻两个时间步的文本数据的特征学习结果进一步融合与学习来产生注意力权重。
　　针对中文文本类别识别中不同文本元素发挥作用不同的问题，提出一种特征差异强化注意力算法模型。通过生成的注意力权重，使重要的文本元素在文本识别中发挥更加突出的作用。
　　针对重要文本特征在中文文本中位置分布分散、稀疏的问题，提出一种多元特征融合中文文本分类模型。通过将语义理解注意力算法模型，长短期记忆网络(LSTM)卷积神经网络(CNN)相结合以更加全面、细致地提取文本特征。
　　针对中文文本重点特征在文本中分布不均匀的问题，提出一种特征强化融合中文文本分类模型。通过双层LSTM与CNN对注意力机制提取的特征逐级强化来获得包含特征信息量更丰富、更全面的文本特征。
　　通过中文文本分类实验验证了提出的四种算法模型的有效性。

著录项

作者
侯永进;
展开▼
作者单位

哈尔滨理工大学;

展开▼
授予单位哈尔滨理工大学;
学科信号与信息处理
授予学位硕士
导师姓名谢金宝;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
中文文本; 特征提取; 深度学习; 卷积神经网络; 长短期记忆网络; 注意力机制; 多元特征融合;

相似文献

中文文献
外文文献
专利

1. 基于语义理解注意力神经网络的多元特征融合中文文本分类 [J] . 谢金宝 ,侯永进 ,康守强 . 电子与信息学报 . 2018,第005期
2. 融合多头自注意力机制的中文短文本分类模型 [J] . 张小川 ,戴旭尧 ,刘璐 . 计算机应用 . 2020,第012期
3. 结合词性信息的基于注意力机制的双向LSTM的中文文本分类 [J] . 高成亮 ,徐华 ,高凯 . 河北科技大学学报 . 2018,第005期
4. 中文文本分类中基于词性的特征提取方法研究 [J] . 胡燕 ,吴虎子 ,钟珞 . 武汉理工大学学报 . 2007,第4期
5. 基于多尺度特征融合注意力机制的纸病分类方法研究 [J] . 张开生 ,宋帆 . 中国造纸 . 2021,第004期
6. 中文文本分类中一种基于语义的特征降维方法 [C] . 胡涛 ,刘怀亮 . 《图书情报工作》杂志社、图书情报工作研究会第25次图书馆学情报学学术研讨会 . 2011
7. 基于多头注意力机制和特征融合的新闻文本分类研究 [A] . 荣麒 . 2021

基于注意力机制与多元特征融合的中文文本分类方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅