文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法

陈可嘉; 刘惠

首页> 中文期刊> 《科学技术与工程》 >文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法

文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对文本分类中文本数据表示存在稀疏性、维度灾难、语义丢失的问题,提出一种基于单词表示的全局向量(global vectors for word representation,GloVe)模型和隐含狄利克雷分布(latent Dirichlet allocation,LDA)主题模型的文本表示改进方法.利用GloVe模型结合局部信息和全局词语共现的统计信息训练得到文本的稠密词向量,基于LDA主题模型生成文本隐含主题和相应的概率分布,构建文本向量以及基于概率信息的主题向量,并计算两者之间的相似性作为分类器的输入.实验结果表明,相比其他几种文本表示方法,改进方法在精确率、召回率和F1值上均有所提高,基于GloVe和LDA的文本表示改进方法能有效提升文本分类器的性能.

著录项

来源
《科学技术与工程》 |2021年第29期|12631-12637|共7页
作者
陈可嘉; 刘惠;
展开▼
作者单位

福州大学经济与管理学院福州350116;

福州大学经济与管理学院福州350116;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
文本表示; GloVe模型; LDA主题模型; 文本分类; 词向量;

相似文献

中文文献
外文文献
专利

1. 基于商品评论主题模型的隐含狄利克雷分布研究 [J] . 周梁 ,方兴龙 . 安徽工程大学学报 . 2019,第001期
2. 基于商品评论主题模型的隐含狄利克雷分布研究 [J] . 周梁1 ,方兴龙2 . 安徽工程大学学报 . 2019,第001期
3. 基于隐含狄利克雷分布的多语种文本的自动检测研究 [J] . 张巍 ,李雯 ,陈丹 . 中国海洋大学学报（自然科学版） . 2017,第012期
4. 基于隐含狄利克雷分配模型的消费者在线评论复杂网络构建及其应用 [J] . 刘晓君 ,那日萨 ,崔雪莲 . 系统工程学报 . 2017,第003期
5. 基于隐含狄利克雷模型的文献主题演化预测 [J] . 茅利锋 ,张伟 . 计算机技术与发展 . 2016,第009期
6. 基于隐含狄列克雷分配的短文本分类方法 [C] . 张志飞 ,苗夺谦 ,高灿 . 第六届全国青年计算语言学会议 . 2012
7. 基于狄利克雷过程及多项分布混合模型的评论聚类研究 [A] . 彭明夷 . 2021

文本分类中基于单词表示的全局向量模型和隐含狄利克雷分布的文本表示改进方法

摘要

著录项

相似文献

相关主题

期刊订阅