一种基于k-最近邻的无监督文本分类算法

余小鹏; 马费成

首页> 中文期刊> 《情报学报》 >一种基于k-最近邻的无监督文本分类算法

一种基于k-最近邻的无监督文本分类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

k-最近邻分类(KNN)是一种广泛使用的文本分类方法,但是该方法并不适用分布不均匀的数据集,同时对k值也比较敏感.本文分析了传统KNN方法的不足及产生这些不足的根本原因,并提出一种无监督的KNN文本分类算法(UKNNC).该方法先采用误差平方和准则自适应地从k个最近邻居所包含的各类别中挑选与输入文档于同一簇的部分邻居作为参照,然后根据输入文档对各类参照邻居核密度的扰动程度进行分类.实验证明该方法具有更高的分类质量,能够有效适用于分布复杂的数据集,同时分类结果对k值不敏感.

著录项

来源
《情报学报》 |2008年第4期|550-555|共6页
作者
余小鹏; 马费成;
展开▼
作者单位

武汉大学信息管理学院;

武汉;

430072;

武汉工程大学经济管理学院;

武汉;

430073;

武汉大学信息管理学院;

武汉;

430072;

展开▼
原文格式 PDF
正文语种 chi
中图分类情报学、情报工作;
关键词
k-最近邻; 核密度估计; 误差平方和准则; 文本分类;

相似文献

中文文献
外文文献
专利

1. 一种新的基于密度的k-最近邻文本分类器训练样本约减方法 [J] . 徐义峰 ,陈春明 ,徐云青 . 计算机系统应用 . 2007,第011期
2. 基于k-最近邻图的小样本KNN分类算法 [J] . 刘应东 ,牛惠民 . 计算机工程 . 2011,第009期
3. 一种基于非监督判别语义特征提取的文本分类算法 [J] . 戴臻 . 数字技术与应用 . 2012,第011期
4. 一种基于非监督判别语义特征提取的文本分类算法 [J] . 戴臻 . 数字技术与应用 . 2012,第011期
5. 一种基于分割K-最近邻算法的传染病预测方法 [J] . 相晓敏 ,顾君忠 ,王永明 . 计算机工程 . 2016,第001期
6. 基于流形学习的半监督文本情感分类算法 [C] . 何慧 ,陈博 ,郭军 . 第五届全国信息检索学术会议CCIR2009 . 2009
7. 一种结合万有引力的高光谱遥感影像无监督分类算法 [A] . 杨文韬 . 2011

一种基于k-最近邻的无监督文本分类算法

摘要

著录项

相似文献

相关主题

期刊订阅