基于χ2统计量的kNN文本分类算法

印鉴; 谭焕云

首页> 中文期刊> 《小型微型计算机系统》 >基于χ2统计量的kNN文本分类算法

基于χ2统计量的kNN文本分类算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.由于χ2统计量能很好地体现词和类别之间的相关性,因此成为特征选择中常用的评估函数.本文分析了χ2统计量在特征选择和分类决策阶段的性质,提出了一种新的基于χ2统计量的相似度定义,并结合基于两次类别判定的快速搜索算法,改进了传统的kNN算法.实验结果显示基于χ2统计量的改进kNN文本分类算法能大大减少kNN算法的分类时间,并提高了kNN算法的准确率和召回率.

著录项

来源
《小型微型计算机系统》 |2007年第6期|1094-1097|共4页
作者
印鉴; 谭焕云;
展开▼
作者单位

中山大学,计算机科学系,广东,广州,510275;

中山大学,计算机科学系,广东,广州,510275;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
文本分类; 特征选择; kNN; χ2统计量;

相似文献

中文文献
外文文献
专利

1. 基于文本和类别信息的KNN文本分类算法 [J] . 艾英山 ,张德贤 . 计算机与数字工程 . 2009,第011期
2. 基于加权局部线性KNN的文本分类算法 [J] . 齐斌 ,邹红霞 ,王宇 . 计算机应用研究 . 2020,第008期
3. 基于TextRank的KNN文本分类算法研究 [J] . 景永霞 ,苟和平 ,孙为 . 洛阳理工学院学报（自然科学版） . 2019,第003期
4. 基于Spark与词语相关度的KNN文本分类算法 [J] . 于苹苹 ,倪建成 ,韦锦涛 . 计算机技术与发展 . 2018,第003期
5. 基于类别特征改进的KNN短文本分类算法 [J] . 黄贤英 ,熊李媛 ,刘英涛 . 计算机工程与科学 . 2018,第001期
6. 基于加权修正的KNN文本分类算法 [C] . . 第二十五届中国数据库学术会议(NDBC2008) . 2008
7. 基于样本重要性原理的KNN文本分类算法 [A] . 万韩永 . 2015

基于χ2统计量的kNN文本分类算法

摘要

著录项

相似文献

相关主题

期刊订阅