首页> 中文会议>全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会 >中文文本自动分类中特征向量选择的一种改进算法

中文文本自动分类中特征向量选择的一种改进算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着互联网的迅速发展,对海量的信息进行处理再加工显得尤为重要.文本自动分类是信息检索方面一个基础性的研究工作,即,研究在特定的分类体系下,如何根据文本的内容自动判别文本的类别,以减少信息检索的范围.本文介绍了文本分类的一些关键技术,包括文本表示,特征向量的选择,分类算法等,并且对常用的特征向量选择算法进行了比较,分析其中存在的问题并提出一种特征向量选择的改进算法,即找出一类有较强类别区分意义的特征词,构成特征向量.利用改进后的算法对语料库进行训练和测试,实验结果表明,在使用各种分类算法对中文文本进行分类的过程中,改进后的特征向量选择算法对分类准确率有不同程度的提高.

著录项

来源
《全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会》|2006年|236-239|共4页
会议地点南京
作者
王若翔; 刘亚军;
展开▼
作者单位

中国计算机学会;

江苏省计算机学会;

江苏省软件行业协会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类 TP311.131;
关键词
文本分类; 特征向量; 信息检索; 分类算法; 语料库;

相似文献

中文文献
外文文献
专利

1. 中文文本自动分类中的特征选择改进与研究 [J] . 张振浩 ,周奇年 ,杨继慧 . 工业控制计算机 . 2012,第011期
2. 一种改进的中文文本特征选择方法 [J] . 王培涌 ,陈好刚 ,王树峰 . 现代计算机（专业版） . 2009,第012期
3. 一种基于多特征因子改进的中文文本分类算法 [J] . 叶敏 ,汤世平 ,牛振东 . 中文信息学报 . 2017,第004期
4. 一种改进的KNN中文文本分类算法 [J] . 杜琳娜 ,闫光辉 ,杨霞霞 . 软件导刊 . 2010,第002期
5. 一种改进的KNN中文文本分类算法 [J] . 杜琳娜 ,闫光辉 ,杨霞霞 . 软件导刊 . 2010,第002期
6. 一种基于EP的中文文本自动分类算法 [C] . 许红涛 ,范明 ,昝红英 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 基于VSM模型和特征选择算法的中文文本自动分类研究 [A] . 朱坤红 . 2011

中文文本自动分类中特征向量选择的一种改进算法

摘要

著录项

相似文献

相关主题

期刊订阅