首页> 中文期刊> 《铁道学报》 >基于粗糙集和模糊聚类理论的文本分类系统的研究与实现

基于粗糙集和模糊聚类理论的文本分类系统的研究与实现

         

摘要

随着Internet的发展及广泛应用,越来越多的文本信息以待阅读和处理.文本分类成为众所关注但仍未很好解决的热门课题.本文提出一种基于粗糙集和模糊聚类(RS&FC)理论的文本分类新模型, 详细讨论和分析了该模型的总体设计思想、主要实现技术和有关的算法及实现方案.该模型在分类规则产生之前,以训练样本直接聚类的结果构造信息表,并对表中的连续属性离散化,再对信息表中的特征词属性进行二次聚类,压缩文本特征子集的向量维数,提取关键字特征属性,建立决策信息表,然后利用粗糙集理论,采用启发式约简算法,对信息表进行约简,产生优化的分类规则,指导文本分类.最后通过实验和性能评价,本文提出的分类方法的分类准确率高于传统的K-最近邻分类(K-NN)法,提高了系统的适应性能和分类能力.

著录项

  • 来源
    《铁道学报》 |2007年第1期|45-49|共5页
  • 作者

    郑丽英; 王海涌; 刘丽艳;

  • 作者单位

    兰州交通大学,电子与信息工程学院,甘肃,兰州,730070;

    兰州交通大学,光电技术与智能控制教育部重点实验室,甘肃,兰州,730070;

    兰州交通大学,电子与信息工程学院,甘肃,兰州,730070;

    兰州交通大学,光电技术与智能控制教育部重点实验室,甘肃,兰州,730070;

    兰州交通大学,电子与信息工程学院,甘肃,兰州,730070;

    兰州交通大学,光电技术与智能控制教育部重点实验室,甘肃,兰州,730070;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 文字信息处理;
  • 关键词

    粗糙集; 模糊聚类; 文本分类; 文本聚类; 规则约简;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号