首页> 中文期刊> 《中文信息学报》 >中心修正增量主成分分析及其在文本分类中的应用

中心修正增量主成分分析及其在文本分类中的应用

         

摘要

增量式学习模型是挖掘大规模文本流数据的一种有效的数据处理技术.无偏协方差无关增量主成分分析(Candid Covariance-free Incremental Principal Component Analysis,CCIPCA)是一种增量主成分分析模型,具有收敛速度快和降维效果好的特点.但是,CCIPCA模型要求训练数据是已经中心化或中心向量固定的.在实际的应用中,CCIPCA往往采用一种近似的中心化算法对新样本进行处理,而不会对历史数据进行中心化修正.针对这一问题,该文提出了一种中心修正增量主成分分析模型(Centred Incremental Principal Component Analysis,CIPCA).CIPCA算法不仅对新样本进行中心化处理,而且会对历史数据进行准确的中心化修正.在文本流数据上的实验结果表明,CIPCA算法的收敛速度和分类性能明显优于CCIPCA算法,特别是在原始数据的内在模型不稳定的情况下,新算法的优势更为明显.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号