首页> 中文期刊> 《计算机与现代化》 >基于信息论方法的分类数据相似性度量

基于信息论方法的分类数据相似性度量

         

摘要

两实例的距离或相似性度量在数据挖掘和机器学习中扮演着重要的角色.常用的距离度量方法主要适用于数值数据,针对分类数据,本文提出一种数据驱动的相似性度量方法.该方法利用属性值与类标签的信息,将属性值的类条件概率结合信息论来度量分类数据的相似性.为了与已提出的相似性度量方法作比较,把各度量方法与k最近邻算法结合,对多个分类数据集进行分类,通过十折交叉验证比较结果的错误率.实验表明该度量结合k最近邻方法使分类具有较低的错误率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号