摘要:目前,现有的聚类方法在对数值数据(numerical data)的处理上,技术已经比较成熟,而类别数据(categorical data)方面发展则相对滞后.这主要是由于类别数据的特征不易量化,很难为其建立特征空间,故使得很多聚类算法对它难以奏效.为了克服这一难题,本文提出了关于类别数据的一种新型特征量化方法,这种方法能够为类别数据建立特征空间,而且很好地体现了类别数据中蕴涵的特征和规律.之后,本文采用层拓展自组织映射(GHSOM)网络对量化后的数据样本进行聚类,并依靠了该网络的动态拓扑结构,取得了较满意的实验结果.