J4 ›› 2011, Vol. 33 ›› Issue (1): 166-170.doi: 10.3969/j.issn.1007130X.2011.
潘章明
PAN Zhangming
摘要:
基于进化算法的自动聚类方法具有搜索目标函数全局最优和自动发现聚类数的优点,同时也存在时间代价过高的缺陷。本文提出一种基于KD树子样的自动聚类方法,该方法使用KD树对样本空间进行分割,并在各子空间中随机取样形成KD树子样,然后在子样中自动聚类,最后运用KMeans在整个样本集中优化子样中的聚类结果。本文方法能够有效避免随机子样分布有偏的缺陷,即使比例很小的子样也能获得较好的聚类效果。仿真结果表明,本文方法能够保证聚类效果没有明显下降的情况下,显著缩短进化算法自动聚类的时间。