计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (01): 170-179.
张明珠,曹杰,王斌
ZHANG Ming-zhu,CAO Jie,WANG Bin
摘要: 聚类数的确定在聚类分析中是一个基本却具有挑战性的问题。一方面,最佳聚类数根据不同的评价标准、用户偏好或需求可能不一致,因此将不同聚类数的聚类结果呈现给用户作参考是有意义的。另一方面,增加聚类数虽会使聚类结果更加紧致,却会削弱不同类之间的分离性,所以选择合适的聚类数是一个在最小化聚类数与最大化类内紧致性或类间分离性之间取得平衡的多目标优化问题。因此,在聚类数不确定的聚类问题中直接将聚类数作为一个优化目标与另一个反映类内紧致性的目标函数同时进行优化,利用新的基于精英集的多目标差分进化算法得到一个Pareto解集,集合中含有多个不同聚类数的近似最优聚类结果。实验结果验证了所提算法的可行性和有效性。