摘要:
针对影响k-means聚类效果的聚类数目和初始中心点两大因素,提出了基于双重遗传的k-means算法。它用外层遗传算法控制聚类数目,用内层遗传算法控制聚类的初始中心点,并采用类间距离和类内距离以及二者之间的比值来评价聚类结果的好坏,在算法终止后,可同时求得较优的聚类数目和某聚类数目下的较优初始中心点。此外,根据内外层遗传算法的特殊性,采用不同的编码策略适应算法需求,为保留优质个体,采用精英个体保留策略。通过UCI数据集测试实例证明此算法有很好的实用性,对数据挖掘技术有一定参考价值。
文静,曹妍,张琳,牟向伟. 基于双重遗传的聚类分析算法研究[J]. 计算机工程与科学.
WEN Jing,CAO Yan,ZHANG Lin,MU Xiang-wei.
A clustering analysis algorithm
based on double genetic algorithm
[J]. Computer Engineering & Science.