摘要:
传统的模糊连接点FJP聚类算法采用基于欧氏距离的最大最小合成运算法生成传递闭包,该方法所生成的传递闭包存在失真问题,即包含有较多错误的数据关联信息,最终造成算法聚类精度低且计算时间长。针对以上问题,提出一种改进的模糊连接点聚类算法:先用组合核函数计算数据集的模糊相似度矩阵,提高算法对数据非线性特征的辨识能力,并用大顶堆存储之;然后遍历传递闭包矩阵中的空元素,用堆顶的桥元素填充传递闭包的空元素,直至生成传递闭包。在测试数据集上的实验结果表明,本文算法的平均聚类精度较传统FJP算法有20%以上的提升,显著改善了传递闭包的失真问题;另外,在大型数据集上的计算效率亦优于传统FJP算法的,说明本文改进FJP算法的思路是有效的、可行的。
孙明珊,覃华,苏一丹. 一种改进的模糊连接点聚类算法[J]. 计算机工程与科学.
SUN Mingshan,QIN Hua,SU Yidan. An improved fuzzy joint points clustering algorithm[J]. Computer Engineering & Science.