摘要:
在不确定性数据聚类算法的研究中,普遍需要假设不确定性数据服从某种分布,继而获得表示不确定性数据的概率密度函数或概率分布函数,然而这种假设很难保证与实际应用系统中的不确定性数据分布一致。现有的基于密度的算法对初始参数敏感,在对密度不均匀的不确定性数据聚类时,无法发现任意密度的类簇。鉴于这些不足,
提出基于区间数的不确定性数据对象排序识别聚类结构算法(UDOPTICS)。该算法利用区间数理论,结合不确定性数据的相关统计信息来更加合理地表示不确定性数据,提出了低计算复杂度的区间核心距离与区间可达距离的概念与计算方法,将其用于度量不确定性数据间的相似度,拓展类簇与对象排序识别聚类结构。该算法可很好地发现任意密度的类簇。实验结果表明,UDOPTICS算法具有较高的聚类精度和较低的复杂度。
吴翠先1,2,3,何少元1,2. 基于区间数的不确定性数据聚类算法:UD-OPTICS[J]. 计算机工程与科学.
WU Cuixian1,2,3,HE Shaoyuan1,2.
UD-OPTICS: An uncertain data clustering
algorithm based on interval number
[J]. Computer Engineering & Science.