摘要:
传统k最近邻算法kNN在数据分类中具有广泛的应用,但该算法具有较多的冗余计算,致使处理高维数据时花费较多的计算时间。同时,基于地标点谱聚类的分类算法(LCkNN和RCkNN)中距离当前测试点的最近邻点存在部分缺失,导致其准确率降低。针对上述问题,提出一种基于聚类的环形k最近邻算法。提出的算法在聚类算法的基础上,首先将训练集中相似度较高的数据点聚成一个簇,然后以当前测试点为中心设置一个环形过滤器,最后通过kNN算法对过滤器中的点进行分类,其中聚类算法可以根据实际情况自由选择。算法性能已在UCI数据库中6组公开数据集上进行了实验测试,实验结果表明:AkNNE与AkNNH算法比kNN算法在计算量上平均减少51%,而在准确率上比LCkNN和RCkNN算法平均提高3%。此外,当数据在10 000维的情况下该算法仍然有效。
匡振曦,武继刚,李嘉兴. 基于聚类的环形kNN算法[J]. 计算机工程与科学.
KUANG Zhenxi,WU Jigang,LI Jiaxing. A clustering-based annular k-nearest neighbor algorithm[J]. Computer Engineering & Science.