摘要:
孪生支持向量机TWSVMs分类过程的计算量和样本的数量成正比,当样本个数较多时,其分类过程将会比较耗时。为了提高样本集的稀疏性,从而提高TWSVMs的分类速度,提出了一种基于AP聚类的约简孪生支持向量机快速分类算法FCTSVMs-AP。首先对原始数据集进行AP聚类操作。聚类的中心为约简后新的样本集,按照分类误差最小的原则构建优化模型,用二次规划方法求解新的决策函数的系数,并证明了当样本集压缩时,收紧新的快速决策函数和原始决策函数之间的误差等价于在样本空间对原始数据集进行AP聚类操作。在人工数据集和UCI数据集上的实验表明,保持分类精度的损失在统计意义上不明显的前提下,FCTSVMs-AP可以通过有效压缩样本数量的方式提高分类速度。
韦修喜1,黄华娟1,周永权1,2. 基于AP聚类的约简孪生支持向量机快速分类算法[J]. 计算机工程与科学.
WEI Xiu-xi1,HUANG Hua-juan1,ZHOU Yong-quan1,2.
A fast classification algorithm of reduced twin
support vector machines based on AP clustering
[J]. Computer Engineering & Science.