摘要:
在多标记学习系统中,每个样本同时与多个类别标记相关,却均由一个属性特征向量描述。大部分已有的多标记分类算法采用的共同策略是使用相同的属性特征集合预测所有的类别标记,但它并非最佳选择,原因在于每个标记可能与其自身独有的属性特征相关性最大。针对这一问题,提出了融合标记独有属性特征的k近邻多标记分类算法—IMLkNN。首先对多标记数据的特征向量进行预处理,分别为每类标记构造对该类标记最具有判别能力的属性特征;然后基于得到的属性特征使用改进后的MLkNN算法进行分类。实验结果表明,IMLkNN算法在yeast和image数据集上的性能明显优于MLkNN算法以及其他3种常用的多标记分类算法。
蒋芸,肖潇,侯金泉,陈莉. 融合标记独有属性特征的k近邻多标记分类新算法[J]. 计算机工程与科学.
JIANG Yun,XIAO Xiao,HOU Jinquan,CHEN Li.
A new kNN multi-label classification
algorithm with label-specific features
[J]. Computer Engineering & Science.