• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

计算机工程与科学

• 论文 • 上一篇    下一篇

一种基于样本加权的合成多核学习方法

沈健,蒋芸,张亚男,胡学伟   

  1. (西北师范大学计算机科学与工程学院,甘肃 兰州 730070)
  • 收稿日期:2015-09-14 修回日期:2016-03-17 出版日期:2017-10-25 发布日期:2017-10-25
  • 基金资助:
    国家自然科学基金(61163036);甘肃省高校研究生导师项目(1201-16);2012年度甘肃省高校基本科研业务费
    专项资金;西北师范大学第三期知识与创新工程科研骨干项目(nwnu-kjcxgc-03-67)

A new summation multi-kernel learning
method based on sample weighting

SHEN Jian,JIANG Yun,ZHANG Ya-nan,HU Xue-wei   

  1. (College of Computer Science and Engineering,Northwest Normal University,Lanzhou 730070,China)
  • Received:2015-09-14 Revised:2016-03-17 Online:2017-10-25 Published:2017-10-25

摘要:

多核学习是目前基于内核学习的机器学习领域中的一个新的研究热点。内核学习方法可以把数据映射到高维空间来增加线性
分类器如支持向量机的计算性能,它是目前处理非线性模式识别与分类问题的一种便捷、高效的方法。然而,在某些特殊情
况下,基于单一核函数的内核学习方法并不能完全有效地处理如数据异构或者不规则、样本规模大、样本分布不平坦等实际
问题,所以通过将多个核函数以加权的形式合成一个核函数,来得到更好的识别精度以及效率,是当前研究的一个发展趋势
。因此,提出一种基于样本加权的合成多核学习方法,通过单一核函数对样本的拟合以及适应能力(对样本的学习精度),
对每一个核函数按照对应的拟合以及适应能力加权,最终得到基于样本加权的合成多核决策函数。为了验证基于样本加权的
合成多核学习方法的有效性和可靠性,在多个数据集上进行了实验分析,实验结果表明,与已有的多核学习方法相比较,本
文提出的方法取得了更好的分类结果。

关键词: 多核学习, 映射, 非线性模式, 数据异构

Abstract:

Multi-kernel learning is a new research hotspot in current kernel machine learning field. By mapping data
into the high dimensional space, kernel methods increase the computing performance of linear classifiers such
as support vector machines, and it is a convenient and effective way to deal with nonlinear pattern
recognition and classification. However, in some complex situations, such as heterogeneous data or irregular
data, large sample size and non-flat sample distribution, the kernel learning method based on single kernel
function cannot completely meet the requirement, so it is necessary to develop multiple kernel functions in
order to get better results. We propose a new summation multi-kernel learning method based on sample
weighting which can be weighted by the capability of how much a single kernel function can fit the sample.
Experiment analysis on several data sets shows that the proposed method can obtain high classification
accuracy.

Key words: multi-kernel learning, map, nonlinear model, heterogeneous data