• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2010, Vol. 32 ›› Issue (5): 85-88.doi: 10.3969/j.issn.1007130X.2010.

• 论文 • 上一篇    下一篇

非平衡类数据分类概述

钱洪波,贺广南   

  1. (南京大学计算机软件新技术国家重点实验室,江苏 南京 210093)
  • 收稿日期:2009-11-15 修回日期:2010-02-09 出版日期:2010-04-28 发布日期:2010-05-11
  • 通讯作者: 钱洪波 E-mail:qhbmars911@gmail.com
  • 作者简介:钱洪波(1983),男,江苏常州人,硕士生,研究方向为机器学习、模式识别和图像检索;贺广南,硕士生,研究方向为图像检索和模式识别。
  • 基金资助:

    国家自然科学基金资助项目(60875011,60723003);江苏省自然科学基金创新人才基金资助项目(BK2007520)

QIAN Hongbo,HE Guangnan   

  1.  (State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093,China)
  • Received:2009-11-15 Revised:2010-02-09 Online:2010-04-28 Published:2010-05-11
  • Contact: QIAN Hongbo E-mail:qhbmars911@gmail.com

摘要:

本文对非平衡类数据分类问题进行了概述。首先在简单介绍非平衡类数据基本概念的基础上,分析了非平衡类数据引起的问题及其导致分类性能下降的原因;然后介绍了目前主要的解决方法,分析了现有处理方法的优缺点;最后讨论了未来的研究方向。

关键词: 非平衡类, 重采样, 代价敏感学习, 分类器集成

Abstract:

In this paper, we provide an uptodate survey of the classimbalanced classification problems. After simply explaining the concepts of this domain, we take a deep look into the problems of classimbalance, and then introduce various kinds of solutions to this problem in detail. The following part analyses the main classifier algorithms’ advantages and disadvantages. Finally,we point out the future trends of this domain.

Key words: classimbalanced;resampling;costsensitive learning;classifier integration

中图分类号: