• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2010, Vol. 32 ›› Issue (6): 106-108.doi: 10.3969/j.issn.1007130X.2010.

• 论文 • 上一篇    下一篇

SVM用于文本分类的适用性

刘晓亮1,丁世飞1,2 ,朱红1,张力文1   

  1. (1.中国矿业大学计算机科学与技术学院,江苏 徐州 221008;
    2.中国科学院计算技术研究所智能信息处理重点实验室,北京 100080)
  • 收稿日期:2009-09-17 修回日期:2009-12-11 出版日期:2010-06-01 发布日期:2010-06-01
  • 通讯作者: 刘晓亮 E-mail:lxlcumtcs@163.com
  • 作者简介:刘晓亮(1983),男,山东潍坊人,硕士生,研究方向为支持向量机和机器学习;丁世飞,博士后,教授,博士生导师,研究方向为机器学习与数据挖掘、人工智能与模式识别等。
  • 基金资助:

    江苏省基础研究计划(自然科学基金)(BK2009093);国家自然科学基金资助项目(60975039);中国科学院智能信息处理重点实验室开放基金资助项目(IIP20062)

Appropriateness in Applying SVMs to Text Classification

LIU Xiaoliang1,DING Shifei1,2,ZHU Hong1,ZHANG Liwen1   

  1. (1.School of Computer Science and Technology,China University of Mining and Technology,Xuzhou 221008;
    2.Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,
    Chinese Academy of Sciences,Beijing 100080,China)
  • Received:2009-09-17 Revised:2009-12-11 Online:2010-06-01 Published:2010-06-01

摘要:

本文从统计的角度描述了文本分类的关键性质,给出了相应的文本文档集的统计分类模式,并将其与支持向量机的模型结合,说明了为什么支持向量机(SVM)能够很好地进行文本分类。本文主要是从理论角度说明SVM用于文本分类的适用性,模型构造简单,并且是高度抽象、无噪音的。

关键词: 文本分类, SVM, 机器学习

Abstract:

This paper introduces the key properties of text classification from a statistical perspective, gives the corresponding statistical classification model of text document sets which is combined with SVMs, and explains why SVMs perform well for text classification. This paper explains the appropriateness in  applying SVMs to text classification primarily from a theoretical perspective, so the model is very simple, high abstract and noiseless.

Key words: text classification;SVM;machine learning

中图分类号: