• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊
论文

SVM用于文本分类的适用性

展开
  • (1.中国矿业大学计算机科学与技术学院,江苏 徐州 221008;
    2.中国科学院计算技术研究所智能信息处理重点实验室,北京 100080)
刘晓亮(1983),男,山东潍坊人,硕士生,研究方向为支持向量机和机器学习;丁世飞,博士后,教授,博士生导师,研究方向为机器学习与数据挖掘、人工智能与模式识别等。

收稿日期: 2009-09-17

  修回日期: 2009-12-11

  网络出版日期: 2010-06-01

基金资助

江苏省基础研究计划(自然科学基金)(BK2009093);国家自然科学基金资助项目(60975039);中国科学院智能信息处理重点实验室开放基金资助项目(IIP20062)

Appropriateness in Applying SVMs to Text Classification

Expand
  • (1.School of Computer Science and Technology,China University of Mining and Technology,Xuzhou 221008;
    2.Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,
    Chinese Academy of Sciences,Beijing 100080,China)

Received date: 2009-09-17

  Revised date: 2009-12-11

  Online published: 2010-06-01

摘要

本文从统计的角度描述了文本分类的关键性质,给出了相应的文本文档集的统计分类模式,并将其与支持向量机的模型结合,说明了为什么支持向量机(SVM)能够很好地进行文本分类。本文主要是从理论角度说明SVM用于文本分类的适用性,模型构造简单,并且是高度抽象、无噪音的。

关键词: 文本分类; SVM; 机器学习

本文引用格式

刘晓亮1,丁世飞1,2 ,朱红1,张力文1 . SVM用于文本分类的适用性[J]. 计算机工程与科学, 2010 , 32(6) : 106 -108 . DOI: 10.3969/j.issn.1007130X.2010.

Abstract

This paper introduces the key properties of text classification from a statistical perspective, gives the corresponding statistical classification model of text document sets which is combined with SVMs, and explains why SVMs perform well for text classification. This paper explains the appropriateness in  applying SVMs to text classification primarily from a theoretical perspective, so the model is very simple, high abstract and noiseless.

文章导航

/