• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2016, Vol. 38 ›› Issue (01): 177-182.

• 论文 • 上一篇    下一篇

基于SVM的局部潜在语义分析算法研究

谭光兴,刘臻晖   

  1. (江西财经大学信息管理学院,江西 南昌 330013)
  • 收稿日期:2015-03-08 修回日期:2015-06-18 出版日期:2016-01-25 发布日期:2016-01-25
  • 基金资助:

    江西省博士研究生创新项目科研基金(YC2011B026)

A local latent semantic analysis algorithm
based on support vector machine 

TAN Guangxing,LIU Zhenhui   

  1. (School of Information Technology,Jiangxi University of Finance and Economics,Nanchang 330013,China)
  • Received:2015-03-08 Revised:2015-06-18 Online:2016-01-25 Published:2016-01-25

摘要:

针对现有的Web文本分类与表示方法中出现的各种分类效果与性能优化等问题,基于局部潜在语义分析的理论原理,利用支持向量机分类优势,设计出一种基于文档与类别之间相关度的生成局部区域的算法,即SLLSA。该算法在语义分析使用矩阵的奇异值分解过程中引入不同类别信息,分析特征词的局部特征,使用支持向量机分类器计算文本对类别的相关度参数,并应用于局部区域生成过程。通过实验表明,SLLSA算法有效解决了局部区域如何进行局部奇异值分解问题,有效提高并优化了Web文本分类效果,更好地表示了Web文本潜在语义空间。

关键词: 文本分类, 局部潜在语义分析, 支持向量机, 奇异值分解, S-LLSA

Abstract:

Based on the theoretical principles of latent semantic analysis, and combined with support vector machine (SVM) classifier performance, we propose a local latent semantic analysis algorithm (SLLSA) to solve multiple problems about classification effect and performance optimization in web text categorization and representation. We introduce category information into singular value decomposition (SVD), analyze the local features of feature words, uses the SVM classifier to compute the dependency degree, and select local areas . Experimental results show that the SLLSA algorithm effectively solves the key problems of SVD, greatly improves the effectiveness of web text classification, and better represents  the latent semantic space of web texts.

Key words: text classification;local latent semantic analysis;SVM;SVD;S-LLSA