• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

计算机工程与科学 ›› 2010, Vol. 32 ›› Issue (5): 79-81.

• • 上一篇    下一篇

基于最优适值保留的蚁群文本聚类算法

刘晓勇   

  1. (1.中国科学院文献情报中心,北京 100190;2.广东技术师范学院计算机科学学院,广东 广州 510665;
    3.中国科学院研究生院,北京 100049)
  • 收稿日期:2009-11-15 修回日期:2010-02-09 出版日期:2010-04-28 发布日期:2010-05-11
  • 通讯作者: 刘晓勇 E-mail:liugucas@gmail.com
  • 作者简介:刘晓勇(1979),男,河南信阳人,博士生,讲师,研究方向为文本挖掘和智能优化算法。
  • 基金资助:

    广东省高校优秀青年创新人才培育基金资助项目(LYM08074);广东技术师范学院自然科学基金资助项目(08kjy02)

Text Clustering Algorithm with Ant Colony Based on the Best Solution Kept

LIU Xiaoyong   

  1. (1.National Science Library,Chinese Academy of Sciences,Beijing 100190;
    2.Department of Computer Science,Guangdong Polytechnic Normal University,Guangzhou 510665;
    3.Graduate School,Chinese Academy of Sciences,Beijing 100049,China)
  • Received:2009-11-15 Revised:2010-02-09 Online:2010-04-28 Published:2010-05-11
  • Contact: LIU Xiaoyong E-mail:liugucas@gmail.com

摘要:

蚁群聚类最早是由Deneubourg提出的一种仿生聚类方法,在聚类分析中得到广泛应用。本文在该算法的基础上提出一种基于精英适值保留的蚁群聚类算法,在一般蚁群聚类算法中引入精英保留机制,在每次算法的迭代中保留一定数量的优良解进入到下一次的循环中,以期提高算法的性能。为了验证算法的有效性,本文选择了两个数据集:数值数据集(iris)和一个文本数据集,用两个外部评价指标进行评判。实验结果表明,新算法的性能能够得到有效提高。

关键词: 文本聚类, 蚁群算法, 蚁群聚类, 文本挖掘

Abstract:

Clustering analysis with ant colony optimization (ACO) is presented by Deneubourg in 1991 and has been used widely. In this paper, a mechanism of the  best solution kept is presented to improve the performance of clustering analysis with ACO further. Two indices are chosen to valide the new algorithm. Two experiments in the datasetIris and the text dataset show that the new algorithm has better performance.

Key words: text clustering, ant colony algorithm, clustering with ACO, text mining

中图分类号: