• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2002, Vol. 24 ›› Issue (5): 18-21.

• 论文 • 上一篇    下一篇

基于模糊聚类和Naive Bayes方法的文本分类器

  

  1. 国防科技大学计算机学院,湖南长沙410073
  • 出版日期:2002-05-01 发布日期:2010-04-30

杨岳湘 田艳芳 等   

  • Online:2002-05-01 Published:2010-04-30

摘要:

本文提出一种文本分类的新方法,该方法将模糊聚类与基于Naive Bayes的EM分类算法相结合,从而大大提高了EM分类算法的准确性,并解决了使用字符匹配引起的不完整性和不准确性问题。该方法首先给出每个类的一些关键词,并把这些关键词作为聚类中心进行聚类,然后使用距离聚类中心较近的文档启动一个引导过程。

关键词: 模糊聚类 Naive Bayes方法 文本分类器 聚类中心 神经网络

中图分类号: