• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2004, Vol. 26 ›› Issue (7): 67-70.

• 论文 • 上一篇    下一篇

一种基于纵向划分数据集的并行决策树分类算法

严胜样 吴绍春 吴耿锋 金沈杰   

  • 出版日期:2004-07-01 发布日期:2010-07-04

  • Online:2004-07-01 Published:2010-07-04

摘要:

本文提出了一种处理多属性数据集的快速可扩展性并行分类算法—FSPC算法。它首次采用了纵向划分数据集以及在测试属性的选择过程中同步划分数据集等方法。实验结果表明,它不仅有利于减少通信及进行I/O的开销,而且有利于提高算法的并行度。

关键词: 数据挖掘 数据仓库 数据集 并行分类算法 FSPC算法 决策树 数据库