• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2002, Vol. 24 ›› Issue (5): 8-10.

• 论文 • 上一篇    下一篇

基于决策树的数据遗失值填充方法的研究

郭景峰 米浦波 等   

  1. 燕山大学信息科学与工程学院,河北秦皇岛066004
  • 出版日期:2002-05-01 发布日期:2010-04-30

  • Online:2002-05-01 Published:2010-04-30

摘要:

数据遗失值填充问题是预处理过程中的一个难点。已有的算法大多寻求数据中属性值之间的关系、属性与属性值之间的关系、属性与属性间的关系来对遗失值进行填充。文章 从数据间的关系入手,引入相似度的概念,并提出一种新的数据遗失值填充算法。这种算法简单,易于理解,可对一个数据具有多个遗失值的情况进行填充。

关键词: 决策树 数据遗失值 填充方法 关联规则 相似度 数据库

中图分类号: