摘要:
ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面
的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造
优化算法,利用相关系数克服了ID3算法在多值属性偏向方面的问题,在一定程度上提高了算法的分类准
确率。利用相关数学知识对计算过程进行了化简,减少了ID3算法在log运算上的运行时间。最后通过实
验验证了优化后的算法是可行的,且在准确率和运行速度方面都有更好的表现。
吴思博,陈志刚,黄瑞. 基于相关系数的ID3优化算法[J]. 计算机工程与科学.
WU Sibo,CHEN Zhigang,HUANG Rui. An improved ID3 algorithm based on correlation coefficients[J]. Computer Engineering & Science.