摘要:
代价敏感学习中经常考虑测试代价和误分类代价。在实际应用中,一个属性的测试代价常跟属性值的粒度有关,而一个具有多个属性的对象的误分类代价又常受它的属性的总测试代价大小的影响。基于这一点,研究在总测试代价受限的情形下,数据的属性和粒度选择的问题。以最小化数据处理的平均总代价为目标提出了一种方法,该方法能同时选择最优的属性子集和数据粒度。首先建立了该方法的理论模型,再设计了一个高效的算法。实验结果表明,所提算法能有效地进行不同大小的测试代价约束下的属性和粒度选择。
廖淑娇1,2,朱清新1,梁锐1. 测试代价受限下数据的属性和粒度选择方法[J]. 计算机工程与科学.
LIAO Shujiao1,2,ZHU Qingxin1,LIANG Rui 1.
Selecting attributes and granularity
for data with test cost constraint
[J]. Computer Engineering & Science.