计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (5): 940-950.
• 人工智能与数据挖掘 • 上一篇
陈丽芳1,2,白云1,施永辉1,代琪1
CHEN Lifang1,2,BAI Yun1,SHI Yonghui1,DAI Qi1#br#
摘要: 对于不平衡数据,传统分类器趋向于保证多数类的准确率,而牺牲少数类的准确率,造成算法的整体性能下降。针对这一问题,提出一种面向不平衡数据的特征子空间增强的异质集成学习算法HEL-FSA。首先利用XGBoost算法学习特征的重要性,并选择重要的特征,形成数据集的特征子空间;其次使用SMOTE算法在特征子空间中生成新样本,获得更加平衡的训练数据;最后,采用逻辑回归、决策树、多层感知器、支持向量机和XGBoost这5种基模型,并使用if_any算法融合异质基模型。在9个不平衡数据集上的实验结果验证了该算法的可行性,同时,将提出的算法用于宫颈癌风险预测,增强了其对宫颈癌风险的理解和预测能力。