·12· Computer Era No. 10 2020
DOI:.cn33-1094/
基于 Kmeans 聚类的 XGBoost 集成算法研究
罗春芳,张国华,刘德华,朱定欢
(湖南工业大学理学院,湖南 株洲 412000)
摘 要:针对分类问题中的模型泛化能力,提出了基于 Kmeans 聚类的 XGBoost 基分类器集成算法,以提升整体算法的
泛化能力。首先,训练数据集获得多个 XGBoost 模型;然后,通过 Kmeans 算法对不同模型的实验结果聚类;最后,对每个
分类簇中泛化能力最优的分类器进行集成。在对某公司实际分类问题中应用该算法,结果表明,该算法的泛化能力有很
大程度的提升。
关键词:Kmeans 聚类;XGBoost;集成算法;泛化能力
中图分类号:TP391 文献标识码:A 文章编号:1006-8228(2020)10-12-03
Research on K-means clustering based XGBoost ensemble algorithm
Luo Chunfang, Zhang Guohua, Liu Dehua, Zhu Dinghuan
(College of Science, Hunan University of Technology, Zhuzhou, Hunan 412000, China)
Abstract:Aiming at the model generalization ability of classification problem, a K-means clustering based XGBoost base classifier
ensemble algorithm is proposed in this paper to improve the generalization abilit