摘要:在机器学习领域,处理高维特征数据时通常会面临冗余和不相关的特征问题,因此特征选择成为一个重要的挑战。对于多维度数据,Relief算法作为一种传统的特征选择算法,具有较高的计算效率和较好的稳定性,被大量应用于实际场景,但Relief算法的特征选择结果具有随机性,不同的初始采样会有不同的结果,且对于特征之间存在较强依赖关系的数据集,如共线性等,可能会导致结果不准确。本文提出了一种特征选择方法,称为X-ACO方法,它结合了XGBoost和蚁群算法。本文算法蚁群路径搜索过程的启发式信息使用XGBoost算法的特征重要性来表示。同时,使用特征之间的皮尔森相关系数来调整信息素浓度,以便更好地控制特征的相关性。实验证明,X-ACO方法可以在保证分类准确率的前提下,减少特征数量,降低特征冗余,并提高算法性能。