支持向量机特征选择中的Lp正则化方法研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

特征选择是机器学习领域中一个重要的研究课题.特征选择可以剔除数据集中冗余和噪声特征，得到一个精简且判别能力更强的特征子集，从而避免学习过程中的“过拟合”问题，提高模型的泛化能力和可解释性，减少数据的采集量和存储量，节省训练和预测时间.
　　Lp正则化方法在特征选择中具有重要地位，已成为当前研究的热点课题.在标准的支持向量机中所使用的L2范数不具备特征选择的能力.为了能在学习分类模型的同时实现特征选择，常采用L0范数或L1范数正则化方法.但L0-SVM是一个难以求解的组合优化问题，而L1-SVM存在欠稀疏的缺点，因此介于两者之间的Lp-SVM(0＜p＜1)引起了国内外学者的关注.本文研究支持向量机特征选择中的Lp正则化方法.主要研究成果如下:
　　1.针对Lp-SVM(0＜p＜1)的目标函数非光滑非凸且非Lipschitz连续的问题，本文提出Lp-SVM(0＜p＜1)的一个等价模型LOSC-SVM.该等价模型具有线性目标函数和光滑约束条件，从而可利用光滑约束最优化的成熟算法有效求解Lp-SVM(0＜p＜1).我们证明了LOSC-SVM与Lp-SVM之间的等价性以及LOSC-SVM的若干良好性质.该等价模型的建立为求解Lp-SVM问题开辟了新途径.人工数值实验验证了模型的有效性，并表明不同结构的数据集适用不同的正则化阶次p.真实数据实验结果表明，采用自适应正则化阶次p的LOSC-SVM在特征选择和分类上的性能均优于L1-SVM.与已有的求解Lp-SVM问题的SLA-SVM算法相比，LOSC-SVM的结果更稳定.
　　2.大量计算研究表明:L1/2正则化可作为Lp(0＜p＜1)正则化问题的代表.在此研究成果之上，本文侧重于研究求解L1/2-SVM的数值算法.基于L1/2-SVM的等价约束模型，我们提出一种求解L1/2-SVM问题的内点法，并证明算法的收敛性.人工数据实验结果表明，与L0-SVM和L1-SVM相比，L1/2-SVM能够更准确的找到相关且非冗余的特征.真实数据实验表明，L1／2-SVM可获得比L0-SVM更精确的分类结果，以及比L1-SVM更稀疏的特征选择结果.
　　3.本文研究求解L1/2-SVM的惩罚序列线性规划算法(PSLP).该算法利用线性规划逼近最优解，适用于变量和约束都很多的大规模问题.我们将PSLP算法应用于具有高维小样本、高噪声、高冗余等特点的基因表达谱数据集.数值实验结果表明，PSLP算法的准确性高于求解L0-SVM的FSV算法.与L1-SVM相比，PSLP算法不仅能找到比L1-SVM更少的特征基因，而且可获得比L1-SVM更好或相当的分类结果.我们统计得出各数据集中频繁被选择的前十位基因，为生物学的进一步研究提供参考.
　　4.本文对Lp正则化支持向量机在特征选择方面的能力进行理论分析.我们首先分析对特定数据进行特征选择的可能性，研究表明支持向量机实现特征选择不仅与目标函数采用的范数有关，还与数据本身有关.然后推导出一个用于度量支持向量机特征选择能力的概率计算公式，并应用该公式计算Lp-SVM在p不同取值时的特征选择概率.计算结果表明，较小的正则化阶数p有助于提升Lp-SVM的特征选择能力.

著录项

作者
姚兰;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科应用数学
授予学位博士
导师姓名曾金平;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;数值分析;
关键词
机器学习; 特征选择; 数据分类; Lp正则化法; 支持向量机; 内点法; 序列线性规划法;

相似文献

中文文献
外文文献
专利

1. 基于正则化技术的对支持向量机特征选择算法 [J] . 业巧林 ,赵春霞 ,陈小波 . 计算机研究与发展 . 2011,第006期
2. 结合ReliefF与支持向量机的特征选择方法研究 [J] . 韦娜 ,王涛 . 计算机应用与软件 . 2008,第001期
3. 基于支持向量机和特征选择的超声缺陷识别方法研究 [J] . 刘清坤 ,阙沛文 ,郭华伟 . 中国机械工程 . 2006,第001期
4. 基于支持向量机的机械故障特征选择方法研究 [J] . 王新峰 ,邱静 ,刘冠军 . 机械科学与技术 . 2005,第009期
5. 支持向量机中特征选择因素在煤矿瓦斯突出预测中的作用 [J] . 梁晓珍 ,施亮 . 中州煤炭 . 2013,第010期
6. Landweber正则化迭代法向下延拓中最优正则化参数的确定方法研究 [C] . LIU Xiao-Gang ,刘晓刚 ,LI Ying-Chun . 2014年大地测量研究进展学术研讨会 . 2014
7. Lp正则化在支持向量机中的应用研究 [A] . 曾文才 . 2012

支持向量机特征选择中的Lp正则化方法研究

摘要

著录项

相似文献

相关主题

期刊订阅