基于自然梯度的统计模型的优化方法的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

分类与回归问题作为机器学习的两类主要问题，解决它们的主要方法是建立相应的含参统计模型，根据观测的样本数据进行训练得到最优模型，进而建立相应的分类器和拟合器。线性分类主要采取逻辑斯蒂回归模型，非线性分类和回归任务主要采取神经网络模型。训练这几种模型最流行的方法是随机梯度下降算法。然而，梯度下降算法仅仅利用了函数的一阶信息，同时由于神经网络具有高度非凸的性质，误差曲面有很多平原区域，使得训练过程经常是缓慢的，需要考虑更先进的算法。自然梯度算法可以通过有效地避开函数的平原区域来解决这个问题。实施自然梯度算法，需要计算信息矩阵和它的逆矩阵。当模型拥有很多参数的时候，计算自然梯度方向需要庞大的计算量以及存储代价。传统上，信息矩阵的定义是梯度向量的外积的期望，矩阵的元素个数是梯度向量个数的平方。保留参数是矩阵的形式，可以建立一种新的自然梯度算法，称之为简化自然梯度算法。由于简化自然梯度算法不稳定，本文对它加以改进，称为简化自适应自然梯度算法，这个算法需要更少的计算量以及存储空间相比简化自然梯度，并且根据实验表明，收敛速度甚至超过动量梯度下降。本文的主要内容总结如下： 1.阐述了自然梯度算法的来源。通过从概率分布的度量，也就是KL散度，贝叶斯观点，Cramer-Rao下界，以及白化参数空间导出自然梯度算法，这些观点都说明了自然梯度算法是最快的随机梯度算法。另外总结了已有的实用的自然梯度算法，也就是如何计算信息矩阵以及它的逆矩阵，并且探讨了自然梯度算法收敛迅速的原因。 2.介绍了简化自适应自然梯度算法。该算法是对简化自然梯度算法的改进。简化自然梯度算法的出发点是把参数保留成矩阵的形式，达到减少计算量的目的，由于采用的经验块信息矩阵容易缺秩，因此在算法的后期表现出震荡不收敛，同时算法前期误差几乎不下降。简化自适应自然梯度算法采用真实的块信息矩阵作为缩放矩阵，通过实验表明，误差下降很快，并且算法后期平稳地加速收敛。 3.给出了简化自适应自然梯度算法在几种模型上的的具体实施，以及从理论上说明了该算法的可行性，同时给出算法的计算复杂度，远远小于已有的二阶方法。最后给出了算法的进一步改进，通过考虑进动量项，加速算法收敛。

著录项

作者
谢继;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科统计学
授予学位硕士
导师姓名武德安;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类地下建筑;计算技术、计算机技术;
关键词
自然梯度; 统计模型;

相似文献

中文文献
外文文献
专利

1. 基于定步长自然梯度算法盲混合信号分离技术研究 [J] . 李留青 ,陈中良 . 电子设计工程 . 2014,第015期
2. 基于自然梯度的电力谐波分析方法研究 [J] . 郭明良 ,刘富凯 ,郭松林 . 工业仪表与自动化装置 . 2013,第003期
3. 基于改进自然梯度算法的双目标辨识研究 [J] . 王海燕 ,冯丹凤 ,刘松江 . 西北工业大学学报 . 2006,第001期
4. 基于自然梯度算法的盲信源分离研究 [J] . 孙守宇 ,郑君里 ,吴德伟 . 空军工程大学学报（自然科学版） . 2003,第003期
5. 基于自然梯度的概率主组件分析在线学习算法 [J] . 陈亚瑞 ,秦智飞 . 天津科技大学学报 . 2021,第001期
6. 基于变步长自然梯度算法的语音信号盲分离 [C] . 季策 ,汤宝成 ,朱丽春 . 2011年中国智能自动化会议 . 2011
7. 基于改进自然梯度算法的盲源分离研究 [A] . 徐林涛 . 2019

基于自然梯度的统计模型的优化方法的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅