云环境下基于极限学习机的XML文档分类的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

XML文档分类技术在XML数据管理中具有重要的学术意义和应用价值。如何对XML数据实现基于语义信息和结构信息的快速分类学习是当前热门的研究方向之一。此外，随着互联网技术的发展，基于MapReduce的云计算技术以其强大的并行计算能力，成为海量数据处理中最普及的计算技术。
　　极限学习机（Extreme Learning Machine，ELM）在分类问题上具有极快的学习速度和好的泛化性能，并且已经被证明极限学习机与支持向量机在优化问题的角度上具有一致的优化目标。极限学习机能够使用支持向量机中的核函数以简化支持向量机的计算过程。然而，带有核函数的极限学习机的计算过程主要是矩阵计算，随着训练样本规模的增大，急剧增长的内存消耗将影响计算效率。
　　本文针对海量XML数据规模的分类问题，在MapReduce计算模型的基础上提出了基于核函数的极限学习机的海量XML数据的分布式训练方案。其中，分布式XML表达模型转换算法(MapReduce based Structured Link Vector Model，MR-SLVM)能够快速地将海量XML训练数据转换为能够作为极限学习机输入的表达模型;分布式核函数极限学习机(Distributed Kernelized ELM，DK-ELM)实现了核函数极限学习机的并行训练;采用随机奇异值分解方法(Stochastic Singular Value Decomposition，SSVD)实现分布式矩阵求逆;设计了两个DK-ELM的子算法以确保DK-ELM在MapReduce模型上的并行性，包括分布式径向基核函数（Distributed Radial Basis Function，D-RBF）和分布式矩阵向量乘法(Distributed Matrix-Vector Multiplication，DMXV)。
　　最后，在真实的分布式集群环境中，通过大量真实数据集的实验测试了MR-SLVM和DK-ELM的可扩展性和分类训练性能。实验结果表明，本文提出的训练方案在不影响核函数极限学习机的计算理论的前提下，具有较好的可扩展性。

著录项

作者
丁金炎;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科计算机系统结构
授予学位硕士
导师姓名赵相国;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
可拓展标记语言; 文档分类; 极限学习机; 核函数; 云环境;

相似文献

中文文献
外文文献
专利

1. 基于双隐层极限学习机的模糊XML文档分类 [J] . 赵震 ,马宗民 ,张富 . 计算机工程与应用 . 2017 ,第004期
2. 基于极限学习机的XML文档分类 [J] . 陈盛双 ,崔唯 . 汉口学院学报 . 2012 ,第004期
3. 基于极限学习机的XML文档分类 [J] . 陈盛双 . 计算机工程 . 2011 ,第019期
4. 一种云环境下用户隐私数据分类加密方案研究与实现 [J] . 季一木 ,蒋晨晨 ,匡子卓 . 南京邮电大学学报（自然科学版） . 2015 ,第005期
5. 基于核极限学习机的多标签数据流集成分类方法 [J] . 张海翔 ,李培培 ,胡学钢 . 数据采集与处理 . 2022 ,第1期
6. 基于带通滤波与核极限学习机的铣削刀具状态分类方法 [C] . LEI Zhi ,雷芝 ,ZHOU Yuqing . 2018年全国设备监测诊断与维护学术会议暨第十六届全国设备故障诊断学术会议、第十八届全国设备监测与诊断学术会议、2018年全国设备诊断工程会议 . 2018
7. 基于极限学习机的不确定XML文档分类的研究与实现 [A] . 王超 . 2014

云环境下基于极限学习机的XML文档分类的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅