关系网络数据的半监督分类方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的发展，特别是移动互联网和社会化媒体的普及，实际应用中需要处理的数据样本，不再是单独存在的个体，而是与其它数据样本相互依赖。这种存在相互依赖关系的数据样本集合，被称为关系网络数据。如在微博应用中，用户与用户相互关注，构成了一个以微博用户为节点，关注关系为边的关系网络数据。
　　对关系网络数据中的样本进行分类时，有效利用样本间的依赖关系能提高分类精度。如相互关注的微博用户倾向于有相似的兴趣爱好，存在超链接关系的网页倾向于有相似的主题。关系网络数据的分类问题也被称为协同分类问题。近十年来，国内外研究人员对协同分类问题进行大量的研究并提出很多能利用关系提高分类精度的算法。然而在实际应用中，要构建大量的训练样本，成本非常高，会耗费大量的人力和物力。于是在训练样本稀少的情况下，如何利用大量测试样本进行半监督协同分类成为近几年的研究热点。
　　本文研究了关系网络数据的半监督分类问题并提出一些解决方法。主要工作包括：
　　（1）将关系网络数据的半监督分类问题分解成三个核心子问题：基于内容属性的半监督分类问题、关系的类标传递能力的学习问题和内容属性与关系信息的结合问题。
　　（2）提出一个强同质关系网络生成方法，在训练样本稀少情况下，将弱同质关系网络转换成强同质关系网络，解决弱同质关系网络数据中关系的类标传递能力的学习问题。
　　（3）提出一个网络正则化生成模型，解决强同质关系网络数据的半监督协同分类问题。网络正则化生成模型构建了一个基于概率隐含语义分析（PLSA）的生成模型，并引入网络正则化因子，将半监督协同分类问题转化成全局最优化问题。同时本文使用了期望最大化算法，通过最大化网络正则化生成模型的目标函数，训练模型参数并预测测试样本的类标。在三个基准数据集上的实验结果表明，本文提出的网络正则化生成模型显著优于其它前沿协同分类算法。

著录项

作者
石瑞超;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名叶允明;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.092;
关键词
关系网络数据; 半监督分类法; 语义分析; 目标函数;

相似文献

中文文献
外文文献
专利

1. 多路径下网络数据安全传输方法研究 [J] . 刘银 ,沈辉 . 信息通信 . 2021,第002期
2. 异构超密度网络数据传输安全量化方法研究 [J] . 刘海龙 . 计算机仿真 . 2021,第001期
3. 面向海量网络数据的收集方法研究与分析 [J] . 鲜敏 . 电脑编程技巧与维护 . 2021,第008期
4. 基于分布式聚类的无线传感器网络数据传输方法研究 [J] . 丁忠祥 ,杨彦红 . 北京印刷学院学报 . 2021,第010期
5. 基于Kubernetes的海量网络数据存储方法研究 [J] . 闫娟雅 . 电脑知识与技术 . 2021,第027期
6. 基于网络数据的天线指标评估方法研究 [C] . 朱文涛 ,高峰 ,和凯 . 中国移动通信集团设计院第23届新技术论坛 . 2017
7. 基于卷积神经网络的高光谱图像半监督分类方法研究 [A] . 张凯琳 . 2020

关系网络数据的半监督分类方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅