大规模社交网络中二元关系预测方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

大规模社交网络中的二元关系预测问题是指通过已知的网络结构信息预测网络中已存在边的二元关系问题,该问题对于研究网络完整的结构和挖掘网络隐藏的相关信息都具有很重要的意义。目前预测效果最好的方法是 Jure等人提出了的使用LR模型的方法,LR模型是一种线性回归方法,不能很好的拟合大量的、复杂的社会关系,因此本文在此基础上提出了使用支持向量SVM模型来解决普通的社交网络中的二元关系。
　　针对于普通的社交网络,本文主要在3个方面上进行了改进:第一,Jure等人虽然选取了23种特征描述网络,但通过分析发现在这23种特征中,存在一些线性相关的特征,这样的特征对于预测没有意义,但却会耗费时间以及空间,因此,本文通过特征选择的方法(PCA方法)进行特征选择。本文首先提出了10种新的特征,综合Jure等人的23种特征,一共33种特征,然后使用PCA对这33种特征中的11种特征进行了降维处理,选出影响力大的主成分,再对网络中的二元关系进行预测;第二,Jure等人使用LR的模型适合处理线性分类,而社交网络中的关系不是线性可分的,因此本文提出使用SVM模型进行分类,支持向量SVM支持非线性的分类;第三,使用Adaboost算法对已有的算法进行集成,将多个单独的算法作为弱分类器,使用Adaboost集成为一个强分类器,提高了预测的准确率。
　　以上三个改进是针对于普通的社交网络中的二元关系预测问题的改进,而针对于大规模社交网络难以使用单一的模型进行预测的问题,本文提出了将一个大规模的网络划分为几个小的网络,然后对每一个子网络单独建立各自的SVM模型,取得了较好的预测结果。本文提出了两种划分网络的方法,第一种方法是根据边的EM值,即边的嵌入度来划分网络,第二种方法是使用K-means聚类方法将整个网络聚为 K类。通过这两种分类方法将一个大规模的社交网络划分为几个小的子网络,然后对每一个子网络建立各自的SVM模型。
　　该算法在Epinions, Slashdot以及Wikipedia三个数据集上进行了测试,在隐藏10％的边的条件下,slashdot中准确率从84.9％提升到了88.37％,在Epinions中准确率从92.62％提升到了94.31％,Wikipedia中准确率从70.16％提升到了75.65％。
　　通过实验可以看出,使用SVM模型优于使用Logistic Regression模型,并且通过划分子网络的方法不但能够解决大规模社交网络中的二元关系预测问题,还能提高预测的准确率。

著录项

作者
陈莲;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名陈端兵;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
社交网络; 二元关系; 预测方法; 机器学习;

相似文献

中文文献
外文文献
专利

1. 基于谱聚类的大规模社交网络可视化方法研究 [J] . 陈召群 ,车向前 ,谷源涛 . 计算机仿真 . 2015,第009期
2. 一种针对大规模社交网络的用户信任度预测算法 [J] . 张琼 ,张勇 . 计算机工程 . 2018,第008期
3. 基于社交网络大规模行为数据的用户关系研究 [J] . 刘晶 ,李琳 ,李石君 . 计算机应用与软件 . 2016,第007期
4. 基于数据挖掘的社交网络信息推荐与预测方法研究 [J] . 陈婉 ,朱世杰 . 内蒙古师范大学学报（自然科学汉文版） . 2018,第002期
5. 元路径选择和矩阵分解的跨社交网络链路预测 [J] . 王瑶 ,寇月 ,申德荣 . 计算机科学与探索 . 2019,第009期
6. 基于社交网络和地理位置的用户关系预测 [C] . 杜翠凤 ,陈少权 . 2016广东蜂窝物联网发展论坛 . 2016
7. 社会网络中二元不对称关系预测方法研究 [A] . 万劼 . 2016

大规模社交网络中二元关系预测方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅