基于社会网络分析的Web数据挖掘研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的快速发展，网络上的网页数量呈现爆炸式的增长。搜索引擎虽然能够在一定程度上给出相关主题的网页搜索结果，但大部分搜索引擎搜索范围小，搜索结果很大一部分与用户搜索要求无关。如何从数以万亿的网页中准确的寻找到需要的网页，成为一个亟需解决的问题。Web上存在一类权威网页，它们具有较高的可信度，被大部分相关主题的网页所链接。如果搜索引擎在给出搜索结果时，给出的是权威网页，那么就可以大大提高搜索质量与搜索效率。
　　社会网络分析最初是用于分析人类群体关系，寻找群体核心成员的。Web上的网页链接关系如同现实社会中人与人的关系。本文将社会网络分析应用于网页挖掘，研究了社会网络分析法在Web数据挖掘的应用。
　　文中首先对Web数据挖掘进行了相关阐述，然后对社会网络分析方法进行了详细介绍，并对各类社会网络分析软件进行了对比，选取了UCINET作为实验的分析软件。同时详细介绍并开发了实验所用到的网络爬虫。
　　本文提出了基于社会网络分析的Web数据挖掘方法，并详细介绍了方法的工作原理。通过给定关键字，利用基于PageRank算法的Google搜索引擎获取种子URL，并通过自己开发的网络爬虫对种子URL进行给定深度的爬取，获取实验URL集。类似于利用社会网络分析挖掘核心人物一样，对获取到的URL集进行中心性分析、凝聚子群分析，从而挖掘出给定关键字的权威网页。实验结果表明，基于社会网络分析的Web数据挖掘可以有效地对权威网页进行挖掘。

著录项

作者
宋洋;
展开▼
作者单位

山东理工大学;

展开▼
授予单位山东理工大学;
学科计算机科学与技术
授予学位硕士
导师姓名田爱奎;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
Web数据挖掘; 社会网络; PageRank算法; Google搜索引擎;

相似文献

中文文献
外文文献
专利

1. 我国图书馆读者荐购领域研究热点与作者团体研究——基于共词分析和社会网络分析 [J] . 黄丽霞 ,欧燕 . 情报探索 . 2021,第001期
2. 中国商业模式研究热点、演化与阶段特征研究——基于文献计量和社会网络分析的方法 [J] . 谭珅 ,李静文 ,齐林 . 科技和产业 . 2020,第004期
3. 基于社会网络分析和文献计量学的新冠肺炎学术研究现状与特点研究 [J] . 张生太 ,宣雅迪 ,仇泸毅 . 北京邮电大学学报（社会科学版） . 2020,第005期
4. 国内甲骨文研究热点、主题聚类及研究状况分析——基于共词和社会网络分析视角 [J] . 张瑞红 . 河南师范大学学报：自然科学版 . 2020,第6期
5. 中国研究生教育领域学者合作的实证研究:基于作者共现的社会网络分析 [J] . 王传毅 ,吕晓泓 ,李明磊 . 学位与研究生教育 . 2017,第008期
6. 一种基于Hadoop平台的海量Web数据挖掘系统研究与实现 [C] . ZHU Xiang ,朱湘 ,JIN Song-chang . 第九届中国通信学会学术年会 . 2012
7. 基于PageRank算法的Web数据挖掘的研究 [A] . 郑普亨 . 2017

基于社会网络分析的Web数据挖掘研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅