首页> 中文学位 >基于数据挖掘的微博用户兴趣群体发现与分类——以新浪微博为例
【6h】

基于数据挖掘的微博用户兴趣群体发现与分类——以新浪微博为例

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景与意义

1.1.1 数据挖掘技术背景

1.1.2 微型博客背景

1.2 国内外研究现状

1.3 本文研究目标与内容

1.3.1 本文研究目标

1.3.2 本文研究内容

1.4 本文的创新点

1.5 本章小结

2 数据挖掘技术概述

2.1 数据挖掘技术

2.1.1 数据挖掘的背景与概念

2.1.2 数据挖掘的过程

2.2 数据挖掘的方法

2.3 聚类分析

2.3.1 聚类分析的概念

2.3.2 聚类分析的方法

2.3.3 聚类分析的步骤

2.4 本章小结

3 微博用户兴趣群体分类模型构建与实现

3.1 微博相关知识

3.1.1 微博的定义

3.1.2 微博用户特点——以新浪微博为例

3.2 微博用户兴趣群发现与分类模型

3.3 微博用户数据标准化

3.3.1 聚类分析的数据类型

3.3.2 聚类分析的相似度度量

3.4 基于数据挖掘的微博用户兴趣发现的实现

3.4.1 样本数据特点与聚类算法选择

3.4.2 SPSS实现过程

3.5 本章小结

4 实证分析—以新浪微博为例

4.1 聚类分析数据样本

4.1.1 样本获取

4.1.2 样本数据可行性分析

4.1.3 数据筛选

4.1.4 相关性检验

4.2 聚类分析

4.2.1 K-means快速聚类

4.2.2 系统聚类

4.1.4 两种聚类分析结果对比

4.3 实证分析结论

4.4 本章小结

5 总结

5.1 论文总结

5.2 不足与展望

5.3 本章小结

参考文献

致谢

展开▼

摘要

微博即微型博客,是一种以关注分享为模式的新兴社交媒体,其内容少、发布快、形式多样正好迎合了人们对信息实时的、准确的、多样的分享交流需求,因此受到广大用户的欢迎与喜爱,而微博本身一跃成为当代互联网领域新兴、火热的明星。人们热衷在微博上获取最新资讯,表达自己观点,分享喜爱的事物。用户在使用微博的时候,浏览什么样的内容,关注什么样的好友是根据其兴趣、偏好、习惯来确定的,所以了解用户本身的兴趣就能够了解到用户大概的关注范围与爱好内容,而“物以类聚,人以群分”,对于拥有相同爱好的用户群体的发现有助于为微博推广、微博营销、好友推荐等提供新的切入点与研究思路。但微博用户数量庞大,每个用户都是一个独立的个体,确定什么样的标准,使用什么样的方法,借助什么样的工具去发现用户兴趣群是本文所要解决的问题。  数据挖掘方法能够找到海量数据中有潜在价值的知识与模式,所用到的数学算法在经过多年完善修正已经日趋稳定,在金融、电信等领域的应用也有很多的成功案例,而在微博用户兴趣群发现上的应用还没有成熟,本文尝试使用数据分析的方法、借助数据挖掘工具去探索微博用户的习惯、兴趣与偏好,同时也希望拓展数据挖掘应用于微博范围上的研究,以提供新的思路与借鉴。  本文以五章的内容尝试探索微博用户兴趣群发现。首先在绪论中阐述了研究微博用户兴趣的重要意义、国内外有关数据挖掘与微博用户兴趣的研究现状与本文的主要内容、研究方法和论文创新点,然后对于数据挖掘概念、流程、方法、算法进行了梳理与探讨,之后提出了基于数据挖掘的微博用户兴趣群体发现的方法与进行聚类分析的数据的标准化方法,最后通过互联网新浪微博上收集的用户数据进行了实证研究,并提出了相应的应用结论与对今后展望。

著录项

  • 作者

    曾珂;

  • 作者单位

    华中师范大学;

  • 授予单位 华中师范大学;
  • 学科 管理信息系统
  • 授予学位 硕士
  • 导师姓名 陈菁华;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    数据挖掘,微博平台,用户兴趣群,聚类分析;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号