面向网络自媒体的空间数据挖掘研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

空间数据挖掘(SDM，Spatial Data Mining)是发掘空间数据库或者是空间实体中蕴含的消息以及实体间的空间关系的学科。在空间数据挖掘中包含着聚类分析法、空间分析法、数据可视化方法等主要方法。其中聚类分析法是指将数据集中的样本按其相似性划分到类簇中，同一类簇中样本间的相似性较高。微博平台每天发布着TB级的数据，这些数据当中隐含着关于社会和生活方方面面的信息。本文将每一个微博用户看做一个空间实体，使用聚类分析方法对微博中带有位置属性的数据进行数据挖掘，以发现微博数据中蕴含的与当下社会和生活相关的热点词，并通过可视化的手段将聚类结果中的样本呈现在地图上，以研究其空间分布状况。其中聚类分析法用到的主要算法是k-means算法；算法的实现上使用hadoop加mahout的分布式计算平台。并在该平台基础上对比了k-means算法与Canopy算法优化后的k-means算法在文本聚类中的区别，以及两个算法在不同输入参数的环境下，收敛速度、迭代次数、簇间距离的变化情况；最终得到经过Canopy算法优化的k-means比普通的k-means聚类质量要明显提高，但是在文本类簇的主题方面，并没有产生很大的影响，只是降低了类簇间的相似性，防止了一个主题多个类别的情况；在聚类的基础上，针对类簇中样本，依据文本的相似性和地理位置上临近性做了用户相似性评价。可视化分析使用ArcGIS以及WebGIS来实现，对类簇进行核密度分析，再做渔网栅格化分析可以使离散的类簇样本具备邻接性，也能够让我们直观的看到类簇主题的主要分布情况。

著录项

作者
钟宇;
展开▼
作者单位

江西理工大学;

展开▼
授予单位江西理工大学;
学科地图学与地理信息系统
授予学位硕士
导师姓名兰小机;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;
关键词
面向网络; 自媒体;

相似文献

中文文献
外文文献
专利

1. 基于改进后K-Means下网络自媒体空间数据挖掘 [J] . 郑翔1 ,兰小机1 ,钟宇1 . 计算机科学与应用 . 2018,第008期
2. 大数据背景下面向城市空间分布数据挖掘研究 [J] . 庄敬宜 ,张娜 ,张晓楠 . 黑龙江科学 . 2020,第022期
3. 面向政府决策的地理信息系统与空间数据挖掘集成研究 [J] . 陈丹 ,李永忠 . 情报探索 . 2013,第011期
4. 计算机空间信息集成与数据挖掘的应用研究——评《矿山空间信息集成与数据挖掘》 [J] . 周泽宇 . 有色金属工程 . 2021,第011期
5. 面向大数据的空间数据挖掘综述 [J] . 杜江毅 ,边馥苓 . 地理空间信息 . 2017,第001期
6. 面向研究生的数据挖掘教学实践 [C] . 刘莹 . 2018中国大数据技术大会(BDTC） . 2018
7. 面向空间数据库的空间数据挖掘应用研究 [A] . 唐理兵 . 2005

面向网络自媒体的空间数据挖掘研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅