首页> 中文学位 >面向社交媒体的网络和内容分析关键技术研究
【6h】

面向社交媒体的网络和内容分析关键技术研究

代理获取

目录

声明

摘要

第一章绪论

1.1研究背景及意义

1.2研究现状

1.2.1社交网络分析

1.2.2 社交网络中的节点排名和链接预测

1.2.3 社交媒体中的事件分析

1.2.4 社交媒体不可靠内容分析

1.3 主要工作及贡献

1.4各章节安排

第二章社交网络表示模型

2.1 社交网络表示模型概述

2.2 基于超图的层次化社交网络模型

2.2.1 问题定义

2.2.2 元素定义

2.2.3 表示模型

2.3脸书案例研究

2.3.1 网络结构

2.3.2 网络特性分析

2.4 CASN案例研究

2.4.1 企业社交网络模型

2.4.2 社交商务系统框架设计

2.4.3 企业社交网络可视化分析

2.4.4 企业社交网络基本属性分析

2.5 小结

第三章社交网络中的节点排名

3.1节点排名概述

3.2 二部图中的节点排名

3.2.1 PageRank和HITS算法

3.2.2 TOPK算法

3.2.3 参数K的选取

3.2.4 TOPK算法的收敛性

3.3实验和分析

3.3.1 实验准备

3.3.2 基于汽车质量的评价方法

3.3.3 基于企业聚类的评价方法

3.3.4供应商排名评价

3.3.5 参数K的评价

3.4 小结

第四章社交网络中的链接预测

4.1链接预测概述

4.2 基础模型

4.2.1可交换数组

4.2.2 具有高斯过程先验的随机函数

4.2.3 变分期望最大化

4.2.4在线链接预测模型

4.3 结合网络形成博弈的模型

4.3.1 网络形成博弈

4.3.2 基于网络形成博弈的预测模型

4.4 实验

4.4.1 实验设置

4.4.2 实验结果

4.5 小结

第五章结合新闻和社交媒体的事件分析

5.1事件分析概述

5.2 多角度事件分析模型EvA

5.2.1 问题定义

5.2.2 模型描述

5.2.3 推理过程

5.2.4事件类别分类

5.2.5 扩展分析

5.3实验和分析

5.3.1 数据集

5.3.2事件特征提取

5.3.3 事件类别分类

5.3.4 扩展分析

5.4 小结

第六章社交媒体不可靠内容分析

6.1 不可靠内容分析概述

6.2 社交媒体假新闻语言特征分析

6.2.1 数据集

6.2.2 逻辑回归分类器

6.2.3 深度学习分类器

6.2.4 结果分析

6.3 不可靠内容的细粒度分类

6.3.1 数据集

6.3.2 方法

6.3.3 分析

6.4 小结

第七章总结与展望

7.1 总结

7.2 展望

参考文献

致谢

博士期间发表的论文

博士期间发布的专利

博士期间参加的科研工作

博士期间获得的奖励

外文论文一

外文论文二

展开▼

摘要

近年来,随着互联网技术的迅速发展,社交媒体已经不再仅仅限于在线交流,而是渗透到生活中的方方面面。社交媒体包含了海量的、具有丰富应用场景的数据,为研究社会生活提供了新的视角和工具,这是传统社会学所不具备的。为了更好地利用和分析社交媒体数据,面向社交媒体的数据挖掘技术层出不穷。网络结构和内容分析,作为社交媒体分析的两个主要方面,吸引了大量的研究者,产生了许多重要的理论和技术成果。本文从这两个方面出发,结合社交媒体在生活中的应用场景,对其中的关键技术进行了创新性的研究和探索,具体完成的工作和贡献包括以下几个方面: 1.提出了一种基于超图的层次化社交网络表示模型,通过组件的增减,可以满足大多数社交网络的建模需求。针对脸书和企业社交网络,用提出的模型进行了建模和案例研究。通过对社交网络结构特性的研究,验证和分析了传统社会学中幂律分布和小世界效应等理论。 2.针对社交网络中节点排名问题,结合PageRank和HITS的核心思想,提出了一种基于二部图的节点排名算法。算法能够支持两类节点和多种节点重要性度量方法的情况。将该算法应用到企业排名问题中,取得了较好的效果。通过不同的评价方法,发现该算法具有更好的排名效果。 3.针对社交网络链接预测问题中,因训练集负样本数量过于庞大,而导致的训练效率较低的问题,提出了一种基于博弈的链接预测模型,通过网络生成博弈模型和其他加速策略,该方法能够在保证良好预测效果的同时,极大地降低训练集中的负样本数量,从而提高训练效率。实验结果表明,在多种社交网络和图数据上,该算法获得了比同类型方法更为优异的表现。 4.针对社交媒体中事件的特征提取问题,提出了一种基于事件的主题模型,不仅能够提取事件的主要话题,还能够对事件的类别特征进行提取。基于模型抽取的特征,并结合新闻和社交媒体,对相关网络事件进行了深入的分析。利用提取的特征,对事件进行分类,其结果表明了这些特征的有效性。 5.针对社交媒体中不可靠内容识别、分类和分析问题,提出了基于逻辑回归和深度学习的两种不可靠内容分类器,以及一种不可靠内容的新分类方法。首先,进行了假新闻识别,逻辑回归和深度学习模型分别展现了在不同分类任务中的有效性。由于逻辑回归模型较好的可解释性,基于逻辑回归模型提取的特征对假新闻的语言风格、情感、主观性等进行了分析。其次,新提出的分类方法能够将不可靠内容目的和可靠性评分结合起来。同样,基于逻辑回归和深度学习模型,对不可靠内容进行新分类下的识别和分析,并结合社交用户反应,获得了新的发现和模式。 综上所述,本文所研究的社交媒体中网络和内容分析的关键技术,对于面向社交媒体的数据挖掘和分析工作有重要的理论意义和应用价值。提出的新模型和方法,能够被应用在实际系统中,获得更高效、准确的结果。对社交媒体中事件、假新闻等热点问题的探讨,为深入理解和解决这些问题提供了参考。

著录项

  • 作者

    王立强;

  • 作者单位

    山东大学;

  • 授予单位 山东大学;
  • 学科 计算机科学与技术
  • 授予学位 博士
  • 导师姓名 孟祥旭,刘士军;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    媒体; 网络; 内容分析;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号