首页> 中文学位 >基于主题模型的企业微博推荐方法研究与实现
【6h】

基于主题模型的企业微博推荐方法研究与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题背景及其意义

1.2 国内外研究现状

1.3 本文主要工作

1.4 本文组织结构

1.5 本章小结

第二章 相关技术概述

2.1 传统文本挖掘方法

2.1.1 TFIDF

2.1.2 余弦相似度

2.1.3 JS散度

2.2 主题模型

2.2.1 LSI主题模型

2.2.2 PLSI主题模型

2.2.3 LDA主题模型

2.2.4 ATM主题模型

2.3 微博推荐算法概述

2.3.1 基于内容的推荐

2.3.2 基于协同过滤的推荐

2.3.3 混合技术推荐

2.4 本章小结

第三章 企业微博用户兴趣建模

3.1 基于主题模型的企业微博用户行业兴趣建模

3.1.1 基于标准LDA的企业微博用户行业兴趣建模

3.1.2 基于ATM的企业微博用户行业兴趣建模

3.2 模型性能测试实验设计与结果分析

3.2.1 数据集

3.2.2 数据预处理

3.2.3 评价方法

3.2.4 实验结果分析

3.3 向量空间模型中企业微博用户行业兴趣建模

3.3.1 企业微博行业特征选择

3.3.2 向量空间模型中企业微博用户建模

3.4 本章小结

第四章 针对企业微博用户的个性化信息推荐

4.1 企业微博用户推荐

4.1.1 企业微博用户相似度计算

4.1.2 评价方法

4.1.3 企业微博用户推荐方法

4.1.4 企业微博用户推荐实验

4.2 企业微博消息推荐

4.2.1 微博消息和微博用户的相似度计算

4.2.2 评价方法

4.2.3 企业微博消息推荐方法

4.2.4 企业微博消息推荐实验

4.3 本章小结

第五章 总结和展望

5.1 总结

5.2 展望

参考文献

附录

致谢

展开▼

摘要

随着PC互联网和移动互联网开始融入人们的生活,人们在网上的活动变得越来越频繁,微博作为一种新兴的社交平台的出现,满足了人们信息获取、日常交流等目的。
  企业微博作为一种特殊的微博群体,可以帮助企业更加方便地进行产品营销、客户沟通以及行业信息动态把握,从而可以从中挖掘出更多的商机,促进企业发展。然而由于微博平台信息过载的问题,对于某些企业微博用户来讲,关注用户数过多导致很多行业相关的微博消息被其他消息所掩盖,未关注到的行业相关的企业微博用户发布的有潜在价值的消息难以获得,如何从包含大量无关信息的微博集合中找出行业相关的微博,从而进行行业情况的分析,这对于企业的发展有着至关重要的作用。
  传统的文本挖掘方法多采用向量空间模型的方式进行,而向量空间模型的方法存在自身的缺陷,就是只能根据文字表面的意义进行分析,无法挖掘文本潜在的深层次的含义,导致了很多有用信息的丢失,而近年来才出现的主题模型在文本挖掘方面的能力已经通过实践得到了证明,相对于传统的文本挖掘方法,基于主题模型的文本挖掘对于发现文本潜在的主题特征有很好的效果。
  对于企业微博文本来说,使用主题模型进行建模可以很好地挖掘出企业微博用户的行业兴趣或者对不同的行业微博消息进行区分,这可以帮助企业更好更快地获取到所需要的行业相关的商业信息,从而进行决策。
  本文基于主题模型来对企业微博用户进行行业主题建模,同时使用向量空间模型进行行业特征选择,从而建立企业微博用户的行业向量,并在以上基础上实现企业微博用户以及企业微博消息的推荐,本文研究的工作体现在以下两个方面:
  1.本文通过BIG DATA爬虫开放平台获取了新浪企业微博消息作为实验数据,并且使用了LDA模型和作者主题模型ATM实现企业微博用户主题维度的行业兴趣建模,实验证明对于企业微博进行主题建模是可行的,其中作者主题模型ATM的建模效果要优于LDA模型的建模效果,这是因为LDA模型对于短文本的主题建模效果不理想,而ATM模型中将微博消息以用户为单位整合后在一定程度上消除了文本长度过短的缺点。
  2.在使用主题模型对各个企业微博用户进行主题建模之后,接着对各类行业的微博进行行业特征选择,并使用向量空间模型得出每个企业微博用户的行业兴趣向量,然后将主题模型得到的主题相似度计算结果和向量空间模型得到的行业兴趣向量相似度计算结果进行线性合并,从而将最终得出的行业相关性计算结果来作为企业微博用户和消息推荐的依据,实验结果表明本文提出的推荐方法在企业微博用户以及企业微博消息推荐上都有不错的效果。

著录项

  • 作者

    禤良;

  • 作者单位

    安徽大学;

  • 授予单位 安徽大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 郑诚;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 F274-39;TP311.13;
  • 关键词

    主题模型; 企业微博; 消息推荐; 文本挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号