首页> 中文学位 >基于Stack Overflow的Java主题分析
【6h】

基于Stack Overflow的Java主题分析

代理获取

目录

声明

1 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容

1.4 本文研究方法

1.5 本文组织结构

2 相关技术背景

2.1 Stack Overflow介绍

2.1.1 Stack Overflow中的问题

2.1.2 Stack Overflow中提问的方式

2.2 主题模型

2.2.1 向量空间模型

2.2.2 潜在语义分析

2.2.3 概率潜语义分析

2.2.4 潜在狄利克雷分配

3 数据获取及预处理框架

3.1 数据源介绍

3.1.1 Stack Overflow数据源

3.1.2 Posts.xml数据集

3.1.3 Tags.xml数据集

3.2 数据获取方法

3.2.1 标签提取

3.2.2 标签筛选

3.2.3 问题文本提取

3.3 数据预处理方法

4 基于Stack Overflow的Java技术趋势分析

4.1 Java技术使用趋势统计

4.1.1 数据提取

4.1.2 Java技术趋势统计

4.1.3 结论

4.2 Java技术使用趋势对比

4.2.1 数据提取

4.2.2 Java技术趋势对比

4.2.3 结论

5 基于Stack Overflow的主题模型分析

5.1 生成文档主题

5.1.1 LDA主题模型

5.1.2 主题模型参数设定

5.1.3 主题模型分析

5.2 相关主题分析方法

5.2.1 主题评价与排序方法

5.2.2 主题代表提问选择方法

5.3 实验结果分析

5.3.1 主题分类

5.3.2 主题代表问题

5.3.3 主题受关注度指标评价

5.3.4 主题困难程度指标评价

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

Stack Overflow(简称SO)是国外著名的程序技术问答平台,在该平台上,软件开发人员针对特定编程语言或开发技术提出问题,其他用户利用自己的领域知识和经验为这些问题提供答案。据统计,在Stack Overflow的所有提问中,针对Java开发框架和第三方开发包提问与回答的帖子占有了相当高的比例。作为目前最受欢迎的编程语言之一,Java提供了丰富的类库和API文档,通过对Stack Overflow中Java语言相关的帖子进行分析,有助于帮助软件开发人员更好的使用该语言。 因此,本文提出一套完整的主题模型分析方法,针对Stack Overflow中Java相关的帖子进行统计分析和主题分析。该框架分为四个步骤:(1)数据集获取:本文从Stack Exchange Data Dump网站下载Stack Overflow的数据集,同时提取和筛选与Java相关的数据,并对提取的数据进行预处理。(2)Java技术趋势分析:针对Stack Overflow中的帖子数量,本文对当前热门的Java技术进行了统计分析,讨论热门的Java技术近年来帖子数随时间的变化趋势。同时还将近年来一些同类型的技术帖子进行对比,比较这些技术近年来的受关注程度。(3)主题模型分析:针对Stack Overflow中的帖子内容,本文使用LDA(Latent Dirichlet Allocation)主题模型技术自动地发现开发人员所讨论的主题,同时对这些主题进行分析,探索主题与帖子内容的关系,根据帖子的相关属性计算主题的相关指标。(4)实验结果分析:通过提出相应的问题,在主题模型分析的基础上,对主题模型得到的概率矩阵进行排序,根据实验结果对提出的问题进行回答,得出该领域开发者比较感兴趣的有价值的结论。 结合上述框架,本文帮助开发人员掌握不同Java技术的变化趋势和这些技术近年来的使用情况,同时帮助开发人员了解每种Java技术的常见问题与解决方案,进而得出该领域开发者比较感兴趣的有价值的结论与话题。这些研究成果为开发人员未来使用Java语言和技术提供了宝贵的经验。

著录项

  • 作者

    张鹏;

  • 作者单位

    大连理工大学;

  • 授予单位 大连理工大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 胡燕;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    Java;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号