声明
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 本文研究方法
1.5 本文组织结构
2 相关技术背景
2.1 Stack Overflow介绍
2.1.1 Stack Overflow中的问题
2.1.2 Stack Overflow中提问的方式
2.2 主题模型
2.2.1 向量空间模型
2.2.2 潜在语义分析
2.2.3 概率潜语义分析
2.2.4 潜在狄利克雷分配
3 数据获取及预处理框架
3.1 数据源介绍
3.1.1 Stack Overflow数据源
3.1.2 Posts.xml数据集
3.1.3 Tags.xml数据集
3.2 数据获取方法
3.2.1 标签提取
3.2.2 标签筛选
3.2.3 问题文本提取
3.3 数据预处理方法
4 基于Stack Overflow的Java技术趋势分析
4.1 Java技术使用趋势统计
4.1.1 数据提取
4.1.2 Java技术趋势统计
4.1.3 结论
4.2 Java技术使用趋势对比
4.2.1 数据提取
4.2.2 Java技术趋势对比
4.2.3 结论
5 基于Stack Overflow的主题模型分析
5.1 生成文档主题
5.1.1 LDA主题模型
5.1.2 主题模型参数设定
5.1.3 主题模型分析
5.2 相关主题分析方法
5.2.1 主题评价与排序方法
5.2.2 主题代表提问选择方法
5.3 实验结果分析
5.3.1 主题分类
5.3.2 主题代表问题
5.3.3 主题受关注度指标评价
5.3.4 主题困难程度指标评价
结论
参考文献
攻读硕士学位期间发表学术论文情况
致谢
大连理工大学学位论文版权使用授权书
大连理工大学;