首页> 中文学位 >在文章聚类中话题热度排序的研究与实现
【6h】

在文章聚类中话题热度排序的研究与实现

代理获取

目录

声明

1 绪论

1.1 研究背景和研究意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究现状

1.3 研究内容

1.4 论文结构

2 文本聚类及话题热度排序相关算法介绍

2.1 文本聚类算法

2.1.1 基于划分的聚类算法

2.1.2 基于层次的聚类算法

2.1.3 基于密度的聚类算法

2.1.4 基于网格的聚类算法

2.1.5 基于模型的聚类算法

2.2 话题关键词提取方法

2.3 话题热度排序算法

2.3.1 Hacker News 算法

2.3.2 Reddit 算法

2.3.3 Stack Overflow 算法

2.3.4 牛顿冷却定律

2.4 本章小结

3 基于核函数的k-means 聚类算法改进

3.1 传统 k-means算法研究及分析

3.1.1 传统 k-means 算法思想逻辑

3.1.2 k-means 算法优缺点

3.2 结合层次聚类思想的 k-means算法实现流程改进

3.2.1 改进后算法思想

3.2.2 改进后算法流程

3.3 基于核函数的 k-means算法相似度计算

3.3.1 k-means 算法相似度计算方法

3.3.2 基于核函数的相似度计算

3.4 实验分析:传统算法与改进算法效果对比

3.5 本章小结

4 基于改进k-means 算法的文本聚类实现

4.1 文本数据的预处理

4.1.1 文本去噪

4.1.2 中文分词

4.1.3 停用词过滤

4.2 基于 Dco2Vec的文本表示模型建模

4.2.1 文本向量化处理

4.2.2 向量归一化处理

4.3 基于改进 k-means算法的文本聚类参数计算

4.3.1文本最佳聚类数计算

4.3.2 算法相似度σ参数计算

4.4文本聚类

4.5 本章小结

5 基于文本聚类的话题热度排序策略

5.1 话题的基本概念

5.2 话题热度影响因素及其量化

5.2.1 话题热度影响因素

5.2.2 热度影响因素量化

5.3 话题热度排序实现流程

5.4 基于文本聚类结果的话题热度排序

5.4.1 话题的关键词提取

5.4.2 话题的热度排序结果

5.5 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间所取得的成果

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号