首页> 中文学位 >基于文本的微学习单元层次融合聚类研究
【6h】

基于文本的微学习单元层次融合聚类研究

代理获取

目录

第一章 绪论

1.1 课题研究背景及意义

1.2 课题研究现状

1.3 本文主要研究内容

1.4 论文组织结构

1.5 本章小结

第二章 文本聚类相关理论和方法

2.1 文本聚类的一般过程

2.2 文本聚类算法

2.3 AP算法及凝聚层次聚类算法

2.4 本章小结

第三章 基于文本的微学习单元层次融合聚类

3.1 微学习单元文本

3.2 基于AP算法的层次融合聚类算法

3.3 基于文本的微学习单元层次融合聚类框架

3.4 本章小结

第四章 基于文本的微学习单元聚类实现

4.1 微学习单元预处理

4.2 微学习单元表示

4.3微学习单元聚类

4.4 本章小结

第五章 实验与结果分析

5.1 实验数据

5.2 算法评价标准

5.3 实验结果分析

5.4 聚类结果展示

5.5 本章小结

第六章 总结与展望

6.1 本文总结

6.2 未来工作展望

参考文献

致谢

攻读硕士学位期间发表的学术论文

展开▼

摘要

随着无线网络技术的发展以及手持移动设备的普及,一种不受时间和地点限制的学习方式──微学习(Micro-learning)应运而生,它使学习者利用碎片化时间获取知识成为可能。目前,社会中越来越多的人通过这种非传统的方式在微博、MOOC等媒体或平台环境中学习并获得知识。多种多样的微学习平台也在不断建立和发展,与此同时各种微学习资源也日渐丰富。但是,随之而来的是微学习资源的碎片化,多个微学习资源之间存在冗余和重复性,同时也出现了信息过载等问题。对于学习者来说,很难快速找到适合自己的学习资源。因此,对微学习资源进行有效的组织将有助于学习者提高其学习效率。
  在微学习中,微学习单元是其最基本的构成,由短小的文本、图片、以及音频和视频等资源组成。其中,文本形式的资源是微学习的主要资源。本研究从微学习单元粒度出发,尝试通过文本聚类方法对微学习单元进行重组和整合,以帮助学习者迅速查找所需要的学习知识,同时也为其个性化学习打下基础。本研究主要完成了以下几方面的工作:
  (1)在对微学习资源管理及文本聚类的研究现状进行调查研究的基础之上,对常用文本聚类算法的优缺点进行了分析,并重点研究和分析了AP算法和凝聚层次聚类算法。
  (2)在AP算法和凝聚层次聚类算法的基础上,提出了基于AP算法的层次融合聚类算法。该算法首先通过AP算法找到数据的聚类中心,然后采用凝聚层次聚类算法将聚类中心聚类为不同类簇,最后将非聚类中心点重新划分至类簇中完成聚类。
  (3)结合文本聚类基本处理流程及微学习单元数据的特点,在构建了基于文本的微学习单元聚类框架的基础上,实现了基于文本的微学习单元的聚类过程。首先实现英文文本微学习单元分词,构建停用词表进行停用词处理以及词干提取。其次提取单元文本特征,综合微学习单元的标题和内容特征计算特征权重,通过向量空间模型将微学习单元文本转化为单元向量。最后应用本文算法将微学习单元聚类为不同的知识群组。
  为验证算法的有效性,本文提出的算法与K-means聚类算法进行实验对比,实验结果表明,本文提出的方法对微学习单元聚类的准确性更高,聚类效果更好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号