首页> 中文学位 >百度文库用于改善学生数据结构成绩预测的研究
【6h】

百度文库用于改善学生数据结构成绩预测的研究

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1 课题研究背景

1.2 课题研究现状

1.3 本文研究的主要内容

1.4 本文的主要工作及论文结构

2 相关技术

2.1 EDM

2.2 评价指标

2.3 预测模型

2.4 本章小结

3 百度文库访问时间估计方案

3.1 数据集

3.2 数据预处理

3.3 时间估计方案设计与改进

3.4 本章小结

4 重点文档类型的确定

4.1 文档分类树

4.2 各类文档访问信息统计

4.3 确定关键文档类型

4.4 本章小结

5 预测模型的构建与评估

5.1 预测的基础与评价标准

5.2 以文库访问时间作为新特征做预测

5.3 以文库访问次数为新特征做预测

5.4 结果分析

5.5 本章小结

6 总结与展望

6.1 本文工作总结

6.2 后续工作及展望

致谢

参考文献

附录

A.作者在攻读硕士学位期间发表的论文目录

展开▼

摘要

随着信息技术的发展,教育的形式与方法均发生了巨大的变化,并产生了大量与教育相关的数据。同时,大数据处理技术的发展及数据挖掘领域的繁荣使得大数据时代逐渐到来。将数据挖掘技术应用于教育学领域被称为教育数据挖掘,简称EDM。EDM是一个交叉学科,涉及计算机科学、教育学、统计学等多个领域。成绩预测是EDM研究中较为经典的应用场景之一。目前的成绩预测研究主要基于智能教学系统和数字化教学软件等信息化教学平台,成果仅能用于分析特定系统,有较强的针对性,但通用性较弱。
  以此为背景,本文对学生访问网络的日志数据及其以往的教学信息进行数据分析和数据挖掘,从而预测他们数据结构课程能否及格。在前期研究中,根据学生访问各类网站的频次信息及高等数学成绩进行成绩预测,取得了一定的效果。此次研究中作者以此为基础,提取学生访问百度文库的时间及频次数据,并将其作为新的特征加入原数据集中,以期进一步提升预测效果。
  在进行百度文库访问时间提取时,通过仔细观察百度文库相关的网络日志,发现了百度文库访问状态转移模型,并以此为基础得到了一种可以较精确地估计访问时间的方法。接下来作者按文档类型统计了学生访问百度文库的频次信息,进而确定了与数据结构成绩最相关的7种文档类型。
  为了提高学生成绩预测的准确性,作者按一定的顺序将新特征加入到模型中。在进行特征组合时考虑了使用新特征及不使用新特征、采用粗略访问时间及精确访问时间、采用重点文档类型及非重点文档类型几种情况。研究同时表明,采用精确访问时间和重点文档类型能有效地提高预测的准确率。通过采用最优的特征组合,本文提出的方法将预测结果的特异性从52.94%提升到了70.59%,同时敏感性保持在了80%以上。
  最后,对全文进行了总结,同时提出了下一步的工作。研究发现,使用网络访问日志和以往的考试成绩进行成绩预测是可行的。本研究使用的数据集不依赖于某些特定的教学系统,因此具有较强的通用性,克服了当前大多数成绩预测研究的缺点,理论上该方法具有可移植性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号