首页> 中文学位 >学术期刊网络化运行与管理中的数据挖掘方法研究
【6h】

学术期刊网络化运行与管理中的数据挖掘方法研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1课题背景及意义

1.2国内外研究状况与进展

1.3本文所做工作

1.4本文结构和组织

第2章一种学术不端行为的分析方法

2.1学术不端行为的特点及其分析

2.2一种学术不端行为的识别方法设计

2.2.1文档复制检测法及其特点

2.2.2基于字符串匹配的文档复制检测方法

2.3识别方法的实现

2.4本章小结

第3章投审稿信息库的挖掘方法

3.1稿源信息库的分类统计分析

3.1.1影响稿源的因素分析

3.1.2基于统计分析的数据挖掘方法

3.1.3稿源的分类统计分析及其实现

3.2审稿专家库的聚类分析

3.2.1审稿专家库的特点

3.3.2聚类分析方法及其种类

3.3.3基于K-means的聚类算法及其改进

3.3.4审稿专家库的聚类分析

3.4本章小结

第4章基于数据仓库的系统日志分析

4.1系统日志的内容和特点

4.2数据仓库的构造方法

4.2.1数据仓库的定义及其特点

4.2.2数据仓库的体系架构及构造方法

4.3系统日志分析的实现

4.4本章小结

第5章总结与展望

5.1总结

5.2展望

参考文献

致谢

攻读硕士学位期间发表的论文及参加的项目

展开▼

摘要

随着计算机技术的迅速发展以及数据库管理系统的广泛应用,越来越多的数据被存储起来,如何在这些海量的数据中寻找真正所需要的知识显得尤为重要。数据挖掘作为一个多学科的交叉学科,能够在海量数据中发现有用的模式和规则,是将数据转化为知识的重要手段。数据挖掘技术虽然渗透到了社会的各个方面,但在学术期刊上应用却比较少。论文以“期刊网络化综合运行管理平台”为应用背景,针对该平台已有的业务数据,基于业务数掘库与主题数据仓库,采用数据挖掘方法对有关期刊运行效率与管理质量中的问题进行了研究,并将研究的结果形成新的质量管理规则,运用到学术期刊在线运行管理中。
   首先,研究了学术不端行为的检测方法,设计出了一种基于字符串匹配的文本复制检测算法。通过抽取各期刊论文的特征,建立稿件信息数据仓库,运用设计的检测方法,先对数据仓库中的论文进行研究方向和关键字的筛选,缩小比对范围,然后再利用KMP算法对论文的摘要进行详细检查,把相同的文字显示出来,为工作人员尽快准确判别和发现学术不端行为提供了一种有效方法。
   其次,对投审稿信息进行了挖掘方法研究,依据统计分析法对稿源信息进行了统计挖掘分析,同时,提出了一种审稿专家的聚类分析方法。前者为工作人员从研究方向,基金类型等各个方面来了解稿源情况提供了依据,后者,则为工作人员构建审稿专家库和合理送审提供了依据。
   最后,针对期刊运行与管理系统中日志文件的特点,基于数据仓库技术,对系统日志进行了统计挖掘分析,为期刊的日常运行和维护提供了科学的分析方法和分析依据。
   通过对上述数据挖掘方法在期刊运行与管理系统中的研究和实现,为期刊的管理提供了一套辅助分析方法,为提高刊物的办刊质量和办刊效率,减少工作人员的工作量创造了条件,对学术期刊的高质量的健康发展和高效稳定运行具有重要的理论和实践意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号