首页> 中文学位 >论文投稿系统评审专家自动推荐模型研究
【6h】

论文投稿系统评审专家自动推荐模型研究

代理获取

目录

文摘

英文文摘

声明

1绪 论

1.1研究背景及意义

1.1.1研究背景

1.1.2研究的意义

1.2国内外研究现状

1.2.1论文投稿系统的发展现状

1.2.2论文投稿系统评审专家选择的现状

1.2.3自动分类的发展现状

1.3课题的提出及主要研究工作

1.4论文组织结构

2论文信息预处理

2.1文本分类的基本介绍

2.1.1文本分类的基本概念

2.1.2文本分类的性质

2.1.3文本分类的评价

2.2特征抽取

2.3特征筛选

2.3.1特征筛选的基本过程

2.3.2特征筛选方法

2.3.3改进的Χ2统计特征筛选方法

2.4论文向量表示方法

2.4.1文本向量表示方法

2.4.2基于TF/IDF特征权重阈值的向量空间模型

2.5实验结果及分析

2.6小结

3论文分类技术

3.1经典分类算法

3.1.1决策树算法

3.1.2朴素贝叶斯

3.1.3 K最近邻算法

3.2需要解决的问题

3.3主动学习

3.3.1主动学习的原理

3.3.2主动学习的算法

3.4主动学习SVM分类算法

3.4.1 SVM分类算法

3.4.2主动学习与SVM的结合

3.4.3主动学习SVM训练样本选择算法

3.4.4改进后主动学习SVM分类算法

3.5实验结果及分析

3.6本章小结

4论文投稿系统评审专家自动推荐模型的构建及实现

4.1总体设计原则

4.2系统平台与开发环境

4.2.1系统平台

4.2.2开发环境

4.3语料库

4.4预处理模块

4.4.1关键论文选择子模块

4.4.2特征筛选子模块

4.4.3论文向量表示子模块

4.5分类器模块

4.5.1分类器构造子模块

4.5.2分类器训练测试论文子模块

4.5.3分类结果及评估子模块

4.6本章小结

5总结与展望

5.1总结

5.2展望

致谢

参考文献

附录

展开▼

摘要

文本自动分类是指在给定的分类体系下,根据文本内容自动确定文本所属类别。文本分类技术的出现,使文档可以自动地按照类别组织和处理,符合人类组织和处理信息的方式。同时,作为信息过滤、信息检索、搜索引擎等领域的技术基础,文本分类技术有着广泛的应用前景。
   学报和学术会议所使用的论文投稿系统,涉及上千篇投稿论文要分配给上百位评审专家去审阅,在很短的时间内人工分配这些投稿论文给相关学科领域的专家们去评审往往匹配的不好。特别是评审专家的研究领域不清楚,人工无法及时、准确的收集到评审专家所属的学科领域信息,影响到论文分配任务的正常进行。选择合适的评审专家是正确评价投稿论文质量和提升学报、期刊学术层次的关键,如何用计算机来实现自动分配投稿论文给匹配领域的评审专家去审阅?文本自动分类可以很好的解决这个问题。
   论文针对上述问题,提出一种基于文本分类技术的评审专家自动推荐模型,通过文本分类技术对投稿论文和对评审专家所发表的论文进行所属学科领域的分类,进而判断出评审专家的主要研究领域和投稿论文的学科领域。然后将投稿论文的学科领域与评审专家的研究领域自动匹配,建立自动推荐评审专家模型。论文的主要研究内容如下:
   ①在特征筛选中,引入最大频率的概念和特征项与类别的相关系数D(mik),提出了改进的x2算法,实验结果表明,在特征项筛选中表现出了良好的筛选效果。
   ②针对评审专家自动推荐模型选取的特征项为论文的关键词,在文本向量表示方法的基础上作了简化,提出了基于TF/IDF特征权重阈值的向量空间模型算法,并选用SVM分类方法对特征矩阵分类。实验结果表明,该算法可以有效的滤除不相关的噪声特征,产生更为准确的分类模型。
   ③针对主动学习SVM分类算法在多类别的分类问题上存在分类器的速度随数目增加而变慢的问题,引入有向无环图SVM,改进了主动学习SVM分类算法,实验结果表明,改进后主动学习SVM分类算法可以增加交互的过程使训练得到的分类器具备自学习的能力,改进后主动学习SVM分类器在多类别的分类上能够精确分类并且提高分类速度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号