文摘
英文文摘
声明
第1章引言
1.1概述
1.2信息过滤研究现状
1.2.1国内外相关研究
1.2.2网络信息检索技术
1.2.3文本信息过滤技术
1.2.4信息过滤技术研究在数字图书馆中的意义
1.3论文的主要研究内容及章节安排
第2章信息过滤技术
2.1信息过滤技术概述及特点
2.2信息过滤模型
2.3文本表示模型
2.3.1布尔逻辑模型
2.3.2向量空间模型
2.3.3概率推理模型
2.3.4潜在语义索引模型
2.4分词与特征选择
2.4.1分词技术
2.4.2特征选择
2.5文本分类
2.5.1 Racchio方法
2.5.2 KNN方法
2.5.3 Naive Bayesian方法
2.5.4支持向量机
2.5.5决策树方法
第3章遗传算法
3.1遗传算法的概述及特点
3.1.1遗传算法的基本定义
3.1.2遗传算法的基本操作
3.1.3遗传算法的主要特点
3.2遗传算法的原理
3.2.1遗传算法简介
3.2.2遗传算法的编码方式
3.2.3选择操作
3.2.4交叉操作
3.2.5变异操作
3.3遗传算法的优缺点
3.3.1遗传算法的优点
3.3.2遗传算法的缺点
第4章改进遗传算法在信息过滤系统中的应用研究
4.1编码以及初始种群的产生
4.1.1编码方式
4.1.2初始种群
4.1.3解码
4.2适应度函数选择
4.3选择
4.3.1传统遗传选择方法的缺点
4.3.2改进的轮盘赌选择方法
4.4交叉
4.4.1单点交叉优点
4.4.2传统单点交叉存在的不足
4.4.3应用于分类中系统中的改进交叉操作
4.5变异
4.5.1传统均匀变异及其改进
4.5.2自适应变异概率的实施
4.6种群扩展
4.7遗传操作参数的设定以及终止条件
4.7.1遗传操作参数的设定
4.7.2中止条件
4.8其他操作
4.8.1中断遗传
4.8.2增量遗传
第5章数字图书馆信息过滤系统的实现
5.1数字图书馆信息过滤系统的结构
5.1.1信息过滤系统的框架结构
5.1.2过滤模块介绍
5.2系统流程图
5.3模板的生成和匹配
5.3.1模板的生成
5.3.2模板信息的构造及匹配
5.4系统的训练
5.5实验分析
5.5.1评估指标
5.5.2过滤常用语料库
5.5_3结果及分析
第6章结论与展望
6.1结论
6.2进一步工作的方向
致谢
参考文献
个人简历 在读期间发表的学术论文与研究成果
同济大学;
同济大学软件学院;