摘要
Abstract
第一章绪论
1.1引言
1.2信息检索系统
1.3机器学习在信息检索中研究现状
1.4本论文的工作
第二章信息检索及相关理论
2.1三种经典的信息检索模型
2.1.1布尔模型
2.1.2向量模型
2.1.3概率模型
2.1.4结论
2.2信息检索的重要概念
2.2.1文本压缩
2.2.2索引
2.2.3查询与反馈
2.3大规模分布式信息检索系统
2.3.1分布式计算
2.3.2分布式系统结构
2.3.3文档分区(Document Partitioing)
2.4系统有效性评估
2.4.1检索率与检索精度
2.4.2检索率—检索精度曲线
第三章机器学习与智能检索
3.1神经网络和信息检索
Hopfield网络:知识表示法和处理过程
3.2符号学习和信息检索
ID3/ID5R:知识表示法和过程
3.3遗传算法和信息检索
遗传算法:知识表示法和过程
第四章分布式智能检索系统的设计与实现
4.1设计概述
4.2分词模块设计
4.2.1中文词的编码体系
4.2.2数据结构
4.2.3算法设计
4.2.4算法评估
4.3节点检索系统设计
4.3.1向量空间生成
4.3.2检索过程实现
4.4训练样本预处理模块
4.5 CC4神经网络算法
4.6用户个性化服务模块
4.6.1 Profile及文档的表示
4.6.2文档过滤实现
4.7Miracle文档数据库设计
4.8模块整合及系统实现
第五章实验结果及分析
5.1测试的规范、素材及方法
5.2节点系统大规模文本集合测试
5.3智能分布式检索比较测试
5.3.1搜索时间
5.3.2检索有效性评估
5.3.3实验小节
第六章系统今后的改进和扩展
参考文献
附录1
Dubl in Core与XML结合——资源有效检索的重要措施
关于Dublin Core
Dubl in Core与XML结合使用
附录2
RDF—Web数据集成的元数据解决方案
一.引言
二.RDF简介
三.RDF实现Web元数据描述与交换的机制
四. RDF的特点
五.RDF与若干Web新技术
六.结束语
致谢