文摘
英文文摘
独创性声明及学位论文版权使用授权书
第一章绪论
1.1问题提出
1.2课题来源
1.3本文的研究工作
1.4本文的组织结构
第二章相关概念与技术
2.1数据挖掘
2.2文本挖掘
2.2.1文本预处理
2.2.2文本聚类
2.2.3文本分类
2.3.1 Web挖掘技术
2.3.2 Web信息检索
2.4 XML文档查询
2.4.1 XML文档模型
2.4.2 XML文档编码
2.4.3 XML文档索引
2.4.4 XML文档查询
2.5本章小结
第三章基于语义的XML文档关键词查询
3.1问题提出
3.2相关工作
3.3基于语义的XML文档关键词查询相关性判别
3.3.1 LCA和PLCA
3.3.2语义相关的关键词查询结果判别准则
3.4基于语义的XML文档关键词查询
3.4.1 PN倒排索引的创建
3.4.2基于语义的XML文档关键词查询算法
3.5实验分析与比较
3.6本章小结
第四章基于XML文档模式与实体的半结构查询
4.1问题提出
4.2相关工作
4.2.1 XML文档检索
4.2.2结构查询扩展
4.2.3相关工作小结
4.3半结构查询的查询语法
4.4基于XML文档模式与实体的半结构查询相关性判别
4.4.1模式和实体
4.4.2相关性判断PE规则
4.4.3等价模式的判别方法
4.5基于PE索引的相关性判别
4.5.1 PE索引
4.5.2基于PE索引的相关性判别方法
4.5.3索引创建算法
4.6 XML文档半结构查询算法
4.7实验分析与比较
4.7.1实验设计
4.7.2实验结果
4.8本章小结
第五章 基于Web文档特征层次的信息检索导航
5.1问题提出
5.2最大序列频繁词组挖掘
5.2.1最大序列频繁词组定义
5.2.2最大序列频繁词组挖掘算法
5.3 Web文档特征层次结构创建
5.3.1 Web文档特征层次结构定义
5.3.2 Web文档特征层次的创建
5.4.1关键词—关键词导航
5.4.2关键词—文档导航
5.4.3文档—关键词导航
5.4.4基于Web文档特征层次结构的信息检索导航小结
5.5原型系统和用例
5.5.1原型系统设计
5.5.2用例分析
5.6相关工作及讨论
5.7本章小结
第六章结束语
6.1本文的主要贡献
6.2进一步的工作
参考文献
致谢
攻硕期间参与项目及发表论文
东北大学;