文摘
英文文摘
原创性声明及关于学位论文使用授权说明
第一章绪论
1.1 问题的提出
1.2 问题的解决方案
1.3 本文的工作和组织
第二章基于主题特征词的Web页面分类挖掘
2.1 Web数据挖掘的定义
2.2 Web数据挖掘的分类
2.2.1 Web内容挖掘
2.2.2 Web结构挖掘
2.2.3 Web日志挖掘
2.3 Web文本挖掘
2.3.1文本总结
2.3.2文本分类
2.3.3文本聚类
2.3.4关联规则
2.4 基于主题特征词的Web文本分类挖掘
2.4.1 Web数据预处理
2.4.2文本表示
2.4.3特征提取
2.4.4分类和评估
2.5 一个已有Web页面分类数据挖掘系统
2.5.1系统介绍
2.5.2系统分析
第三章本体
3.1 本体的定义
3.2 本体的作用
3.3本体的种类
3.4 本体的建模语言
3.5本体的描述
3.5.1用RDF(S)元语建立Ontology
3.5.2 RDF(S)元语集合的扩展
第四章基于本体的Web页面分类挖掘
4.1 基于本体的Web页面分类挖掘模型
4.2 应用本体
4.3本体解析
4.3.1一致性映射规则
4.3.2推理映射规则
4.3.3上下文映射规则
4.3.4关系映射规则
4.4 Html页面解析
4.5本体匹配
4.6 相关度向量计算
4.6.1密度算法
4.6.2期望值算法
4.6.3 1max集合算法:
4.7 学习算法
4.8分类过程描述
4.8.1基本分类过程
4.8.2改进后的分类过程
4.9测试评估
第五章研究实验及其说明
5.1 实验描述
5.1.1原型系统
5.1.2实验过程
5.2 验证实验说明和分析
5.2.1实验1
5.2.2实验2
5.2.3实验3
5.3 对比实验说明和分析
5.3.1实验4
5.3.2实验5
第六章结束语
6.1 本文的总结
6.2 进一步的研究方向
参考文献
致谢
攻读学位期间主要的研究成果