声明
摘要
第1章 绪论
1.1 研究背景
1.2 研究现状
1.2.1 XML模式提取研究现状
1.2.2 XML语义研究现状
1.3 论文研究内容
1.4 论文组织结构
第2章 相关理论知识
2.1 XML模式简介及模式提取准则
2.1.1 DTD模式
2.1.2 XML Schema模式
2.1.2 模式提取准则
2.2 XML解析介绍
2.2.1 DOM解析
2.2.2 SAX解析
2.3 XML语义
2.3.1 XML文档中存在的语义信息
2.3.2 单词语义关系
2.4 XML基本数据类型提取
2.5 OWL本体
2.6 基于自动机的XML模式提取
2.7 本章小结
第3章 XML元素类型提取
3.1 XML文档解析
3.1.1 UXML Tree的定义
3.1.2 XML解析算法UXMLParse
3.2 XML文档聚类
3.3 确定XML元素的元素类型
3.3.1 XML标签名称提取
3.3.2 元素类型相似度计算
3.3.3 相同元素类型划分
3.4 本章小结
第4章 基于元素类型划分的XML模式提取
4.1 模式表示
4.2 XML模式提取
4.2.1 ExSOA的定义以及提取ExSOA
4.2.2 从ExSOA提取出元素类型的模式
4.2.3 提取XML元素类型模式信息
4.2.4 XML文档模式提取算法SchemaInfer
4.3 本章小结
第5章 基于语义的XML模式提取设计及实验分析
5.1 系统设计
5.2 实验测试与结果分析
5.2.1 测试平台及测试集
5.2.2 可扩展测试及结果
5.2.3 元素类型划分测试及结果
5.2.4 表达能力测试及结果
5.3 本章小结
第6章 总结与展望
6.1 总结
6.2 展望
参考文献
致谢