文摘
英文文摘
1 绪论
1.1 研究动机
1.2 研究内容
1.3 研究目标
1.4 论文的组织
2 相关研究综述
2.1 引言
2.2 半结构化数据挖掘相关研究问题
2.3 频繁模式挖掘技术
2.4 现有问题与不足
2.5 小结
3 频繁子树挖掘
3.1 引言
3.2 基本概念和问题定义
3.3 用FREQT算法挖掘频繁子树
3.3.1 问题定义
3.3.2 挖掘算法
3.3.3 算法分析
3.4 基于子树编码聚类的频繁诱导子树挖掘算法
3.4.1 树的关系编码
3.4.2 基于最右路径扩展子树
3.4.3 XMLMiner算法
3.4.4 实验和算法的性能分析
3.5 基于项集表达的频繁嵌入子树挖掘算法
3.5.1 基本思想
3.5.2 EXMLMiner算法
3.5.3 实验和算法的性能分析
3.6 小结
4 基于约束的频繁子树挖掘
4.1 引言
4.2 基本概念和问题定义
4.2.1 树的基本概念
4.2.2 基于约束挖掘的定义
4.2.3 基于约束的频繁闭子树挖掘
4.3 基于约束的频繁诱导子树挖掘算法CTreeMiner
4.3.1 CTreeMiner算法
4.3.2 约束检查过程
4.4 实验与性能分析
4.5 小结
5 部分标记频繁子图挖掘
5.1 引言
5.2 相关工作
5.3 基本概念和问题定义
5.4 用Vanetik的算法挖掘部分标记频繁子图
5.4.1 相关定义
5.5 部分标记频繁子图挖掘算法PLSM
5.5.1 gIDX索引结构
5.5.2 基于gIDX索引结构的PLSM算法
5.5.3 时间复杂度的分析
5.6 实验与性能分析
5.7 小结
6 基于约束的部分标记频繁子图挖掘
6.1 引言
6.2 相关研究
6.3 基于约束的图模式
6.3.1 模式弱化支持度约束
6.3.2 支持度度量和最小允许扩展
6.4 使用模式弱化支持度约束挖掘标记子图
6.4.1 标记子图挖掘
6.4.2 SCMiner的剪枝方法
6.5 实验与性能分析
6.5.1 人工数据集
6.5.2 真实数据集
6.6 小结
7 结论与展望
7.1 总结
7.2 进一步的工作
致谢
参考文献
附 录
A.作者在攻读学位期间发表的论文目录
B.作者在攻读学位期间取得的科研成果目录