摘要:在网络环境下大数据量的半结构化数据模式发现和模式变化检测是关于半结构化数据研究的一个重要方向。本文在有向标记树的基础上,研究了半结构化数据的树状最大频繁模式挖掘问题,采用最右扩展枚举方法无重复枚举所有候选模式,利用频繁模式扩展森林实现高效剪枝扩展和挖掘频繁叶模式,从而高效挖掘树状最大频繁模式。此外通过改进模式变化检测到约束满足问题映射的方法来降低问题转换后的规模,从而可以利用CSP问题求解技术高效地解决半结构化数据的模式变化检测问题。实验表明该方法能有效降低转化后的问题规模,使得求解时间大大降低,同时由于CSP的特性,克服了一般方法要在有序树基础上进行的限制。