首页> 中文学位 >概念格剪枝方法研究及其在Web挖掘中的应用
【6h】

概念格剪枝方法研究及其在Web挖掘中的应用

代理获取

摘要

形式概念分析是一种概念化知识处理的有效工具,现在已广泛应用于知识发现、软件工程、信息检索、数据库管理、Web挖掘等很多方面。随着网络的发展和数据库规模的增大,数据库中不仅包含了有用的信息,同时也存在大量的冗余信息,研究如何从中提取有价值的信息具有很强的实用价值。
   对于大型数据库来说,其产生的概念格往往节点众多、规模巨大,使得概念格变得难以分析,失去利用价值。为此,需要使用一些度量方法来缩减概念格的规模,使它更加清晰明确的反映数据库中的关键信息。论文研究了概念格的基础理论、概念格的构造算法,并对概念格的剪枝理论及其在Web挖掘中的应用展开了深入的研究。在本文中首先引入两种剪枝策略:支持度剪枝和稳定性剪枝。其中,对概念格进行支持度剪枝方法通过挖掘频繁项集的方法建立Iceberg(冰山)概念格,它却有可能隐藏了那些不频繁却具有现实意义的概念。而稳定性剪枝方法是根据概念格中概念之间的相关性来进行剪枝。然后,提出计算概念稳定性算法,并对概念稳定性理论进行了分析。最后,将形式概念的稳定性理论与Web挖掘应用相结合。将概念格应用于分众分类中,能够反映出这个社区的思维和认识,有利于各个社区的资源组织和利用,实验中将支持度剪枝和稳定性剪枝的概念格进行对比,表明稳定度剪枝能有效去除冗余信息并发现用户兴趣。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号