首页> 中文学位 >面向单幅不确定大图的频繁模式挖掘技术研究
【6h】

面向单幅不确定大图的频繁模式挖掘技术研究

代理获取

目录

声明

第一章 绪论

1.1研究背景及意义

1.2国内外研究现状

1.3论文研究内容

1.4论文组织结构

第二章 单幅不确定图上频繁模式挖掘问题定义

2.1确定图的定义

2.2不确定图的定义

2.3挖掘技术框架

2.4本章小结

第三章 子图模式的支持度评价

3.1子图模式的支持度计算

3.2计算复杂度分析

3.3子图模式评价方法

3.4本章小结

第四章 支持度评价的优化策略

4.1样本间计算重用

4.2减少样本数量的剪枝策略

4.3本章小结

第五章 实验测试与分析

5.1实验准备

5.2评价近似质量

5.3评价优化技术

5.4评价参数的影响

5.5评价不确定性的影响

5.6评价可扩展性

5.7本章小结

第六章 文本情报分析应用

6.1文本情报建模

6.2基于频繁模式的文本情报分析

6.3应用效能评估实验

6.4本章小结

结 束 语

论文主要工作及创新

论文后续研究工作

致谢

参考文献

作者在学期间取得的学术成果

附 录 A 基于概率语义的挖掘

展开▼

摘要

在军事信息系统中,军事情报分析与处理分系统占据重要地位。随着各类情报获取手段的演进,军事情报数据呈现出异构性和非结构化等特点,使得军事情报分析与处理面临极大的技术挑战。海量文本情报分析是情报分析与处理中最重要和最基础的组成部分。当前,一种从整体上把握文本情报的有效手段是构建以单个文本为节点、文本之间相互关系为联系的文档网络图,即单幅大图(网络)数据,并在此基础上开展一系列分析研判。本文以文本情报分析为应用背景研究单幅大图(网络)上的数据挖掘问题。
  由于噪声、测量误差、保密性、不完整性等原因,不确定性在现实世界的数据中广泛存在。作为一种具有广泛建模能力的数据模型,图数据中也存在着不确定性。除了前述的文档网络图,生物信息学、社会网络等领域中亦大量存在着不确定图。因此,针对不确定图的研究成为国内外的热点。本文使用不确定图建模文本军事情报,并在此基础上挖掘频繁模式;目前在单幅不确定大图上频繁子图挖掘的问题尚未见已公开的研究。
  首先,对单幅不确定大图上子图模式的支持度进行了定义,据此提出了基于枚举-评估的支持度评估方法。枚举策略采用与确定图挖掘时相同的方式,本文主要关注支持度评估过程。其次,通过证明在单幅不确定图上期望支持度的计算是#-P难的,设计了一种具有精度保证的近似算法以满足实际应用需求。然后,为进一步增强算法效率,提出了两种优化策略,一是考虑对样本图计算结果的重用,二是引入检查点机制和基于结构的上界,提前对不频繁的分枝进行剪枝。上述两种优化策略的应用提升了挖掘性能。最后,在实际数据集上进行的实验验证了该挖掘方法及优化策略的实际可用性和有效性。
  为了进一步评价所提技术的实际效用和意义,在真实文本情报数据上开展了应用研究。对于采集的公开文本情报数据,以文档为节点、文档间相似度为边建立文档关联。使用LDA模型为节点附加标签,使用基于知识库的算法衡量节点间相似度;当相似度大于给定阈值时,则连接一条边,并以相似度值作为边上的概率。最终建立文档网络图,并用所提技术对其进行挖掘。实验结果表明,发现的模式具有可解释性,所提挖掘技术具有较好的实际应用前景。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号