首页> 中文学位 >半结构化数据的聚类研究及在产品设计中的应用
【6h】

半结构化数据的聚类研究及在产品设计中的应用

代理获取

目录

封面

声明

中文摘要

英文摘要

插图索引

表格索引

符号对照表

缩略语对照表

目录

第一章 绪论

1.1 研究背景与意义

1.2 半结构化数据概述

1.3半结构化数据聚类研究的现状

1.4 论文的主要工作内容

第二章 半结构化数据聚类的相关知识

2.1 XML概述

2.2 XML文档

2.3 产品设计文档

2.4 聚类概述

2.5 XML文档聚类的特点

2.6 本章小结

第三章 半结构化数据的聚类分析

3.1 半结构化文档聚类过程

3.2 XML文档表示方法分析

3.3 信息表达式表示方法

3.4 相似度计算方法

3.5 XML文档聚类方法分析

3.6 聚类模型

3.7 本章小结

第四章 半结构化数据聚类方案的设计

4.1 半结构化数据聚类整体过程

4.2 XML文档的数据结构

4. 3 构建信息表达式

4.4 节点间语义相似度计算

4.5 XML文档之间相似度的计算

4.6 XML文档聚类流程

4.7 本章小结

第五章 半结构化数据聚类在机械产品设计中的应用

5.1机械产品设计中的半结构化数据聚类

5.2 机械传动设计

5.3 基于XML产品设计文档的聚类实例

5.4 与基于树路径集合表示方法的聚类相比

5.5 本章小结

第六章 总结与展望

6.1 研究结论

6.2 研究展望

参考文献

致谢

作者简介

展开▼

摘要

随着计算机网络以及数据库技术的快速发展,各领域积累的半结构化数据和信息急剧增加,迫切需要面向知识发现的方法,而数据挖掘的出现与应用,为这一目的提供了强大的工具。通过利用半结构化数据的内容和结构信息,配合数据挖掘算法,可以从大量半结构化数据中提取用于描述结构特征以及内容的信息,并进行综合以对半结构化数据进行深层次的潜在知识发现,而发现的知识能为决策者提供良好的数据支持。
  半结构化数据有很多类型,而其中XML文档是半结构化数据的典型代表,所以本文以XML文档作为半结构化数据研究对象,并讨论基于XML产品设计文档的聚类方法。XML文档是结构信息和内容信息的综合体,因此对XML文档的聚类处理需要考虑XML文档的结构信息和内容信息。XML文档聚类的过程主要为:文档表示、相似度计算以及聚类处理。本文也从这三个过程对XML文档聚类进行分析研究。
  第一、对XML文档一般的表示方法树形结构和树路径集合的优缺点进行分析总结。分析XML文档特征,在前人提出的基于层次的表示方法的基础上,对该方法作了改进,定义了信息表达式,加入了文本内容,父节点以及层次信息,使信息表示更完整和精确。
  第二、在XML文档相似度计算阶段,为了充分考虑XML文档标签的信息,加入标签的语义信息,并基于语义词典计算它们的语义相似度。对于基于XML的产品设计文档,一般语义词典缺乏相关领域专业术语,对此,本文通过加入领域专业术语词典对标签语义的相似度计算进行扩展。同时,不同XML文档中拥有相同子节点的父节点表示的信息有可能不一致,以致影响相似度的计算结果。根据分析基于XML的产品设计文档的特点,可以将父节点的信息进一步抽象化,用更抽象化的节点信息来取代。因此,为了解决这一问题,在构建信息表达式阶段,加入专业术语词典对非专业术语的节点进行约简。
  第三、介绍分析了凝聚层次聚类以及建立了基于XML的产品描述文档的聚类模型,并对其进行了设计与实现,并将这个聚类模型应用于机械传动设计中,得到了理想的结果,同时与基于树路径集合表示方法的聚类结果相对比,也得到了较好的结果,验证了本文所建立模型的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号