首页> 中文学位 >异构数据库集成中相同语义对象识别方法研究
【6h】

异构数据库集成中相同语义对象识别方法研究

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

第1章文献综述

第2章绪论

第3章基于权值的属性匹配方法研究

第4章基于神经网络的属性匹配方法研究

第5章总结语

参考文献

附录:部分代码

致谢

攻读硕士学位期间参加的科研项目和发表的学术论文

展开▼

摘要

本文首先分析了现有异构数据库语义集成技术;具体到语义匹配,首先提出基于权值的异构数据库语义集成中属性匹配方法,然后考虑到基于规则匹配方法需要先验知识来确定描述属性的各数据指标的权重,提出了不直接人为地给属性的元数据赋予权重,而是尝试应用机器学习及人工智能的方法从描述属性的各数据指标中学习规则。在处理具有不确定性的属性匹配问题上,神经网络有着独特的优势,神经网络是通过具体的实例进行训练而不是根据确定的规则进行编程,不需要先验知识,能够充分考虑到属性实例值的信息,且有较强的推广能力和自适应能力。 主要研究工作如下: (1)综述现有异构数据库语义集成技术,分析了目前文献中应用最多的三种判定属性相似度方法的不足,提出了一种改进的基于权值的异构数据库语义集成中属性匹配方法-CRC法。该方法首先根据数据类型把属性进行分类,然后根据重要性对特征向量进行排序,按照给定的公式计算权重,最后进行属性匹配。 (2)基于权值的方法属于基于规则匹配的方法,此类方法需要先验知识来确定描述属性的各数据指标的权重,属性的各数据指标的权重很难准确量化。即便是在一个应用环境下给出了合理的权重,当环境变化时仍要重新修改权重,动态适应能力较差,也不能找到一个通用的固定匹配规则来实现属性的匹配。根据其不足,结合进行语义匹配的特点以及神经网络的优势,提出用SOM神经网络模型对属性进行分类的思想。 (3)由于标准BP算法存在收敛速度慢、易陷于局部极小点的缺陷。对于复杂问题,训练过程需迭代几千、几万次才能收敛到期望的精度。因此,标准的BP算法在很大程度上表现出它的不实用性,特别是对实时性很强的系统。从而出现了各种改进的BP算法。提出了采用改进的BP算LM算法。该算法根据迭代的结果动态地调整阻尼因子,即动态地调整迭代的收敛方向,可使每次的迭代误差函数值都有所下降,收敛速度较快。实验结果证明该方法能明显提高属性匹配的准确率,降低神经网络的训练时间。第(2)点与第(3)点结合起来就是本文提出的一种改进的基于神经网络的SOM-LM法属性匹配算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号