首页> 中文学位 >基于本体的异构数据集成技术的研究
【6h】

基于本体的异构数据集成技术的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1 .1 研究背景及意义

1 .2 国内外研究现状

1 .3 主要研究内容及工作

1 .4 论文的组织结构

第二章 数据集成相关技术

2 .1 异构数据集成概述

2 .2 本体的概念

2 .3 本体映射技术

2 .4 数据集成系统总体框架设计

2 .5 本章小结

第三章 基于多策略混合的本体映射系统

3 .1 本体映射方法的局限性

3.2 W-NPSI映射系统

3 .3 概念特征提取模块

3 .4 概念集筛选模块

3 .5 本章小结

第四章 基于多策略混合的相似度计算方法

4 .1 多策略混合的映射框架

4 .2 基于多策略的概念映射方法

4 .3 改进的多策略混合的映射方法

4 .4 本章小结

第五章 实验设计及结果分析

5 .1 实验设计

5 .2 评估方法

5 .3 实验结果

5 .4 结果分析

5 .5 本章小结

第六章 总结与展望

6 .1 总结

6 .2 展望

参考文献

攻读硕士期间发表的论文

致谢

附录(实现W-NP SI映射系统算法的主要代码)

展开▼

摘要

在信息科技飞速进步的今天,各类信息系统被普遍地使用。然而,因为信息平台的创建具有阶段性、目的性和分散性等,数据异构性问题随之产生。数据异构问题的存在导致了各信息系统之间的通信变得困难,信息难以得到有效的共享,“信息孤岛”现象普遍存在。为了适应信息社会的发展,使信息得到高速、有效的利用,就必须实现异构数据集成,现阶段要实现异构数据集成的当务之急就是解决语义异构问题。
  本文针对语义异构问题提出了基于本体的多策略相似度混合的方法。首先阐述了异构数据集成的概念、类型和目标,总结分析了几种现存集成方法的优缺点,详细介绍了本体及本体映射中的一些关键的技术及作用,提出了本文的集成系统的总框架,从用户应用层、中间集成层和异构数据层三个层次对该系统进行了介绍。
  接着对数据集成中本体映射技术进行研究,着重对本体映射中的相似度计算方式进行研究。在对现有的映射算法进行了分析后,发现这些算法中普遍存在着计算量大、自动化程度低、通用性差和算法单一的问题,针对这些问题提出了W-NPSI映射系统,该系统包括概念特征提取模块、概念集筛选模块、多策略映射模块和结果处理模块:概念集筛选模块中提出了基于Wo rd Net计算概念相关度的算法,根据词语在Wo rd Net位置关系计算出词语相关度,进而推算出概念相似性而筛选出候选概念集的方法,解决计算量大的问题;多策略映射模块设计了自适应相似度聚合器,其中心思想是以自适应计算权值的方法,提高系统的自动化程度;多策略映射模块中提出了混合概念名称、属性、结构和实例四大特征相似度的多策略混合的算法,该方法能够有效地提高映射的效果和改善系统的通用性,并解决了算法单一的问题。
  最后,采用OAEI(Ontology Alignment Evaluation Initiative,本体一致性评估计划)提供的b enc hmark数据集来验证本文提出的基于多策略混合的映射算法。通过对实验结果的分析,证明该算法可以在保证查全率和查准率的同时,有效地减少计算量,降低算法的时间复杂度和空间复杂度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号