基于实例的异构数据模式匹配方法研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，大部分企业已经完成业务数据信息化，各企业都搭建了自己的数据存储系统来存放自身业务数据。企业兼并引起的数据库合并，跨数据库查询服务，数据集成等应用都依赖异构数据源合并技术。
　　数据模式匹配作为异构数据源数据合并中的基本问题，其目标是通过从与数据模式相关的信息中提取有效特征信息来描述数据模式之间的相似程度，进而找出数据模式中所有元素之间的最佳对应关系。当前大部分的数据模式匹配工作通过手工完成，但是数据规模的膨胀和数据源之间的异构性使人工匹配工作变得繁杂、耗时且极易出错，因而人工匹配数据模式的代价变得非常昂贵，通过实现模式匹配过程自动化来降低该过程耗费的时间已经成为各个数据集成应用的主要任务。
　　经过多年的研究，目前在数据模式匹配领域已经许多不同类型的数据模式匹配方法，有依赖诸如字典等辅助信息的方法，也有依赖列名、列类型等数据模式描述信息的方法，也有一些依赖数据实例的方法。尽管不乏一些具有划时代意义的方法，但大多数方法还是缺乏领域无关性，因而仅对某个或者某几个特定领域的数据有效，缺乏通用性。
　　在本文中通过分析总结当前方法的匹配原理的基础上，从解决通用性和匹配效率两个角度出发，提出了一种基于有序互信息的非透明列名和列数据值的数据模式匹配方法，该方法不依赖数据模式描述信息，直接从数据实例中抽取特征信息建立相似模型，因此具有良好的通用性。在多个公开数据集上的实验结果表明该方法能够在大幅降低匹配花费时间的同时提高匹配结果的准确率。

著录项

作者
郭乐乐;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名董兴业;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
异构数据; 模式匹配; 非透明条件; 匹配效率;

相似文献

中文文献
外文文献
专利

1. 基于实例的GIS数据库模式匹配方法 [J] . 王育红 ,陈军 . 武汉大学学报：信息科学版 . 2008,第1期
2. 异构数据源间数据转换方法的研究与实现 [J] . 任义 ,凌玉华 ,廖力清 . 长沙通信职业技术学院学报 . 2006,第004期
3. 基于IEC61970标准的异构数据源间数据转换方法的研究与实现 [J] . 任义 ,凌玉华 ,蓼力清 . 安徽电力 . 2006,第004期
4. 基于异构多核平台的数据传输方法研究与实现 [J] . 谭磊 ,李益 ,付建国 . 黑龙江科技信息 . 2021,第001期
5. 基于异构多核平台的数据传输方法研究与实现 [J] . 谭磊 ,李益 ,付建国 . 科学技术创新 . 2021,第001期
6. 面向异构计算平台的列数据库调度方法研究与实现 [C] . LUO Wei-Liang ,罗伟良 ,LI Guan-Zhao . 2012全国高性能计算学术年会 . 2012
7. 基于实例聚类的数据库模式匹配方法研究 [A] . 张媛新 . 2013

基于实例的异构数据模式匹配方法研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅