混合的大规模数据库自动模式抽象方法

王雪; 周烜; 王珊

首页> 中文期刊> 《计算机学报》 >混合的大规模数据库自动模式抽象方法

混合的大规模数据库自动模式抽象方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

随着数据库规模的扩大,其模式的复杂度也不断地增加,复杂的模式和文档的缺乏使得理解和操作数据库更加困难.现有的模式抽象方法大多通过关系表中的主外键信息查找出模式中最重要的表,然后使用这些最重要的表来构成单层次的模式总结.在现实应用中,这些模式总结的主题并不明确.文中陈述了现有方法的不足,然后给出了一种为大规模数据库生成多层次模式抽象的方法.在此方法中,首先使用不同类型的社区社团检测算法来将数据库模式划分为“团”,然后使用元聚类方法将这些“团”集成为数据库的主题组,每一个主题组代表数据库的一个主题.最后将这些主题组进行进一步的聚类以生成主题组类,并为每一个主题组类挑选标签以生成多层次的模式抽象.在Freebase——开源的大规模数据库上验证了文中算法的有效性.实验证明文中算法不仅能够精确地识别大规模数据库的主题,同时可以依据数据库的主题生成易于理解、能够帮助用户浏览和检索数据库的多层次模式抽象.%The complexity of database schemas and the lack of documentations usually make databases difficult to use.Some existing solutions attempt to identify the most important tables based on the foreign key relationships and use these tables as a summary of the database schema.However,in real world scenarios,the schema summaries generated by these approaches may fail to capture the subjects of the databases.In this paper,we describe the limitations of the previous approaches,and propose a principled method to summarize large-scale database schemas.Firstly,we partition a data-base schema into communities through a number of community detection algorithms.Then,we integrate these results into a set of groups,each presenting a subject.Finally,we cluster the subject groups into abstract domains to form a multi-level navigation structure.Our approach is evaluated on Freebase,a real world large-scale database.The results show that our approach can identify subject groups precisely and the generated abstract schema layers are very helpful for users to explore a data-base.

著录项

来源
《计算机学报》 |2013年第8期|1616-1625|共10页
作者
王雪; 周烜; 王珊;
展开▼
作者单位

数据工程与知识工程教育部重点实验室(中国人民大学)北京100872;

中国人民大学信息学院北京 100872;

中国人民大学信息学院北京 100872;

数据工程与知识工程教育部重点实验室(中国人民大学)北京100872;

中国人民大学信息学院北京 100872;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
模式; 抽象; 大规模数据库; 主题组; 混合;

相似文献

中文文献
外文文献
专利

1. 混合的大规模数据库自动模式抽象方法研究 [J] . 雷萌 ,孙海霞 . 安徽电子信息职业技术学院学报 . 2015,第004期
2. 大规模混合网络数据库模糊查询算法改进仿真 [J] . 云微 . 计算机仿真 . 2020,第005期
3. 大规模混合数据库分层高效访问仿真研究 [J] . 侯晓凌 . 计算机仿真 . 2019,第008期
4. 混合的大规模数据库中数值型数据聚类算法研究 [J] . 何育朋 . 微电子学与计算机 . 2017,第2期
5. 大规模混合数据库缓冲区替换方法优化仿真 [J] . 陆云帆 ,诸振家 ,孙洁 . 计算机仿真 . 2016,第008期
6. 混合的大规模数据库自动模式抽象方法 [C] . WANG Xue ,王雪 ,ZHOU Xuan . 第30届中国数据库学术会议 . 2013
7. 面向HTAP的大规模分布式数据库混合存储引擎 [A] . 姚入榕 . 2020

混合的大规模数据库自动模式抽象方法

摘要

著录项

相似文献

相关主题

期刊订阅