首页> 中国专利> 一种基于谓词的多源数据集清洗方法

一种基于谓词的多源数据集清洗方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出一种基于谓词的多源数据集清洗方法所提供的方法能够有效从同构多源数据集中识别出最可靠的数据项，涉及数据清洗、数据融合等领域。所述方法包括：1)用自动化方法挖掘谓词，并对挖掘出来的谓词进行过滤；2)根据谓词推导数据集中各实体的属性值的可信度；3)建立属性值可信度跟数据源可信度之间的关系，计算数据源可信度；4)结合数据源可信度和属性值可信度找出可信度最高的数据项。对于多个数据源，本发明可以对来自不同数据源但内容相同的信息进行分析，过滤掉冗余、错误和过时的数据，留下可信度最高的数据，为后续数据分析夯实基础，对后续数据处理的效率和准确率具有重要意义。

著录项

公开/公告号CN108776697A

专利类型发明专利
公开/公告日2018-11-09

原文格式PDF
申请/专利权人南京大学;
展开▼

申请/专利号CN201810578708.3
发明设计人谢子哲;李论;刘奇志;
展开▼

申请日2018-06-06
分类号
代理机构南京瑞弘专利商标事务所(普通合伙);
代理人陈建和
地址 210093 江苏省南京市鼓楼区汉口路22号
入库时间 2023-06-19 07:04:59

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-09

授权

授权
2018-12-04

实质审查的生效 IPC(主分类):G06F17/30 申请日:20180606

实质审查的生效
2018-11-09

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于谓词的多源数据集清洗方法 [P] . 中国专利： CN108776697B . 2020.06.09
2. 一种基于多源时空数据集成的城市资源环境承载力综合评价方法 [P] . 中国专利： CN113887974A . 2022-01-04
3. Submarine topography construction method based on multi-source water depth data integration [P] . 美国专利： US9361728B2 . 2016-06-07

机译：基于多源水深数据集成的海底地形构建方法
4. SUBMARINE TOPOGRAPHY CONSTRUCTION METHOD BASED ON MULTI-SOURCE WATER DEPTH DATA INTEGRATION [P] . 美国专利： US2015243074A1 . 2015-08-27

机译：基于多源水深数据集成的海底地形构造方法
5. METHOD FOR PROVIDING A SET OF DATA RELATIVE TO A WEARER OF AN OPHTHALMIC EQUIPMENT AND METHOD FOR DETERMINING THE OPHTHALMIC EQUIPMENT BASED ON THE SET OF DATA [P] . 欧洲知识产权局专利： EP3208737A1 . 2017-08-23

机译：提供一种与眼科设备佩戴者有关的数据集的方法以及一种基于该数据集确定眼科设备的方法