首页> 中文学位 >数据空间中基于数据世系的关联关系获取方法研究
【6h】

数据空间中基于数据世系的关联关系获取方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题的研究背景及意义

1.1.1 课题的研究背景

1.1.2 课题的意义

1.2 国内外研究现状

1.2.1 数据空间

1.2.2 数据世系

1.2.3 专利关联关系

1.3 主要研究内容和预期研究结果

1.4 论文的组织结构

第2章 相关技术理论基础

2.1 专利号分类体系

2.2 专利号共类分析

2.3 专利文本挖掘

2.3.1 主题词抽取

2.3.2 主题词相似度计算

2.4 本章小结

第3章 专利技术关联关系分析

3.1 专利信息分析

3.2 专利作者相同关系

3.3 专利分类号共类分析

3.3.1 IPC国际专利分类号

3.3.2 IPC专利分类树

3.3.3 基于IPC分类的专利相似性

3.4 基于文本挖掘专利技术关联

3.4.1 专利文本结构

3.4.2 专利文本相似度计算

3.5 多维融合专利相似度模型

3.6 本章小结

第4章 专利数据世系

4.1 专利世系关联网络

4.1.1 相关知识

4.1.2 专利世系关联网络构建

4.2 专利价值计算

4.2.1 专利价值评估算法

4.2.2 专利价值动态更新算法

4.3 本章小结

第5章 实验与结果分析

5.1 实验环境

5.2 数据采集及处理

5.2.1 专利数据抓取

5.2.2 专利数据库构建

5.3 实验结果与分析

5.3.1 综合语义相似性模型参数的选择

5.3.2 专利关联关系模型的准确率对比

5.3.3 专利价值评估算法对比分析

5.4 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

随着信息技术的不断发展,数据信息逐步呈现海量、多样、非结构化的特点。而传统的数据库技术已不能够对这些复杂数据进行有效的管理,新的数据管理模式——数据空间应运而生,其不但可以支持文档、Web等多种不同的异构数据源,而且具有集成演化的特性,强调数据之间的关联性及演化性。而专利文献中含有丰富的结构化信息及非结构化信息,本文选取海量专利数据进行分析,挖掘专利间潜在的技术关联关系并以此发现新颖专利。
  由于专利文献中引文的缺失以及作者引用动机难以判断,因此,不能直接使用引用关系作为专利技术关联的评价指标。针对这一问题,本文构建了专利间综合语义相似度模型,用以评估专利间的技术关联。首先,根据专利文献中包含的专利作者、IPC专利分类号等结构化信息分别构建了专利作者相同关系矩阵WA和基于IPC专利分类号共类关系矩阵WC;然后,针对专利标题、摘要、权利说明书等文本信息构建专利文本相似度矩阵WS,最后,进行多维融合构建综合语义相似度模型。
  接下来,引入时序因素并结合专利间综合语义相似度模型构建专利世系关联网络,根据专利数据世系分析相关技术的演化路径,以此来对专利价值进行评估,并挖掘新颖专利。首先利用专利世系关联网络中专利间潜在的直接或间接被引关系,综合考量专利价值随时间指数衰减因素及潜在的直接或间接被引的专利对专利价值的贡献度,提出专利价值评估算法;由于新加入的专利对原有专利世系关联网络中的专利的价值影响,为节省大量重复计算的时间,最后提出专利价值动态更新算法,当在T+1时刻新加入的专利与原有T时刻的专利存在潜在技术关联时,其价值为所有的邻接点的价值传递度之和,从而提高算法的计算效率。
  最后,使用专利数据集进行相关实验,经实验结果对比分析验证了专利综合语义相似度模型的准确性以及专利价值动态更新算法的高效性。

著录项

  • 作者

    王会会;

  • 作者单位

    哈尔滨工程大学;

  • 授予单位 哈尔滨工程大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 王念滨;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据空间; 关联关系; 时序因素; 数据世系;

  • 入库时间 2022-08-17 10:35:25

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号