首页> 中文学位 >大数据处理技术在专利数据分析中的应用研究
【6h】

大数据处理技术在专利数据分析中的应用研究

代理获取

目录

1.概述

1.1 专利文献与专利信息处理简介

1.2 专利文献大数据处理的意义

1.3 大数据的概念与发展简述

1.4 大数据技术应用简况

1.5 本文主要研究开发内容

2.专利大数据处理平台体系结构

2.1 数据源层

2.2 Spark大数据框架层

2.3 应用系统层

3.专利数据审查质量分析

3.1 专利数据审查质量简介

3.2 基于KNN的专利数据审查质量软件实现算法

3.3 影响模型准确性的因素

4.低质量专利大数据分析

4.1 低质量专利数据分析算法思路

4.2 低质量专利数据分析算法描述

5.1 大数据基础平台

5.2 大数据分析工具

5.3 基于spark的低质量专利数据聚类分析软件实现

5.4 软件评价

6.总结

致谢

参考文献

展开▼

摘要

专利文献具有数据量大、类型复杂,蕴含信息丰富的特点。但是,目前常用的专利文献处理信息化平台对海量专利文献数据的处理能力不足,缺乏对专利文献进行系统分析与深度信息挖掘的能力。为了解决这些问题,本文课题围绕大数据技术在专利数据分析中的应用展开了研究开发。
  作者调查了专利审查工作,尤其是专利数据审查质量分析与低质量专利分析的应用需求;研究了大数据处理与分析的相关技术;设计了专利大数据处理平台的体系结构(主要包括应用系统、Spark大数据框架、数据源三大组成部分)。研究了K-近邻算法、关联规则算法,以及聚类算法在专利数据分析处理中的应用方法。
  在理论研究的基础上,基于Linux操作系统、Spark2.1.0、R3.3.2构建了专利大数据处理平台,基于Spark R与Mlib环境,应用基于R的W e b交互界面的应用框架软件包Shiny、可在Spark中进行数据分析的R语言包Sparklyr,以及R语言开发实现了低质量专利数据聚类分析软件。
  本软件以外观专利申请中的低质量案件为对象,获取其主分类号等数据集,存储在分布式文件系统h d fs中;应用R语言调用Sparklyr连接Spark计算框架;通过K均值聚类软件进行聚类输出,获得数据分析结果,再通过R程序进行可视化;使用shiny与用户进行Web交互。
  目前,低质量专利数据聚类分析软件已在某公司正常运行,可对低质量专利数据进行聚类分析;可根据颜色,位置,聚合程度来直观显示聚类效果。运行结果表明,本软件对于辅助专利机构提高审查效率与专利服务水平,推进专利处理信息化具有很好的实用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号