首页> 中文学位 >基于多视图专利聚类和时序分析的技术演化追踪研究
【6h】

基于多视图专利聚类和时序分析的技术演化追踪研究

代理获取

目录

摘要

图目录

表目录

第1章 绪论

1.1 研究背景

1.2 研究内容及意义

1.3 本文的主要工作综述

1.4 本文的组织结构

1.5 本章小结

第2章 理论基础和相关技术

2.1 主题模型(Topic Model)

2.1.1 潜在语义分析(LSA)

2.1.2 概率潜在语义分析(PLSA)

2.1.3 潜在狄利克雷分配模型(LDA)

2.2 多视图学习

2.3 聚类分析

2.3.1 K-means聚类

2.3.2 谱聚类(Spectral Clustering)

2.4 本章小结

第3章 多视图专利聚类

3.1 专利数据分析

3.2 多视图构建

3.2.1 相同作者关系

3.2.2 基于树距离的IPC分类相似性

3.2.3 文档相似度

3.3 多视图融合及算法与实现

3.4 本章小结

第4章 基于概率潜在语义分析的技术演化追踪

4.1 自适应宽度滑动窗口法

4.1.1 朴素滑动窗口法

4.1.2 窗口大小的选择

4.2 增量式概率潜在语义分析

4.3 检测新兴技术与热门词汇

4.3.1 新兴技术检测

4.3.2 热门词汇分析

4.4 本章小结

第5章 实验结果和分析

5.1 实验数据集

5.1.1 实验软硬件环境

5.2 算法评价标准

5.2.1 准确率(AC)

5.2.2 共同信息(MI)

5.3 实验结果及分析

5.3.1 多视图专利聚类实验

5.3.2 多视图融合参数的选择

5.3.3 新兴技术检测

5.4 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

随着科技的日益发展,专利越来越受到人们的重视。由于专利数据几乎涵盖了所有领域的科技创新成果,因此如果对专利数据进行研究,就可以得到每个行业的发展情况。每年新申请的专利数量非常之多,而专利中又蕴含了丰富的信息,如何对专利数据进行研究和分析成为了当前研究的热点问题。
  本文针对这一点,利用专利中丰富的结构化信息和非结构化信息构建出专利之间的相同作者关系矩阵、基于树距离的相似性矩阵和专利文本的相似性矩阵,之后对这三个视图进行加权融合,利用谱聚类算法对专利数据进行聚类。之后,提出了基于自适应宽度滑动窗口法及针对专利数据优化的增量式概率潜在语义分析的新兴技术检测算法,对聚类得到的结果进行时序分析,并通过实验对算法的效果进行了展示。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号