首页> 中文学位 >基于信息融合的专利相似度研究——以新一代移动通信技术为例
【6h】

基于信息融合的专利相似度研究——以新一代移动通信技术为例

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 研究背景及意义

1.2 研究思路与内容结构

1.3 主要方法与可能的创新点

2 国内外研究综述

2.1 专利相似度

2.2 基于引文分析的专利相似度研究现状

2.3 基于文本挖掘的专利相似度研究

2.4 信息融合研究概况

2.5 本章小结

3 专利相似度计算理论基础

3.1 融合模型

3.2 基于专利耦合的专利相似度计算方法

3.2.1 耦合分析计算专利相似度的适用性

3.2.2 专利分类体系

3.2.3 耦合强度

3.3 基于文本挖掘的专利相似度计算方法

3.4 基于概率主题模型的专利相似度计算方法

3.4.1 概率主题模型

3.5 基于信息融合的专利相似度计算方法

3.6 本章小结

4 实证研究

4.1 新一代移动通信技术简介

4.2 专利数据获取

4.3 专利技术相似度计算

4.3.1 基于引用分析的专利相似度计算

4.3.2 基于向量空间模型的专利相似度计算

4.3.3 基于LDA主题模型的专利相似度计算

4.3.4 数据标准化

4.3.5 多种相似度之间的独立性验证

4.4 基于信息融合的相似度计算

4.4 本章小结

5 结论与展望

5.1 主要结论

5.2 研究局限性

5.3 后续研究

参考文献

作者简介

学位论文数据集

展开▼

摘要

相似专利是技术相似性、竞争性的体现,表征了企业技术层面的竞争态势分布,通过测量专利相似度从而发现相似专利对专利侵权检测、专利检索、企业竞争分析、专利布局、新技术识别、专利规避、侵权检测、专利诉讼、专利预警等都具有重大意义。目前研究专利相似度的方法主要集中于专利引文和专利文本。这两种方法分别从单一信息源对专利的相似度进行了刻画,都还有一定缺陷。本文提出基于多源信息融合理论,通过线性加权模型对专利相似度进行融合的方法。在通过专利引文计算专利相似度的方法中选择专利耦合,在通过专利文本计算专利相似度的方法中选择了向量空间模型和LDA(latent dirichlet allocation)主题模型,综合考虑专利引文和专利文本对专利相似度的影响,通过遗传算法对三种方法所得的专利相似度赋予不同的权重从而调节各方法对相似度计算影响的大小,从而从而准确地计算专利相似度。该方法与其他方法相比,信息来源更加全面广泛,权重刻画较为客观,从而使专利相似度计算更加准确。
  本文是提出理论再选择数据加以实证的过程。选择新一代移动通信技术领域的专利为例,分别计算了基于专利耦合的引文相似度和基于向量空间模型、基于LDA主题模型的文本相似度。相似度的对比分析发现:同样的专利数据集,基于专利耦合和向量空间模型所计算的相似度普遍较小,大多分布在0-0.1区间段。基于专利耦合所计算的相似度大多为0。基于LDA主题模型所计算的相似度大多分布在0.6-0.8区间段。在对各方法所计算出的专利相似度进行标准化处理后,比较结果之间的相关性,确认结果之间无强相关关系之后将其融合。通过精确率,召回率,F值,MAP值评价各相似度。发现通过信息融合之后的专利相似度在精确率,召回率,F值上都有提高,在MAP值上并无提高。最后在上述研究和实证的基础上,总结了本文的结论和展望,以期提升相似度计算效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号