USPTO专利发明人重名辨识方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

专利发明人重名辨识通过区分专利数据库中具有相同或相似姓名的发明人，将每个发明人与其专利对应起来，该研究有助于优化专利数据库、提升专利发明人评价和推荐准确性、促进竞争情报学科发展等。本研究通过对国内外现有的重名辨识方法进行研究分析，发现:规则方法重名辨识环境适应性较差;机器学习方法虽然能够有效辨识专利发明人，但是其时间成本较高。
　　因此，本研究提出了基于语义指纹和DBSCAN聚类的专利发明人重名辨识方法。该方法基于专利的元数据特征和文本特征生成128位语义指纹，给每篇专利的每个发明人赋予一个指纹值，将字符串成对比较转换为二进制指纹值的成对比较，提高方法运行效率，实现在较短时间内有效完成发明人重名辨识的研究目的。
　　本研究选择2015年USPTO专利发明人姓名消歧竞赛中的IS和E&S数据集进行实验。首先，IS和E&S数据集有标签、规模较大;其次，这两个数据集经过广泛地研究测试，已被作为标准的专利发明人重名辨识方法评测数据。
　　本研究选取查准率、查全率和F1值评价指标评价本文方法的重名辨识有效性，选取方法运行时间评价本文方法的时间成本，而方法运行时间包含数据处理时间、参数估计时间和方法消歧时间。本研究在IS和E&S实验数据集上测得F1值分别为94.69％、96.54％，证明本文方法具有较好的重名辨识效果;本文在1200万条专利数据上测得方法运行时间约为4.54小时、方法消歧时间约为3.6分钟，这证明本文方法具有较低的时间成本;本文方法不仅可以在较低的机器配置环境下运行，而且需要的数据存储空间较小，这证明本文方法实用性较强。
　　结论:基于语义指纹和DBSCAN聚类的方法不仅可以在较短时间内较为精确地重名辨识专利发明人，而且方法实用性较强。

著录项

作者
于永胜;
展开▼
作者单位

中国科学技术信息研究所;

展开▼
授予单位中国科学技术信息研究所;
学科竞争情报
授予学位硕士
导师姓名董诚,韩红旗;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类理论方法;
关键词
专利发明人; 重名辨识; 数据吃力; 语义指纹;

相似文献

中文文献
外文文献
专利

1. USPTO专利发明人重名辨识方法综述 [J] . 于永胜 ,董诚 ,韩红旗 . 天津科技 . 2018,第002期
2. 中文专利发明人重名消解问题研究 [J] . 邢晓昭 ,郑彦宁 . 数字图书馆论坛 . 2018,第10期
3. 专利发明人英文重名识别判据及效度比较分析 [J] . 王道仁 ,杨冠灿 ,傅俊英 . 数字图书馆论坛 . 2016,第8期
4. 数据缺失时基于BP神经网络的作者重名辨识研究 [J] . 柯昊 ,李天 ,周悦 . 情报学报 . 2018,第006期
5. 作者重名辨识研究进展 [J] . 袁军鹏 ,俞征鹿 ,苏成 . 数字图书馆论坛 . 2011,第010期
6. 基础测绘生产中图名重名查找方法的研究 [C] . 沙富家 . 江苏省测绘学会2009年学术年会 . 2009
7. 中国专利发明人的国际流动问题研究 [A] . 王道仁 . 2016

USPTO专利发明人重名辨识方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅