利用词嵌入模型实现基于网站访问日志的专利聚类研究

文奕; 陈文杰; 张鑫; 杨宁; 赵爽

首页> 中文期刊>现代情报 >利用词嵌入模型实现基于网站访问日志的专利聚类研究

利用词嵌入模型实现基于网站访问日志的专利聚类研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

[目的/意义]专利信息是人类科学技术进步的结晶,随着社会的发展,专利信息将为促进科技创新发挥日益重要的作用.利用聚类技术可以将海量专利信息进行自动分类,在实现信息有序归并管理的同时,有助于用户高效而全面的获取相关技术领域中的集成专利信息,具有重要的现实意义,传统聚类研究方法效率与准确度存在不足.[方法/过程]本文通过对专利信息服务网站(中国科学院知识产权网)访问日志数据的清洗与分析,生成专利信息点击序列,基于深度学习词嵌入模型,设计了PatentFreq2Vec模型,计算得出专利关联信息.[结果/结论]利用 PatentFreq2Vec模型分析计算访问日志数据,能够得到关联专利信息,实现专利聚类,且聚类准确度高于传统方法.%[Purpose/Significance]Patent information is the fruit of the progress of science and technology.With the development of society, patent information will play an increasingly important role in promoting scientific and technolog-ical innovation.Through patent clustering analysis, it is possible to aggregate isolated information according to different ag-gregation degree, so that they can be transformed from ordinary information to valuable Patent Competitive intelligence.The traditional clustering methods have some efficiency and accuracy problems.[Method/Process]Based on cleaning and anal-ysis access log data of the patent information service website(Intellectual property network of the Chinese Academy of Sci-ences), the sequence data of patent clicking were generated and input into the PatentFreq2Vec model based on word em-bedding to obtaine patent related information with the learning algorithm.[Result/Conclusion]This could cluster the pa-tents and improve accuracy of the patent clustering.

著录项

来源
《现代情报》|2018年第4期|112-117|共6页
作者
文奕; 陈文杰; 张鑫; 杨宁; 赵爽;
展开▼
作者单位

中国科学院成都文献情报中心,四川成都610041;

中国科学院成都文献情报中心,四川成都610041;

中国科学院成都文献情报中心,四川成都610041;

中国科学院成都文献情报中心,四川成都610041;

中国科学院成都文献情报中心,四川成都610041;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理技术;
关键词
专利; 聚类; 深度学习; 词嵌入; 访问日志;

相似文献

中文文献
外文文献
专利

1. 利用集合差异度实现基于内容聚类的P2P搜索模型 [J] . 王菁 ,张焕杰 ,杨寿保 . 中国科学院研究生院学报 . 2007,第002期
2. 基于深度神经网络的医药专利文本聚类模型研究 [J] . 王思源 ,何先波 . 太原师范学院学报（自然科学版） . 2021,第003期
3. 基于聚类算法的异常入侵检测模型的研究与实现 [J] . 李涵 ,包立辉 . 计算机应用与软件 . 2006,第010期
4. 技术型专利通过战略联盟实现产业化的进入模型研究: 基于专有资产投资的角度 [J] . 龙勇 ,李薇 ,李根道 . 科技管理研究 . 2006,第008期
5. 利用已实现极差预测市场波动率——基于ARFIMA-Realized GARCH模型的实证研究 [J] . 覃思程 . 经济论坛 . 2018,第001期
6. 基于用户日志聚类的查询扩展模型 [C] . 吴京慧 ,余珊珊 ,王明文 . 第三届全国信息检索与内容安全学术会议 . 2007
7. 基于Web日志挖掘的网站访问分析系统的设计与实现 [A] . 李振红 . 2009

利用词嵌入模型实现基于网站访问日志的专利聚类研究

摘要

著录项

相似文献

相关主题

期刊订阅