首页> 中国专利> 一种文本挖掘的特征词权重计算方法

一种文本挖掘的特征词权重计算方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供了一种文本挖掘的特征权重计算方法，将文本特征词的向量表征为分布式表达的实数值向量；根据表征特征词的分布式表达实数值向量，计算获取与该特征词关联度较大的特征词集；通过TextRank算法计算特征词的权重时，将两两特征词间的关联度加入到特征值权重的计算中；通过TextRank算法计算与该特征词关联度较大的其他特征词权重，即特征词集，并同样在计算中加入两两特征词间的关联度。采用本发明的技术方案，可以显著提高文本特征词权重的计算准确率，并能应用于文本的特征词抓取，文本分类和文本聚类中。

著录项

公开/公告号CN106372064B

专利类型发明专利
公开/公告日2019-04-19

原文格式PDF
申请/专利权人北京工业大学;
展开▼

申请/专利号CN201611020416.5
发明设计人崔宪坤;李建强;赵申荷;
展开▼

申请日2016-11-18
分类号
代理机构北京思海天达知识产权代理有限公司;
代理人张慧
地址 100124 北京市朝阳区平乐园100号
入库时间 2022-08-23 10:30:32

法律信息

法律状态公告日

法律状态信息

法律状态
2019-04-19

授权

授权
2017-03-01

实质审查的生效 IPC(主分类):G06F17/27 申请日:20161118

实质审查的生效
2017-03-01

实质审查的生效 IPC(主分类):G06F 17/27 申请日:20161118

实质审查的生效
2017-02-01

公开

公开
2017-02-01

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种文本挖掘的特征词权重计算方法 [P] . 中国专利： CN106372064B . 2019.04.19
2. 一种文本挖掘的特征词权重计算方法 [P] . 中国专利： CN106372064A . 2017-02-01
3. QUESTION WORD WEIGHT CALCULATION APPARATUS, QUESTION ANSWER RETRIEVAL APPARATUS, QUESTION WORD WEIGHT CALCULATION METHOD, QUESTION ANSWER RETRIEVAL METHOD, PROGRAM AND RECORD MEDIUM [P] . 日本专利： JP2019008367A . 2019-01-17

机译：问题词权重计算设备，问题答案权重设备，问题词权重计算方法，问题答案权重方法，程序和记录介质
4. Information exchange community's e.g. wikipidea site, element weight calculating method for use in e.g. Internet, involves determining linear system connecting weight associated to members and weight associated to content [P] . 法国专利： FR2914456A1 . 2008-10-03

机译：信息交流社区的wikipidea网站，元素权重计算方法，例如互联网涉及确定连接成员相关权重和内容相关权重的线性系统
5. MASK CALCULATION DEVICE, CLUSTER WEIGHT LEARNING DEVICE, MASK CALCULATION NEURAL NETWORK LEARNING DEVICE, MASK CALCULATION METHOD, CLUSTER WEIGHT LEARNING METHOD, AND MASK CALCULATION NEURAL NETWORK LEARNING METHOD [P] . 美国专利： US2020143819A1 . 2020-05-07

机译：掩码计算设备，集群权重学习设备，掩码计算神经网络学习设备，掩码计算方法，集群权重学习方法以及掩码计算神经网络学习方法