首页> 中国专利> 训练样本生成、文本数据、舆情事件分类方法及相关设备

训练样本生成、文本数据、舆情事件分类方法及相关设备

页面导航

摘要
著录项
相似文献

摘要

本申请公开了训练样本生成、文本数据、舆情事件分类方法及相关设备，在本申请实施例提供的训练样本生成方法中，首先对文本数据进行聚类处理，因为文本数据被聚类，当找到一个目标类别对应的聚类结果后，只需要在其对应的聚类结果中去选择符合目标类别条件的文本数据然后进行类别标注，就可以得到这个目标类别的训练样本，而不用再去分析其他聚类中的文本数据是否存在符合目标类别条件的情况。因此，极大的缩小了文本数据的选择范围，提高了标注的效率和样本的准确性，缩短了标注文本数据的时间。同时，提升了文本数据分类和舆情事件分类过程的效率和准确性。

著录项

公开/公告号CN109299271B

专利类型发明专利
公开/公告日2022-04-05

原文格式PDF
申请/专利权人腾讯科技(深圳)有限公司;
展开▼

申请/专利号CN201811278481.7
发明设计人袁恺村;
展开▼

申请日2018-10-30
分类号G06F16/35(20190101);G06F16/9535(20190101);G06F40/289(20200101);G06F40/30(20200101);
代理机构44285 深圳市深佳知识产权代理事务所(普通合伙);
代理人王仲凯
地址 518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层
入库时间 2022-08-23 13:24:29

相似文献

专利
中文文献
外文文献

1. 训练样本生成、文本数据、舆情事件分类方法及相关设备 [P] . 中国专利： CN109299271A . 2019-02-01
2. 舆情文本分类模型构建和舆情文本分类方法、装置及设备 [P] . 中国专利： CN110674297B . 2022.04.29
3. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16
4. 一种训练样本有效性检测方法、计算机设备及计算机非易失性存储介质 [P] . 世界知识产权组织专利： WO2020/143301A1 . 2020.07.16
5. 群体信息分类方法、装置、计算机设备和存储介质 [P] . 世界知识产权组织专利： WO2020/143305A1 . 2020.07.16