首页> 中国专利> 一种缺少负例的文本分类方法

一种缺少负例的文本分类方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种缺少负例的文本分类方法，属于机器学习和文本分类技术领域。该方法首先确定待分类的数据文本，并自定义文本分类类别；然后基于获取的语料库训练TF‑IDF模型和LSI模型；然后基于训练好的TF‑IDF模型和LSI模型分别构建文本的特征向量，并基于ensemble方法构建组合的文本特征向量；然后采用ROC‑SVM组合算法，训练Basic分类器，并且可结合k‑means聚类方法进行Basic分类器的训练，同时训练label分类器；最后将待分类的文本首先采用Basic分类器进行初始分类，并用Elasticsearch进行筛选，确定候选分类，再采用label分类器将待分类文档准确的分入自定义类别中的一类或者几类中。本发明的方法能够有效地对缺少负例的文本数据进行分类，准确率高、效果好、效率高。

著录项

公开/公告号CN110795564A

专利类型发明专利
公开/公告日2020-02-14

原文格式PDF
申请/专利权人南京稷图数据科技有限公司;
展开▼

申请/专利号CN201911058163.4
发明设计人吴刚;王楠;
展开▼

申请日2019-11-01
分类号
代理机构江苏瑞途律师事务所;
代理人刘琦
地址 210000 江苏省南京市秣周东路12号南京未来科技城3号楼1805室
入库时间 2023-12-17 06:34:29

法律信息

法律状态公告日

法律状态信息

法律状态
2020-03-10

实质审查的生效 IPC(主分类):G06F16/35 申请日:20191101

实质审查的生效
2020-02-14

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种缺少负例的文本分类方法 [P] . 中国专利： CN110795564B . 2022.02.22
2. 一种文本检测训练集中增加特殊负例的方法 [P] . 中国专利： CN113011299A . 2021-06-22
3. Text automatic classification device, text automatic classification program, and computer-readable recording medium recording the text automatic classification method and text automatic classification program [P] . 日本专利： JP4711556B2 . 2011-06-29

机译：文本自动分类装置，文本自动分类程序以及记录该文本自动分类方法和文本自动分类程序的计算机可读记录介质
4. A method of classifying text units based on scores, computer program product and computer therefor [P] . 德国专利： DE112013002187T5 . 2015-01-08

机译：一种基于分数的文本单元分类方法，计算机程序产品及其计算机
5. Se proporciona un aparato y método para una fuente de alimentación eléctrica digital que puede proporcionar el control independiente de potencia para dos o más cargas eléctricas. Algunas formas de realización divulgadas proporcionan potencia continua y variable, mientras que Otras formas de realización divulgadas proporcionan niveles de potencia discretos. Algunas formas de realización descritas pueden reducir la magnitud de corrientes armónicas y/o flicker introducidos en un sistema de potencia. Algunas formas de realización incluyen un microprocesador que entrega potencia a cargas eléctricas utilizando corriente alterna de fase controlada. En algunas formas de realización, el microprocesador puede calcular una matriz de potencia correspondiente a una potencia solicitada para cada carga eléctrica, Se proporciona una lógica para llenar las matrices de potencia en un patrón que reduce la magnitud de las corrientes armónicas y flicker. Las porciones de la divulgación incluyen un controla [P] . CL2019003699A1 . 2020-05-08

机译：提供了一种用于数字电源的设备和方法，其可以为两个或更多个电负载提供独立的功率控制。一些公开的实施例提供连续的和可变的功率，而其他公开的实施例提供离散的功率电平。一些描述的实施例可以减小引入电力系统中的谐波和/或闪烁电流的大小。一些实施例包括微处理器，该微处理器使用相控交流电将功率传递给电负载。在一些实施例中，微处理器可以为每个电负载计算与所请求的功率相对应的功率矩阵，提供逻辑以减小谐波和闪烁电流的大小的模式来填充功率矩阵。披露部分包括支票