首页> 外国专利> TRAINING SAMPLE GENERATION METHOD AND DEVICE FOR TEXT CLASSIFICATION, AND COMPUTER APPARATUS

TRAINING SAMPLE GENERATION METHOD AND DEVICE FOR TEXT CLASSIFICATION, AND COMPUTER APPARATUS

机译:用于文本分类的训练样本生成方法和装置以及计算机设备

摘要

A training sample generation method and device for text classification, and a computer apparatus, applied to the technical field of classification models. The method comprises: acquiring a first classification result of a pre-trained first text classification model for a feature vector of actual text (S110); inputting the feature vector of the actual text to a pre-trained second text classification model so as to acquire a second classification result, wherein the second text classification model is used to test whether the first classification result of the first classification model is correct (S120); determining, by means of comparison, whether the first classification result is identical to the second classification result (S130); and if so, determining that the first classification result is correct, and storing the feature vector of the actual text and the first classification result as a training sample in a database, wherein the training sample is used for training a text classification model in a model training stage (S140).
机译:用于文本分类的训练样本生成方法和装置以及计算机设备,应用于分类模型的技术领域。该方法包括:获取针对实际文本的特征向量的预训练的第一文本分类模型的第一分类结果(S110);将实际文本的特征向量输入训练后的第二文本分类模型中,获取第二分类结果,所述第二文本分类模型用于测试所述第一分类模型的第一分类结果是否正确(S120) );通过比较确定所述第一分类结果与所述第二分类结果是否相同(S130);如果是,则确定所述第一分类结果正确,并将所述实际文本的特征矢量和所述第一分类结果作为训练样本存储在数据库中,所述训练样本用于训练模型中的文本分类模型训练阶段(S140)。

著录项

  • 公开/公告号WO2020215563A1

    专利类型

  • 公开/公告日2020-10-29

    原文格式PDF

  • 申请/专利权人 PING AN TECHNOLOGY (SHENZHEN) CO. LTD.;

    申请/专利号WO2019CN103014

  • 发明设计人 SHI MINGCHUAN;

    申请日2019-08-28

  • 分类号G06F16/35;

  • 国家 WO

  • 入库时间 2022-08-21 11:08:51

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号