首页> 外国专利> DEEP LEARNING-BASED METHOD FOR FILTERING OUT SIMILAR TEXT, AND APPARATUS USING SAME

DEEP LEARNING-BASED METHOD FOR FILTERING OUT SIMILAR TEXT, AND APPARATUS USING SAME

机译:基于深度学习的滤除方法方法以及使用该文本的装置

摘要

According to the present invention, provided is a method for collecting filtered text data, comprising the steps in which: a computing device acquires first text data and records the first text data in a text data pool; the computing device acquires second text data; the computing device performs a calculation in a deep learning model by using the first text data and the second text data as input values and calculates a first feature vector corresponding to the first text data and a second feature vector corresponding to the second text data; and the computing device compares the degree of similarity between the first feature vector and the second feature vector, and records the second text data in the text data pool when the degree of similarity is less than a predetermined value.
机译:根据本发明,提供了一种用于收集滤波的文本数据的方法,包括步骤:计算设备获取第一文本数据并将第一文本数据记录在文本数据池中;计算设备获取第二个文本数据;计算设备通过使用第一文本数据和第二文本数据作为输入值来执行深度学习模型中的计算,并计算与第一文本数据对应的第一特征向量和与第二文本数据相对应的第二特征向量;计算设备比较第一特征向量和第二特征向量之间的相似度,并且当相似度的程度小于预定值时,将第二文本数据记录在文本数据池中。

著录项

  • 公开/公告号WO2021118040A1

    专利类型

  • 公开/公告日2021-06-17

    原文格式PDF

  • 申请/专利权人 SELECT STAR INC.;

    申请/专利号WO2020KR14337

  • 发明设计人 KIM SE YEOB;

    申请日2020-10-20

  • 分类号G06F16/36;G06F16/35;G06N3/08;

  • 国家 KR

  • 入库时间 2022-08-24 19:26:57

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号