首页> 外国专利> GENERATION OF TRAINING DATA FOR VERBAL HARASSMENT DETECTION

GENERATION OF TRAINING DATA FOR VERBAL HARASSMENT DETECTION

机译：用于口头骚扰检测的培训数据

页面导航

摘要
著录项
相似文献

摘要

In some cases, one or more heuristics can be automatically generated using a small dataset of segments previously labeled by one or more domain experts. The generated one or more heuristics along with one or more patterns can be used to assign training labels to a large unlabeled dataset of segments. A subset of segments representing an occurrence of verbal harassment can be selected using the assigned training labels. Randomly selected segments can be used as being indicative of a non-occurrence of verbal harassment. The selected subset of segments and randomly selected segments can be used to train one or more machine learning models for verbal harassment detection.

机译：在某些情况下，可以使用先前由一个或多个域专家标记的段的小型数据集自动生成一个或多个启发式。生成的一个或多个启发式和一个或多个模式可以用于将训练标签分配给一个大型未标记的段数据集。可以使用指定的训练标签选择代表出现口头骚扰的段的子集。随机选择的段可以用作指示不发生的口头骚扰。所选择的段和随机选择的段的子集可用于训练一个或多个机器学习模型以进行口头骚扰检测。

著录项

公开/公告号WO2021138316A1

专利类型
公开/公告日2021-07-08

原文格式PDF
申请/专利权人 BEIJING DIDI INFINITY TECHNOLOGY AND DEVELOPMENT CO. LTD.;
展开▼

申请/专利号WO2020US67303
发明设计人 LYU YING;HAN KUN;
展开▼

申请日2020-12-29
分类号G06N5/02;G06N20;
国家 US
入库时间 2022-08-24 19:47:43

相似文献

专利
外文文献
中文文献