首页> 外国专利> GENERATION OF TRAINING DATA FOR VERBAL HARASSMENT DETECTION

GENERATION OF TRAINING DATA FOR VERBAL HARASSMENT DETECTION

机译:用于口头骚扰检测的培训数据

摘要

In some cases, one or more heuristics can be automatically generated using a small dataset of segments previously labeled by one or more domain experts. The generated one or more heuristics along with one or more patterns can be used to assign training labels to a large unlabeled dataset of segments. A subset of segments representing an occurrence of verbal harassment can be selected using the assigned training labels. Randomly selected segments can be used as being indicative of a non-occurrence of verbal harassment. The selected subset of segments and randomly selected segments can be used to train one or more machine learning models for verbal harassment detection.
机译:在某些情况下,可以使用先前由一个或多个域专家标记的段的小型数据集自动生成一个或多个启发式。生成的一个或多个启发式和一个或多个模式可以用于将训练标签分配给一个大型未标记的段数据集。可以使用指定的训练标签选择代表出现口头骚扰的段的子集。随机选择的段可以用作指示不发生的口头骚扰。所选择的段和随机选择的段的子集可用于训练一个或多个机器学习模型以进行口头骚扰检测。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号