首页> 中国专利> 一种基于多模态信息特征的不良内容过滤方法

一种基于多模态信息特征的不良内容过滤方法

摘要

本发明提出了一种基于多模态信息特征的不良内容过滤方法,将文本集划分为训练集与测试集,将分词结果和关键词输入到分类算法,提取文本特征,训练分类器;将训练好的分类器用于预测测试集,得到文本分类结果;将文本集和关键词集转为图像数据,将数据图像集与文本集相对应,划分为对应的训练集与测试集,进行相似度计算,得到相似度最大值集合以及最大值对应的关键词集合,如果该关键词集合的关键词满足阈值约束,则匹配成功,则该关键词为相似度最大值对应的关键词,作为图像分类结果;对比文本分类结果与图像分类结果,根据判别条件得到最终的类别预测结果,以过滤该不良内容。

著录项

  • 公开/公告号CN109902223B

    专利类型发明专利

  • 公开/公告日2020-12-04

    原文格式PDF

  • 申请/专利权人 中国科学院信息工程研究所;

    申请/专利号CN201910032064.2

  • 发明设计人 黄龙涛;马婷;虎嵩林;韩冀中;

    申请日2019-01-14

  • 分类号G06F16/9535(20190101);G06F16/9536(20190101);G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构11200 北京君尚知识产权代理有限公司;

  • 代理人俞达成

  • 地址 100093 北京市海淀区闵庄路甲89号

  • 入库时间 2022-08-23 11:24:19

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号