【24h】

2-Way Text Classification for Harmful Web Documents

机译:有害网络文件的双向文本分类

获取原文

摘要

The openness of the Web allows any user to access almost any type of information. However, some information, such as adult content, is not appropriate for all users, notably children. Additionally for adults, some contents included in abnormal porn sites can do ordinary people’s mental health harm. In this paper, we propose an efficient 2-way text filter for blocking harmful web documents and also present a new criterion for clear classification. It filters off 0-grade web texts containing no harmful words using pattern matching with harmful words dictionaries, and classifies 1-grade,2-grade and 3-grade web texts using a machine learning algorithm.
机译:Web的开放性允许任何用户访问几乎任何类型的信息。但是,一些信息,例如成人内容,不适合所有用户,尤其是儿童。另外,对于成人来说,异常色情网站中包含的一些内容可以做普通的人们的心理健康危害。在本文中,我们提出了一种有效的2路文本滤波器,用于阻止有害的Web文件,并提出了一种清晰分类的新标准。它从包含与有害单词词典的模式匹配的模式匹配的0年级Web文本过滤,并使用机器学习算法对1年级,2级和3级Web文本进行分类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号