首页> 外文会议>Workshop on Arabic Natural Language Processing >Adult Content Detection on Arabic Twitter: Analysis and Experiments
【24h】

Adult Content Detection on Arabic Twitter: Analysis and Experiments

机译:阿拉伯语推特上的成人内容检测:分析和实验

获取原文

摘要

With Twitter being one of the most popular social media platforms in the Arab region, it is not surprising to find accounts that post adult content in Arabic tweets; despite the fact that these platforms dissuade users from such content. In this paper, we present a dataset of Twitter accounts that post adult content. We perform an in-depth analysis of the nature of this data and contrast it with normal tweet content. Additionally, we present extensive experiments with traditional machine learning models, deep neural networks and contextual em-beddings to identify such accounts. We show that from user information alone, we can identify such accounts with F1 score of 94.7% (macro average). With the addition of only one tweet as input, the F1 score rises to 96.8%.
机译:随着Twitter是阿拉伯地区最受欢迎的社交媒体平台之一,发现在阿拉伯语推文中发布成人内容的帐户并不奇怪; 尽管这些平台劝阻用户免受这样的内容。 在本文中,我们提供了成人内容的Twitter帐户的数据集。 我们对此数据的性质进行了深入的分析,并将其与正常的推文内容进行了对比。 此外,我们对传统的机器学习模型,深神经网络和上下文EM-床单进行了广泛的实验,以确定此类帐户。 我们展示了从用户信息中,我们可以识别此类账户,F1得分为94.7%(宏观平均值)。 只需添加一个推文作为输入,F1得分上升到96.8%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号