中文微博僵尸粉检测技术研究

摘要

微博(microblog)以强势的劲头在世界范围内迅速的发展壮大,随之而来的是大量的僵尸粉正逐渐包围整个“微博世界”。僵尸粉即机器注册或操纵的,以发送包含恶意链接、垃圾广告微博或者中奖信息的在内的恶意信息为目的的微博帐号。对于检测隐蔽性很高的活跃僵尸粉,目前的技术还很薄弱。本文以研究僵尸粉中的活粉的自动检测问题为目的,通过设计包括用户微博信息类特征和用户个人信息类特征等多种类型的特征,训练了分类器,并对生成的检测模型进行了多个实验。经实验结果表明,本文中的模型可以准确的检测出活粉,对于检测疑似活粉更具效率。经特征选择分析结果表明,对于检测活粉最有效的特征是:用户微博数特征、用户简介特征、用户域名特征、用户昵称可疑度特征、原创微博图特征、转发微博评论特征。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号