首页> 中文期刊>数据分析与知识发现 >基于主成分分析和随机森林的恶意网站评估与识别

基于主成分分析和随机森林的恶意网站评估与识别

     

摘要

【目的】充分利用网站多源评测指标,研究恶意网站的评估和识别问题。【方法】在广泛收集网站多源评测指标的基础上,采用主成分分析法对恶意网站进行多维度评估,并在此基础上利用随机森林分类算法构建恶意网站识别模型。【结果】所构建方法可以有效提取权威、引用、访问量、排名、链接5个评估维度;同时,基于主成分分析法和随机森林的恶意网站识别模型具有较高的准确率和识别效率。【局限】受数据获取的限制,本研究样本大多属于国外网站,所提取的维度可能与国内恶意网站有一定差异;同时没有考虑恶意网站与正常网站的数量存在不均衡问题。【结论】所构建的基于主成分分析和随机森林的模型既可以提取具有较好解释性的网站评价维度,又具有较高的识别准确率和效率,对后续恶意网站的评估与识别研究具有借鉴意义。

著录项

  • 来源
    《数据分析与知识发现》|2018年第4期|P.71-80|共10页
  • 作者单位

    武汉大学信息管理学院;

    武汉大学电子商务研究与发展中心;

    武汉大学信息管理学院;

    武汉大学电子商务研究与发展中心;

    武汉大学信息管理学院;

    武汉大学电子商务研究与发展中心;

    武汉大学信息管理学院;

    武汉大学电子商务研究与发展中心;

  • 原文格式 PDF
  • 正文语种 CHI
  • 中图分类 TP393.092;
  • 关键词

    恶意网站; 评估与识别; 主成分分析; 随机森林;

  • 入库时间 2023-07-26 00:47:28

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号