首页> 外文会议>2010 Network and distributed system security symposium >Large-Scale Automatic Classification of Phishing Pages
【24h】

Large-Scale Automatic Classification of Phishing Pages

机译:大型的网络钓鱼页面自动分类

获取原文
获取原文并翻译 | 示例

摘要

Phishing websites, fraudulent sites that impersonate arntrusted third party to gain access to private data, continuernto cost Internet users over a billion dollars each year. Inrnthis paper, we describe the design and performance char-rnacteristics of a scalable machine learning classifier we de-rnveloped to detect phishing websites. We use this classifierrnto maintain Google's phishing blacklist automatically. Ourrnclassifier analyzes millions of pages a day, examining thernURL and the contents of a page to determine whether orrnnot a page is phishing. Unlike previous work in this field,rnwe train the classifier on a noisy dataset consisting of mil-rnlions of samples from previously collected live classificationrndata. Despite the noise in the training data, our classifierrnlearns a robust model for identifying phishing pages whichrncorrectly classifies more than 90% of phishing pages sev-rneral weeks after training concludes.
机译:仿冒网站,冒充受信任的第三方以获取私人数据的欺诈性网站,继续使互联网用户每年花费超过10亿美元。在本文中,我们描述了一种可扩展的机器学习分类器的设计和性能特征,我们对这些分类器进行了开发以检测网络钓鱼网站。我们使用此分类器来自动维护Google的网络钓鱼黑名单。我们的分类器每天分析数百万个页面,检查URL和页面内容,以确定页面是否为网络钓鱼。与该领域以前的工作不同,我们在嘈杂的数据集上训练分类器,该数据集包含来自先前收集的实时分类数据的数百万个样本。尽管培训数据中存在噪音,但我们的分类器仍会学习一种可靠的网络钓鱼页面识别模型,该模型可在培训结束后的几周内正确地对90%以上的网络钓鱼页面进行分类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号