反搜索引擎作弊中种子集合自动扩展算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着搜索引擎和万维网的飞速发展，快速增长的网络信息在供人们分享和获取的同时，也催生了大量的搜索引擎作弊行为。搜索引擎作弊是指利用各种手段欺骗搜索引擎排序算法，从而让一些页面获得比它们应得的页面排名更靠前的排名。搜索引擎作弊会造成增加搜索服务提供商的运营成本，降低用户使用搜索引擎的满意程度等问题。
　　传统的基于启发式规则的反作弊算法难以广泛的对抗搜索引擎作弊行为，而且容易被作弊者攻破。基于信任传播的反作弊算法对作弊者的攻击具有较高的鲁棒性，能广泛的抵抗作弊行为。但由于这类反作弊算法有效性依赖于可信的种子节点，因此种子节点集合的数量和质量会约束算法在抵抗作弊行为上的效率。传统的获取种子集合的方法依赖于人工评测。这不仅从成本上限制了种子集合不会太大，而且难以保证选取的种子节点的质量。因此，如何选取或扩展种子节点集合来满足基于信任传播反作弊算法的需要，成为了反搜索引擎作弊算法中值得研究的问题。
　　本文提出的ASE算法(Automatic Seed Expansion)，引入了节点间的可信支持度的概念，并结合领域知识和网络节点共引用的拓扑结构，能够将一个小规模的种子节点集合扩展成为一个大规模的，高质量的，具有较小领域偏向性的种子节点集合，从而满足了基于信任传播的反作弊算法的对种子节点集合质量和数量的需要。同时，本文还进一步分析了如何为ASE算法选取初始的小规模种子节点集合，分别给出了适用于不同情况的两个启发式算法combineSelection和thresholdSeleetion，并分析了它们的算法效率和优缺点。在WEBSPAM-2007数据集上的实验证明了应用ASE的TrustRank排序算法与原始TrustRank算法相比在可信节点提升和作弊节点降级的效率上分别提高了27.2％和49.5％，显示了ASE在提高反作弊算法在抵抗作弊行为上的有效性。

著录项

作者
韩博;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机应用技术
授予学位硕士
导师姓名张宪超;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.02;
关键词
链接分析; 搜索引擎; 自动扩展算法; 引擎作弊; 排序算法; 网络信息;

相似文献

中文文献
外文文献
专利

1. 搜索引擎中的反SEO作弊研究 [J] . 王利刚 ,赵政文 ,赵鑫鑫 . 计算机应用研究 . 2009,第006期
2. 反搜索引擎作弊的相关探讨 [J] . 李俊 . 网络与信息 . 2011,第001期
3. 基于扩展集合操作的频繁项集挖掘算法研究 [J] . 徐爱萍 ,刘德喜 . 武汉大学学报：信息科学版 . 2006,第2期
4. 基于扩展集合操作的关联规则生成算法研究 [J] . 刘德喜 ,徐爱萍 . 湖北文理学院学报 . 2005,第005期
5. 搜索引擎作弊及反作弊技术探究 [J] . 肖卓磊 . 阜阳师范学院学报（自然科学版） . 2011,第004期
6. 搜索引擎的反作弊技术研究 [C] . SHEN Wen-ming ,申文明 ,LIANG Yi-ping . 2009年中国高校通信类院系学术研讨会 . 2009
7. 基于限制标记传播的搜索引擎反链接作弊方法 [A] . 牟南 . 2013

反搜索引擎作弊中种子集合自动扩展算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅