文摘
英文文摘
第一章 引言
第一节 现代社会与垃圾邮件
第二节 反垃圾邮件现状
第三节 本文研究的内容
第四节 论文结构
第二章 研究基础
第一节 Chord网络环境研究
2.1.1 结构化P2P
2.1.2 Chord网络
2.1.3 基于Chord的协作式文件系统CFS
第二节 高维向量相似搜索研究
2.2.1 度量空间模型
2.2.2 高维向量近似搜索方法
第三章 改进的摘要算法P-Nil
第一节 哈希算法
第二节 摘要算法分析
3.2.1 Nilsimsa
3.2.2 CTPH模糊摘要算法
3.2.3 Nilsimsa和CTPH的特征及不足
第三节 分片摘要算法P-Nil的提出
第四章 基于LSH的P-Nil摘要的发布与查询方法
第一节 二值化摘要相似度量
第二节 局部敏感哈希LSH
4.2.1 LSH
4.2.2 LSH索引
第三节 基于Chord的LSH函数设计
4.3.1 基于Chord的LSH函数设计要点
4.3.2 汉明空间到k维向量的转化
4.3.3 k维向量映射转化为一维标识符
4.3.4 基于Chord的LSH关键字的产生
第四节 P-Nil摘要的发布与查询
4.4.1 摘要的发布
4.4.2 P-Nil摘要的查询
第五章 实验与性能评价
第一节 P-Nil验证实验描述
5.1.1 攻击方式抵御效果对比
5.1.2 相似文本实际过滤效果
第二节 摘要发布仿真实验
5.2.1 利用随机生成数据仿真
5.2.2 利用真实数据集仿真
第六章 原型系统设计与实现
第一节 LSHNil相似搜索系统设计
第二节 系统特性
第三节 数据的发布与查询
6.3.1 数据的发布
6.3.2 数据的查询
第七章 总结与展望
第一节 系统的特点
第二节 进一步完善系统的建议
参考文献
致谢
附录
附录 A:图索引
附录 B:表索引
个人简历、在学期间的研究成果