首页> 中文学位 >面向不同对象的搜索引擎中的排序模型与性能评价
【6h】

面向不同对象的搜索引擎中的排序模型与性能评价

代理获取

目录

声明

摘要

第1章 绪论

1.1 引言

1.2 研究背景

1.2.1 信息检索

1.2.2 对象级别的搜索

1.2.3 搜索引擎性能评价

1.3 本文动因

1.4 本文研究内容与主要贡献

1.5 本文章节安排

第2章 相关工作综述

2.1 引言

2.2 传统搜索引擎算法

2.3 对象级搜索算法

2.4 搜索引擎性能评价方法

2.5 本章小结

第3章 对象级搜索引擎的排序模型研究

3.1 引言

3.2 对象影响力计算

3.3 单个查询的相关度计算

3.4 多个查询的相关度合并

3.5 实验数据与结果

3.5.1 单个查询的性能对比

3.5.2 多个查询的合并性能对比

3.6 本章小结

第4章 搜索引擎性能评价

4.1 引言

4.2 搜索引擎性能评价标准

4.3 搜索引擎中用户点击分布的理想模型

4.3.1 搜索结果页内总点击率的分布模型

4.3.2 搜索结果页内每个文档的点击分布模型

4.3.3 模型中的参数估计

4.4 实验结果

4.4.1 搜索结果页内总点击率拟合

4.4.2 搜索结果页中总点击率拟合

4.5 本章小结

第5章 总结与展望

参考文献

致谢

在读期间发表的学术论文与取得的其他研究成果

展开▼

摘要

目前,互联网规模不断扩大,成为人们最重要的信息来源之一,但同时也出现了“信息过载”的问题,网络上的信息增长速度过快,用户获取所需信息难度越来越大。因此,搜索引擎应运而生。随着搜索引擎的发展,目前有两个重要的研究方向:其一,传统搜索引擎是基于网页的,而网络上的信息承载方式已经不仅限于传统网页,因此需要探索新的搜索引擎技术;其二,搜索引擎层出不穷,质量参差不齐,需要有一种合适的方式来评价搜索引擎的性能。
  本文主要贡献有以下三点:第一,提出了一种新的对象级别搜索引擎的排序模型。本模型适用于多种对象存在的场合,是基于对象之间的链接关系的,从而具有通用性。第二,提出了UIG的概念。UIG与传统的DCG相比,衡量的信息更为准确。第三,提出了一种用于搜索引擎性能评价的搜索引擎的理想点击分布族。在实际应用中,可以通过搜索引擎的实际点击数据拟合其参数;同时,从实际点击分布与理想点击分布的差别上,可以反映出搜索引擎排序算法的缺陷与改进方向。
  本文所提出的对象级搜索引擎排序模型,首先以对象链接图为基础,计算单个对象对单个term的相关度,然后对多个term的相关度进行合并。本模型在ACM Portal数据集上得到验证取得较好效果。本文所提出的搜索引擎点击分布模型,是从寿命分布中的威布尔分布出发,并结合搜索引擎的特点加以修改所得。本模型在AOL、搜狗、微软搜索引擎数据集上得到验证取得较好效果。

著录项

  • 作者

    李梁;

  • 作者单位

    中国科学技术大学;

  • 授予单位 中国科学技术大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 陈恩红;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;
  • 关键词

    搜索引擎; 排序算法; 点击分布模型; 评价工作;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号