首页> 中文学位 >基于超链分析及镜像页面处理的WWW搜索引擎优化
【6h】

基于超链分析及镜像页面处理的WWW搜索引擎优化

代理获取

目录

文摘

英文文摘

前言

第一章 信息发现技术的发展与现状

1.1 信息发现(Information Retreival)技术介绍

1.1.1 信息发现技术的出现

1.1.2 信息发现技术的发展

1.2 WWW信息发现技术

1.2.1 著名WWW搜索引擎

1.2.2 WWW搜索引擎基本工作方式

1.3 信息发现研究热点及相关成果

1.3.1 分布式体系结构

1.3.2 通用搜索引擎原型系统

1.3.3 检索算法

1.4 Gonia系统介绍

1.4.1 分布式体系结构

1.4.2 中文切词的双字切分法

1.4.3 基于噪声识别和消除的相关度计算方法

第二章 超链分析的引入及定义

2.1 背景

2.2 超链分析的引入

2.2.1 超链及其分类

2.2.2 引入超链分析对信息发现技术的帮助

2.3 超链聚类算法

2.3.1 关于超链的一些定义

2.3.2 算法描述

2.3.3 算法的应用探讨

2.4 在Gonia系统中引入超链分析的实现

2.4.1 系统总体结构

2.4.2 数据格式更新

第三章 基于超链分析的结果压缩研究

3.1 背景

3.2 搜索引擎返回结果的压缩算法

3.3 访问基的选择探讨

3.4 关于复合rank计算的探讨

3.5 实现

3.5.1 系统的改进功能

3.5.2 数据结构描述

3.5.3 程序结构流程

3.6 实验结果分析

3.6.1 实验背景及目的

3.6.2 实验方法及过程

3.6.3 实验结果及分析

第四章 搜索引擎目录索引的自动生成

4.1 背景

4.2 分类索引自动生成

4.2.1 分类Web页面的选出

4.2.2 基于超链分析的资源发现

4.2.3 镜像页面的发现

4.3 系统模型构建

4.4 实现

4.4.1 系统功能描述

4.4.2 程序结构及流程

4.5 实验结果分析

4.5.1 实验背景及目的

4.5.2 实验方法及过程

4.5.3 实验结果及分析

第五章 总结

5.1 论文工作总结

5.2 有待进一步研究的问题

参考文献

作者参与的工作和发表的论文

致谢

展开▼

摘要

该文的内容主要包括以下几个方面:(1)引入超链分析方面的研究.介绍WWW中的超链概念,及其在搜索引擎中引入的意义和前景,提出作为文本后续工作基础的超链聚类算法,并给出了在普通搜索引擎中引入超链分析实现的基础改进和结构.(2)超链聚类算法在搜索引擎返回结果优化中应用的研究.针对搜索引返回结果优化的应用环境,在原超链聚类算法基础上改进提出了基于超链分析的压缩算法,并对算法中涉及的具体问题.(3)超链聚类算法在目录索引生成中应用的研究.针对为搜索引擎构造分类目录索引的应用环境,在原超链聚类算法和镜像页面发现基础上改进提出了分类目录索引生成.并给出了Gonia中的实现模型,同时也通过实验进行结果分析以验证效果.

著录项

  • 作者

    魏星;

  • 作者单位

    东南大学;

  • 授予单位 东南大学;
  • 学科 计算机系统结构
  • 授予学位 硕士
  • 导师姓名 龚俭;
  • 年度 2001
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.092;
  • 关键词

    WWW; 信息发现; 超链分析; 分类目录索引;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号