首页> 中文学位 >链接分析在权威Web信息源搜索中的应用研究
【6h】

链接分析在权威Web信息源搜索中的应用研究

代理获取

目录

文摘

英文文摘

原创性声明及本论文使用授权说明

第一章绪论

1.1研究背景

1.2研究目的

1.3研究内容

1.3.1 Web信息检索基础

1.3.2 Web链接结构分析

1.3.3主题提取算法HITS

1.3.4改进算法g-HITS

1.3.5改进算法g-HITS的实验验证及其讨论

1.4论文结构

第二章Web信患检索基础

2.1信息检索简介

2.1.1信息检索发展简介

2.1.2信息检索过程简介

2.2三大经典信息检索模型

2.2.1布尔模型(boolean model)

2.2.2向量空间模型(vector space model,VSM)

2.2.3概率模型(probabilistic model,PM)

2.2.4三大模型的比较

2.3搜索引擎

2.3.1搜索引擎的工作原理

2.3.2搜索引擎的分类

2.3.3搜索引擎的排序算法

2.4信息检索效果评价

第三章Web链接结构分析

3.1 Web链接结构分析产生的背景

3.2 Web链接结构分析的基本假设

3.3 Web链接结构分析模型

3.3.1有向图

3.3.2 Web链接结构图

3.3.3 Web链接结构分析的基本思想

3.4 Web链接结构分析算法

3.4.1网页聚簇性分析算法

3.4.2网页权值分析算法

3.5 Web链接结构分析在Web信息检索中的应用

3.5.1网页评价

3.5.2主题划分

3.5.3主题提取

第四章主题提取算法HITS

4.1 HITS算法的基本思想

4.2 HITS算法的具体过程

4.2.1构造特定主题的Web链接结构子图

4.2.2迭代式链接分析计算

第五章改进算法g-HITS

5.1 HITS算法的优点

5.2 HITS算法存在的不足

5.3改进算法g-HITS

5.3.1改进算法g-HITS的基本思路

5.3.2改进算法g-HITS的三个过程

第六章 改进算法g-HITS的实验验证及分析讨论

6.1实验

6.1.1实验方案

6.1.2实验系统的实现

6.1.3实验结果

6.2实验结果分析与讨论

第七章总结和展望

参考文献

攻读硕士学位期间发表的论文及参与编写的专著

致谢

论文说明

展开▼

摘要

互联网上的信息每天都以指数量级的速度爆炸性增长,面对如此浩瀚的资源,从Web上的大量信息中准确有效地提取用户所需要的信息成为了Internet用户的迫切需要.搜索引擎是目前最主要的Web检索工具,然而搜索引擎的效果还不能令人满意.研究表明Web上的链接结构含有非常丰富和重要的信息,分析链接结构信息可大大改进检索效果.本文首先介绍了Web信息检索的基础知识,其中包括信息检索简介、三大经典信息检索模型、搜索引擎和信息检索效果评价等方面的内容;然后深入分析了Web链接结构信息,并在此基础上,回顾了主题提取算法HITS的基本思想和算法步骤,分析了HITS算法存在的不足,从网页标题和链接周围的文本内容着手,为不同的网页链接赋予适当的权重,提出结合网页内容和纯链接的改进算法g-HITS;最后通过实验来验证改进算法g-HITS的合理性和有效性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号