首页> 中文学位 >Web信息检索中对超链接类型的判别和应用
【6h】

Web信息检索中对超链接类型的判别和应用

代理获取

目录

文摘

英文文摘

1序言

1.1 研究背景

1.2 研究内容

1.3 论文结构

2 Web信息检索基础知识

2.1 信息检索介绍[4]

2.1.1 信息检索与数据检索

2.1.2文档逻辑视图

2.1.3检索过程

2.2 向量空间模型

2.2.1模型描述

2.2.2定义

2.2.3关键词权重计算

2.2.4 对于相关性的讨论

2.3 HITS算法

2.3.1 利用超链接

2.3.2 HITS概要

2.3.2.1构造领域图

2.3.2.2迭代计算指标

2.3.3 HITS的应用

2.3.4 问题和改进

2.4 PageRank算法

2.4.1 算法概要

2.4.2存在的问题

2.5 搜索引擎

2.5.1 工作原理

2.5.2 引擎类型

2.6 信息检索效果评价[4]

3改进HITS算法

3.1 改进目标

3.2 改进的总体思路

3.3超链接类型判别和静态权重设置

3.4内容相关的动态权重设置

4实验

4.1 原型系统实现

4.1.1索引编制

4.1.2检索过程

4.2 实验结果

4.3 实验总结

5总结与展望

6致谢

7参考文献

8附录

8.1 部分实验结果

8.1.1 Query Input:劣质奶粉坑害婴儿

8.1.2 Query Input:中国围棋名人战

8.2 所发表的相关论文

论文独创性声明及论文使用授权声明

展开▼

摘要

在Web信息检索中,利用超链接提供的信息来辅助提高信息检索的准确性已经得到广泛的运用.但因特网总体上是一个自由的发挥的、缺乏统一规范约束的信息网络,对超链接的运用非常随意,绝大多数的超链接都是站点结构导航,而类似于科技文献的引证类型的超链接的比重很小.所以,对于信息检索而言,有利用价值的超链接是淹没在大量的无价值的超链接之中的,给利用超链接信息提高信息检索质量带来的很大的干扰.所以如果能够对超链接类型加以判别,筛选出对信息检索有价值的超链接,屏蔽掉大量无效超链接的干扰,会有助于提高对超链接对提高Web信息检索精度的辅助作用.该次研究就是通过辨别超链接的类型来筛选超链接,并结合查询信息调整超链接在具体查询中的权重,以期达到提高超链接对信息检索的贡献程度.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号