首页> 中文学位 >基于多特征因子融合的网页排序算法研究
【6h】

基于多特征因子融合的网页排序算法研究

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 搜索引擎发展现状

1.2.2 网页排序算法发展现状

1.3 主要内容

1.4 结构安排

1.5 本章小结

2 搜索引擎相关技术

2.1 常用分类

2.1.1 全文搜索

2.1.2 目录索引

2.1.3 元搜索

2.2 主要技术

2.2.1 搜索器

2.2.2 索引器

2.2.3 检索器

2.2.4 用户接口

2.3 评价指标

2.3.1 查准率

2.3.2 相关度

2.4 本章小结

3 经典算法介绍

3.1 PageRank算法

3.1.1 基本原理

3.1.2 PageRank算法特点

3.2 Hits算法

3.2.1 基本原理

3.2.2 Hits算法特点

3.3 PageRank算法和Hits算法对比分析

3.4 本章小结

4 多特征因子融合的网页排序算法

4.1 ER算法介绍

4.2 改进算法分析

4.2.1 基本原理

4.2.2 多特征因子

4.2.3 EKTR算法

4.3 本章小结

5 仿真实验

5.1 实验环境平台

5.2 系统各模块功能

5.2.1 信息采集

5.2.2 索引建立

5.2.3 查询处理

5.2 一查询处理

5.3 实验设计过程

5.3.1 基础工作

5.3.2 实验步骤

5.4 实验结果分析

5.4.1 网页排名分析

5.4.2 查准率分析

5.4.3 相关度分析

5.5 本章小结

结论

参考文献

作者简历

学位论文数据集

展开▼

摘要

针对PageRank算法仅依靠网页之间的链接结构关系排序,造成平均分配网页权值、主题漂移、偏重旧网页等问题,本文提出一种基于多特征因子融合的网页排序算法。该算法通过增加权重因子,依据各网页入度和出度,按照权重比分配PR值,避免平均分配网页权值;添加用户反馈因子和主题相关因子,利用点击量和关键词比,解决主题漂移问题;加入时间因子,根据同一周期内网页被抓取次数与存在时间成正比的关系,提升新网页排名,优化偏重旧网页现象。经仿真实验验证,改进算法返回的网页信息在查准率和相关性两方面,较传统PageRank算法有显著提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号