首页> 中文学位 >互联网信息搜索排序算法研究——统一开放的排序公式
【6h】

互联网信息搜索排序算法研究——统一开放的排序公式

代理获取

目录

文摘

英文文摘

第一章绪论

1.1互联网搜索排序算法研究的意义

1.2搜索引擎发展史

1.3搜索引擎的分类

1.4搜索引擎的系统架构

1.5搜索引擎关键技术和本文研究重点

第二章网络蜘蛛

2.1基本原理

2.2内容提取

2.3更新周期

第三章中文分词

3.1中文分词算法

3.2分词中的难题

第四章排序算法

4.1相关度分析

4.2链接分析

4.3其它排序技术

4.4目前排序算法的问题总结

4.5统一开放的排序公式

4.6排序公式的实现

第五章对未来搜索发展的一些讨论

5.1信息结构化

5.2信息的质量

5.3搜索进化

参考文献

附件(计算机程序清单)(一)

附件(计算机程序清单)(二)

附件(计算机程序清单)(三)

攻读硕士学位期间发表的学术论文

致谢

原创性声明

展开▼

摘要

当前的互联网已经达到数十亿网页的规模,并且正在以每日数百万网页的海量速度增长.由于其规模如此之庞大的,用户在查询资料的时候,经常面对搜索引擎所返回的几千甚至几万个网页,用户很难准确找到自己所需要的内容.因此,搜索引擎如何优化搜索和排序算法,如何在解决搜索速度和查全率的基础上,提高查准率,并且把最恰当的,最可信的链接放在返回结果的最前面成为互联网搜索的关键问题.本文分析了现有的互联网搜索和排序算法,特别是深入探讨了当前排序算法中的相关度分析和链接分析的优缺点,也研究了网络蜘蛛的算法和中文分词技术的应用.在此基础上,本文提出了统一开放的排序公式.该公式把不同的排序算法整合在一起,用户可以根据不同的搜索要求动态调整排序算法,解决当前排序算法的互不兼容问题.本文在最后给出了该公式的一个简单的应用实例.

著录项

  • 作者

    曾长缨;

  • 作者单位

    中山大学;

  • 授予单位 中山大学;
  • 学科 计算数学
  • 授予学位 硕士
  • 导师姓名 李小福;
  • 年度 2004
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 计算机网络;
  • 关键词

    搜索引擎; 排序算法;

  • 入库时间 2022-08-17 10:26:56

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号