首页> 中文学位 >迅雷资源搜索引擎的研究与实现
【6h】

迅雷资源搜索引擎的研究与实现

代理获取

目录

文摘

英文文摘

西北工业大学学位论文知识产权声明书及西北工业大学学位论文原创性声

第一章绪论

1.1研究背景及意义

1.2国内外研究现状

1.3论文组织结构

第二章搜索引擎的产生、发展及趋势

2.1搜索引擎的产生

2.1.1什么是搜索引擎

2.1.2最早的搜索引擎

2.2搜索引擎的发展及分类

2.2.1搜索引擎的发展

2.2.2搜索引擎的分类

2.3搜索引擎的发展趋势

2.3.1垂直搜索引擎

2.3.2即时信息搜索引擎

2.3.3多媒体资源搜索引擎

2.4小结

第三章搜索引擎的原理及实现

3.1搜索引擎的工作原理

3.1.1搜索引擎的组成

3.1.2搜索引擎的工作流程

3.2搜索器

3.2.1网络蜘蛛的实现

3.2.2网页的更新周期

3.2索引器

3.2.1索引器概述

3.2.2中文分词

3.2.3倒排索引

3.3检索器

3.3.1检索器概述

3.3.2 Google的PageRank

3.3.3检索器的实现

3.4用户接口

3.5小结

第四章资源搜索引擎研究

4.1传统的检索多媒体资源的方法

4.2基于内容的多媒体资源检索

4.3迅雷资源搜索引擎

4.4多媒体资源搜索的展望

4.5小结

第五章迅雷资源搜索引擎的实现

5.1迅雷资源搜索引擎实现原理图

5.2迅雷资源搜索引擎的网络蜘蛛

5.2.1抓取文件的一部分作为唯一标识

5.2.2配模板

5.2.3不抓取的站点

5.2.4网页的更新

5.3迅雷资源搜索引擎的索引器

5.3.1中文分词

5.3.2倒排表

5.4迅雷资源搜索引擎的检索器

5.5迅雷资源搜索引擎的用户接口

5.5.1层叠样式表CSS(Cascading Style Sheet)技术

5.5.2搜索范围的选择

5.6迅雷资源搜索引擎中的用户标签

5.6.1标签技术简介

5.6.2迅雷用户标签

5.7迅雷资源搜索引擎中的反馈机制

5.8迅雷资源搜索引擎的其他一些优化措施

5.8.1相关资源自动推荐

5.8.2关键字智能辨析

5.8.3资源排列方式

5.8.4搜索特定类型的文件

5.9小结

第六章结束语

6.1总结

6.2展望

参考文献

攻读硕士期间所发表的论文

致谢

展开▼

摘要

多媒体资源搜索引擎是搜索引擎发展的方向之一,创建出好的多媒体资源搜索引擎能全面、准确、快速的搜索出多媒体文件,对提高互联网的利用率,增加人们对互联网的信心有十分重要的意义。 搜索引擎搜索出来的结果是网页,而多媒体资源搜索引擎搜索出来的结果是多媒体文件。这两类系统的相同点是具有大致相同的组成部分,即都是由网络蜘蛛、索引器、检索器和用户接口四个部分组成;不同点是网络蜘蛛对于前者抓取的是网页,而对于后者抓取的是多媒体文件。 论文研究的重点是迅雷多媒体资源搜索引擎的原理及实现,具体研究的内容包括以下五个部分。(1)迅雷资源搜索引擎网络蜘蛛的实现,包括在互联网中抓取文件并且对文件的内容做摘要生成文件的唯一标识CID,使用配模板进行网络文件的抓取。(2)迅雷资源搜索引擎索引器的实现,主要是如何建立中文分词和倒排表。(3)迅雷资源搜索引擎检索器和用户接口的实现。(4)迅雷资源搜索系统中采用的较新的标签技术和反馈机制,通过标签技术和反馈机制,使搜索引擎的准确性得到较大幅度的提高。(5)迅雷资源搜索引擎采用了一些优化措施,包括资源自动推荐、关键字智能辨析、资源排列方式、搜索特定类型的文件等。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号