首页> 中文学位 >面向组织内部搜索引擎的构建策略
【6h】

面向组织内部搜索引擎的构建策略

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景及意义

1.2研究现状

1.3主要研究内容

1.4论文组织结构

第二章 面向内部搜索引擎的信息更新方法

2.1引言

2.2问题描述

2.3相关工作

2.4信息集成框架

2.5信息更新方法

2.6实验评估

2.7本章小结

第三章 基于TF-IDF的排序优化方法

3.1引言

3.2问题描述

3.3相关概念

3.4基于TF-IDF的排序优化方法

3.5评估

3.6本章小结

第四章 原型系统实现

4.1引言

4.2设计思路

4.3相关技术

4.4系统功能

4.5系统评估

4.6本章小结

第五章 总结和展望

5.1研究成果总结

5.2未来工作展望

参考文献

发表论文和科研情况说明

致谢

展开▼

摘要

在大数据时代,互联网产生的庞大的数据信息让亿万用户时刻享受着最新资讯。无论学习或者工作,对于用户而言,及时掌握学校或者企业的最新消息都是非常必要的,但是在内部网中最新更新的信息很难被及时发现。并且网站中还存在着大量的可用资源,这些资源处于网站的深层中,用户往往需要跳转很多的链接才能找到。现有的企业内部搜索工具不能有效地解决以上问题。本文通过对内部网站信息更新特点的研究,提出了解决方法,本文主要贡献如下:
  (1)提出了基于内部搜索引擎的信息更新方法。信息集成是计算内部网络中信息更新周期的基础,它决定了企业门户网站信息能否被全面检索。基于该问题,针对企业门户网站的特点,提出了企业信息集成方法。同时定义了企业web信息网络、有效访问、节点更新周期等相关概念。基于此,进一步提出了基于内部搜索引擎的信息更新方法。并比较了传统更新方法、基于更新周期的信息更新方法、自适应的更新方法的优点和不足。
  (2)提出了基于TF-IDF排序的优化方法。对传统的内部搜索工具的搜索结果进行对比,使用基于网页全文的搜索方法,结合返回结果和搜索语句计算网页的权重,并使用NDCG评分策略对优化后的结果进行评价,最终呈现一个用户满意的查询结果。
  (3)对提出的方法进行了系统实现。基于以上方法,进行了系统实现,通过实际使用验证了所提方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号