文摘
英文文摘
第一章 绪论
1.1 课题研究背景及意义
1.1.1 背景及意义
1.1.2 目前现状
1.2 教育资源搜索存在的问题
1.3 本文主要工作
1.4 本文的组织结构
第二章 HADOOP平台架构
2.1 Hadooo的产生
2.2 基于Hadoop分布式架构的优势
2.3 Hadoop组件
2.4 本章小结
第三章 MDVSP平台需求分析
3.1 教育资源垂直搜索的用户群
3.2 MDVSP搜索资源类型需求
3.3 MDVSP搜索平台功能需求
3.4 本章小结
第四章 基于HADOOP平台的MDVSP模型
4.1 分布式文件系统HDFS与Map/Reduce技术
4.1.1 分布式文件系统HDFS
4.1.2 Map/Reduce技术
4.2 基于Hadoop的MDVSP平台的多层分布式架构
4.2.1 系统体系结构
4.2.2 MDVSP平台数据处理模型整体框架
4.2.3 MDVSP平台数据在HDFS中存放结构
4.3 MDVSP通信数据模型设计
4.3.1 数据模型分析
4.3.2 数据模型设计
4.3.3 主表设计
4.4 本章小结
第五章 基于HADOOP平台的MDVSP的关键技术
5.1 MDVSP中聚焦蜘蛛
5.1.1 工作原理
5.1.2 关键技术
5.2 Map/Reduce设计
5.2.1 Map/Reduce逻辑结构设计
5.2.2 Map/Reduce数据流设计
5.2.3 容错和可靠性设计
5.2.4 任务粒度和backup任务性能优化设计
5.3 远程调用设计
5.3.1 MDVSP采用的RPC远程调用设计思想
5.3.2 MDVSP-RPC数据表示设计
5.3.3 MDVSP-RPC服务器端的实现
5.3.4 MDVSP-RPC客户端的实现
5.4 Hadoop的HA设计
5.4.1 Health Check设计
5.4.2 Hadoop Failover流程设计
5.5 本章小结
第六章 MDVSP平台的实现
6.1 方案部署
6.1.1 硬件配置
6.1.2 SSH公钥认证配置
6.1.3 Hadoop平台搭建
6.1.4 Hbase平台搭建
6.1.5 与垂直搜索引擎结合
6.2 开发平台及其开发工具
6.2.1 操作系统
6.2.2 硬件平台
6.2.3 开发工具
6.3 MDVSP系统的实现
6.3.1 聚焦蜘蛛模块的实现
6.3.2 教育资源搜索结果
6.3.3 教育资源信息自动抽取的实现
6.3.4 LUCENE倒排文件索引结构
6.3.5 教育资源信息的存储实现
6.4 用户查询功能的实现
6.4.1 用户查询主要函数实现
6.4.2 教育资源信息查询
6.5 运行结果与对比
6.6 本章小结
第七章 总结与展望
7.1 总结
7.2 展望
参考文献
致谢