声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 Hadoop小文件处理研究
1.2.2 图片地理定位研究
1.3 本文的研究内容
1.4 本文的组织结构
第二章 相关技术研究
2.1 Hadoop分布式平台结构
2.1.1 HDFS分布式文件系统
2.1.2 MapReduce分布式计算
2.2 Hadoop小文件处理问题分析
2.3 Trie树和三叉搜索树
2.3.1 Trie树
2.3.2 三叉搜索树
2.4 基于内容的图片检索
2.4.1 图片特征描述
2.4.2 Bag-of-Features模型
2.5 聚类算法
2.5.1 k-均值聚类算法
2.5.2 Canopy聚类算法
2.6 分类器
2.6.1 朴素贝叶斯分类器
2.6.2 k-近邻分类器
2.7 本章小结
第三章 海量图片存储方案分析与设计
3.1 Hadoop归档文件和序列文件
3.1.1 Hadoop归档文件
3.1.2 序列文件
3.2 图片文件存储改进方案
3.2.1 文件存储结构设计
3.2.2 存储访问接口设计
3.2.3 图片文件检索设计
3.3 方案可行性分析
3.4 本章小结
第四章 图片地理定位方案研究
4.1 基于文本标签的图片地理定位
4.1.1 GPS坐标聚类
4.1.2 文本标签分类
4.1.3 目标图片地理定位
4.1.4 方案有效性分析
4.2 基于内容的图片地理定位
4.2.1 FCTH特征
4.2.2 Bag-of-Features模型构建
4.2.3 图片相似度计算
4.2.4 目标图片地理定位
4.3 基于Hadoop的改进的图片地理定位
4.4 本章小结
第五章 系统设计与实现
5.1 系统总体设计
5.1.1 图片库生成模块
5.1.2 检索模型构建模块
5.1.3 图片地理定位模块
5.2 数据库设计
5.3 系统实现
5.3.1 相关环境
5.3.2 HMPI实现
5.3.3 GPS坐标聚类
5.3.4 图片检索模型
5.4 实验结果与分析
5.4.1 存储方案性能比较
5.4.2 图片地理定位准确性比较
5.5 系统运行效果
5.6 本章小结
第六章 总结与展望
6.1 总结
6.2 展望
参考文献
攻读硕士学位期间发表的论文
致谢