改进K-Means聚类算法在基于Hadoop平台的图像检索系统中的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

现代人们的生活已经进入了移动互联网时代，各种移动互联网设备的普及和广泛应用极大的方便了人们的生活学习等各个方面。与此同时，来自各行各业的大量信息正以多媒体信息的方式数字化并不断累积。其中图像作为最为基本的多媒体信息之一易于理解和使用，人们对图像检索的需求也从开始的根据文本描述来检索图像发展到根据图像内容来检索相似图像。
　　图像检索早已成为计算机领域的一个研究热点，它可以按照检索内容划分为基于文本的图像检索和基于内容的图像检索。本文主要的内容是如何应用大数据技术进行基于内容的海量图像检索技术的研究和实现。
　　从数据层面分析，一个基于内容的图像检索系统要解决大量图像数据的存储和快速处理两个最主要的问题，本文将使用专门用于大数据存储和处理的Hadoop技术来存储大量的图像数据并进行离线地分布式计算;从检索技术层面分析，要进行特征提取和处理，本文将提取图像的SIFT特征，然后对这些特征进行K-Means聚类，将聚类结果作为Bag-of-Words模型的视觉词袋对所有图像的SIFT特征点进行量化处理，从而用一个固定维数的特征向量表示每一幅图像，此外再用TF-IDF加权技术处理这些特征向量，最终计算这些图像与检索图像特征向量之间的相似度，返回相似度最小的一些图像。
　　本文使用并修改HIPI-Hadoop图像处理接口实现在Hadoop上进行图像类型的存储处理和检索，提出了一种改进的并行K-Means算法并应用于特征点的聚类，使用一种基于面积的相似度计算方法计算图像特征向量间的相似度。改进了部分Mahout源码适应大数据的处理需求。
　　图像检索应用广泛，对基于Hadoop的图像检索系统的研究将对大数据时代图像检索技术的发展起到一定的指导作用。

著录项

作者
黎光谱;
展开▼
作者单位

厦门大学;

展开▼
授予单位厦门大学;
学科计算机技术
授予学位硕士
导师姓名郑建德;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
图像检索; 大数据技术; K-Means聚类算法; Hadoop平台;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop平台的一种改进K-means文本聚类算法 [J] . 潘俊辉 ,王辉 ,张强 . 微型电脑应用 . 2022,第1期
2. 基于Hadoop平台的K-means聚类算法并行化改进研究 [J] . 禤世丽 ,刘建明 . 玉林师范学院学报 . 2020,第3期
3. 基于改进的K-means聚类算法在图像分割中的研究 [J] . 姚丽君 ,赵磊 . 计算机光盘软件与应用 . 2014,第020期
4. 基于Hadoop平台的K-means聚类算法 [J] . 刘宝龙 ,苏金 . 计算机系统应用 . 2017,第006期
5. 基于Hadoop平台的K-means聚类算法优化研究 [J] . 卢胜宇 ,王静宇 ,张晓琳 . 内蒙古科技大学学报 . 2016,第003期
6. 改进的K-Means聚类算法在车辆聚集分析中的应用 [C] . Li Yuzhen ,李玉贞 ,Ding Xianyong . 第十五届中国智能交通年会 . 2020
7. 基于Hadoop平台的K-means聚类算法改进 [A] . 蒋悦 . 2017

改进K-Means聚类算法在基于Hadoop平台的图像检索系统中的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅