基于内容和文本辅助的web图像分类系统的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着移动互联网时代的到来,人们可以通过任何手持移动设备发布声音、图像和视频等多媒体资源到互联网上,导致互联网上的多媒体信息呈爆炸式增长,基于内容的图像分类和检索技术由于在管理和准确查询web图像等领域拥有广阔的应用前景而受到业界越来越广泛的关注,例如Google和百度等搜索巨头都推出了自己的图像检索功能。本文在分析目前web图像分类技术的基础上进行了深入的研究,结合图像视觉特征和网页相关文本信息,设计并开发了一个web图像分类系统TinyPanda。
　　首先,为了全面的描述图像内容本身,本文提出一种基于SVM将SURF局部特征描述子和全局特征决策融合的图像分类算法。该算法首先提取图像的SURF特征向量集合,利用局部敏感哈希(LocalitySensitiveHashing,LSH)归约成单一直方图向量,然后提取图像的全局特征(如颜色),接着分别利用SVM对上述特征进行分类,并对其分类结果做决策融合,从而得到最终的分类结果。该算法除了综合利用图像的局部特征和全局特征各自在图像特征描述方面的优势之外,既能克服全局特征和局部特征直接融合用于图像分类时的维数泛滥,又能解决由于SURF关键点数量造成的匹配点寻找时间复杂度过高的问题。
　　然后,在构建web图像分类系统的数据库时,设计并实现了基于关键字的web图像主题爬虫,在爬取图像的过程中,根据预先限定的一系列关键字来计算网页相关度,并对网页正文区域进行识别,以达到网页级图像筛选以及网页中图像和文本信息获取的目的,从而克服由于Web网页上图像纷繁复杂难以限定图像类别的问题。
　　最后,采用融合图像和文本辅助的web图像分类技术,通过人工决策算法,融合图像在视觉特征提取和SVM分类决策融合后获取的属于各类别的概率,以及网页按照关键字相关度计算后获取的该图像所在网页对应文本类别的权重,实现web图像分类准确率的提高。
　　为了验证上述算法,本文设计并开发了一个web图像分类系统TinyPanda,系统主要包括查询模块、视觉特征提取模块、多特征融合模块、web图像主题爬虫模块、视觉特征和文本信息融合模块等功能模块。通过对从网页上实时爬取的13719张web图像构建的图像库进行的实验,结果表明,决策融合HSV颜色和局部SURF特征后能将平均分类准确率从单一视觉特征的74.6％提高到82.7%;网页文本信息辅助视觉特征的web图像分类能将平均分类准确率进一步提高到91.5%。充分验证了本文的多特征融合算法和文本辅助算法的有效性。
　　本文的研究工作是对基于内容的web图像分类和检索技术走向实用化和商业化的有意探索和尝试,论文中提出的算法具有一定的理论意义及应用价值。

著录项

作者
陈细华;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科通信与信息系统
授予学位硕士
导师姓名程起敏;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;
关键词
Web网页; 图像分类系统; 视觉特征; 文本信息; 内容检索;

相似文献

中文文献
外文文献
专利

1. 基于Web文本内容的信息过滤系统的设计 [J] . 蒋志伟 . 中国电子商务 . 2012,第007期
2. 基于Web的酒店评论文本观点抽取系统的设计与实现 [J] . 王涛 ,刘立波 . 宁夏工程技术 . 2021,第002期
3. 一种基于文本聚类的web军事情报挖掘系统设计与实现 [J] . 傅畅 ,宋佳庆 . 中国电子科学研究院学报 . 2015,第005期
4. 基于Web的内容资讯管理系统(CMS)的设计与实现 [J] . 丁庆立 ,侯惠芳 ,邹洋 . 信息通信 . 2017,第010期
5. 基于Web自定义标签内容管理系统设计与实现 [J] . 尹华国 . 西南民族大学学报（自然科学版） . 2012,第006期
6. 基于文档中心内容快速提取的Web监控辅助系统 [C] . 王灿辉 ,金奕江 ,马少平 . 中国中文信息学会二十五周年学术会议 . 2006
7. 基于Web文本内容的信息过滤系统的研究与设计 [A] . 刘七 . 2004

基于内容和文本辅助的web图像分类系统的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅