首页> 中文学位 >基于隐含语义哈希算法的相似性搜索研究
【6h】

基于隐含语义哈希算法的相似性搜索研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1.绪 论

1.1 课题研究背景

1.2 国内外研究现状

1.3 研究内容

1.4 本文的组织结构

2.相似性搜索算法回顾

2.1 相似性度量

2.2 精确相似性搜索算法

2.3 近似相似性搜索算法

2.4 本章小结

3.基于隐含语义的数据感知哈希算法

3.1 引言

3.2 快速检索框架

3.3 基础算法简介

3.4 隐含语义的学习

3.5 算法非递增性证明

3.6 深入解析更新规则

3.7 哈希函数的学习

3.8 算法复杂度分析

3.9 实验结果与分析

3.10本章小结

4. 哈希索引及多哈希排序融合

4.1 引言

4.2 基于分段哈希码的多重倒排索引树

4.3 基于多个哈希算法的排序融合

4.4 本章小结

5. 总结与展望

5.1 论文总结

5.2 工作展望

致谢

参考文献

附录1:攻读学位期间的研究成果

附录2:攻读学位期间参加的科研项目

展开▼

摘要

随着 IT技术的快速发展和广泛应用,多媒体数据呈现指数增长趋势。虽然多样性的海量数据为基于数据分析的智能化服务提供了丰富的原材料,但同时为数据的组织、分析和检索带来了前所未有的挑战。虽然传统的最近邻搜索方法在低维特征空间中的精确查找中很奏效,但无法有效解决高维度的多媒体数据带来“维度灾难”的难题。二进制哈希码在存储和计算方面具有绝对优势,因此哈希算法非常有潜力帮助人们从信息过载的阴影中走出来。
  基于隐含语义的数据感知哈希算法,在隐含语义层面分析数据间的关联性,跨越数据的底层特征和语义层之间的“鸿沟”,提供基于语义层面的相似性搜索。该算法考虑了数据在语义空间中的局部空间几何结构,尽最大努力维持数据在语义层面的近邻关系。为了使数据的表达方式符合人脑的认知过程,采用基于部件表达的方式将数据映射至隐含语义空间。此外,对数据的隐含语义表达添加稀疏化约束,以突出主要的隐含语义并消除其他微弱语义的干扰。为了生成紧凑高效的哈希码,采用空间分割的方法将数据从隐含语义空间投影至汉明空间,使得每一位哈希码具有最大的信息熵。最终,哈希函数被视为多个分类器的组合,从而将学习哈希函数的任务转化为多个分类器的学习。在公开数据集上的实验结果显示,基于隐含语义的哈希算法在准确率、召回率和MAP等评价指标上都超出了其他几个极具代表性的哈希算法。此外,基于分段哈希码的倒排索引树结构极大地提升了检索速度。基于多个哈希算法的排序列表的融合技术,大大提高了排序的准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号