首页> 中文学位 >视频搜索结果分析及其可视化方法研究与应用
【6h】

视频搜索结果分析及其可视化方法研究与应用

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景

1.2 研究意义与目的

1.3 课题研究内容

1.4 本文的组织结构

第二章 相关技术的研究

2.1 粗糙集理论概述

2.2 向量空间模型

2.3 遗传算法

2.4 K-means聚类算法

2.5 数据可视化技术

2.6 本章小结

第三章 对视频搜索结果聚类方法的研究与改进

3.1 文本预处理

3.2 文本表示模型构建

3.3 聚类方法分析与研究

3.4 K值学习算法

3.5 初始质心选取算法

3.6 文本聚类算法

3.7 本章小结

第四章 可视化视频搜索系统的设计与实现

4.1 聚类结果与可视化

4.2 可视化搜索引擎

4.3 RIA与Flex技术

4.4 系统总体设计与实现

4.5 本章小结

第五章 实验与评价

5.1 实验方法

5.2 实验结果

5.3 实验评价

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读学位期间的研究成果目录

致谢

展开▼

摘要

随着互联网的飞速发展和广泛应用,以谷歌,百度为代表的搜索引擎已逐渐成为人们查询和获取信息的重要途径。然而,由于大量存在的Web信息和查询本身的歧义性,传统搜索引擎以线性列表返回的结果集过于庞大和杂乱,导致用户无法快速而准确地定位所需信息。一种行之有效的解决办法是对搜索结果进行聚类,形成若干主题相关的分类,从而引导用户查询过程,减轻用户查询负担。
   本文以视频系统的应用为背景,就搜索结果聚类分析中的核心技术,聚类结果可视化方法中的若干关键问题展开了具体的研究工作。文中应用了粗糙集(Rough Sets)、向量空间模型(Vector Space Model)和遗传算法( Genetic Algorithm)的理论知识,给出了K-means聚类中的K值学习算法,改进了K-means聚类初始质心的选取算法,提出了一种新的聚类结果可视化方法。
   结合粗糙集和向量空间模型的相关理论,本文引入基于容错粗糙集(Tolerance Rough Sets)的文本表示方法,丰富了对视频标题和摘要文本的描述,避免了传统方法只考虑特征词之间的互斥性而忽略相关性,缺乏对文本内容的概括,以致影响最终聚类结果的情形。文中利用特征词协同出现的关系构造特征词容错类,然后生成视频标题和摘要文本的上近似集表示,从而为聚类算法提供了良好的数据输入,以保证聚类结果的有效性。
   K-means是一种常用的基于划分的聚类算法,聚类效果较好,对大数据集是相对可伸缩的和有效率的。然而,K-means聚类中K值的确定方法存在着严重的不合理性,初始质心的随机选取又导致了聚类结果的不稳定性,使得该算法的聚类质量在大多数情况下不够理想。本文结合遗传算的全局优化特性与K-means算法的局部优化特性,给出了用于K值学习的遗传算法,并改进了初始质心的选取算法,以提高聚类算法的性能。此外,考虑到文本类属的多样性,文中借鉴了模糊聚类(Fuzzy Clustering)的思想,采用可生成K个重叠簇的K-means算法进行文本聚类。
   最后,本文在对粗糙集、向量空间模型和遗传算法的研究基础上,在对K-means算法的改进基础上,提出了一种新的适于视频聚类结果呈现的可视化方法,突破了传统搜索引擎以线性列表表示返回结果的局限性,从而使用户能够在海量数据中快速理解和获取所需信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号