基于内容的音频信息分类检索技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着多媒体技术的飞速发展和计算机处理的不断增长，人们面临着一个巨大的数字化“信息海洋”，如何对这些信息进行快速准确地检索已经成为人们的迫切需要。在这样的条件下，多媒体信息检索技术于20世纪90年代开始蓬勃发展起来，成为信息检索技术研究的一个重要分支。开始阶段，研究的注意力主要集中在基于内容的图像检索和视频检索两个方面，而往往忽视了音频数据中所蕴含的丰富语义，加上原始的音频数据的非结构化特性，因此，音频检索相对滞后。随着音频数据的大量出现，基于内容的音频检索也逐渐成为多媒体信息检索技术的一个研究热点。本文在认真总结了前人研究成果的基础上，对基于内容的音频信息检索中的若干问题进行了相关探讨，着重研究了音频特征的分析、分类器设计和语音信息检索这几方面的问题。本文的主要工作和研究成果包括以下几个方面： (1)音频特征分类方法的研究音频分类主要以一些主观或者客观的音频特征为基础，音频特征的选取要能够充分体现出音频在时域和频域中的重要分类特性。因此，音频特征的分析与提取也就成为音频分类问题的基础和重点。如何有效地提取音频特征，并保持特征间相互独立，减少信息冗余就是需要进一步解决的重要问题。本文在音频特征分析中，引入独立分量分析算法，用来提取音频最为关键并高维独立的特征，提高特征的可分性。同时，在此基础上，利用支持向量机良好的分类性能，对各类音频数据的特征进行分类，即提出一种将独立分量分析和支持向量机结合而构成的混合模型用于音频特征分类问题，收到较好的效果。 (2)音频分类器的设计与实现基于内容的音频检索就是要针对连续的音频信号进行分类。因此，如何构造一个分类器，使其能较好地表征音频的时间统计特性，同时又具有一定的类别区分能力是一个值得研究的问题。本文在结合课题组在语音识别研究中已完成的研究基础之上，将由隐马尔科夫模型引申出来的广义模型运用到音频分类检索中，将广义模型与支持向量机结合，提出将基于支持向量机和广义模型的混合模型用于音频分类检索。 (3)基于广播新闻音频的检索技术研究语音是音频数据中的一个重要组成部分，比如，在广播新闻节目、学术会议的录音中包含着大量的语音信息。由于语音具有直观、自然、方便使用的特点，因此，如何直接利用语音来有效地检索多媒体中相关的音频信息，也是一个值得探讨的研究方向。本文针对广播新闻，进行音频检索探讨，研究其中的音频分类、音频检索以及语音识别问题。并在此基础上，设计和初步实现一个基于内容的音频信息检索原型系统。

著录项

作者
何新;
展开▼
作者单位

南京理工大学;

展开▼
授予单位南京理工大学;
学科控制科学与工程
授予学位博士
导师姓名周献中;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类多媒体情报检索系统;
关键词
多媒体信息检索; 音频检索; 音频特征分类; 音频特征; 音频分类器;

相似文献

中文文献
外文文献
专利

1. 基于内容的音频检索技术研究 [J] . 吴春辉 ,陈洪生 . 湖北科技学院学报 . 2011,第006期
2. 基于内容的音频检索技术研究 [J] . 吴春辉 ,钟宝荣 . 科技情报开发与经济 . 2007,第006期
3. 基于内容的音频检索关键技术研究与设计 [J] . 吴春辉 ,陈洪生 . 湖北科技学院学报 . 2007,第006期
4. 基于内容的音频音乐自动分析和检索技术研究 [J] . 韩圣龙 . 情报科学 . 2007,第3期
5. 基于内容的音频检索关键技术研究 [J] . 朱爱红 ,李连 . 现代计算机（专业版） . 2003,第011期
6. 基于数据包加密的数字视音频内容保护技术研究 [C] . 程云 ,张海地 ,聂梦涛 . 中国教育技术协会信息技术教育专业委员会第十二届学术年会 . 2016
7. 基于音频的视频内容检索——面向流媒体内容监控的音频检索关键技术研究 [A] . 时金 . 2009

基于内容的音频信息分类检索技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅