首页> 中文学位 >音乐情感检索下音频感知哈希方法的研究
【6h】

音乐情感检索下音频感知哈希方法的研究

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景及意义

1.2 音乐情感检索研究历史和现状

1.3 音频感知哈希综述

1.3.1 传统哈希与感知哈希

1.3.2 音频感知哈希

1.3.3 方法综述

1.4 本文主要研究内容及论文结构

第2章 音乐情感检索概述

2.1 常用的声学特征提取方法

2.1.1 梅尔频率倒谱系数

2.1.2 形状特征谱

2.2 音乐情感检索研究框架

2.2.1 音乐情感认知模型

2.2.2 情感数据抽取方法

2.2.3 快速音乐哈希及匹配

2.2.4 音乐情感检索及推荐

2.3 小结

第3章 一种快速的音频感知哈希方法

3.1 引言

3.2 向量投影及随机搜索策略

3.3 基于向量投影和随即搜索策略的音频感知哈希方法描述

3.4 仿真实验结果

3.4.1 训练投影向量

3.4.2 测试算法性能

3.5 广播监控中的应用

3.6 小结

第4章 基于深度置信网络的音频感知哈希方法

4.1 引言

4.2 深度置信网络的Bottleneck特征框架

4.2.1 受限的玻尔兹曼机

4.2.2 深度置信网络

4.2.3 Bottleneck特征

4.3 基于Bottleneck特征的感知哈希方法

4.3.1 感知哈希数学描述

4.3.2 感知哈希算法框架及流程

4.4 仿真实验结果

4.5 NN-Bootleneck-FFT方法与VP-FFT方法的理论分析

4.5.1 神经元

4.5.2 神经网络

4.5.3 VP与NN-Bootleneck的同质分析

4.6 小结

结论

参考文献

致谢

附录A 攻读硕士学位期间发表的学术论文及参与的科研项目

展开▼

摘要

在音乐信息检索及音乐推荐等领域中,如何对音乐情感进行高效、准确的识别及检索,是该领域研究的关键课题。音乐所表达的情感以及人们听音乐时的情感反应,可以被量化到一个统一的情感模型中,实现基于情感需求的音乐检索。本文充分挖掘Web2.0用户对音乐情感的评价信息,构建音乐情感数据库,通过检索数据库的方式实现音乐情感检索。
  运用信息抽取方法,虽然能够从网页中得到音乐情感的文本信息,但由于数字音频的不唯一性,如何基于数字音频的感知内容,将文本信息与音频数据一一映射,是构建音乐情感语料库必须要解决的关键科学问题。基于此,本文研究快速音频感知哈希方法,旨在追求区分性和鲁棒性的同时提高感知效率。本文研究了两种高效的音频感知哈希方法:
  (1)运用向量投影以及随机搜索策略,先从大量训练数据中搜索得到合适的投影向量,然后将高维的感知特征投影到一维空间,并进行哈希编码,实现快速的音频感知哈希。实验结果证明,该方法在不降低哈希向量区分性和鲁棒性的前提下,时间性能相对于传统方法有很大的改进。
  (2)运用深度置信网络,通过DNN-Bottleneck特征框架,从音频数据中提取鲁棒的感知特征,然后编码实现快速的音频感知哈希。实验结果验证了该方法的可行性,区分性和鲁棒性相比VP-FFT方法有所提升。进一步分析发现,VP-FFT方法和单层的NN-Bottleneck-FFT方法在数学形式的描述上,是完全一致的,为VP-FFT方法的理论解释提供了参考。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号