首页> 中文学位 >语音信号近似度模型匹配研究
【6h】

语音信号近似度模型匹配研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 选题背景及意义

1.2 国内外研究动态

1.3 课题主要研究工作

1.4 内容组织及结构

第2章 语音信号近似度模型匹配系统框架

2.1 语音信号近似度模型匹配系统的流程

2.2 音频数据特征

2.3 音频数据来源

2.4 本章小结

第3章 音频信号分析与特征提取

3.1 MP3音频信号分析

3.1.1 音频信号特性描述

3.1.2 MP3编码技术分析

3.1.3 MP3的帧格式

3.2 MP3音频解码分析

3.2.1 MP3音频解码过程

3.2.2 解码算法简介

3.3 音频信号的特征提取

3.3.1 音频输入预处理

3.3.2 音频信号的特征提取

3.4 本章小结

第4章 匹配算法分析与改进

4.1 经典(U,D,R)算法分析

4.2 音高轨迹匹配算法

4.3 统计模型算法

4.4 动态时间规整匹配算法

4.5 匹配算法的改进

4.6 本章小结

第5章 近似度匹配系统评估

5.1 近似度匹配系统的建立

5.2 近似度评估标准分类

5.3 本章小结

第6章 系统模块设计及仿真分析

6.1 系统模块设计

6.2 系统仿真分析

6.3 本章小结

第7章 结论与展望

7.1 本文工作与结论

7.2 展望

参考文献

攻读硕士学位期间发表的论文及其它成果

致谢

展开▼

摘要

随着多媒体技术、计算机网络技术和音频识别技术的快速发展,音频匹配在音频、多媒体文件的数据分析和音频辅助教学等领域中已经成为非常重要的课题。音频匹配技术是以音频识别技术作为基础,对音频参考模板和音频测试模板进行特征提取与表达,得到能够完整地表达二者音频特征的特征序列后,运用匹配算法对音频信号特征进行匹配的过程。音频匹配的目的在于得到音频参考模板与音频测试模板在音频特征上的近似度,从而运用于音频模型的训练、评价、多媒体检索、声波加密和解密、卡拉OK歌唱打分等多个领域。
  本文以MP3音频多媒体文件以及用户对照MP3文件歌唱所建立的音频文件为匹配与研究对象,MP3音频多媒体文件作为音频参考模板、用户对照MP3文件歌唱所建立的音频文件作为音频测试模板,主要对音频特征提取、表达和两种模板的匹配算法进行了研究,在此基础上提出了一种倒谱分析结合短时能量分析的特征提取方法以及字符串匹配结合动态时间规整计算模板的近似度。本文主要工作如下:
  (1)定义模型的输入。选取一首MP3音频多媒体文件,用户对照MP3音频文件通过音频输入设备录入一段歌唱音频,将该MP3音频信号作为音频参考模板,用户歌唱的音频信号作为测试模板,对声波进行去噪、预加重、分帧等一系列预处理。
  (2)对预处理完成后的音频参考模板与音频测试模板的波形使用本文提出的倒谱分析结合短时能量分析进行特征提取工作。由于歌曲的声音成份十分复杂,因此考虑了如何将MP3音频中的背景音乐滤除,减轻特征提取的工作量。
  (3)运用改进的匹配算法从音频参考模板与音频测试模板中提取出音高差值序列及音长比值序列并对它们进行近似匹配,本文提出的字符串匹配结合动态时间规整算法提高了近似度模型匹配的效率与精度。
  (4)采用本文提出的近似度函数对音频参考模板与音频测试模板进行最终的近似匹配评分,最终建立一个公平、准确的音频近似度评分系统。最后对改进的匹配算法与传统匹配算法进行了对比实验分析。
  通过完成上述工作内容、实验验证了论文中算法的有效性。所建立的评分系统实现了音频参考模板与音频测试模板的近似匹配评分,在音频特征提取与匹配方面进行了有效的探索与研究。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号