基于隐马尔科夫模型的钢琴音符识别算法研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

钢琴音符识别是将音乐音频文件自动转换到数字音乐文件(MIDI)的过程,在钢琴辅助教学、乐谱自动记录等工作中具有重要作用。本课题主要研究钢琴音符识别的问题,即根据钢琴演奏所录制的音频文件,通过特定算法来确定某时段内的声音是由哪些单音符组合而成。根据实际应用需求和音符识别算法自身的限制,本课题将钢琴音符识别任务分为:实时稳健的单音符识别、非实时的多音符识别。对于单音符的识别,本课题侧重于实时性和稳健性两个方面。为此,本文提出采用局部能量的端点检测、多样本字典、多样本字典后处理等算法来提高单音符识别的实时性和稳健性;对于多音符的识别,由于无法通过单音符所采用的时域法,本课题转而采用模式识别法,即以多音符为基本建模单位,建立基于隐马尔可夫过程的多音符模型,进而重新编译HTK中相关模块来搭建多音符识别系统。
　　本课题的主要内容包括以下几个方面:
　　1)提取多音符音频文件的特征。在分析常用音频文件参数化原理的基础上,结合多音符音频的特性,对HTK中已有特征提取模块进行优化;
　　2)判断确定音频中音符端点的位置。在分析常用端点检测的基础上,根据单音符、多音符不同的任务需求,分别为单音符识别系统和多音符识别系统设计或该写端点检测算法;
　　3)研究基于HMM模型的语音识别原理,找出语音识别与多音符识别之间的共性与差异,建立多音符HMM声学模型和多音符间模型;
　　4)根据MIDI文件以及对应的钢琴音频文件,构建训练、测试波形数据以及相应的标注文件。在此基础上,利用重新改写编译后的HTK相关工具对各个多音符隐马尔可夫模型进行初始化和训练,进而构建出完整的多音符识别系统。最后根据实验结果与对应标注文件之间的比对,对多音符系统进行性能评价。
　　本文成功地实现了单音符的实时稳健识别、多音符的HMM建模以及多音符HMM模型识别。对于单音符的识别,与线性模型法相比,正确率提高了3％,达到了98%,且平均识别帧数达到4帧,即稳健性方面提高近2倍;对于多音符的识别,与时频域、统计法等相比,本文所采用得基于HMM的音符识别方法,识别率提高了近5%,提高了钢琴音乐转录实用化的可能性。

著录项

作者
刘兴永;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科电路与系统
授予学位硕士
导师姓名李锵,关欣;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
钢琴音符识别算法; 特征提取; 端点检测; 隐马尔科夫模型;

相似文献

中文文献
外文文献
专利

1. 基于隐马尔科夫模型的入侵检测算法研究 [J] . 刘宗礼 ,孔祥才 . 甘肃科技 . 2007,第004期
2. 基于动态栅格与隐马尔科夫模型前车换道意图识别 [J] . 杨杨 ,杨正才 ,蔡林 . 湖北汽车工业学院学报 . 2021,第002期
3. 基于隐马尔科夫模型的履带行走装置状态识别 [J] . 苏龙飞 ,张宏 . 太原科技大学学报 . 2021,第001期
4. 基于隐马尔科夫模型的牵引座状态识别 [J] . 谢锋云 ,冯春雨 ,刘翊 . 现代制造工程 . 2020,第006期
5. 一种基于隐马尔科夫模型的跑步机语音识别系统设计 [J] . 陶君 ,陈云龙 ,王庆 . 信息技术与信息化 . 2020,第009期
6. 保险资金债券投资的量化管理——基于隐马尔科夫模型的市场状态识别与因子筛选 [C] . 宋佰秩 ,SONG Baizhi ,杜尚隆 . 2018中国保险与风险管理国际年会 . 2018
7. 基于隐马尔科夫模板模型的视频动作识别算法研究 [A] . 师小凯 . 2013

基于隐马尔科夫模型的钢琴音符识别算法研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅