首页> 中文学位 >基于双阈值的特定英语音频切分方法的研究与实现
【6h】

基于双阈值的特定英语音频切分方法的研究与实现

代理获取

目录

基于双阈值的特定英语音频切分方法的研究与实现

RESEARCH AND IMPLEMENTATION OF

摘 要

Abstract

目 录

第1章 绪论

1.1 课题研究背景及意义

1.2 课题相关领域的研究现状

1.3 本文的主要研究内容及结构安排

第2章 MPEG-1/AUDIO Layer3 编解码算法

2.1 MP3 编码算法

2.2 MP3 解码算法

2.3 本章小结

第3章 基于双阈值的音频切分算法

3.1 WAV 文件格式

3.2 基于双阈值的音频切分算法

3.3 本章小结

第4章 辅助文本校正的双阈值音频切分算法

4.1 基于规则的文本切分算法

4.2 文本校正双阈值算法

4.3 本章小结

第5章 音频切分系统设计与实现及实验结果分析

5.1 系统设计与实现

5.2 实验结果分析

5.3 本章小结

结论

参考文献

攻读学位期间发表的学术论文

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

个人简历

展开▼

摘要

移动学习是近年来随着网络技术、无线通信技术、移动计算技术和多媒体技术等的迅速发展及融合而悄然兴起的一种新型的学习技术与方式。结合移动学习技术,构建移动英语学习平台是一件十分具有研究价值和实用价值的事情。
  为适应移动英语学习平台构建时对资源的需求,本文实现了MP3解码模块,提出了基于双阈值的特定英语音频切分算法,并对文本在音频切分中的作用进行了积极的探索。在此基础上,设计并实现了音频切分系统。
  网络上广泛流行的VOA、BBC等音频具有良好的适合英语学习者的特性,本文主要就是对这些特定英语音频进行切分。但它们在网络上主要是以MP3格式进行存储,而不是采用无压缩的波形文件格式。因此,本文首先对MP3的相关理论进行研究,详细介绍了MP3编码算法和解码算法的处理流程以及若干细节问题。
  接着,本文在对特定英语音频波形特点和不同语言单元边界之间的异同进行仔细分析的基础上,提出了基于双阈值的音频切分算法。这里,双阈值是指静音能量阈值和静音时延阈值。算法首先利用合适的方法估测出双阈值,然后对音频数据提取能量序列,并将序列通过双阈值两级门限,最终检测到音频句子边界。对28篇VOASpecial音频进行切分的实验数据表明,该算法的精确率和召回率都在90%以上。
  每个音频都有对应的文本,大致来说,文本在音频切分中的作用有两方面,一方面为句子级音频提供句子级文本对照,另一方面可以考虑利用文本信息校正音频切分结果。对于前者,本文采用了基于规则的方法对文本进行切分,实验数据表明切分正确率接近100%。对于后者,本文利用了文本切分后的信息,提出了双阈值校正算法。
  最后,本文组合MP3解码模块、文本切分模块和音频切分模块等,搭建了一个音频切分系统,并设计了简洁的界面。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号