基于双阈值的特定英语音频切分方法的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

移动学习是近年来随着网络技术、无线通信技术、移动计算技术和多媒体技术等的迅速发展及融合而悄然兴起的一种新型的学习技术与方式。结合移动学习技术，构建移动英语学习平台是一件十分具有研究价值和实用价值的事情。
　　为适应移动英语学习平台构建时对资源的需求，本文实现了MP3解码模块，提出了基于双阈值的特定英语音频切分算法，并对文本在音频切分中的作用进行了积极的探索。在此基础上，设计并实现了音频切分系统。
　　网络上广泛流行的VOA、BBC等音频具有良好的适合英语学习者的特性，本文主要就是对这些特定英语音频进行切分。但它们在网络上主要是以MP3格式进行存储，而不是采用无压缩的波形文件格式。因此，本文首先对MP3的相关理论进行研究，详细介绍了MP3编码算法和解码算法的处理流程以及若干细节问题。
　　接着，本文在对特定英语音频波形特点和不同语言单元边界之间的异同进行仔细分析的基础上，提出了基于双阈值的音频切分算法。这里，双阈值是指静音能量阈值和静音时延阈值。算法首先利用合适的方法估测出双阈值，然后对音频数据提取能量序列，并将序列通过双阈值两级门限，最终检测到音频句子边界。对28篇VOASpecial音频进行切分的实验数据表明，该算法的精确率和召回率都在90％以上。
　　每个音频都有对应的文本，大致来说，文本在音频切分中的作用有两方面，一方面为句子级音频提供句子级文本对照，另一方面可以考虑利用文本信息校正音频切分结果。对于前者，本文采用了基于规则的方法对文本进行切分，实验数据表明切分正确率接近100%。对于后者，本文利用了文本切分后的信息，提出了双阈值校正算法。
　　最后，本文组合MP3解码模块、文本切分模块和音频切分模块等，搭建了一个音频切分系统，并设计了简洁的界面。

著录项

作者
李相前;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名刘秉权;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类翻译机;
关键词
双阈值校正; 特定英语音频; 切分算法; MP3编码; 解码实验;

相似文献

中文文献
外文文献
专利

1. 双阈值的特定英语音频句子边界检测 [J] . 刘秉权 ,徐帅 ,李相前 . 哈尔滨工业大学学报 . 2010,第002期
2. 基于音频特征的音乐音符智能切分识别方法 [J] . 任瑞 . 信息技术 . 2021,第012期
3. 基于应用数学的科教创新——词根词缀的英语单词切分与搜索方法探讨 [J] . 张然 . 中国科教创新导刊 . 2012,第023期
4. 基于统计方法的英语长难句句法分析器研究与实现 [J] . 孙杰欢 ,张鑫 ,高利 . 软件导刊 . 2015,第006期
5. 基于统计方法的英语长难句句法分析器研究与实现 [J] . 孙杰欢 ,张鑫 ,高利 . 软件导刊 . 2015,第006期
6. 基于DSP的音频变时变调方法研究与实现 [C] . 林星 ,林凡 ,侯绍东 . 2006年全国第六届嵌入式系统学术年会 . 2006
7. 面向移动学习的英语音频跨语言检索方法的研究与实现 [A] . 朱文强 . 2007

基于双阈值的特定英语音频切分方法的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅