长音频与文本的对齐研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

长语音和文本的对齐可以促进对丰富的语音资源的大规模研究，例如，有声读物收集或者多媒体文档索引。对于这样的资源，基于传统的维特比强制对齐算法被证明是不足以胜任的，原因在维特比算法受限于：一是转写文本必须是准确的和二音频相对没有噪声。由于近几年中文语音识别率有显著提升，具备了用语音识别引擎解决语音文本对齐的条件。在本文中，我们用C++语言实现了一个具有鲁棒性的长音频文本对齐的程序，并能规避传统对齐方法中的一些限制。它实现了一个自适应、迭代性的语音识别和文本对齐的方式，而且能够处理时长很长的音频(可能包含噪声)，并对噪声音频具有一定的鲁棒性。本文通过运行人为拼接的来自TIMIT数据库和863语音数据库的长音频，本文将给出相关的参考文本的边界结果。

著录项

作者
周陈;
展开▼
作者单位

湘潭大学;

展开▼
授予单位湘潭大学;
学科计算数学
授予学位硕士
导师姓名黄云清;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
长音频; 文本; 语音识别; 人为拼接; 对齐程序;

相似文献

中文文献
外文文献
专利

1. 蒙古语长音频语音文本自动对齐的研究 [J] . 牛米佳 ,飞龙 ,高光来 . 中文信息学报 . 2020,第001期
2. 基于“文本对齐”进行短文本过滤算法的研究 [J] . 方媛 ,车启凤 . 信息通信 . 2013,第009期
3. 基于语义对齐的生成式文本摘要研究 [J] . 吴世鑫 ,黄德根 ,李玖一 . 北京大学学报：自然科学版 . 2021,第1期
4. 富媒体环境下语音和文本内容的对齐研究 [J] . 韦向峰 ,袁毅 ,张全 . 情报工程 . 2019,第002期
5. 富媒体环境下语音和文本内容的对齐研究 [J] . 韦向峰1 ,袁毅1 ,张全1 . 情报工程 . 2019,第002期
6. 基于向量空间模型的网页文本句子对齐方法研究 [C] . 张贯虹 ,乌达巴拉 ,巩政 . 第十一届全国人机语音通讯学术会议 . 2011
7. 中职阅读教学中文本-图片和文本-音频两种注释对词汇附带习得的效果研究 [A] . 孟燕 . 2015

长音频与文本的对齐研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅