一种增量式学习的语音字典构造方法

滕少华; 宋欢; 霍颖翔; 张巍

首页> 中文期刊>广东工业大学学报 >一种增量式学习的语音字典构造方法

一种增量式学习的语音字典构造方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

爆炸式增长的语音数据为存储与传输带来极大困难, 现有方法难以实时应对海量语音频域数据. 因此本文提出一种增量式学习的语音字典构造方法, 该方法先将语音时域信号经短时傅里叶变换处理后转换为各窗频谱幅值, 再将高维空间向量投影到低维空间, 并以字典中的少数基向量线性拟合当前窗向量. 进而通过存储基向量的标识和拟合系数完成对当前窗向量的存储, 把无法拟合的窗向量经处理后加入字典, 实现增量式学习. 解压过程依据用户请求将字典中指定条目经线性拟合实现. 实验结果表明, 本方法能大幅度压缩语音频谱包络, 适用于受带宽限制下实时高采样率的流式语音数据, 与同类算法相比, 在保证还原质量的情况下, 能对信号的存储空间以及传输带宽进行大幅度的压缩.%The explosive growth of audio streams brings difficulties in storage and transmission; however, many methods could not give high compression ratio while keeping the quality. In order to solve this problem, the proposed method compresses amplitude spectrum of voice by constructing a dynamic sparse voice dictionary based on incremental learning. It calculates amplitude envelopes spectrums via Short-Time Fourier Transform (STFT) firstly, and then it uses a dictionary to fit each envelope by projecting high dimensional vectors to several 2D planes. In addition, it minimizes the number of dictionary items and therefore can store the parameters of linear interpolation instead of spectrums. Otherwise, if the fitting step above fails, it will store this window of spectrum directly. By using dictionary and parameters of linear interpolation, it can reconstruct the spectrum efficiently in decompressing process. The results of experiments show that comparing with other methods, the proposed method gives high compression ratio as well as better accuracy in decompressing, and adapt to live voice stream encoding with high sampling rate.

著录项

来源
《广东工业大学学报》|2018年第3期|29-36|共8页
作者
滕少华; 宋欢; 霍颖翔; 张巍;
展开▼
作者单位

广东工业大学计算机学院,广东广州 510006;

广东工业大学计算机学院,广东广州 510006;

广东工业大学计算机学院,广东广州 510006;

广东工业大学计算机学院,广东广州 510006;

展开▼
原文格式 PDF
正文语种 chi
中图分类理论、方法;
关键词
语音压缩; 语音解压; 实时处理; 流式数据; 增量学习; 稀疏字典学习;

相似文献

中文文献
外文文献
专利

1. 一种基于新型BDS模型的语音信号字典构造方法 [J] . 张宏乐 ,李凤莲 ,张雪英 . 微电子学与计算机 . 2017,第1期
2. 一种用于方言口音语音识别的字典自适应技术 [J] . 潘复平 ,赵庆卫 ,颜永红 . 计算机工程与应用 . 2005,第023期
3. 网格失配下MIMO-STAP稀疏字典构造方法 [J] . 何团 ,唐波 ,张进 . 探测与控制学报 . 2020,第002期
4. 基于显著图的特征字典构造方法 [J] . 吴晓燕 ,王海燕 . 计算机工程与设计 . 2016,第008期
5. 稀疏表示分类中遮挡字典构造方法的改进 [J] . 朱明旱 ,李树涛 ,叶华 . 计算机辅助设计与图形学学报 . 2014,第011期
6. 一种用于并行模型噪声鲁棒语音识别的特征构造方法 [C] . 张明新 ,中国科学院声学研究所 ,倪宏 . 第八届全国人机语音通讯学术会议（NCMMSC8) . 2005
7. 稀疏分解中的联合字典构造方法及应用 [A] . 朱俊江 . 2015

一种增量式学习的语音字典构造方法

摘要

著录项

相似文献

相关主题

期刊订阅