首页> 中文学位 >矢量量化码书设计与矢量量化应用研究
【6h】

矢量量化码书设计与矢量量化应用研究

代理获取

目录

摘要

Abstract

第一章 绪论

1.1 研究背景

1.2 矢量量化技术的发展历史与研究现状

1.3 本文的主要工作与特色

1.3.1 研究内容

1.3.2 主要贡献与特色

1.4 论文的结构安排

第二章 相关理论

2.1 引言

2.2 矢量量化的基本原理

2.2.1 矢量量化的理论基础

2.2.2 矢量量化的定义

2.2.3 矢量量化的特点

2.3 矢量量化的目标函数

2.3.1 矢量失真描述

2.3.2 信号失真描述

2.4 最优矢量量化器的几个条件

2.4.1 两个基本必要条件

2.4.2 零边界概率条件

2.4.3 等误差条件

2.4.4 最优条件的充分性

2.5 编码速率与比特率、复杂度

2.5.1 编码速率和比特率

2.5.2 复杂度

2.6 模糊集合与模糊逻辑

2.6.1 模糊数学理论基础

2.6.2 模糊集合及其运算

2.6.3 隶属函数

2.6.4 模糊矩阵、模糊关系、模糊向量

2.7 同态信号处理

2.7.1 同态信号处理表示

2.7.2 卷积同态信号处理的一些性质

2.7.3 倒谱与复倒谱的关系

2.7.4 倒谱与复倒谱的特点

2.7.5 复倒谱与倒谱的计算方法

2.8 说话人识别统计模型

2.8.1 隐马尔科夫模型

2.8.2 高斯混合模型

2.9 本章小结

第三章 LSF码书设计与优化

3.1 引言

3.2 线谱频率(LSF)系数

3.3 LSF矢量量化

3.3.1 LSF标量量化

3.3.2 初始码书生成算法

3.4 LSF经典码书设计算法(LBG)与分析

3.4.1 LBG算法与基本问题

3.4.2 LBG算法的进一步分析

3.5 新的码书优化方案

3.5.1 最近邻划分变异方案

3.5.2 矢量空间状态优化方案

3.6 基于概率密度估计的进化规划码书设计算法

3.6.1 研究思路

3.6.2 算法原理分析

3.6.3 算法实现步骤

3.6.4 实验结果与分析

3.7 基于粒子群的码书优化算法

3.7.1 研究思路

3.7.2 算法原理分析

3.7.3 实现步骤

3.7.4 实验结果与分析

3.8 本章小结

第四章 基于模糊相关度的VQ说话人识别

4.1 引言

4.2 说话人识别的基本原理

4.3 说话人识别的特征选择

4.3.1 高层次与低层次语音特征

4.3.2 短时傅里叶变换

4.3.3 线性预测系数及其派生系数

4.3.4 基于听觉原理的特征参数

4.3.5 特征参数的统计评价

4.4 说话人识别的主要方法与分析

4.4.1 最小距离分类器

4.4.2 矢量量化

4.4.3 高斯混合模型

4.4.4 隐马尔科夫模型

4.4.5 几种方法的比较与分析

4.5 基音及其提取

4.6 倒谱特征参数

4.6.1 MFCC参数提取算法

4.6.2 LPCC参数提取算法

4.7 基于模糊相关度的VQ说话认人辨认

4.7.1 研究思路

4.7.2 算法原理分析

4.7.3 算法实现步骤

4.7.4 实验结果与分析

4.8 本章小结

第五章 抗信道噪声的矢量量化数字水印

5.1 引言

5.2 矢量量化图像压缩码书设计与优化

5.2.1 一种改进的LBG算法

5.2.2 基于AMPSO的图像码书优化

5.3 水印算法的基本要求

5.4 一种基于图块分类的水印算法

5.4.1 基本原理

5.4.2 实现步骤

5.4.3 实验结果

5.5 基于基本码字标志的矢量量化数字图像水印算法

5.5.1 矢量量化数字水印算法原理

5.5.2 实现步骤

5.5.3 实验结果

5.6 抗信道噪声矢量量化数字水印新算法

5.6.1 研究思路

5.6.2 算法原理与步骤

5.6.3 实验与分析

5.7 本章小结

第6章 总结与展望

6.1 本文工作总结

6.2 未来研究方向

参考文献

致谢

在学期间发表的学术论文

附录

展开▼

摘要

伴随着信息与通信等领域的迅速发展,大量的语音、图像等多媒体信息要进行存储、处理与传输,需要很大的存储空间和信道带宽。为了提高存储效率和减小存储空间,在允许的失真条件下,应尽可能地消除媒体信息中的冗余信息。矢量量化技术作为一种有效的有损压缩技术,具有压缩比大、解码算法简单的特点,而成为语音、图像压缩编码的重要技术之一。矢量量化(VQ)技术不单是用于信息压缩,现已发展到说话人识别、数字水印、语音识别、图像识别、文献检索等领域。因此,矢量量化技术具有重要的研究价值。 矢量量化有三个方面的关键技术:码书设计、码字搜索和码字索引分配,其中码书设计是首要问题。码书设计的主要目标是找到训练矢量的一个最佳分类,即将M个k维的训练矢量分成N个类别的最佳方案。压缩编码,基于矢量量化的说话人识别,和基于矢量量化的数字水印都需要一个性能良好的码书。本文重点分析了经典的码书设计算法,研究了改进方案和码书优化算法。在此基础上,进一步地结合语音信号处理和图像处理有关理论和技术,研究了新的矢量量化说话人识别方案和矢量量化数字水印技术。
  本文的主要工作和特色如下: 1.码书设计经典算法LBG得到了广泛应用,但该算法一般得到一个局部最优码书。利用进化算法优化码书是近年来的一个重要研究方向,其关键是需求合理的优化方案和优化搜索方法。目前有基于码书和基于训练矢量划分两种方案,但这两种方案将导致进化算法的优化搜索空间过大,要优化的维数分别是M和N×k,而目前的进化算法还难以有效解决高维的优化,优化效果不明显。本文针对上述两种方案存在的问题,提出了基于最近邻划分变异/矢量空间状态优化的方案。基于该方案,优化搜索在与矢量同维的低维空间中进行,编码空间相对较小,有利于优化算法的性能发挥,可有效地提高码书性能。 2.为了提高码书优化算法的效率,本文分析了进化规划(EP)、概率密度估计算法(EDA)、粒子群优化(PSO)等方法在应用于矢量量化方面存在的问题,并针对性地提出了两种新的混合型优化方法,及相应的码书优化算法: 1)基于概率密度估计算法的进化规划码书设计算法。EP具有找到全局最优码书的进化趋势,但其以变异算子为主要的进化操作,收敛较慢,引入EDA通过概率估计,预测最优个体,为EP提供搜索方向,加速算法的收敛。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号