公开/公告号CN102568488A
专利类型发明专利
公开/公告日2012-07-11
原文格式PDF
申请/专利权人 安徽创世科技有限公司;
申请/专利号CN201210041994.2
申请日2012-02-23
分类号G10L19/00(20060101);G10L19/14(20060101);G10L21/02(20060101);
代理机构34115 合肥天明专利事务所;
代理人金凯
地址 230088 安徽省合肥市黄山路602号合肥国家大学科技园5楼A区
入库时间 2023-12-18 06:00:04
法律状态公告日
法律状态信息
法律状态
2016-07-20
专利权人的姓名或者名称、地址的变更 IPC(主分类):G10L21/0208 变更前: 变更后: 申请日:20120223
专利权人的姓名或者名称、地址的变更
2013-06-12
授权
授权
2012-09-12
实质审查的生效 IPC(主分类):G10L19/00 申请日:20120223
实质审查的生效
2012-07-11
公开
公开
技术领域
本发明涉及一种语音数据的后处理方法,具体是一种抑制网络丢包影响的语音数据后处理方法。
背景技术
随着近年来互联网的迅猛发展,如视频会议、视频监控、VOIP等基于网络音视频技术的各种应用和产品得到了迅速的推广。其中音频数据在网络上传输时,为了保证实时性,大多数应用都是基于UDP进行传输的。UDP传输数据的特点是传输时不能保证负载数据的完整性。因此传输的音频数据不可避免的会产生丢包。如果丢包后的数据不做任何处理,直接播放会引入很多高频噪音,影响主观听觉感受。
人们对音频数据在网络传输丢包的后处理方法进行了相关的研究,如:[1]、在分布式语音识别处理和系统中减轻传输错误影响的方法和设备,专利申请号:01809628.X;[2]、处理丢失帧的语音通信系统及方法,专利申请号:01812823.8;[3]、一种在网络上传输IP语音包的丢包恢复方法,专利申请号:00129594.2。专利[1]主要是基于识别并替换传输的错误语音参数来进行语音处理,而基于UDP的数据传输一般都是数据包丢失,而数据包内容错误的情况非常少见;专利[2]、专利[3]的目的都是要减轻数据包丢失造成的影响,不过这两个方法采用的思路是通过曲线拟合、波形插值、线性预测等方法恢复丢失的数据包的语音数据,这样的处理思路一般要缓冲丢失数据包前后各若干个数据包进行处理,需要内存较多,且影响语音播放的实时性。
发明内容
本发明要解决的技术问题是提供一种抑制网络丢包影响的语音数据后处理方法,在网络传输过程中数据包丢失情况下,对收到的前后两个数据包的边缘数据进行拟合校正,通过滤除采样点幅值突变而引入的高频噪音,改善了主观听觉感受。
本发明的技术方案为:
一种抑制网络丢包影响的语音数据后处理方法,其特征在于:包括以下步骤:
(1)、将每一个音频数据包记为 ,每个数据包都由个采样点组成,第个采样点幅值记为,=0……-1;
(2)、一个新接收到的数据包,如果其通过数据包序列号的方式判断出和上一次接收的数据包之间没有数据丢失时,则此数据包的播放按正常方式播放上一次接收的数据包,并且将此数据包缓冲起来;如果此数据包通过数据包序列号的方式判断出和上一次接收的数据包之间有数据丢失时,则将上一次接收的数据包记为,将这次接收的数据包记为;
(3)、如果一个点的幅值大于前后两点的幅值,我们称为极值点;在的采样点中从后向前找到的第一个极值点记为,在的采样点中从前向后找到的第二个极值点记为;
(4)、以数据包每个采样点的序号为横坐标,幅值为纵坐标,对和前后各一个点做正弦函数曲线拟合,得以下函数式[1]:;对和前后各一个点同样按正弦函数曲线进行拟合,得以下函数式[2]: ;
(5)、[,]对区间之间的点按式[1]和式[2]的线性组合后得的式[3]来求取新的幅值替代原来的幅值,函数式[3]为:;
(6)、将更改了之后若干点幅值的新的数据包即时播放,并且将更改了之前若干点幅值的新的数据包缓冲起来用于后续数据包的处理;
(7)、返回步骤1重新开始处理下一个接收到的数据包。
本发明的有益效果:本发明对收到的前后两个数据包的边缘数据进行拟合校正,滤除了采样点幅值突变而引入的高频噪音,从而改善主观听觉感受,该方法具有低延时、内存需求少、复杂度低的优点。
附图说明
图1是没有校正前的采样点波形图,其中,空心圈代表了前一个数据包的采样点的幅值,空心矩形代表了当前接收的数据包的采样点的幅值,代表前一个数据包从后向前的第一个极值点,代表当前接收的数据包从前向后的第二个极值点。
图2是校正后的采样点波形图,其中空心圈代表了前一个数据包的采样点的幅值,空心矩形代表了当前接收的数据包的采样点的幅值,实心圈代表了校正后的采样点的幅值,实心圈代表了校正后的采样点的幅值,代表前一个数据包从后向前的第一个极值点,代表当前接收的数据包从前向后的第二个极值点。
具体实施方式
一种抑制网络丢包影响的语音数据后处理方法,其特征在于:包括以下步骤:
(1)、将每一个音频数据包记为,每个数据包都由个采样点组成,第个采样点幅值记为,=0……-1;
(2)、一个新接收到的数据包,如果其通过数据包序列号的方式判断出和上一次接收的数据包之间没有数据丢失时,则此数据包的播放按正常方式播放上一次接收的数据包,并且将此数据包缓冲起来;如果此数据包通过数据包序列号的方式判断出和上一次接收的数据包之间有数据丢失时,则将上一次接收的数据包记为,将这次接收的数据包记为;
(3)、如果一个点的幅值大于前后两点的幅值,我们称为极值点;在的采样点中从后向前找到的第一个极值点记为,在的采样点中从前向后找到的第二个极值点记为;
(4)、以数据包每个采样点的序号为横坐标,幅值为纵坐标,对和前后各一个点做正弦函数曲线拟合,得以下函数式[1]:;对和前后各一个点同样按正弦函数曲线进行拟合,得以下函数式[2]: ;
(5)、[,]对区间之间的点按式[1]和式[2]的线性组合后得的式[3]来求取新的幅值替代原来的幅值,函数式[3]为:;
(6)、见图2,将更改了之后若干点幅值(实心圆)的新的数据包即时播放,并且将更改了之前若干点幅值(实心圆)的新的数据包缓冲起来用于后续数据包的处理;
(7)、返回步骤1重新开始处理下一个接收到的数据包。
从图1、图2可以看出,校正后的幅值可能和原来的幅值有较大的偏差,但在两个数据包相邻采样点的跳变会减小,从而抑制了高频噪声。
机译: 一种用于在数据分组中布置表示语音编码语音的参数数据以减少传输信道错误对分组的影响的方法和系统
机译: 进行自动重发请求的数据网络中的丢包方法及丢包装置
机译: 在移动终端中发送/接收语音消息的装置和方法,在移动数据网络中使用移动终端进行语音消息发送/接收的无线数据网络中发送语音消息的服务系统和服务方法