首页> 中国专利> 语音质量损耗估算方法及相关装置

语音质量损耗估算方法及相关装置

摘要

本发明公开了一种语音质量损耗估算方法及相关装置。本发明实施例中,获取无线信号中的无线链路参数;并根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。通过无线链路参数预测无线网络传输语音的相对变化,相对于现有技术中预测接收到的语音质量本身,可以获得更好的相关性,预测更加准确,有利于对无线网络的语音传输情况作出正确评价。

著录项

  • 公开/公告号CN101459934A

    专利类型发明专利

  • 公开/公告日2009-06-17

    原文格式PDF

  • 申请/专利权人 上海华为技术有限公司;

    申请/专利号CN200710172408.7

  • 发明设计人 程志坤;

    申请日2007-12-14

  • 分类号H04W28/16(20090101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人逯长明

  • 地址 200121 上海市浦东新区宁桥路615号

  • 入库时间 2023-12-17 22:06:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2010-12-08

    授权

    授权

  • 2009-08-12

    实质审查的生效

    实质审查的生效

  • 2009-06-17

    公开

    公开

说明书

技术领域

本发明涉及通信技术领域,具体涉及语音质量损耗估算方法及相关装置。

背景技术

在现代无线通讯网络中,语音业务占据重要的地位。为了能够给用户提供良好的语音质量服务,运营商需要对网络的语音质量做一个准确的检测。端到端的语音质量可以通过一些客观评估工具得到,这个业务流程包括有线网络和无线网络2个部分,其中无线网络是影响语音质量的关键环节。但在无线网络中只能测量得到一系列无线链路参数,包括误码率(BER)、删帧率(FER)、切换频率和切换状态等,它们同端到端语音质量本身没有直接的联系。

那么用这些无线链路参数,经过组合同端到端语音质量建立一个映射方式,即通过这个映射方式,能够从无线链路质量大概评估接收端用户的语音质量感受,进而得知无线系统的语音传输质量。

现有的一种技术方案是:

首先获取系统的无线链路参数,包括:BER、FER、切换频率和切换状态等。

通过对上述参数的统计,考虑到对不同语音声码器特性做相应的调整,经过独立的运算可以得出语音质量指示(Speech Quality Indicator)评分的分数。

具体过程包括:首先是接收众多的无线链路参数,比如BER、FER、接收电平(RxLev)切换状态等,这些参数包含无线时域特性,包括衰落率、衰落长度、衰落深度、信噪比、信干比、信号电平、切换场景等。这些参数重新计算得到时域可用信息,这些信息可用于计算得出一系列可用于统计分析的时域参数,比如任何预定义时段内(0.1s~10s)的最大值、最小值、平均值、标准方差、自相关值。时域参数合并产生一系列更接近语音质量的相关参数。最后预测器用这些相关参数得到语音质量的预测值。预测器可以基于线性或非线性预测,可由神经网络组成,或是配置状态机响应网络的动态变化因素比如移动台速度、调频非调频之间的改变等。

一个简单的预测式子为其中的系数A、B等可以采用训练序列线性回归得到,也可以采用非线性预测得到更准确的值。

对应上面的预测式子,代入一些目前使用较多的链路参数,就得到目前我们所熟悉的公式为SQI=A×BER+B×FER+C×LFE+CONST.对于GSM全速率语音编码算法(GSM-FR),在不考虑切换和DTX的情况下,可以给出的一个式子为:

SQI=20.67—57.2×BER—29.3×TFER—0.11×LFE

其中,计算时段为2.5s,BER是过去2.5s内平均的误码率,FER是过去2.5s内平均的删帧率,TFER是指FER的平方根。限制TFER的最大值为0.66,LFE是过去2.5s内的最长删帧长度。同RXQUAL类似,SQI是每0.5s计算一次。也可以更改为0.48s计算一次。

在上述对现有技术方案的描述中可以得知,在确定了需要参与预测无线链路参数后,在给定语音质量和无线链路参数的值的情况下,其中A、B、C等系数,可以采用训练序列线性回归得到,当然也可以采用非线性预测得到更准确的值。

发明人对上述现有的技术方案进行了模拟,如图1所示,是采用20个语音样本,无线链路参数以删帧情况为例,经过试验得到20个语音样本的无损耗和在各个删帧情况下的遍历所有帧之后对所有帧做平均后得到的语音质量的感知估算(Perceptual Evaluation of Speech Quality,PESQ)的MOS分值,其中PESQ是目前应用广泛的客观语音质量评价方法。

图1中的横坐标为20个语音序列,纵坐标为语音质量的MOS评分值。同样的删帧情况的点被连成一条折线。折线0至折线13分别表示20个语音序列在不同的删帧情况下的语音评分。

图1中折线标号与删帧情况的对比列表如表1所示:

表1

 

编号删帧情况0无损耗1丢1帧2间隔2帧丢3帧3间隔2帧丢2帧4连丢2帧5间隔1帧丢2帧6连丢3帧7间隔1帧丢3帧8间隔2帧丢4帧9连丢4帧10间隔1帧丢4帧11间隔2帧丢10帧12连丢10帧13间隔1帧丢10帧

下面依据图1给出的数据,采用上述SQI的方式进行线性回归拟合,因为图中只是模拟丢帧的情况,没有模拟误码,因此公式中的参数为FER和LFE,没有BER。采用Microsoft公司的电子表格软件Excel提供的线性拟合函数LINEST进行拟和,得到结果如下:

拟合后的公式为:SQI=-0.2965×FER-0.00083×LFE+4.03276

判定系数=0.34556

残差平方和的标准方差=0.128787。

判定系数是函数值的估计值与理想的实际值之比,范围在0~1之间,如果为1则样本有很好的相关性,Y的估计值与实际值之间没有差别。如果判定系数为0,则回归公式不能用来预测函数值。

在对现有技术的研究和实践过程中,发明人发现现有技术存在以下问题:

经过上述分析得到的判定系数为0.34556,残差平方和的标准方差为0.128787,可见SQI同接收语音质量之间的相关性并不强,况且这是在清晰语音样本下的几个删帧平均值的模拟,实际情况下的相关性可能更差。用这种方式预测语音质量结果偏离实际情况较大,较难对无线网络的语音传输情况作出正确的判断。

发明内容

本发明实施例解决的技术问题是提供语音质量损耗估算方法及相关装置,可以获得更好的相关性,对无线网络的语音传输情况预测更准确。

本发明实施例提供一种语音质量损耗的估算方法,包括:

获取无线信号中的无线链路参数;

根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。

本发明实施例提供一种语音质量损耗估算的装置,包括:

无线链路参数提取单元,用于获取无线信号中的无线链路参数;

估算单元,用于根据所述无线链路参数提取单元获取的无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。

本发明实施例提供一种估算语音质量损耗的参量系数的装置,包括:

无线链路参数获取单元,用于获取待测系统的无线链路参数;

语音质量损耗获取单元,用于根据给定的发送端的语音质量和相应的接收端的语音质量计算得出无线链路参数对应的语音质量损耗值;

系数计算单元,用于根据所述语音质量损耗值和无线链路参数进行拟合计算得到用于估算语音质量损耗的各个参量的系数。

采用上述技术方案,本发明实施例有益的技术效果在于:

本发明实施例中,获取无线信号中的无线链路参数;并根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。通过无线链路参数预测无线网络传输语音的相对变化,相对于现有技术中预测接收到的语音质量本身,可以获得更好的相关性,预测更加准确,有利于对无线网络的语音传输情况作出正确评价。

附图说明

图1为对现有技术方案进行模拟的语音质量评分示意图;

图2为本发明实施例一语音质量损耗估算方法的流程图;

图3为本发明实施例二估算语音质量损耗的参量系数的拟合方法的流程图;

图4为本发明实施例中20个序列语音在不同无线链路参数下的质量评分差值示意图;

图5为本发明实施例对估算语音质量损耗的系数进行线性拟合的系统结构图;

图6为本发明实施例中网络语音损耗的实际应用方式的系统结构图;

图7为本发明实施例三语音质量损耗估算的装置的结构示意图;

图8为本发明实施例四语音质量损耗估算的装置的结构示意图;

图9为本发明实施例五估算语音质量损耗的参量系数的装置的结构示意图;

图10为本发明实施例六估算语音质量损耗的参量系数的装置的结构示意图。

具体实施方式

本发明实施例提供了语音质量损耗估算方法及相关装置,可以获得更好的相关性,对无线网络的语音传输情况预测更准确。

从现有的技术方案中可以得知,以接收端语音质量来作为训练序列来拟和SQI相关性并不并不理想,我们需要建立一个新的有效的映射方式。从图1中可以看到,接收端语音质量比起发射端无损语音质量有所下降,但每种删帧情况下的曲线形状都接近无损情况的曲线,即在删帧情况下,语音质量的下降接近一个常数,这个常数同删帧率和连续删帧有关。可见,采用接收端对发射端语音质量的下降值也就是语音质量损耗,就能获得比起上面单纯采用接收端语音质量更高的相关性。

下面对本发明提供的语音质量损耗估算方法及相关装置进行详细描述。

实施例一,一种语音质量损耗估算方法,流程图如图2所示,包括:

A1,获取无线信号中的无线链路参数;

本发明实施例中,所述无线链路参数至少包括:误码率、删帧率、最长连续删帧长度、接收信号电平、软信息、语音能量参数或越区切换统计量的其中一项。

A2,根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。

本发明实施例中,根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗可以包括:

首先,将所述无线链路参数变换成与语音质量损耗相关的形式;

本发明实施例中,所述形式变化可以包括:

通过执行对数、指数、乘方、开方、正交、取幂或加权平均开窗口中的任何一个运算或操作对无线链路参数进行形式变换。

可以理解的是,形式变化还可以是其他多种数学变换方式,变换的目的是为了得到与语音质量损耗相关的形式,而有利于后面的估算。具体的变换形式不构成对本发明的限制。

然后,根据所述无线链路参数经过变换后的形式和预置的估算语音质量损耗的参量系数估算语音质量损耗。

可以理解的是,所述无线链路参数也可以不经过形式变换,直接利用获取的无线链路参数估算语音质量损耗,不过对于一些无线链路参数经过形式变换与语音质量损耗可以具有更好的相关性。所述估算语音质量损耗的参量系数可以通过预置的算法估算得到,具体的估算方式参考实施例二。

本发明实施例中,所述估算语音质量损耗的过程可以采用线性估算器执行估算或采用非线性估算器执行估算,还可以利用神经网络来执行估算。

本发明实施例一中,获取无线信号中的无线链路参数;并根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。通过无线链路参数预测无线网络传输语音质量的相对变化,相对于现有技术中预测接收到的语音质量本身,可以获得更好的相关性,预测更加准确,有利于对无线网络的语音传输情况作出正确评价。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括如下步骤:

获取无线信号中的无线链路参数;

根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

对于上述实施例一语音质量损耗估算方法中,本发明实施例还提供一种估算语音质量损耗的参量系数的拟合方法,由此可以得出本发明比现有技术方案更好的相关性和拟合精度。

实施例二,一种估算语音质量损耗的参量系数的拟合方法,流程图如图3所示,包括:

B1,获取待测系统的无线链路参数;

B2,获取所述无线链路参数对应的语音质量损耗值;

所述获取待测系统的语音质量损耗值可以包括:

根据给定的发送端的语音质量和相应的接收端的语音质量计算得出无线链路参数对应的语音质量损耗值。

B3,根据所述语音质量损耗值和无线链路参数进行拟合计算得到用于估算语音质量损耗的各个参量的系数。

本发明实施例中,为了得到更好的相关性,同样也是先将所述无线链路参数变换成的与语音质量损耗相关的形式;

再根据所述语音质量损耗值和无线链路参数经过变换后的形式进行拟合计算得到用于估算语音质量损耗的各个参量的系数。

本发明实施例中,可以通过变换形式后的无线链路参数和其对应的语音质量损耗值的训练序列,进行多次拟合计算得到用于估算语音质量损耗的各个参量的系数。

所述拟合计算为线性回归拟合计算或非线性预测拟合计算或神经网路计算。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括如下步骤:

获取待测系统的无线链路参数;

获取所述无线链路参数对应的语音质量损耗值;

根据所述语音质量损耗值和无线链路参数进行拟合计算得到用于估算语音质量损耗的各个参量的系数。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。

下面对上述实施例二的方法进行具体说明。

参阅图4,是本发明实施例中中20个序列语音在不同无线链路参数下的质量评分差值示意图。本图中的无线链路参数采用删帧情况进行模拟。

图中横坐标表示20个语音序列,纵坐标表示语音质量评分的差值(发送端语音评分一接收端语音评分),由下至上13条曲线表示不同13中不同的删帧情况。相同的丢帧情况连接为一条曲线,其中,丢1帧表示遍历所有帧后得到的丢1帧后的语音质量损伤平均,以序列1为例,它共有400帧,丢1帧平均语音质量损耗=(丢第1帧后得到的语音质量损耗+丢第2帧后得到的语音质量损耗+......丢第400帧得到的语音质量损耗)/400,其余各个序列类似计算。连续丢2帧表示丢2帧,这2帧是连续位置的,比如1/2,或2/3等,编译所有帧后同样也得到一个平均语音质量损耗,以序列1为例,连续丢2帧平均语音质量损耗=(丢第1,2帧后得到的语音质量损耗+丢第2,3帧后得到的语音质量损耗+......丢第399,400帧得到的语音质量损耗)/399。其余连续丢帧类似。间隔丢帧表示同时丢的几帧是间隔的,比如1,3,或2,4。而间隔2帧表示同时丢的几帧是间隔2帧的,比如1,4,或2,5。

图4中折线标号与删帧情况的对比列表如表2所示:

表2

 

标号删帧情况1丢1帧2间隔2帧丢2帧3连丢2帧4间隔1帧丢2帧5间隔2帧丢3帧6连丢3帧7间隔1帧丢3帧8间隔2帧丢4帧9连丢4帧10间隔1帧丢4帧11间隔2帧丢10帧12连丢10帧13间隔1帧丢10帧

本实施例中的参量为:删帧率的平方根(TFER)和最长删帧长度(LFE)。

因传输导致语音质量评分的下降,可以看到这个时候的数据点的值比起图1要小的多。

下面对上述的20个语音序列进行线性拟合计算,拟合计算采用Excel的LINEST线性拟合,结果如下表3。

表3

 

8.2E-1561.9692012601.68140841.209290.0022160.08376500.0013180.002033#N/A0.9372270.047352#N/A1926.026258#N/A8.6372790.578501#N/A0.1826160.047261

输出的公式为ΔSQ=MOSx-MOSr=0.083765×TFER+0.002216×LFE这个时候,判断系数达到0.937227,已经很接近于1了。而残差平方和标准方差只有0.047261。比起现有的技术方案模拟得到的数值特也要小的多了。

可见语音质量的损耗值与无线链路参数的相关性,和接收端语音质量本身与无线链路参数的相关性相比,更加良好。

反映在公式上,即:

ΔSQ=MOSx-MOSr=x×BER+y×TFER+z×LFE

注意公式中没有常数项。

上面公式中MOSx和MOSr的测量可以通过主观测试得到,但更多地是采用各种客观语音测量工具得到,比如目前应用很广的PESQ,或者是应用于VOIP网络的E-MODEL。应用PESQ计算MOSx和MOSr,从而得到ΔSQ,再对BER、FER、LFE等无线链路参数进行线性回归可以得到较为准确的无线语音质量损耗。

本发明在实际应用中,因为无线网络语音质量损耗同无线链路参数存在较大的相关性,但这种相关性的具体映射方式同实际网络状况有关,各个参数的变换形式和系数需要通过训练序列预测得到。

请参阅图5为本发明实施例对估算语音质量损耗的系数进行线性拟合的系统结构图;该图体现了训练过程。

图5中首先给出一个包含标准语音序列的数据库,理论上在网络语音业务呼叫出现的各种语音最好都包含在内,这样拟和出的结果就有一个“完全性”,但实际上这样的语音太多,数据库容量有限,并且各种语音出现的概率不等,我们只要选取满足大部分场景下应用的语音序列即可,这样的序列也不会太少。一般上,选取的序列都是无环境噪声下的清晰语音样本,且它要涵盖男声女声、不同语言、不同年龄段等。此外,语音激活比例也是一个需要关注的因素,一般需要激活比例在40%~80%之间。通过评分软件可以得到这些序列的MOS分值,即MOSx。

将标准语音序列灌到待测的网络系统中,在接收端测量得到损耗后语音质量MOSr以及一系列无线链路参数,包括BER、FER、LFE、RxLevel、DTX比例等等。计算ΔMOS=MOSx-MOSr,对这些无线链路参数进行时域形式变换,之后按照最小均方误差等原则进行线性拟和或多项式拟和,就可以得到包括无线参数变化形式和系数在内的拟和公式。

无线参数的时域变化形式包括平均值、最大值、方差,以及它们的各个指数形式等,为了得到一个最佳意义的拟和结果,可能需要多次试验。目前可以得到的初步结论是语音损耗对FER的0.5次(即TFER)成线性关系,更接近的指数数值是0.6667次。

采用上面拟和得到的结果应用到这个实际网络中,即可以用作对网络语音质量损耗程度的度量。

请参阅图6为本发明实施例中,网络语音损耗的实际应用方式的系统结构图。

图6中,实际网络的发射端发送语音,经过无线环境衰减误码后,由接收端接收语音信号,同时,测量得到这一个时段的无线链路参数,采用上面训练得到的拟和公式,计算得到此时对用的无线网络语音损耗。计算得到的损耗越大,此时对应的网络状态越差。

图6中的TX是移动终端(如:手机),RX是基站,或者反过来。

统计的时段依据接收端设备对网络链路参数的测量能力,一般来说越短,对网络质量的检测越准确,但也不是越短越好,太多的测量任务会加重系统的负载,并且采用的训练序列也要相应缩短,过短的序列会影响到语音测量工具的准确性。在GSM网络中,网络一般以480ms超帧时段进行上报,此时可以采用480ms的倍数作为测量时长,一般以2.4s为宜。

下面对本发明实施例提供的实施上述实施例方法的装置进行说明。

实施例三,一种语音质量损耗估算的装置700,装置结构示意图如图7所示,包括:无线链路参数提取单元710和估算单元720;

无线链路参数提取单元710,用于获取无线信号中的无线链路参数;

估算单元720,用于根据所述无线链路参数提取单元710获取的无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。

本发明实施例四,一种语音质量损耗估算的装置800,装置结构示意图如图8所示,包括:无线链路参数提取单元810、估算单元820,所述估算单元820包括:参数形式变换单元821和损耗估算单元822。

无线链路参数提取单元810,用于获取无线信号中的无线链路参数;

参数形式变换单元821,用于将所述无线链路参数变换成与语音质量损耗相关的形式;

损耗估算单元822,根据所述无线链路参数经过变换后的形式和预置的估算语音质量损耗的参量系数估算语音质量损耗。

所述损耗估算单元可以是线性估算器或非线性估算器或神经网络。

本发明实施例三和实施例四所述的装置可以运行实施例一所述的方法。

实施例五,一种估算语音质量损耗的参量系数的装置900,装置结构示意图如图9所示,包括:无线链路参数获取单元910、语音质量损耗获取单元920和系数计算单元930;

无线链路参数获取单元910,用于获取待测系统的无线链路参数;

语音质量损耗获取单元920,用于根据给定的发送端的语音质量和相应的接收端的语音质量计算得出无线链路参数对应的语音质量损耗值;

系数计算单元930,用于根据所述语音质量损耗值和无线链路参数进行拟合计算得到用于估算语音质量损耗的各个参量的系数。

实施例六,一种估算语音质量损耗的参量系数的装置,装置结构示意图如图10所示,包括:无线链路参数获取单元1010、语音质量损耗获取单元1020和系数计算单元1030,所述系数计算单元包括:参数形式变换单元1031和拟合计算单元1032;

无线链路参数获取单元1010,用于获取待测系统的无线链路参数;

语音质量损耗获取单元1020,用于根据给定的发送端的语音质量和相应的接收端的语音质量计算得出无线链路参数对应的语音质量损耗值;

参数形式变换单元1031,用于将所述无线链路参数变换成的与语音质量损耗相关的形式;

拟合计算单元1032,根据所述语音质量损耗值和所述无线链路参数经过变换后的形式进行拟合计算得到用于估算语音质量损耗的各个参量的系数。

所述拟合计算单元是线性估算器或非线性估算器或神经网络。

本发明实施例五和实施例六所述的装置可以运行实施例二所述的方法。

以上对本发明所提供的一种语音质量损耗估算方法及相关装置进行了详细介绍,其中:

本发明实施例中,获取无线信号中的无线链路参数;并根据所述无线链路参数和预置的估算语音质量损耗的参量系数估算语音质量损耗。通过无线链路参数预测无线网络传输语音的相对变化,相对于现有技术中预测接收到的语音质量本身,可以获得更好的相关性,预测更加准确,有利于对无线网络的语音传输情况作出正确评价。

对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号