首页> 中国专利> 在通用移动电信系统中实现多种语音编解码的方法

在通用移动电信系统中实现多种语音编解码的方法

摘要

本发明公开了一种在通用移动电信系统中基于一种编解码算法实现多种语音编解码的方法,该方法包括编码时首先根据编码类型选择速率模式,调用统一的AMR语音编解码模块,如果检测为非静音,则按照确定的速率输出语音编码比特,如果检测为静音,则根据编码类型选择各自的舒适噪音产生和断续传输模块,输出静音编码比特;解码是编码的逆过程,只增加一个错帧补偿和弱音处理步骤,最后统一输出13bit线性PCM数据。在保证语音质量不变的前提下,基于一种语音编解码算法统一实现所有UMTS系统窄带语音业务定义的7种语音编解码,以显著改善UMTS系统语音编解码器的经济性、可实现性并解决占用存储空间大的问题。

著录项

  • 公开/公告号CN1398126A

    专利类型发明专利

  • 公开/公告日2003-02-19

    原文格式PDF

  • 申请/专利权人 华为技术有限公司;

    申请/专利号CN01123007.X

  • 发明设计人 周亮;

    申请日2001-07-18

  • 分类号H04Q7/20;H04M1/66;

  • 代理机构

  • 代理人

  • 地址 518057 广东省深圳市科技园科发路华为用服大厦

  • 入库时间 2023-12-17 14:40:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-12-21

    未缴年费专利权终止 IPC(主分类):H04Q7/20 授权公告日:20040128 终止日期:20150718 申请日:20010718

    专利权的终止

  • 2016-07-20

    文件的公告送达 IPC(主分类):H04Q7/20 收件人:华为技术有限公司 文件名称:专利权终止通知书 申请日:20010718

    文件的公告送达

  • 2015-12-23

    文件的公告送达 IPC(主分类):H04Q7/20 收件人:华为技术有限公司 文件名称:缴费通知书 申请日:20010718

    文件的公告送达

  • 2004-01-28

    授权

    授权

  • 2003-05-21

    实质审查的生效

    实质审查的生效

  • 2003-02-19

    公开

    公开

  • 2002-03-27

    实质审查的生效

    实质审查的生效

查看全部

说明书

技术领域

本发明涉及一种语音编解码技术,更具体地涉及通用移动电信系统(UMTS)中统一实现多种语音编解码的方法。

背景技术

语音编解码器TC(Transcoder)是UMTS系统实现语音承载业务的基础。不仅在用户设备(UE)上必不可少,而且在现阶段核心网中的语音承载设备也是必须使用的功能实体。3GPP标准组织为UMTS系统实现窄带语音业务定义了7种语音编解码:GSM系统增强型全速率编解码(GSM EFR),TDMA系统增强型全速率编解码(TDMA EFR),PDC系统增强型全速率编解码(PDC EFR),半速率AMR语音编解码(HR AMR),全速率AMR语音编解码(FR AMR),UMTS系统AMR语音编解码(UMTS AMR),UMTS系统AMR语音编解码标准2(UMTS AMR 2)(见3GPP TS 26.103)。其中,GSM EFR、TDMA EFR、PDC EFR、HR AMR、FR AMR都是传统2G系统的语音编解码算法,UMTS AMR和UMTS AMR 2是为UMTS系统新定义的语音编解码器。UMTS核心网上的语音承载设备为了实现TFO模式下与其他移动通讯系统(GSM、IS54、IS136、PDC、R99的UMTS系统等)的互通,其语音编解码器必须支持上述所有7种语音编解码协议。UMTS的UE为了实现编解码器非级联方式(Transcoder Free Operation-简称TFO)模式通讯及在多个系统间漫游,也需要尽可能支持多种语音编解码协议。

为了达到上述目的,通常的做法就是在语音编解码器中分别实现所有7种语音编解码算法。然而,由于语音编解码算法非常复杂,这种实现方法的代价十分昂贵(自行开发或采购)。而且通常用于实现语音编解码的高速半导体器件(如DSP)的存储器空间十分有限,特别是UE,受成本、功耗、体积等因素限制,其存储空间更是紧张。为了实现7种语音编解码算法所需要的程序空间和数据空间都是相当可观并且难以承受的。

发明内容

本发明的目的是在于克服上述存在的缺陷,在保证语音质量不变的前提下,基于一种语音编解码算法统一实现所有UMTS系统窄带语音业务定义的7种语音编解码,以显著改善UMTS系统语音编解码器的经济性、可实现性并解决占用存储空间大的问题。

本发明的方法是通过如下的技术方案实现的,在通用移动电信系统中实现多种语音编解码的方法,该方法包括如下步骤:

编码时首先根据设置的命令判断当前的编码类型;

根据编码类型选择速率模式;

然后调用统一的AMR语音编码模块,执行编码操作;

其中,如果经过静音检测确定是静音,则根据相应的编码类型调用各自的舒适噪音编码(SID)和断续传输(DTX)模块;

如果是非静音,则根据确定的速率输出语音编码比特;

解码是编码的逆过程,首先从接收到的帧中判断其坏帧指示(BFI)标志,检查是否有错帧,根据坏帧指示(BFI)标志判断是否需要作错帧补偿;

如果判断是错帧,则进行错帧补偿和弱音处理;

如果判断是正常的,则根据舒适噪音编码(SID)标志判断是否是静音,如果是静音,则根据相应的编解码类型调用各自的断续传输和舒适噪音解码模块;

如果是非静音,则根据相应的编解码类型设置速率,进行AMR解码操作,最后统一输出13bit线性PCM数据。

所述的确定的速率和根据相应的编解码类型设置速率均为:GSMEFR选择AMR_12.20,TDMA_EFR选择AMR_7.40,PDC_EFR选择AMR_6.70,而HR AMR、FR AMR、UMTS AMR和UMTS AMR 2则根据各自的速率控制命令确定速率。

本发明基于AMR语音编解码统一实现了UMTS系统窄带语音业务规定的所有7种语音编解码算法,显著降低了UMTS语音编解码器的实现成本,解决了存储空间的问题,明显提高了系统实现效率。

附图说明

下面结合附图和实施例进一步说明本发明的方法。

图1是本发明方法使用的编码流程示意图;

图2是本发明方法使用的解码流程示意图;

图3是传统实现方法的代码量统计表格图;

图4是本发明实现方法的代码量统计表格图;

图5是不同方法的存储空间比较表格图。

具体实施方式

本发明所述的在通用移动电信系统中实现多种语音编解码的方法是通过如下的技术方案实现的,在上述7种语音编解码算法中,HR AMR、FR AMR、UMTS AMR和UMTS AMR 2的算法核心都是基于自适应多速率算法,其原理和结构都是相同,只是因为应用环境不同,算法的速率控制范围有所差别。而且协议中明确说明UMTS AMR 2完全可以兼容HRAMR、FR AMR、UMTS AMR。因此,可以使用UMTS AMR 2协议统一实现HRAMR、FR AMR、UMTS AMR。

AMR算法是多速率的语音编解码算法,一共有8种模式(AMR_12.20,AMR_10.20,AMR_7.95,AMR_7.40,AMR_6.70,AMR_5.90,AMR_5.15,AMR_4.75),分别对应8种速率(12.20 kbit/s(GSM EFR),0.20 kbit/s,7.95 kbit/s,7.40 kbit/s(TDMA-EFR),6.70 kbit/s(PDC-EFR),5.90 kbit/s,5.15 kbit/s,4.75 kbit/s)。

另外,AMR还支持静音检测(VAD)和断续传输功能(DTX),在静音期间只定期传输舒适噪音(由SID帧承载),其他时间不传输任何数据。因此,除了上述8种速率模式之外,还有AMR_SID(1.80 kbit/s)和AMR_NODATA(0 kbit/s)两种模式。

GSM EFR、TDMA EFR和PDC EFR都是固定速率的语音编解码算法,其速率分别是12.20 kbit/s,7.40 kbit/s,6.70 kbit/s。由于AMR、GSMEFR、TDMA EFR和PDC EFR的算法原理都是采用“算术码本激励”(ACELP)的方法,而且在设计AMR解码算法时,考虑了兼容需求,因此AMR_12.20模式与GSM EFR是兼容的;AMR_7.40模式与TDMA EFR是兼容的;AMR_6.70模式与PDC EFR是兼容的。但是他们在静音检测和断续传输模式下的静音帧(SID帧)却是不兼容的:AMR_SID帧的大小是35bit并且每160ms更新一次,而GSM EFR的静音帧是244bit并且每480ms更新一次,TDMAEFR的静音帧是38bit并且可以连续更新1。另外,不同语音编解码的DTX控制也是不同的,例如TDMA-EFR和PDC-EFR在原有系统中只支持上行的断续传输(DTX),不支持下行的DTX;而且AMR与其他编解码的DTX平滑机制也有所不同。由于断续传输模式可以有效增大无线信道容量、节省UE功率、节约传输资源,因此是UMTS设备缺省的配置项。在编解码协商时,除了指定的编解码速率,缺省设置了SID模式和NO DATA模式。因此上述SID帧的不兼容实际上导致了AMR与GSM EFR、TDMA EFR和PDC EFR无法统一实现。

本发明的方法,在AMR语音编解码的核心算法的基础上,集成GSMEFR、TDMA EFR和PDC EFR协议的断续传输(DTX)和舒适噪音产生功能,通过编解码类型和模式的控制,统一实现7种语音编解码,具体的编解码流程描述如下:

图1是本发明方法使用的编码流程示意图。如图1所示,13bit线性PCM数据流在步骤S101根据设置的命令判断当前的编码类型,在后续的步骤中,根据步骤S101选择的编码类型设定速率:如果选择GSM-EFR编解码,则在步骤S102-1设定为AMR_12.20kbps的速率;如果选择TDMA-EFR,则在步骤S102-2设定为AMR_7.40kbps的速率;如果选择PDC-EFR,则在步骤S102-3设定为AMR_6.70的速率;如果选择HR AMR、FR AMR、UMTS AMR、UMTS AMR 2,则在步骤S102-4至步骤S102-7根据速率控制命令设置指定的速率。在步骤S103:根据步骤S102设定的速率,执行AMR语音编码功能,接着在步骤S104判断在步骤S103的编码过程中,根据计算参数判断应该输出非静音帧还是静音帧,如果判断是非静音,则在步骤S105输出语音压缩码流;如果判断是静音,则在步骤S106判断当前编码类型:如果判断是GSM-EFR,则在步骤S107-1执行GSM-EFR的算法计算静音帧的参数,并在步骤S108-1按照GSM-EFR的断续传输的方法输出静音数据;如果是TDMA-EFR,则在步骤S107-2执行TDMA-EFR的算法计算静音帧的参数,在步骤S108-2按照TDMA-EFR的断续传输的方法输出静音数据;如果是PDC-EFR,则在步骤S107-3执行PDC-EFR的算法计算静音帧的参数,在步骤108-3按照PDC-EFR的断续传输的方法输出静音数据;如果是HR AMR、FR AMR、UMTS AMR、UMTS AMR 2,则在步骤S107-4统一执行UMTS AMR 2的算法计算静音帧的参数,在步骤108-4按照UMTS AMR 2的断续传输的方法输出静音数据。

解码是编码的逆过程,只增加一个错帧补偿和弱音处理。图2是本发明方法使用的解码流程示意图。如图1所示,在步骤S201:从接收到的帧中判断其坏帧指示(Bad Frame Indication-简称BFI)标志,检查是否是错帧;如果步骤S201判断是正常的,则程序进入步骤S203,如果步骤S201判断是错帧,在步骤S202则进行错帧补偿和弱音处理,在步骤S203从接收到的帧中判断其SID标志;如果在步骤S203判断是静音,则在步骤S204判断当前的编解码类型;根据步骤S204判断的编解码类型,调用不同的静音处理程序:如果是GSM-EFR,则在步骤S205-1和步骤S206-1根据GSM-EFR的断续传输和SID参数输出静音数据;如果是TDMA-EFR,则在步骤S205-2和步骤S206-2根据TDMA-EFR的断续传输和参数输出静音数据;如果是PDC-EFR,则在步骤S205-3和步骤S206-3根据PDC-EFR的断续传输和SID参数输出静音数据;如果是HR AMR、FRAMR、UMTS AMR、UMTS AMR 2,则在步骤S205-4和步骤S206-4根据UMTSAMR 2的断续传输和SID参数输出静音数据;如果步骤S203判断为非静音,则在步骤S207判断当前的编解码类型;根据步骤S207判断的编解码类型设置速率:如果是GSM-EFR,则在步骤S208-1设置成AMR_12.20的速率;如果是TDMA-EFR,则在步骤S208-2设置成AMR_7.40的速率;如果是PDC-EFR,则在步骤S208-3设置成AMR_6.70的速率;如果是HRAMR、FR AMR、UMTS AMR、UMTS AMR 2,则在步骤S208-4根据速率控制命令设置成指定的速率;在步骤S209:根据S208设置的速率,在步骤S209执行AMR语音解码功能;在步骤S210:输出13bit的线性PCM数据,至此,描述了编解码程序的整个过程。

本发明只需在AMR算法的基础上添加GSM EFR、TDMA EFR和PDC EFR的舒适噪音生成(SID)和断续传输(DTX)模块和速率指定和控制模块,增加的实现工作量很小,分别用AMR、GSM EFR、TDMA EFR、PDC EFR算法协议的ANSI C语言的算法描述程序作为工作量的标准,图3描述了传统实现方法所需要开发的代码量,图4描述了本发明实现方法所需要开发的代码量。对比上面两图的合计,本发明需要实现的代码量只及传统实现方法的48%,实现成本(开发时间和费用)大大降低。

在存储空间上,本发明的效果十分明显。图5参照在TMS320C54X DSP上的应用实例,给出了传统实现方法分别实现所有语音编解码所需要的存储器容量。由此可见,本发明实现的方法在程序空间比传统方法节省了2.8倍;表空间上节省了2.6倍,效果十分明显。按照传统实现方法,实现1路UMTS语音编解码处理需要92K×16bit的空间,超过大多数定点DSP的片内存储器容量;而本发明实现方法仅需35.4K×16bit的空间,可以在一般的定点DSP上实现。因此硬件实现成本也大大降低。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号