首页> 中国专利> 固定电话/移动电话/IP电话接入IP视频会议系统的方法

固定电话/移动电话/IP电话接入IP视频会议系统的方法

摘要

本发明提出了一种使固定电话用户、移动电话用户和IP电话用户同时接入IP视频会议的方法,解决了现有一些接入方法的局限性,而且系统实现简单明了,具有较大的实用价值。

著录项

  • 公开/公告号CN1433209A

    专利类型发明专利

  • 公开/公告日2003-07-30

    原文格式PDF

  • 申请/专利权人 北京艾尼通科技有限公司;

    申请/专利号CN03105364.5

  • 发明设计人 於朝晖;林海涛;

    申请日2003-02-26

  • 分类号H04M11/00;H04M11/06;H04M1/26;H04Q3/00;H04Q7/38;H04L9/32;H04L12/56;H04L12/24;H04L12/26;

  • 代理机构11127 北京三友知识产权代理有限公司;

  • 代理人李强

  • 地址 100045 北京市西城区南礼士路月坛理想大厦4层

  • 入库时间 2023-12-17 14:52:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2008-04-30

    专利权的终止(未缴年费专利权终止)

    专利权的终止(未缴年费专利权终止)

  • 2006-10-04

    授权

    授权

  • 2003-10-15

    实质审查的生效

    实质审查的生效

  • 2003-07-30

    公开

    公开

说明书

技术领域

本发明属于VOIP(IP语音)通信领域,尤指一种固定电话/移动电话/IP电话接入IP视频会议系统的方法。

背景技术

IP视频会议系统是当前支持人们远距离进行实时信息交流与共享、开展协同工作的应用系统。IP视频会议系统一方面继承了传统会议系统的特点:通过传输会议成员的视频与音频信息,使会议成员之间能够直观、实时的交流;另一方面由于IP电话技术的成本低廉、而且相关技术的不断成熟使得服务质量不逊于传统会议系统,用户无需投入高昂的成本,就能够实现高质量、高可靠性的音视频通讯、协同工作、会议管理等多种会议功能,具有传统会议系统无法比拟的优势。

现有的接入IP视频会议的方法主要有三种,但每种方法都有其固有的局限,简单介绍如下:

一种接入IP视频会议的方法是使用MCU(MCU:Multipoint Control Unit,多点控制单元),主要应用在基于H.323的IP电话网中。IP电话用户通过与MCU之间的信令和媒体交互来完成多点之间的音视频通讯,MCU则负责对整个会议的管理和控制。这种接入方法的主要局限在于普通的电话用户无法接入IP视频会议系统,IP电话用户和固定电话用户之间如果想进行会议的话,则无法通过此方法完成。

另一种接入IP视频会议的方法是使用带有会议功能的电话语音卡。固定电话用户通过PBX(PBX:Private Branch Exchange专用分组交换机)接入到支持会议功能的电话语音卡,从而实现会议成员之间的实时交流。这种方法的局限在于会议成员之间只能进行音频的交流而无法获得会议成员的视频信息,使会议的直观性受到了一定的限制。

最后一种接入IP视频会议的方法是使用H.320-H.323网关。通过这种网关,使用窄带ISDN业务的固定电话用户和使用IP电话业务的IP电话用户都可以接入到IP视频会议系统之中,从而解决了上述两种方法的局限性。但是这种方法同样有其致命的缺点,网关整个系统较为庞大和复杂,不易于实现且成本较高。

发明内容

本发明提出一种新的系统方法,使得固定电话用户、移动电话用户和IP电话用户都可以方便地接入到IP视频会议系统之中,从而实现用户之间的音视频通讯,同时系统实现简单,成本低廉。

本发明的一种固定电话接入IP视频会议系统的方法,包括下列步骤:

A)固定电话用户发出呼叫,通过电话语音卡与视频会议系统建立连接;

B)视频会议系统审查固定电话用户加入会议的资格,如果用户不允许加入会议,则提示用户具体原因并终止呼叫;如果用户允许加入会议,则视频会议系统给多点控制单元发送会议消息,表示一个新的会议成员已经加入会议,并继续下列步骤;

C)电话语音卡接收用户的语音流并传送给视频会议系统;

D)视频会议系统接收语音卡传送过来的语音流并封装成RTP语音包发送给多点控制单元;

E)多点控制单元将各个会议用户的音频数据进行混合后回传给视频会议系统;

F)视频会议系统将混合后的音频去掉RTP包头后回传至电话语音卡;

G)电话语音卡将接收的语音流播放给固定电话用户。

上述步骤A)包括下列步骤:

A1)当电话语音卡检测到有固定电话用户呼入时给视频会议系统发建立连接消息请求建立呼叫连接;

A2)视频会议系统给电话语音卡回送振铃消息和连接消息告知呼叫连接已建立;

A3)电话语音卡接通固定电话用户。

上述步骤B)中当用户允许加入会议时,包括下列步骤:

B1)视频会议系统通过电话语音卡向固定电话用户播放提示音,提示用户输入会议标识和会议密码信息;

B2)用户输入会议标识和会议密码信息;

B3)视频会议系统根据用户输入的数据查询数据库系统,判断用户输入的数据是否正确;如果用户输入的数据不正确,则提示用户具体原因并终止呼叫;如果用户输入的数据正确,则视频会议系统给多点控制单元发送会议消息。

所述固定电话用户通过专用分组交换机连接到电话语音卡上。

本发明提供一种移动电话接入IP视频会议系统的方法,包括下列步骤:

A)移动电话用户发出呼叫,通过无线网络接入电话语音卡,并通过电话语音卡与视频会议系统建立连接;

B)视频会议系统审查固定电话用户加入会议的资格,如果用户不允许加入会议,则提示用户具体原因并终止呼叫;如果用户允许加入会议,则视频会议系统给多点控制单元发送会议消息,表示一个新的会议成员已经加入会议,并继续下列步骤;

C)电话语音卡接收用户的语音流并传送给视频会议系统;

D)视频会议系统接收语音卡传送过来的语音流并封装成RTP语音包发送给多点控制单元;

E)多点控制单元将各个会议用户的音频数据进行混合后回传给视频会议系统;

F)视频会议系统将混合后的音频去掉RTP包头后回传至电话语音卡;

G)电话语音卡将接收的语音流通过无线网络播放给移动电话用户。

所述步骤A)包括下列步骤:

A1)当电话语音卡检测到有移动电话用户呼入时给视频会议系统发出建立连接消息请求建立呼叫连接;    

A2)视频会议系统给电话语音卡回送振铃消息和连接消息告知呼叫连接已建立;

A3)电话语音卡接通移动电话用户。

所述步骤B)中当用户允许加入会议时,包括下列步骤:

B1)视频会议系统通过电话语音卡向移动电话用户播放提示音,提示用户输入会议标识和会议密码信息;

B2)用户输入会议标识和会议密码信息;

B3)视频会议系统根据用户输入的数据查询数据库系统,判断用户输入的数据是否正确;如果用户输入的数据不正确,则提示用户具体原因并终止呼叫;如果用户输入的数据正确,则视频会议系统给多点控制单元发送会议消息。

上述电话语音卡通过TAPI标准应用程序接口与视频会议系统通讯。

上述电话语音卡与视频会议系统通过双端口RAM以PCM码实现音频数据的传递。

上述的电话语音卡为双缓冲区语音卡,所述双缓冲区语音卡包括:普通语音卡、第一缓冲区、第二缓冲区和应用程序;所述应用程序控制语音卡将录制的音频数据依序存入第一和第二缓冲区,并依序将第一和第二缓冲区的语音数据取出。

本发明另提供一种IP电话接入IP视频会议系统的方法,包括下列步骤:

A)IP电话用户通过网关、呼叫服务器与视频会议系统建立呼叫连接;

B)视频会议系统审查固定电话用户加入会议的资格,如果用户不允许加入会议,则提示用户具体原因并终止呼叫;如果用户允许加入会议,则视频会议系统给多点控制单元发送会议消息,表示一个新的会议成员已经加入会议,并继续下列步骤;

C)用户的语音流在网关处被封装成RTP语音包并通过已建立的呼叫连接传送到视频会议系统;

D)视频会议系统接收网关发送过来的RTP语音包并传送给多点控制单元;

E)多点控制单元将各个会议用户的音频数据进行混合后回传给视频会议系统;

F)视频会议系统将混合后的音频通过呼叫连接回传至网关;

G)网关将RTP包中的音频数据转换成语音流播放给IP电话用户。

所述步骤A)包括下列步骤:

A1)网关给呼叫服务器发出建立连接消息请求建立呼叫连接;

A2)呼叫服务器通过媒体网关控制协议的创建连接消息告诉视频会议系统创建呼叫连接;

A3)视频会议系统给呼叫服务器回送创建连接响应消息告知呼叫连接已建立;

A4)呼叫服务器给网关回送振铃消息和连接消息,告知呼叫连接建立完成。

所述步骤B)中当用户允许加入会议时,包括下列步骤:

B1)视频会议系统通过网关向IP电话用户播放提示音,提示用户输入会议标识和会议密码信息;

B2)用户输入会议标识和会议密码信息;

B3)视频会议系统根据用户输入的数据查询数据库系统,判断用户输入的数据是否正确;如果用户输入的数据不正确,则提示用户具体原因并终止呼叫;如果用户输入的数据正确,则视频会议系统给多点控制单元发送会议消息。

本发明的方法能够使固定电话用户、移动电话用户和IP电话用户同时接入IP视频会议系统,且系统结构简单实用,成本低廉,系统内部流程控制简洁、灵活。

附图说明

图1为本发明方法所应用的系统结构示意图。

图2为本发明方法中所使用的带双缓冲区的电话语音卡结构示意图。

具体实施方式

本发明方法所应用的系统结构如图1所示,图中表述了各种终端设备接入IP视频会议的方式:

IP电话用户通过VOIP(VOIP:Voice Over IP语音)网关和CallServer(呼叫服务器)接入到视频会议系统。图中的VOIP网关和CallServer都是现有VOIP体系结构中的设备。网关主要负责处理信令和音视频媒体数据,并在CallServer的控制之下与视频会议系统进行RTP音视频媒体流的交互;CallServer相当于VOIP体系结构中的MGC(MGC:Media Gateway Controller媒体网关控制器),它主要负责呼叫的建立、拆除等控制流程。它通过标准的MGCP(MGCP:Media Gateway Control Protocol媒体网关控制协议)消息控制视频会议系统与VOIP网关建立媒体连接。

固定电话用户通过PBX(PBX:Private Branch Exchange专用分组交换机)交换机连接到具有会议功能的电话语音卡上,电话语音卡通过TAPI(TAPI:Telephone Application Programming Interface电话应用编程接口)等标准应用程序接口与视频会议系统通讯,建立和拆除呼叫;语音卡与视频会议系统之间的音频通信是以PCM(PCM:Pulse Code Modulation脉冲编码调制)码流的形式进行的,语音卡和会议系统通过双端口RAM实现音频数据的共享。

移动用户接入IP视频会议的方法与固定电话用户类似,不同的只是移动用户需要先通过无线通信网连接到PBX交换机。

图中的虚线框部分是本发明方法所述及的视频会议系统。系统主要分为两个部分:控制部分和媒体部分。控制部分负责与CallServer或电话语音卡交互,并执行相应的控制流程,如向主叫方放音,提示主叫用户输入等,同时通过会议消息(消息可以是标准的信令消息,也可以是自定义的私有消息)建立与MCU的呼叫连接。控制部分还可以根据相应的流程访问数据库系统,进行用户数据和会议相关信息的管理。系统中的媒体部分主要负责音视频媒体流的处理,它从VOIP网关或电话会议卡接收会议用户的音视频媒体流,并将音视频媒体数据以RTP(RTP:Real-time Transport Protocol实时传输协议)包发送给MCU,由MCU负责用户音频的混音和视频的合成。MCU将合成后的会议音视频数据以RTP包返回给系统的媒体部分,媒体部分经过适当的处理后将音视频数据发送VOIP网关或电话语音卡,并最终达到终端用户。

图中的MCU主要负责音视频数据的混合。数据库系统主要负责用户信息及会议信息的管理。

IP电话用户的接续流程主要包括以下步骤:

1、网关给CallServer发Setup消息请求建立呼叫连接;

2、CallServer通过MGCP协议的CRCX(Create Connection:创建连接)消息告诉视频会议系统创建呼叫连接;

3、视频会议系统给CallServer回送CRCX ACK(Create ConnectionAcknowledge:创建连接响应)消息告知呼叫连接已建立;

4、CallServer给网关回送Alerting(振铃)消息和Connect(连接)消息,至此网关和视频会议系统之间的呼叫连接建立完成;

5、视频会议系统通过网关向IP电话用户播放提示语音,提示用户输入会议标识和会议密码等信息;

6、用户输入会议标识和会议密码等信息;

7、视频会议系统根据用户输入查询数据库系统,判断用户是否可以加入会议。如:用户密码不正确时不允许参加会议;

8、如果用户不允许加入会议,则提示用户具体原因并终止呼叫;

9、如果用户允许加入会议,则视频会议系统给MCU发送会议消息,表示一个新的会议成员已经加入会议;

10、以上步骤完成后,网关-视频会议系统-MCU之间的连接建立完成,用户可以开始会议交流;

11、用户的语音流在网关处被封装成RTP语音包并通过已建立的呼叫连接传送到视频会议系统;

12、视频会议系统接收网关发送过来的RTP语音包并传送给MCU;

13、MCU负责将各个会议用户的音频数据进行混合后回传给视频会议系统;(语音经MCU混合后,用户就可以听到其他会议用户的声音,主要利用现有的音频混音技术);

14、视频会议系统将混合后的音频通过呼叫连接回传至网关;

15、网关将RTP包中的音频数据转换成语音流播放给用户,从而用户听到会议中其它成员的语音。

固定电话用户的接续流程主要包括以下步骤:

1、当固定电话用户想接入会议系统时,首先拨打系统预先设定的特服号码,当电话语音卡检测到有固定电话用户呼入时,给视频会议系统发Setup消息请求建立呼叫连接;

2、视频会议系统给电话语音卡回送Alerting消息和Connect消息告知呼叫连接已建立;

3、电话语音卡接通固定电话用户,至此固定电话用户-电话语音卡-视频会议系统之间的连接建立完成;

4、视频会议系统通过电话语音卡向固定电话用户播放提示音,提示用户输入会议标识和会议密码等信息;

5、用户输入会议标识和会议密码等信息;

6、视频会议系统根据用户输入查询数据库系统,判断用户是否可以加入会议。如:用户密码不正确时不允许参加会议;

7、如果用户不允许加入会议,则提示用户具体原因并终止呼叫;

8、如果用户允许加入会议,则视频会议系统给MCU发送会议消息,表示一个新的会议成员已经加入会议;

9、以上步骤完成后,固定电话用户-电话语音卡-视频会议系统-MCU之间的连接建立完成,用户可以开始会议交流;

10、电话语音卡接收用户的语音流并传送给视频会议系统;

11、视频会议系统接收语音卡传送过来的语音流并封装成RTP语音包发送给MCU;

12、MCU负责将各个会议用户的音频数据进行混合后回传给视频会议系统;(语音经MCU混合后,用户就可以听到其他会议用户的声音);

13、视频会议系统将混合后的音频去掉RTP包头后回传至电话语音卡;

14、电话语音卡将接收的语音流播放给用户,从而用户听到会议中其它成员的语音。

移动用户的接续流程主要包括以下步骤:

移动用户的接续流程与固定电话用户的接续流程基本一致,唯一的不同之处在于移动用户接入电话语音卡时还需要经过无线网(WirelessNetwork)这一中间网络。

在整个技术方案中,视频会议系统的控制部分与媒体部分基本上不需要复杂的硬件支持,主要采用软件实现的方法,因此系统具有简单明了和易于实现的特点。

整个系统在通用的CPU硬件体系上运行。系统采用软件实现的方法,主要包含控制处理模块和媒体处理模块。正如上面所描述的,控制处理模块主要负责呼叫连接的建立,流程的控制;媒体处理模块则主要负责用户和会议媒体数据的交换。

从上面的描述可以看出会议系统针对普通固定电话和移动电话(如手机)的控制接入部分是基本相同的,而针对IP电话用户和固定电话用户的控制接入部分是不大相同的。两者最大的区别在于用户与视频会议系统之间的连接方式:在IP电话用户接入时使用的是IP电话网关和CallServer,主要基于现有IP电话系统架构;而在固定电话用户接入时使用的是电话语音卡,主要基于现有的计算机语音集成技术。本发明的方法正是将这两种通用的技术结合于一体,从而使不同的用户都能方便的接入视频会议系统。

本发明方法所使用的电话语音卡是双缓冲语音卡。一般的语音卡在放音和录音时使用的缓冲区只有一个,因此语音的质量难以达到理想的效果;而我们在此方案中采用的是具有双缓冲区的语音卡,极大的改善了系统的语音质量。

此处提到的双缓冲区语音卡技术是在现有技术基础上进行改进的。双缓冲技术和语音卡技术都是现有的技术,双缓冲技术在声卡中运用的较为普及,语音卡技术也是一种普通的计算机语音集成技术。但是,现有的语音卡在语音的质量方面存在不足,主要是因为现有的语音卡只使用一个缓冲区来进行录、放音。我们将声卡中经常运用的双缓冲技术应用到现有的语音卡中则形成了改进后的双缓冲区语音卡。

双缓冲语音卡的结构示意图如图2所示,在图2中,虚线框下方代表的是普通语音卡,虚线框则代表使用语音卡录、放音功能的软件应用系统,其中的应用程序面向用户提供语音功能,缓冲区A和缓冲区B是应用程序提供给语音卡的用于录、放音的数据结构,在物理上表现为一段内存空间。

由于录音和放音使用双缓冲的原理一致,我们仅以录音为例对照图2对该双缓冲区语音卡的工作过程进行描述:

1、应用程序在录音开始之前准备好缓冲区A和缓冲区B;

2、应用程序调用语音卡提供的启动录音函数将缓冲区A和缓冲区B交由语音卡控制,语音卡开始录音操作。

注意:此处的启动录音函数需要调用两次,第一次将缓冲区A交由语音卡进行录音,第二次则是缓冲区B;

3、语音卡进行录音,并将录制的音频数据存放在缓冲区A中,直到缓冲区A录满;

4、缓冲区A录满,一方面语音卡调用应用程序提供的回调函数将缓冲区A交由应用程序控制,另一方面语音卡继续录音并将录制的音频数据存放在缓冲区B中;

5、应用程序将缓冲区A中已录制好的音频数据取出,并再次调用语音卡提供的函数将缓冲区A交由语音卡控制;

6、缓冲区B录满,语音卡调用应用程序提供的回调函数将缓冲区B交由应用程序控制,同时继续录音并将录制的音频数据存放在缓冲区A中;

7、应用程序将缓冲区B中已录制好的音频数据取出,并再次调用语音卡提供的函数将缓冲区B交由语音卡控制;

8、重复步骤4~7,直到应用程序调用语音卡提供的停止录音函数停止录音操作为止。

本发明通过将双缓冲技术应用在现有的语音卡上较好地改善原有语音卡的录、放音效果。

当然,对于本文提到的方法而言,使用一般的语音卡也能够实现,但是语音的效果不是很理想。

本发明方法中提到的音频混合技术是现有技术,本发明利用MCU实现音频混音功能。MCU接收会议各用户的音频数据,并将会议用户的语音进行混音处理(用户自己的声音除外),然后将合成后的语音播放给用户。因此用户听到的都是其它会议用户的声音,而听不到自己的声音。对每个会议用户而言,MCU混合后的音频数据都是不同的。

混音的基本原理是将各路输入的音频数据按照一定的规则(如将各路音频进行简单叠加或取各路音频中的最大者)进行处理并形成最后的混音数据。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号