首页> 中国专利> 用于重定向呼叫者和语音应用程序之间的音频的系统和方法

用于重定向呼叫者和语音应用程序之间的音频的系统和方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

提供了一种呼叫中心环境，允许客户服务代表使用键击或语音输入来向工作站显示屏幕填充数据。语音输入是通过利用语音覆盖和语音平台向所述工作站提供的，以将音频转换为工作站可用的数据，以填充屏幕。

著录项

公开/公告号CN101601267A

专利类型发明专利
公开/公告日2009-12-09

原文格式PDF
申请/专利权人三德惬瑞公司;
展开▼

申请/专利号CN200780012693.4
发明设计人布赖恩·马凯特;迈克尔·克拉克;查尔斯·科菲尔德;
展开▼

申请日2007-02-08
分类号H04M3/42;
代理机构北京市柳沈律师事务所;
代理人李晓舒
地址美国科罗拉多州
入库时间 2023-12-17 23:10:12

法律信息

法律状态公告日

法律状态信息

法律状态
2017-03-29

未缴年费专利权终止 IPC(主分类):H04M3/42 授权公告日:20140507 终止日期:20160208 申请日:20070208

专利权的终止
2014-05-07

授权

授权
2010-02-03

实质审查的生效

实质审查的生效
2009-12-09

公开

公开

说明书

关于联邦资助研究的声明

本申请不被美国政府资助。

相关申请的交叉引用

本申请权利要求于2006年2月8日提交的题为SYSTEMS ANDMETHODS TO REDIRECT AUDIO BETWEEN CALLERS AND VOICEAPPLICATIONS的美国临时专利申请序列号60/771,725的优选权，此处引用该申请作为参考。

技术领域

本发明涉及客户服务呼叫，且更具体而言，涉及将呼叫者之间的音频重定向到语音应用程序的系统和方法。

背景技术

很多公司使用虚拟的或实际存在的客户呼叫中心来服务于它们的客户群体。在这些呼叫中心中，客户通常呼叫中心，而客服代表(CSR或操作员)回答这些呼叫。CSR通常询问一系列问题，且将信息键入到位于CSR工作站的图形用户界面(GUI)中，以被客户关系管理应用程序(CRM应用或应用程序)所用。例如，CSR可能询问产品序列号，客户提供该号码，且基本同时地，CSR通过GUI将这些号码键入到应用程序中。

信息的手动键入导致太多的需求。例如，操作员经常需要客户重复信息。不管客户是否重复该信息，操作员都可能在输入信息时出错。对来自于客户的信息的键入是易出错且是耗时的。

基于这样的背景，希望开发出一种改善的系统和方法来向应用程序键入数据。

发明内容

本发明的上述和其他特征、用途和优点将从下面如附图所示的本发明优选实施例的更具体的描述得以显现。

附图说明

附图被结合到本说明书中并构成本说明书的一部分，附图与描述一起示出本发明的实施例，用于解释本发明的原理。附图中，使用相同的附图标记表示相同的项：

图1是根据本申请的技术构建的呼叫中心环境的功能框图；

图2是示出与图1的呼叫中心环境相关的呼叫和信息流的时序图；

图3是示出与图1的呼叫中心环境相关的呼叫和信息流的另一时序图；

图4是示出与图1的呼叫中心环境相关的呼叫和信息流的又一时序图；

图5是根据本申请的技术构建的另一呼叫中心环境的功能框图；。

图6是图5中所示的环境在会议模式中的连通图；以及

图7是图5中所示的环境在静音模式中的连通图。

具体实施方式

语音自动控制能通过加快速度和减少与向应用程序中键入数据相关的错误，来改善CSR生产率。语音自动控制改善了效率，因为一般而言，与使用键盘、鼠标、触摸屏等键入相同的内容相比，它花费较少的时间来说出命令、位置和数值。尽管对于每次数据键入而言所节省的很少，但对于很长一段时间内的多个任务而言，时间和成本上的总的节省就可能变得相当大。

尽管语音自动控制能够显著节省时间和成本，但大多数应用程序并没有配置成支持语音输入。这些应用程序可配置成使用语音覆盖(voice overlay)接收语音输入或数据键入。语音覆盖程序用说出的词语代替键盘敲击、鼠标点击等。因而，这些覆盖程序与应用程序交互，就好像例如CSR正使用键盘键入数据一样。对诸如键击之类的用户输入的模拟是普通的编程技术，且例如，在嵌入式JavaScript代码，Netscape’LiveConnect等中使用。语音输入与语音识别可从很多来源获得，例如，International Business MachineCorporation(IBM)、LumenVox、Microsoft、Nuance等公司。

为了创建覆盖程序，程序员编写诸如Voice XML片段的脚本，来描述说话者可能为屏幕上的每个针对的行为说出的内容。语音覆盖获得VoiceXML解释的结果，且依照编写的程序来操作，就好像例如通过在屏幕中设置相应形式元素的值、导航到所需的目的等键入的键击等动作一样。

使用语音覆盖可以以很多不同的方式实现。例如，CSR可以直接通过覆盖程序向应用程序说话。当需要时，CSR可以将待定向的音频(audio)切换(toggle)到需要的客户或应用程序。这种切换(toggle)可以类似于一键通(push-to-talk)无线电切换(raodio toggle)。在这种情况下，例如，键入头戴式耳机可能导致音频被直接引导到应用程序，而正常的、非键入的音频被引导到客户。

因而，使用切换的通信(toggled communication)时，CSR可能需要一部分号码或序列号。客户将提供这种信息。CSR基本同时地切换或键入系统，使得CSR音频被引导到应用程序。CSR将重复信息，且语音覆盖将CSR音频引导到语音平台，以便于识别。同样，音频可以被切换，使得来自于CSR的音频仅被语音平台“听到”或被语音平台和客户二者“听到”。备选地，CSR直接将来自于客户的音频输入引导到语音平台。换句话说，覆盖在执行中具有极大的灵活性。例如，覆盖可以允许或不允许客户听到CSR向应用程序输入了什么。而且，使用键按钮或开关的连接允许在不用对CSR工作站的硬件做太大改变的情况下实现覆盖。然而，常规电话可能需要升级接口，以使音频能转换成语音平台可用格式。该接口例如可以是媒体网关或VoIP卡。

尽管很多配置对于本领域技术人员而言是显见的，但为方便和简单起见，以下描述假设应用程序呈现为组合使用HTML、JavaScript和Java applet的网页的集合。本领域技术人员在阅读了本公开说明后，会将意识到，也可使用诸如ActiveX、Toolbars等其他浏览器协议。而且，尽管在基于web环境中进行描述，本领域技术人员将意识到其他操作环境也是可行的，例如，在Windows或Linux操作系统中执行的桌面应用程序、客户应用程序等。在这种配置中，应用程序典型地在CSR工作站的桌面上运行。应用程序通过HTML形式收集数据，这些数据被提交给应用服务器，以便被应用程序处理。一旦被处理过，则新的页面与数据一起被返回CSR工作站。

在上述环境中，语音覆盖的voiceXML脚本可以被设置到存有应用程序的服务器，或作为一种设计选择可在远程被利用。操作中，只要新的页面被显示或显示被更新，语音平台将按需要运行voiceXML脚本。尽管语音覆盖控制模块可以是在CSR工作站处独立装载的应用程序，它也可以在应用程序被下载或更新到工作站时被下载。例如，当客户呼叫被转接到CSR或代理时，语音覆盖控制模块可以与用于该特定呼叫的最初CSR web屏幕一起被下载。这是尤其有利的，因为如今很多CSR被若干公司聘用，这些公司可能都需要不同voiceXML脚本来运行。

现在参考图1，提供了呼叫中心环境100的功能框图。尽管所示的为软件环境，但本领域技术人员将意识到可以使用大量的软件组件、硬件组件、其组合等来创建环境100。除其他装置外，环境100还包括应用程序服务器102。应用程序服务器102可以支持各种互连网通信协议，诸如，会话初始化协议104和超文本传输协议106。应用程序服务器102经由通信链路110与客户108相连。如果客户108使用VoIP兼容连接，通信链路110可以经由网络112被从客户108引导到应用程序服务器102。如果客户108使用常规电话线，通信链路110可包括媒体网关114，且网络112将是常规PSTN网络。语音平台116将语音覆盖脚本118和连接器120连接到工作站122。工作站122可以是具有处理器、BIOS和显示系统的常规个人电脑等。语音平台例如可以是能从SandCherry，Inc.买到的语音平台，且连接器可以是Vivo连接器。

操作中，客户呼叫进入应用服务器102，以起动与SIP 104的会话。工作站122在显示器上提供屏幕124且将具有可执行脚本的语音覆盖118提供给工作站122。语音覆盖118脚本可以通过工作站122的处理器执行。语音覆盖导致语音平台116从应用程序服务器102装载voiceXML。CSR使用切换键(toggle key)126切换语音覆盖。切换键126可以是手动开关、所示的GUI接口、工作站键盘上的热键、语音分接头(voice tap)(下面进一步解释)等。语音覆盖118用连接器120来如图所示那样将来自于CSR的音频输入引导到语音平台116，但连接器120也可配置成将来自于客户的输入引导到语音平台116，该语音平台116处理音频且返回为应用程序服务器格式化的数据，以便输入到合适的字段。如果引导的音频是从CSR到语音平台，语音平台116可以断开从CSR到客户的音频(即，静音)。因而，取决于配置，当CSR提示客户说出电话号码时，例如，客户可以陈述555-1234，该号码可以直接被输入到屏幕124上的适当字段130，或者CSR可以重复该信息，以在该音频对于客户是静音的条件下进行输入。

尽管一般在功能良好的环境中描述，本领域技术人员将意识到，接入的呼叫可以是常规PSTN呼叫、TDM呼叫、VoIP呼叫等。而且，工作站可以为SCR提供常规电话、TDM、VoIP或软件电话。

切换键126允许CSR或具有切换键126的任意参与者在需要时引导手持听筒的音频输出。因而，当需要时，CSR可以将来自于包括头戴式耳机或手持听筒(麦克风和扬声器装置)122h的CSR工作站122的音频输出引导到为操作员自动化键击或输入的语音应用程序。实际上，当在客户和CSR之间建立呼叫时，切换键126作为一类“套管(spigot)”工作，以在客户、代理和语音平台之间引导音频。

当客户与CSR相连时，客户连接到服务器102，也一般已知为背靠背用户代理(B2BUA)。服务器102例如发送sip邀请到诸如VoIP兼容电话这样的CSR工作站通信设备。换句话说，信号通路上的客户服务会话的三个参与者包括客户(和诸如电话这样的客户通信设备)、服务器和CSR工作站设备。B2BUA或服务器引导音频和会话连接。经由与语音覆盖控制模块的HTTP连接，B2BUA连接到诸如电话这样的CSR工作站，该语音覆盖控制模块可以(通过HTTP)发送命令以引导音频到语音平台。最初，音频通路在客户108和CSR 122通信设备之间运行(即，常规电话到电话的连接)。

理想地，在客户电话和CSR工作站之间建立呼叫通路基本相同的时间，在可以是台式机的CSR工作站装载应用程序的起始网页。当网页下载到浏览器时，它包括语音覆盖的示例，该语音覆盖包括切换键126和覆盖控制模块。控制模块可以由Java applet等执行，它(经由HTTP)向B2BUA发送命令，且经由控制通道向语音平台发送命令。命令之一是初始化语音平台上的应用会话的“连接到语音平台”(类似于与常规IVR平台相连接的呼叫)。另一命令是“装载VXML脚本”，它请求语音平台装载特定的VXML脚本，且设置该脚本以用于执行。该命令还可以以编程方式使用，从而在代理导航CRM应用程序时，设置语音平台上执行的各种VXML脚本。例如，语音覆盖可以选择在只要新的页面被下载时提供可视用户接口和语音用户接口的再同步。或者当用户在单个网页上从一个HTML形式元素的字段切换到另一字段时，语音覆盖可以改变有效VXML脚本。考虑我们的发明，控制模块还对应于代理按下和释放虚拟传输键发送用于“起动传输”和“停止传输”的命令。起动/停止命令经由HTTP发送到B2BUA，该B2BUA(继而)发信号给相关设备(电话、交换机、媒体网关等)，以向语音平台转发代理的输出音频，使得VXML应用程序能够识别代理说了什么和经由控制通道将(一个或多个)结果返回到控制模块。在此之后，控制模块按程序模拟使用web用户接口的代理，以键入相同的数据或导航到特定地点。

根据上述说明，对于本领域技术人员而言很明显，对客户、CSR和语音平台之间的控制可以以很多方式实现。例如，CRM应用程序和语音覆盖控制模块可以以平台(例如，Win32)的本地代码而不是web应用程序来实施。客户和CSR通信设备可以是常规的或VoIP。如果呼叫中心的交换机已经是能够支持VoIP的，则可以不需要媒体网关。相反，如果交换机使用常规电路交换，可能必须在交换机中安装VoIP卡或者安装外部媒体网关。

下面的呼叫流方案示出了很多可能的不同方案中的三种。在下面的呼叫流程图中，“VIVO客户”标记对应于控制模块，而“PTT按钮”标记对应于本发明的上述说明中的传输键。

方案1-连接到SIP代理的PSTN呼叫者

现在参考图2，本方案涉及通过IP网络向CSR说话的PSTN呼叫者。CSR可以使用基于SIP的硬件电话或基于SIP的软件电话。本方案包括下面的逻辑组件：

客户PSTN电话

媒体网关

SIP应用服务器

CSR SIP电话

运行在台式计算机上的覆盖应用程序，以及

语音平台

在图2所示的方案中，在步骤202，客户108通过PSTN 112使用常规电话作出一个呼叫。在步骤204，在媒体网关114处接收到呼叫，该媒体网关114在步骤206向应用服务器102发送SIP邀请。在步骤208，应用服务器102识别出合适的CSR 122，且在步骤210，向CSR 122发送SIP邀请。在步骤212，被选的CSR 122向应用服务器102发送SIP接受，在步骤214，该应用服务器102发送相应的接受到媒体网关114。尽管此处没有解释，但在阅读了本公开说明后，本领域技术人员将意识到媒体网关114可以与若干应用服务器相连，且应用服务器102可以与若干不同CSR相连。因而，如果第一个被选的服务器或CSR不能接受该呼叫，将返回SIP拒绝，提示媒体网关和/或服务器向下一可用服务器或CSR发送邀请，直到建立连接为止或忙信号或消息返回到客户为止。

在任意情况中，一旦CSR被选择且返回SIP接受(或OK)，在步骤S216，媒体网关114完成PSTN连接，且在步骤S218，建立客户、媒体网关、服务器与CSR之间的音频通路。在某种意义上，连接类似于3个或更多的呼叫，其中客户108、服务器102和语音平台116、以及CSR 122作为独立的三方。

在步骤219，CSR工作站屏幕124装载语音覆盖应用程序。如上所述，在常规操作中，CSR可以提示客户输入电话号码。常规地，客户可能说“555-1234”，且CSR将它键入到屏幕124上的适当字段中。使用本技术时，CSR 122可以提示客户108输入例如电话号码的信息。基本上当完成请求或至少在客户应答之前，在步骤220，CSR 122将激活(activate)切换开关(toggleswitch)126，以引导音频到语音平台116。音频信号可以是客户的音频(CA)或客户服务代表的音频(CSRA)。在步骤222，语音平台116接收引导的音频，且在步骤224，传输合适的信号到VIVO连接器120和应用服务器102。在步骤226，语音平台116将音频转换成适当的信号格式，且将格式化的信号输入到语音覆盖118，在步骤228，语音覆盖118使用这些信号来填充屏幕125上的适当字段。如图所示，但不限于此，如一般在本领域中所理解的那样，语音平台、音频输入、VIVO连接器和语音覆盖将需要实施适当的握手协议。一旦客户呼叫结束，在步骤230，呼叫以常规方式终止。

如上所述，切换开关126将音频引导到语音平台。音频可以来自于客户108或来自于重复客户108所说词语的CSR 122。如果CSR 122正重复客户108的话，在步骤220，激活的切换开关126执行额外功能，该额外功能将客户108与CSR 122之间的音频连接静音。静音可以是将信号通路暂时断开或其他常规静音技术。

方案2-连接到PSTN代理的SIP呼叫者

现在参考图3，本方案涉及通过PSTN电话向CSR说话的SIP呼叫者。呼叫者可以使用基于SIP的硬件电话或基于SIP的软件电话。本方案包括下面的逻辑组件：

呼叫者SIP电话

SIP应用服务器

媒体网关

CSR PSTN电话

运行在台式计算机上的语音覆盖应用程序，以及

语音平台

在方案2中，在步骤302，客户108经由网络112直接连接到应用服务器102。在步骤304，客户108电话发送SIP邀请到应用服务器102。在步骤306，应用服务器102发送相应的SIP邀请到媒体网关114，在步骤308，该网关拨出CSR 122电话。在步骤310，CSR 122回答电话，这导致在步骤312产生合适的SIP邀请接受。一旦被接受，在步骤218，音频通路被建立。一旦建立音频，该过程基本与上述流程图200相同。

在该例子中，对于从CSR 122填充到屏幕124上的字段的音频，CSR 122音频经由媒体网关被传输到语音平台。另外该过程的剩余步骤与方案1类似。

方案3-连接到PSTN代理的PSTN呼叫者

现在参考图4，本方案涉及通过PSTN电话向CSR说话的PSTN呼叫者。本方案包括下面的逻辑组件：

呼叫者PSTN电话

媒体网关

SIP应用服务器

CSR PSTN电话

运行在台式计算机上的语音覆盖应用程序，以及

语音平台

方案3的连接布置得略微不同，但是一旦建立起连接，则环境操作基本与上述相同。首先，在步骤402，客户108直接通过PSTN网络呼叫CSR 122。在步骤404，CSR拨号媒体网关114，且在步骤406，该网关114发送邀请到应用服务器102。在步骤408，应用服务器和媒体网关接受邀请，且在步骤410，实现呼叫握手。在步骤412，这种握手连接客户108、媒体网关114和CSR 122。一旦被连接，环境操作如上所述。

应当理解，客户108与CSR 122之间的音频连接可以直接通过媒体网关114连接，而不连接应用服务器102。在这种情况下，应用服务器102仅在切换开关126激活的时候被连接。

尽管上述流程图涉及填充可编辑的数据字段，在阅读了本公开说明后，本领域技术人员将理解，声音命令可用于通过可编辑字段导航，以及装载分离的网页或开启新的窗口。例如，为了键入电话号码，CSR可以说“电话号码555-1234；家庭地址1 Main Street USA Town USA”，这将为语音覆盖提供可编辑字段的标识符，该可编辑字段被供给信息和键入数据。如图所示，“电话号码”提示将导致语音覆盖使用“555-1234”更新电话号码数据字段。“家庭地址”提示将导致语音覆盖使用“1 Main Street USA Town USA”更新家庭地址数据字段等。陈述或命令之间的停顿，诸如“停止”，可用于指示新的信息。类似地，更新可以在各个页面上完成。因而，CSR可以陈述，第1页装载第一CRM页，第二页装载第二CRM页等。尽管音频被描述为是通过CSR说出的，但可以使用任意音频。

现在参考图5，提供了呼叫中心环境500。如图5所示，呼叫中心环境具有通过适当的通信网络506与CSR台式电话504相连的客户502。典型地，这种连接使用常规PSTN连接，但也可以是任意常规网络，例如，包括，私网、VoIP网络、蜂窝网络(模拟或数字)、其他有线网络、其他无线网络等。通信网络506可以具有交换机508，该交换机508包括代理队列510，以保持呼叫，直到CSR电话504变得可用为止。CSR通过可能包括麦克风和扬声器的常规CSR头戴式耳机512与CSR台式电话504相连。CSR头戴式耳机512可以是常规电话手持听筒。台式电话504与头戴式512耳机之间相连的是语音分接头(voice tap)514。语音分接头514用于在头戴式耳机512和/或CSR工作站516与台式电话504之间引导来自头戴式耳机512的声音。工作站516具有声卡518，以提供接口并将声音信号转换成计算机可用信号。工作站516还具有装载了(或预先安装)特定工作站显示的语音覆盖520。示为VIVO连接器的连接器522，经由数据连接524连接工作站516和语音平台526。语音平台可以是本地连接上的，或是经由因特网连接而远程连接上的。

现在参考图6，示出了操作的会议模式600中的呼叫流。如图所示，通过使用标准电话连接，语音分接头514被设置在台式电话504和头戴式耳机(或手持听筒)512之间。换句话说，语音分接头514提供连线，以运送来自CSR麦克风的音频以及向CSR说话者传递音频。语音分接头514还提供PC音频输出连接器602、PC音频输入连接器604和PC通用串行总线(USB)控制606。现在参考图5-7，将在示例性实施例中解释语音分接头的使用。首先，代理建立与应用程序的连接，该应用程序包括下载或初始化任意语音覆盖。CSR最终向客户请求信息，客户可将信息填充到工作屏幕或直接输入到工作屏幕。CSR可以使用切换开关来协商工作站进入会议。切换开关可以是在工作站上“点击”的图形用户接口切换开关，这将导致工作站(可以是个人电脑)发送命令到声音分接头，以从客户向工作站提供声音。关于来自工作站的信号的更多信息，参见2005年2月17日提交的共同未决的美国专利申请序列号10/906,363，名为METHOD AND APPARATUS TO ALLOWTWO WAY RADIO USERS TO ACCESS VOICE ENABLEDAPPLICATIONS，此处引用该申请的全部内容作为参考。一旦被提供，语音覆盖将导致脚本执行以填充各个字段。释放切换开关使会议模式失效，将工作站与提供音频的客户断开。在该模式中，CSR仍能听见客户，因为音频被引导到CSR和工作站。而这不是必须的，优选地，CSR将知道客户何时停止通信。

在某些情况下，CSR将使用音频来向工作站屏幕输入数据。尽管客户可以与功能类似于上述功能的线相连，但是语音分接头将CSR麦克风连接到PC声音输入连接器，经常地，CSR选择将与客户的连接静音(mute)，使得客户不能听见CSR。在这种情况下，切换开关将同时提供控制信号到USB控制606，以开启从CSR麦克风到客户说话线的音频中的断连702。这一般可以称为操作的静音模式700。除了断连702，功能基本与会议模式相同。

语音分接头514可选地包括增益控制550。增益控制550允许调节来自于CSR或客户的声音，以避免较大声音的饱和或箝位，并避免从音频到软件的损耗被忽略。而且，来自于PC声卡的音频可选地允许语音覆盖，以进行通信。

尽管本发明是通过参考某些实施例具体示出和描述的，本领域技术人员应当理解，可以在不偏离本发明的精神和范围的情况下，在形式和细节上做出各种其他修改。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 用于重定向呼叫者和语音应用程序之间的音频的系统和方法 [P] . 中国专利： CN101601267B . 2014.05.07
2. 用于重定向呼叫者和语音应用程序之间的音频的系统和方法 [P] . 中国专利： CN101601267A . 2009-12-09
3. Systems and methods to redirect audio between callers and voice applications [P] . 美国专利： US8023635B2 . 2011-09-20

机译：在呼叫者和语音应用程序之间重定向音频的系统和方法
4. Systems and methods to redirect audio between callers and voice applications [P] . 美国专利： US7702093B2 . 2010-04-20

机译：在呼叫者和语音应用程序之间重定向音频的系统和方法
5. SYSTEMS AND METHODS TO REDIRECT AUDIO BETWEEN CALLERS AND VOICE APPLICATIONS [P] . 欧洲知识产权局专利： EP1985099B1 . 2016-02-03

机译：在呼叫者和语音应用程序之间重新定向音频的系统和方法