首页> 中国专利> 具有文本到语音和语音到文本翻译的聊天与远程会议系统

具有文本到语音和语音到文本翻译的聊天与远程会议系统

摘要

一种使电话用户能够参与基于即时消息传送的会议的系统(10)与方法(50),该方法(50)可以包括下述步骤:通过远程会议系统(24)从电话(26或28)接收语音输入(52),将所述语音输入转录(54)为第一文本消息,以及将所述第一文本消息发送(58)到耦合到属于所述基于即时消息传送的会议的即时消息传送网络的多个设备(18、20、26或28)。所述方法进一步可以包括下述步骤:从所述基于即时消息传送的会议上的所述多个设备中的任何一个设备接收(60)第二文本消息,将所述第二文本消息转换(62)为语音输出,以及将所述语音输出经由所述远程会议系统发送(68)到所述电话。

著录项

  • 公开/公告号CN1817025A

    专利类型发明专利

  • 公开/公告日2006-08-09

    原文格式PDF

  • 申请/专利权人 国际商业机器公司;

    申请/专利号CN200480019301.3

  • 发明设计人 B·戴维斯;P·贾斯威;P·芒塞;

    申请日2004-07-22

  • 分类号H04M3/56(20060101);

  • 代理机构11247 北京市中咨律师事务所;

  • 代理人于静;李峥

  • 地址 美国纽约

  • 入库时间 2023-12-17 17:33:59

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2009-12-02

    专利申请权、专利权的转移(专利权的转移) 变更前: 变更后: 登记生效日:20091023 申请日:20040722

    专利申请权、专利权的转移(专利权的转移)

  • 2009-09-30

    授权

    授权

  • 2006-10-04

    实质审查的生效

    实质审查的生效

  • 2006-08-09

    公开

    公开

说明书

技术领域

本发明涉及远程通信领域,更具体地说,本发明涉及使用实时消息传送以及文本到语音和语音到文本转换的电话会议系统。

背景技术

使用基于文本的即时消息传送(IM)应用开会经常被用作家庭用户和企业之间协作的工具。令人遗憾的是,不是每个人都能接入或连接到LAN或因特网来参与这种文本会议。移动的人们以及不喜欢计算机的人们可能不能接入连网计算机和键盘来参与基于IM的会议。这些用户中的许多人尽管没有进行连接,仍然希望以无缝的且为他们所熟悉的方式参与到IM会议中。

若干系统试图接通电话会议和即时消息传送系统之间的隔阂,但是这些现有系统通常具有限制,其阻止实时环境中的真正的用户友好体验。例如,美国专利No.6,430,604描述了一种使用蜂窝电话和文本寻呼机(但是仅使用文本输入)传递即时消息的方法。另一个专利WO0135615A2讨论了一种将IM系统扩展到电话消息传送系统的方法,其中用户能够登录到他们的声音消息传送系统以和他们的朋友列表上的用户通信。

使用文本到语音和语音到文本的已知系统示例包括美国专利公开US2002/0069069 A1,其中该系统关注于能够听到声音会话和不能够听到声音会话的参与者之间的通信;或者美国专利号6,339,754 B1,其中与语言翻译相耦合的文本到语音和语音到文本技术允许进行聊天与电话会议;或者美国专利号6,385,586 B1或6,292,769 B1,其中文本到语音和语音到文本技术被用来改进两个或更多口述(不同语言)通信之间的语言翻译。

尽管存在使用文本到语音和语音到文本技术的众多系统,但是没有任何一个系统能够理想地适于在数据传输协议上增加声音(和文本)聊天,其中这种协议可以包括聊天/即时消息传送(IM)和诸如SMS的消息传送协议。没有任何一种现有系统提供了将声音消息以预定接收者所理解的语言、以预定接收者设备的本地格式传递到预定接收者,同时还提供一种不必需要声音消息传送系统来获得接入会议的实时协作系统。因此,需要一种能够解决上述不利之处的系统与方法。

发明内容

根据本发明的实施例提供了用于增强实时聊天信道以使电话用户能够参与到即时消息传送会议中的新技术。

在本发明的第一方面,一种使电话用户能够参与到基于即时消息传送的会议中的方法包括下述步骤:通过远程会议系统从电话接收语音输入,将所述语音输入转录为第一文本消息,以及将所述第一文本消息发送到耦合到属于所述基于即时消息传送的会议的即时消息传送网络的多个设备。所述方法还可以包括下述步骤:从所述基于即时消息传送的会议上的所述多个设备中的任何一个设备接收第二文本消息,将所述第二文本消息转换为语音输出,以及将所述语音输出经由所述远程会议系统发送到所述电话。

在本发明的第二方面,一种用于使电话用户能够参与到基于即时消息传送的会议中的系统可以包括:输入端口,用于经由远程会议系统接收主叫方的语音输入;语音到文本转换器,用于将所述主叫方的语音输入转换为文本消息,用以发送到即时消息传送系统;以及文本到语音转换器,用于将从所述即时消息传送系统接收的文本消息转换为语音输出,用以发送到远程会议系统。所述系统还可以包括耦合到所述远程会议系统的电话和即时消息传送设备。

在本发明的第三方面,一种计算机程序具有多个可由机器执行的代码部分,用于引起所述机器执行某些步骤。所述步骤可以包括下述步骤:通过远程会议系统从电话接收语音输入,将所述语音输入转录为第一文本消息,将所述第一文本消息发送到耦合到属于所述基于即时消息传送的会议的即时消息传送网络的多个设备,从所述基于即时消息传送的会议上的所述多个设备中的任何一个设备接收第二文本消息,将所述第二文本消息转换为语音输出,以及将所述语音输出经由所述远程会议系统发送到所述电话。

优选地,当转换第二文本消息时,与耦合到所述即时消息传送网络的所述多个设备中的任何一个相关联的声音签名(vioce signature)被用来在所述电话处提供具有个性化声音的语音输出。

第二文本消息可选地通过使用文本到语音转换而被转换为语音输出。

第一文本消息可选地被翻译成另一种语言,以便提供经翻译的第一文本消息。

第二文本消息可选地被翻译成另一种语言,以便提供经翻译的第二文本消息用于随后的语音输出。

文本消息优选地作为文本被发送。

第二文本消息优选地使用文本到语音合成进行转换。这可以由语音合成器来执行,语音合成器可选地使用被叫方的声音签名来产生听得到的输出。

电话可选地被耦合到远程会议系统。所述系统可选地进一步包括即时消息传送设备,例如个人数字助理、膝上型计算机和智能电话。所述即时消息传送设备优选地具有显示器,用于显示来自主叫方的文本消息和/或来自即时消息传送设备的文本消息。

可选地,如果任何一个文本消息被翻译,则它被作为文本输出发送到即时消息传送设备或者被作为语音输出发送到被耦合到所述远程会议系统的电话。

优选地,文本流在即时消息传送/聊天系统上被基本实时地接收和发送。

可选地,文本流是使用数据传输协议在消息传送系统上接收和发送的。

可选地,用户简档被用于将来自即时消息传送设备的文本消息中的至少一个文本消息转换为定制的语音输出用以发送到主叫方,并将来自主叫方的文本消息转换为用户所定义的替代文本消息。

附图说明

现在将仅通过示例的形式参考如附图所示的本发明优选实施例来描述本发明,在附图中:

图1是图示了示例性远程通信系统的流程框图,该示例性远程通信系统图示了使用即时消息传送的增强型会议系统;以及

图2是图示了用于使电话用户能够参与到基于即时消息传送的会议中的方法的流程图。

具体实施方式

根据本发明的实施例可以提供用于使电话用户能够参与基于IM的会议的解决方案。在代表性的基于IM的会议中,所有参与者被连接到数据网络上的IM服务器,并且每个参与者的文本消息被广播给会议中的所有当事人。根据一个实施例,用户可以使用他们的有线或无线电话呼叫进入系统,聆听IM参与者键入的消息,并且可以通过说出他们的消息进行参与,所说出的消息可以被转录成文本并被广播给IM参与者。这种系统可以将文本消息合成为语音,将文本语音转录成文本,进而实质上桥接IM系统和远程会议系统。此外,该系统可以被用户个性化,以提供丰富的终端用户体验。

用于使电话用户能够参与到基于即时消息传送的会议中的系统10可以包括设备12,设备12用作远程会议系统24和即时消息传送系统22之间的桥梁。设备12可以直接耦合到远程会议系统24和即时消息传送系统22之间,或者如图所示经由可选的数据网络17耦合到远程会议系统24和即时消息传送系统22之间。在操作上,诸如PSTN的网络16上的传统电话(26或28)可以经由远程会议系统24耦合到设备12,并且经由远程会议系统24向设备12提供输入并从设备12接收输入。当电话(26或28)提供意在用于IM会议上的设备(18或20)和它们的对应用户的语音输入时,设备12可以将该语音输入转录为文本消息,文本消息能够被广播给IM会议中的所有或某些设备。设备18和20可以是个人数字助理、膝上型计算机、台式计算机、智能电话或实质上能够接收和显示文本消息的任何计算设备。设备18和20可以经由IM网络14耦合到IM会议。设备12可以经由IM系统或服务器22和IM网络14将文本消息发送到这些IM会议参与者。

参与IM会议的传统电话(26或28)还能够从其它设备接收经合成语音输出形式的IM消息。例如,在IM设备(18或20)上输入文本的用户将把他们的文本消息经由IM网络14和IM系统22发送到设备12。设备12能够将该文本消息转换为语音,并且将该语音经由系统24和网络16转发或发送到电话26或28。可选地,用于设备18和20(以及可能在进入IM会议时已经提供了某种形式标识的传统电话用户)的用户简档13(具有声音印迹或其它标记或特定用户)可以通过重构具有发送方的模拟声音印迹的语音而增强传统电话上的用户体验。

另一个选择将顾及在设备12处接收或转换的文本的语言翻译。因此,与IM设备18相对应的用户简档13可以引导设备12使用例如耦合到设备12的可选的文本翻译系统15来翻译以一种语言接收到并将以另一种语言被发送到设备18的文本。类似地,具有用户简档13的电话26可以在语音合成之前引导用于电话26的文本消息被翻译成另一种语言(例如通过使用可选的文本翻译系统15),从而电话26处的用户聆听优选语言的语音。

参考图2,流程图图示了使电话用户能够参与到基于IM的会议中的方法50。在步骤52,如图1所示的系统10将通过远程会议系统从电话接收语音输入。在步骤54,该语音输入可以被转录成第一文本消息。可选地,在步骤56,第一文本消息可以被翻译成另一种语言以提供经翻译的第一文本消息。如果需要的话,图1的用户简档13可以被用来设置这个额外的能力。在步骤58,第一文本消息可以被发送到耦合到属于基于IM的会议的即时消息传送网络的多个设备。第一文本消息可以作为文本流发送。

再次参考图2,在步骤60,系统可以从基于IM的会议上的多个设备中的任何一个设备接收第二文本消息。在步骤62,系统可以优选地通过使用文本到语音转换或合成将第二文本消息转换为语音输出。在步骤64,系统可选地再一次将第二文本消息翻译成另一种语言,以提供经翻译的第二文本消息用于随后的语音输出。在步骤66,另一选项使系统能够使用与耦合到IM网络的多个设备中的任何一个设备相关联的声音签名来提供在电话处聆听到的具有个性化或定制声音的语音输出。最后,在步骤68,语音输出可以经由远程会议系统被发送到电话。

应当理解,本发明能够以硬件、软件或软硬件的组合来实现。本发明还能够在一个计算机系统中以集中的方式实现,或者以分布的方式(其中不同的元件跨若干个互连计算机系统分布)实现。适于执行这里所描述的方法的任何种类的计算机系统或其它装置都是适合的。软硬件的代表性组合可以是具有计算机程序的通用计算机系统,所述计算机程序在被加载和执行时控制该计算机系统,使得该计算机系统执行这里所描述的方法。

本发明还可以被嵌入计算机程序产品,其包括使这里所描述的方法能够实现的所有特征,并且该计算机程序产品被加载到计算机系统中时能够执行这些方法。本文中的计算机程序或应用指的是在任何语言、代码或符号形式下的指令集的任何表示法,所述指令集用于引起具有信息处理能力的系统直接或经过以下述两种方式之一或两者之后来执行特定功能,所述两种方式包括:a)转换到另一语言、代码或符号;b)以不同的物质形式再现。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号