首页> 中国专利> 构建语音合成数据库的通信系统及其中继设备和中继方法

构建语音合成数据库的通信系统及其中继设备和中继方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及构建语音合成数据库的通信系统及其中继设备和中继方法。中继设备(20)对从一个通信终端接收的语音数据进行复制，该通信终端与另一个通信终端进行话音通信。所复制的语音数据被发送和存储在媒体处理设备(40)。该媒体处理设备(40)根据所存储的语音数据构建用于语音合成的数据库。

著录项

公开/公告号CN101515455A

专利类型发明专利
公开/公告日2009-08-26

原文格式PDF
申请/专利权人株式会社NTT都科摩;
展开▼

申请/专利号CN200910007871.5
发明设计人矶部慎一;坂口拓史;田村基;薮崎正实;
展开▼

申请日2009-02-20
分类号G10L13/04(20090101);H04W84/02(20090101);
代理机构中国国际贸易促进委员会专利商标事务所;
代理人李玲
地址日本东京
入库时间 2023-12-17 22:31:46

法律信息

法律状态公告日

法律状态信息

法律状态
2012-06-13

授权

授权
2009-10-21

实质审查的生效

实质审查的生效
2009-08-26

公开

公开

说明书

技术领域

本发明涉及一种用于构建在语音合成中使用的语音数据库的通信系统，一种用于此目的的中继设备以及一种用于此目的的中继方法。特别地，本发明涉及一种用于根据电话和可视电话呼叫中的语音对话来构建在关注于再现个体性的语音合成中使用的语音数据库，一种用于此目的的中继设备以及一种用于此目的的中继方法。

背景技术

目前已开发的语音合成技术关注的是合成语音的自然性(naturalness)和个体性(individuality)，以使合成语音可以接近于人类主体(human subject)的语音。

在此类语音合成技术中，人类主体的语音数据片段被预先记录在数据库中，该数据库是通过记录该人类主体的不同语音片段来创建的，并且这种记录是通过让人类主体大声阅读不同的故事来实现的，此外，将与输入文本最为匹配的片段进行组合以便产生合成语音，其相关实例在日本专利申请公开2003-295880中有所描述。

但是，在常规的语音合成技术中，通常会在专用工作室中耗费很多小时的记录时间(例如数小时甚至数十小时)来构建存储用于语音合成的众多语音数据片段的数据库。由此，常规系统可用于只需要有限类型的语音模式的系统，例如车载导航系统或IVR(交互式话音响应)系统，但其不适合在诸如移动通信系统之类的系统中再现人类主体的语音。

发明内容

有鉴于上述问题，在这里提出了本发明，并且本发明的目的是提供一种用以构建用于语音合成的语音数据库的通信系统，该系统关注再现人类主体的语音特性过程中的个体性，此外，本发明的目的还在于提供一种用于此目的的中继设备和用于此目的的中继方法。

在一个方面，本发明提供了一种通信系统，该系统具有：与通信网络相连的中继设备；经由中继设备与通信网络相连的至少两个通信终端，每一个通信终端经由中继设备向另一个通信终端发送语音数据并从该另一个通信终端接收语音数据；以及与中继设备相连的媒体处理设备，该中继设备具有接收从第一通信终端发起的第一语音数据以及将接收到的第一语音数据发送到第二通信终端的发射机-接收机；对语音数据进行复制的数据复制器；通信控制器，用于使数据复制器复制经由发射机-接收机而从第一通信终端接收的第一语音数据，并且使发射机-接收机将所复制的语音数据发送到媒体处理设备，该媒体处理设备具有用于从中继设备接收所复制的第一通信终端的语音数据的接收机；语音数据处理器，用于将由接收机接收的语音数据存储在语音数据存储设备中；语音合成数据库生成器，用于根据存储在语音数据存储设备中的语音数据来为第一通信终端产生语音合成数据库；语音合成数据库存储设备，用于存储语音合成数据库生成器产生的语音合成数据库；以及语言合成器，其在从第一通信终端接收到语音合成请求的情况下，根据语音合成数据库来执行语音合成。依照本发明的通信系统，可以很容易地构建一个语音合成数据库，其强调的是再现人类主体语音特性过程中的个体性。

在一个优选实施例中，在该通信系统中，中继设备还可以具有：用于存储关于第一和第二通信终端的通信信息的通信信息存储设备，该通信信息至少包括用于指示第一通信终端是否预订语音合成服务的服务信息，如果该服务信息指示第一通信终端预订了语音合成服务，那么通信控制器可以确定对由发射机-接收机接收的语音数据进行复制，并且使复制器复制该语音数据。依据该模式，只有在通信终端预订了语音合成服务的情况下，从通信终端发送的语音数据才被复制并发送到媒体处理设备。由此，与复制所有引入(incoming)语音数据片段相比，在中继设备上复制并发送所复制的语音数据片段的处理负载将会减轻。此外还可以节约通信系统的通信资源。因此，提高了构建用于语音合成的数据库的效率。

优选地，该通信系统还可以具有与中继设备相连且用于存储关于所述至少两个通信终端中的每一个的预订信息(或者关于与网络运营商有合约关系的所有终端的预定信息)的预订信息数据库设备，而存储在通信信息存储设备中的关于第一通信终端的通信信息则可以根据从预订信息数据库设备下载的信息来创建。依照该模式，由于关于第一通信终端的服务信息可以从预订信息数据库下载，因此，中继设备不必为当前未经由该中继设备通信的通信终端存储服务信息。因此，减轻了中继设备上的存储器消耗。

更为优选的是，中继设备的发射机-接收机还可以从第二通信终端接收语音数据，以及可以将接收到的语音数据发送到第一通信终端，并且如果在一定时段中在第一和第二通信终端之间执行的呼叫次数超出某个阈值，那么通信控制器可以使数据复制器复制经由发射机-接收机而从第二通信终端接收的语音数据。依据该模式，即使对应通信终端没有预订语音合成服务，也可以创建用于该对应通信终端的数据库。

在该通信系统的另一个优选实施例中，如果发射机-接收机接收到来自第一通信终端的复制指令，那么通信控制器可以使数据复制器复制经由该发射机-接收机而从第一通信终端接收的语音数据。在这种情况下，第一通信终端可以在每次发送语音数据时指示所要记录的语音数据。作为替换，第一通信终端可以指示是否在话音通信终止之后记录语音数据。依据该模式，记录在媒体处理设备中的语音数据可以由通信终端自由指示。

在该通信系统的另一个优选实施例中，语音数据处理器还可以具有一个判定器，该判定器确定由接收机接收到的语音数据片段是否与任何已存储的语音数据片段相对应；以及噪声测量器，用于测量包含在接收到的语音数据片段中的噪声量和在相应的已存储语音数据片段中包含的噪声量，如果接收到的语音数据片段的噪声量少于相应的已存储语音数据片段的噪声量，那么语音数据处理器可以用接收到的语音数据片段来盖写已存储的语音数据片段。在另一个优选实施例中，语音数据处理器还可以具有用于移除语音数据中包含的背景噪声的噪声滤波器，并且该语音数据处理器可以在噪声滤波器移除噪声之后存储语音数据。在这种情况下，语音合成数据库就可以提供更高质量的语音数据。

在一个优选实施例中，中继设备的发射机-接收机还可以接收从第二通信终端发起的第二语音数据，并可以将接收到的第二语音数据发送到第一通信终端；并且通信控制器可以使数据复制器复制第一和第二语音数据片段中的至少一个并且可以使发射机-接收机将所复制的语音数据片段连同用于将第一和第二通信终端之一标识为发端通信终端的标识信息一起发送到媒体处理设备，该媒体处理设备的接收机可以从中继设备接收所复制的语音数据片段和标识信息；语音数据处理器可以存储由接收机依据语音数据存储设备中的标识信息而接收的语音数据片段；语音合成数据库生成器可以根据语音数据存储设备中存储的语音数据来为发端通信终端产生语音合成数据库；以及如果语音合成请求是从由标识信息所标识的通信终端接收的，那么语言合成器可以根据该语音合成数据库来执行语音合成。在这种情况下，第一和第二通信终端两者都可以与本发明的通信系统中的同一中继设备相连。作为替换，第一通信终端可以与本发明的中继设备相连，并且第二通信终端可以与包括本发明的中继设备在内的任何其他中继设备相连。依照该实施例，第一和第二通信终端中的至少一个的语音数据可以被记录。

优选地，中继设备还可以具有用于存储关于第一和第二通信终端的通信信息的通信信息存储设备，所述通信信息至少包括关于第一和第二通信终端每一个的服务信息，所述服务信息指示的是第一和第二通信终端中的每一个是否预订语音合成服务，以及如果该服务信息指示第一通信终端预订了语音合成服务，那么通信控制器可以确定对由发射机-接收机接收的第一语音数据进行复制并使复制器复制第一语音数据，并且如果该服务信息指示第二通信终端预订了语音合成服务，那么通信控制器也可以确定对由发射机-接收机接收的第二语音数据进行复制并可以使复制器复制第二语音数据。在这种情况下，由于是为第一和第二通信终端中的每一个执行关于每一个终端是否预订了该语音合成服务的判定，因此，只有在发端通信终端预订了语音合成服务的情况下才会对第一语音数据和第二语音数据中的每一个进行复制。因此，提高了构建用于语音合成的数据库的效率将得以提高。

更为优选的是，该通信系统还可以具有与中继设备相连且用于存储关于所述至少两个终端中的每一个的预定信息(或者关于与网络运营商有合约关系的所有终端的预定信息)的预订信息数据库设备，并且该中继设备还可以包括从预订信息数据库设备下载关于第一通信终端的服务信息以便将其存入通信信息存储设备的第一下载器，以及从预订信息数据库设备下载关于第二通信终端的服务信息以便将其存入通信信息存储设备的第二下载器。根据该模式，由于关于第一和第二通信终端两者的服务信息可以从预订信息数据库下载，因此，中继设备不必为当前未经由该中继设备进行通信的通信终端存储服务信息。因此，减轻了中继设备上的处理负载。

在这种情况下，通信系统可以具有多个中继设备，这其中包括与第一通信终端相连并具有第一下载器的第一中继设备，以及与第二通信终端相连并具有第二下载器的第二中继设备；并且第二中继设备还可以具有将关于第二通信终端的服务信息传送到第一中继设备的传送器，第一中继设备可以将第一下载器下载的关于第一通信终端的服务信息以及第二中继设备发送的关于第二通信终端的服务信息存储在通信信息存储设备中。依照这种模式，由于服务信息是由第一和第二中继设备中的每一个下载的，并且由第二中继设备下载的服务信息被传送到第一中继设备，因此，第一中继设备可以为第一和第二语音数据中的每一个执行是否应该复制语音数据的判定。

在另一个方面中，本发明提供了一种在通信系统中使用并且用于将数据从一个通信终端中继到另一个通信终端的中继设备，其中该通信系统包括与通信网络相连的所述中继设备，以及经由中继设备而与通信网络相连的至少两个通信终端，并且所述中继设备可以具有从第一通信终端接收语音数据并且将接收到的语音数据发送到第二通信终端的发射机-接收机；对语音数据进行复制的数据复制器；以及通信控制器，用于使数据复制器复制经由发射机-接收机而从第一通信终端接收的语音数据，并且使发射机-接收机将所复制的语音数据发送到媒体处理设备，以便存储所复制的语音数据以及产生语音合成数据库。依照本发明的中继设备，可以很容易地配置一个语音合成数据库，其强调的是再现人类主体语音特征过程中的个体性。

在另一个方面中，本发明提供了一种在通信系统中的中继设备上使用的中继方法，其中该通信系统包括与通信网络相连的所述中继设备以及经由中继设备而与通信网络相连的至少两个通信终端，该中继设备将数据从一个通信终端中继至另一个通信终端，该方法可以包括：从第一通信终端接收语音数据，并且将接收到的语音数据发送到第二通信终端；对在接收步骤中接收的语音数据进行复制；以及将所复制的语音数据发送到媒体处理设备，以便存储所复制的语音数据并产生语音合成数据库。依照本发明的中继方法，可以很容易地配置一个语音合成数据库，其强调的是再现人类主体语音特征过程中的个体性。

根据本发明，在这里可以提供一种易于构建用于语音合成的语音数据库的通信系统及用于此目的的中继设备和中继方法，其中该系统关注的是再现人类主体语音特征过程中的个体性。

附图说明

图1是显示依照本发明实施例的通信系统的总体结构的图示。

图2是显示依照本实施例的通信终端的功能结构的框图。

图3是显示依照本实施例的中继设备的功能结构的框图。

图4是显示存储在中继设备的通信信息存储设备中的数据实例的表格。

图5是显示存储在根据本实施例的注册信息数据库中的数据实例的表格。

图6是显示依照本实施例的媒体处理设备的功能结构的框图。

图7A和7B是显示在依照本实施例的通信系统中交换的信息流的序列图。

图8是显示由中继设备执行的通信控制处理的流程图。

图9是显示由中继设备执行的注册处理流程的流程图。

图10是显示由中继设备执行的呼叫方处理流程的流程图。

图11是显示由中继设备执行的接收方处理流程的流程图。

图12是显示由中继设备执行的用户数据传送和复制处理流程的流程图。

具体实施方式

在下文中将会参考附图来给出关于本发明优选实施例的详细说明。

图1显示的是根据本实施例来构建在语音合成中使用的语音数据数据库的通信系统的实例。该通信系统具有由网络N提供服务的多个通信终端10(通信终端10a，10b)，用于将相应通信终端连接到网络N的多个中继设备20(中继设备20a，20b)，用于管理每一个通信终端10的预订信息的预订信息DB(数据库)30，以及用于存储和处理与每一个通信终端相关的媒体信息的媒体处理设备40，并且这些设备经由网络N相互连接。虽然在图中只显示了两个通信终端10和两个中继设备20，但是也可以提供三个或更多的通信终端10或中继设备20。

语音数据例如包括话音通信、视频电话以及应答机的语音数据。而媒体信息则例如可以是视频和音频消息、音乐文件以及例如由应答机记录的动画。

通信终端10经由中继设备20与网络N相连。网络N向每一个通信终端10提供通信服务，并且该网络N例如可以是移动通信网络。通信终端10通过有线或无线方式与中继设备20相连接。

通信终端10能够经由中继设备20而与同样连至网络N的另一个通信终端10进行通信。该通信终端10是一台计算机，它具有CPU(中央处理器)、作为主存储设备的RAM(随机存取存储器)和ROM(只读存储器)、用于执行通信的通信模块、诸如充当辅助存储设备的硬盘之类的硬件、以及由通信终端10的用户操作的操作单元(未示出)。这些部件彼此协作，由此实现如下所述的通信终端10的功能。

图2是显示通信终端10的功能结构的框图。如图2所示，通信终端10具有话音输入器-输出器101，编码器-解码器102、分组处理器103、通信控制器104以及数据发射机-接收机105。

话音输入器-输出器101具有麦克风101a和扬声器101b。话音输入器-输出器101通过麦克风101获取用户输入的话音，以便将所获取的话音作为语音数据输出到编码器-解码器102。此外，话音输入器-输出器101还接收由编码器-解码器102解码的语音数据输入，以便将其从扬声器101b输出。

编码器-解码器102对从麦克风101a输入的语音数据进行编码，以便可以从数据发射机-接收机105发送语音数据。另一方面，编码器-解码器102对所输入的语音数据进行解码，以便可以从话音输入器-输出器101的扬声器101b输出解码数据。其中举例来说，用于移动通信的编码器-解码器102可以是多种编解码器之一，例如窄带AMR(自适应多速率窄带)和宽带AMR。

分组处理器103将经过编码器-解码器102编码的语音数据分成多个分组，以便将其输出到数据发射机-接收机105。该分组处理器103还组合从数据发射机-接收机105接收的分组，以便可以在由编码器-解码器102解码之后再现语音数据。分组处理器执行的处理遵循的是用于VoIP(借助网际协议的语音传输)之类的IP系统中的话音通信的协议，例如RTF(实时传输协议)。

通信控制器104产生注册消息，以使通信终端10可以接收网络N的通信服务。所产生的消息随后被输出至数据发射机-接收机105。一旦经由数据发射机-接收机105接收到来自对应设备的响应消息，通信控制器104就会确定现在启用通信。由通信控制器104执行的控制处理遵循的是诸如SIP(会话初始协议)之类的协议。如果用户经由操作单元输入了终止通信的指令，那么依照通信控制器104执行的控制处理，通信终端10会向对应终端发送一个终止消息，并且会在一接收到来自对应终端的响应消息就终止通信。

数据发射机-接收机105向其他终端发送数据和消息并接收来自于该其他设备的数据和消息。数据发射机-接收机105向网络N传送从分组处理器103输入的语音数据以及从通信控制器104输入的控制消息。此外，数据发射机-接收机105还将从网络N接收的语音数据输出到分组处理器103，并且将从网络N接收的控制消息输出到通信控制器104。

通信终端10例如可以是移动通信终端，但其并不局限于此。例如，通信终端10可以是能够执行话音通信的个人计算机或SIP电话。然而在本实施例中，所给出的描述假设该通信终端10是移动通信终端。

中继设备20与网络N相连。该中继设备20提供将通信终端10经由另一个中继设备20连至另一个通信终端10的通信功能。中继设备20是一台计算机，它具有CPU、作为主存储设备的RAM和ROM、用于执行通信的通信模块、以及诸如充当辅助存储设备的硬盘之类的硬件(未示出)。这些部件彼此协作，由此实现如下所述的中继设备20的功能。

图3是显示中继设备20的功能结构的框图。如图3所示，中继设备20具有数据发射机-接收机201、数据复制器202、通信控制器203、通信信息存储设备204以及简档信息(profile information)管理DB(数据库)205。由于本实施例中的通信终端10是移动通信终端，因此，中继设备20是通过无线方式与通信终端10相连的基站，或者是与其他网络元件通信的路由器和交换机。为了简化起见，在下文中假设中继设备20是中继设备20a。

一旦接收到来自通信终端10、另一个中继设备20(在本实施例中是中继设备20b)、预订信息DB 30或媒体处理设备40之一的控制消息，数据发射机-接收机201就把接收到的消息输出到通信控制器203。数据发射机-接收机201则将通信控制器203输入的控制消息发送到通信终端10、中继设备20b、预订信息DB 30和媒体处理设备40之一。

对在中继设备20a上接收和从其发送的控制消息来说，其实例包括：来自通信终端10的用于接收来自网络N的服务的注册消息、用于从预订信息DB 30下载通信终端10的简档信息的简档下载消息、用于通知通信开始的呼叫消息、以及用于应答呼叫消息的响应消息。控制消息的其他实例包括：用于询问对应通信终端的连接点(即中继设备20)的接收机连接点询问消息、作为接收机连接点询问消息的响应而发送对应连接点的接收机连接点响应消息、来自通信终端10的用于终止与对应通信终端的通信的终止消息、用于终止与媒体处理设备40的通信的终止消息、以及来自对应通信终端10或来自媒体处理设备40的用于响应该终止消息的响应消息。

此外，一旦接收到由通信控制器203指示的分组，数据发射机-接收机201就把该分组传送到数据复制器202。数据发射机-接收机201将数据复制器202复制的分组发送到媒体处理设备40。

数据复制器202对数据发射机-接收机201输入的分组进行复制。数据复制器202保持了所复制的分组中的原始发送端地址，但是将目的地址改为媒体处理设备40的IP地址，然后将该分组输出到数据发射机-接收机201。

图4显示的是存储在通信信息存储设备204中的信息的实例。如图所示，通信信息存储设备204包括多个记录，每一个记录包含了当前正在相互通信的呼叫方和接收方通信终端10的通信终端标识符(通信终端的标识信息)及IP地址。此外，每一个记录都包含关于呼叫方和接收方通信终端10中的每一个是否预订了语音合成服务的服务信息。例如，语音合成服务可以是由移动通信网络运营商提供的服务，并且该服务是为了产生与预订方指定的文本相对应的语音合成消息以及将所述语音合成消息发送到指定目的地而提供的。

每一个记录都是根据与中继设备20相连的通信终端10的简档信息而为每一个话音通信会话产生的，其中该简档信息是从预订信息DB30下载的，稍后将会对其进行详细描述。在通信会话终止之后(也就是在接收到对用于终止通信的终止消息做出响应的响应消息之后)，删除每一个记录。

在本实施例中使用了电话号码作为通信终端标识符，以便唯一标识每一个通信终端。

简档信息管理DB 205存储从预订信息DB 30下载的简档信息。从预订信息DB 30下载的简档信息至少包括已发送注册消息的通信终端10的电话号码(即通信终端标识符)，以及用于指示该通信终端10是否预订了语音合成服务的服务信息。该简档信息是以与每一个通信终端10的IP地址相关联的方式存储的，并且该简档信息在每次下载了具有相同通信终端标识符的简档信息的时候都会用最新的IP地址来盖写。

一旦接收到来自数据发射机-接收机201的控制消息，通信控制器203就会执行与控制消息相对应的处理。控制消息的实例已在上文中描述。

一旦经由数据发射机-接收机201接收到来自通信终端10的注册消息，通信控制器203就会将该消息经由数据发射机-接收机201发送到预订信息DB 30。响应于这个消息，相关通信终端10的简档信息将会借助简档下载消息而被通告。接收到的简档信息则被存储在简档信息管理DB 205中。

此外，一旦经由数据发射机-接收机201接收到来自通信终端10的呼叫消息，通信控制器203就会产生一个接收机连接点询问消息，以便将连至对应通信终端10的中继设备20标识成呼叫消息的转发目的地。然后，通信控制器203将所产生的接收机连接点询问消息输出到数据发射机-接收机201，以便将其传送到预订信息DB 30。一旦经由数据发射机-接收机201接收到接收机连接点响应消息，通信控制器203就会标识与对应通信终端10相连的中继设备20，以便将呼叫消息经由数据发射机-接收机201发送到所标识的中继设备20。一旦接收到来自对应通信终端10的响应消息，通信控制器203就会在通信信息存储设备204中产生一个新纪录。

一旦经由数据发射机-接收机201接收到来自对应中继设备20的呼叫消息，通信控制器203就会将该呼叫消息经由数据发射机-接收机201发送到相关通信终端10。一旦经由数据发射机-接收机201接收到针对来自通信终端10的该呼叫消息的响应信息，那么在从简档信息管理设备DB 205中读取了与响应消息发送方相对应的简档信息并将所读取的发送方通信终端10的简档信息和IP地址附加于该响应消息之后，通信控制器203向该对应中继设备20发送该响应消息。

一旦经由数据发射机-接收机201接收到来自通信终端10的终止消息，通信控制器203就会经由数据发射机-接收机201而向对应中继设备20和媒体处理设备40中的每一个发送终止消息。此外，在确认接收到来自对应中继设备20和来自媒体处理设备40的两个响应消息之后，通信控制器203会向通信终端10发送一个响应消息。

在假设的范例中，由简档下载消息通告的简档信息表明通信终端10a的用户预订了语音合成服务。在这种情况下，当从通信终端10a发送话音通信呼叫或视频电话呼叫时，或者当在通信终端10a上接收到来自另一个通信终端10b的呼叫时，通信控制器203使数据发射机-接收机201向数据复制器202输出与在呼叫中保持的对话相对应的语音数据。所输出的语音数据会在数据复制器202上被复制，并且所复制的语音数据经由数据发射机-接收机201而被发送到媒体处理设备40。

由此，如果通信终端10a预订了语音合成服务，那么通信控制器203使数据复制器202复制从通信终端10a接收的语音数据，并且使数据发射机-接收机201将所复制的语音数据发送到媒体处理设备40。由于发送到媒体处理设备40的语音数据将会被存储并用作语音合成数据库的基础，因此，在这里可以根据预订语音合成服务的用户的实际语音数据来配置一个用于语音合成的数据库。因此，基于该数据库并以这种方式创建的语音合成消息将会是一个反映用户个体语音特征的话音消息，也就是说，该消息与用户的实际话音具有很高的相似度。

此外，如果与通信终端10a通信的通信终端10b预订了语音合成服务，那么与通信终端10a相连的中继设备20a的通信控制器203会使其数据复制器202复制从通信终端10b接收的语音数据。如果通信终端10a及其对应的通信终端10b全都预订了语音合成服务，那么中继设备20a的通信控制器203使其数据复制器202复制从通信终端10a接收的语音数据以及从通信终端10b接收的语音数据。由此，依照本发明的通信系统，在这里还可以为对应通信终端的用户配置一个语音合成数据库。

应该指出的是，作为呼叫消息响应发送的响应消息不仅仅是为了对引入呼叫做出响应，而且还是为了通告接收方通信终端10的IP地址。由此，与呼叫方通信终端10相连的中继设备20将会具有关于呼叫方和接收方通信终端10两者的通信终端标识符及IP地址的信息，从而将该信息存储在通信信息存储设备204中。如上所述，在呼叫期间，呼叫方和接收方通信终端10的通信终端标识符及IP地址是在通信信息存储设备204上维持的。

一旦接收到来自对应通信终端10的响应消息，通信控制器203就会产生一个呼叫消息，以便与媒体处理设备40建立通信路径，用以向媒体处理设备40进行传输。在接收到来自媒体处理设备40的响应消息之后，在数据复制器202上开始分组的复制。

预订信息DB 30与网络N相连，并且它是管理与网络N的运营商有合约关系的所有通信终端10的预定信息以及关于每一个通信终端10所在地的信息的数据库服务器。在移动通信系统中，预订信息DB 30例如可以是HLR(归属位置寄存器)。预订信息DB是一台计算机，它具有CPU、作为主存储设备的RAM和ROM、用于执行通信的通信模块、以及诸如充当辅助存储设备的硬盘之类的硬件(未示出)。这些部件相互协作，由此实现预订信息DB 30的下列功能。

图5显示的是在预订信息DB 30中注册的信息的实例。如图所示，用户ID、电话号码、涉及语音合成服务预订的“是”或“否”以及每一个通信终端10的注册状态都被注册为预订信息301。在本实施例中，存储在预订信息DB中的电话号码充当通信终端10的通信终端标识符。如果通信终端10已被注册(也就是已经开启)，那么该注册状态将会通过中继设备20的IP地址来显示与通信终端10相连的中继设备20。中继设备20的IP地址是连同注册消息一起从中继设备20发送的。从这个意义上讲，注册消息与位置注册请求消息是等价的。

一旦接收到来自中继设备20的注册消息，预订信息DB 30就会依照注册状态项目来注册用于标识与发送了注册消息的通信终端10相连的中继设备20的信息。此外，预订信息DB 30还会在简档下载消息中向中继设备20传送电话号码和用于指示是否预订了语音合成服务的服务信息，以此作为通信终端10的简档信息。另外，如果预订信息DB 30接收到用于询问有关接收方通信终端10的连接点(也就是与通信终端10相连的中继设备20)的接收机连接点询问消息，那么在将关于连接点的信息包括在接收机连接点响应消息之内以后，预订信息DB 30会将接收方通信终端10的连接点发送到已发送所述询问的中继设备20。

媒体处理设备40与网络N相连，它提供了存储和处理通信终端10的多媒体信息的功能。该媒体处理设备40是一台计算机，它具有CPU、作为主存储设备的RAM和ROM、用于执行通信的通信模块、以及诸如充当辅助存储设备的硬盘之类的硬件(未示出)。这些部件相互协作，由此实现媒体处理设备40的下列功能。

图6是显示媒体处理设备40的功能结构的框图。如图所示，媒体处理设备40具有数据发射机-接收机401，媒体处理应用402(语音数据处理器)，语音数据存储设备403，语音合成DB生成引擎404，语音合成DB(数据库)(语音合成数据库存储设备)405以及语音合成器406。

一旦接收到来自中继设备20的控制消息，数据发射机-接收机401就会将该消息传送到媒体处理应用402。数据发射机-接收机401将从媒体处理应用402接收的控制消息传送到中继设备20。此外，数据发射机-接收机401还将从中继设备20接收的分组发送到媒体处理应用402。一旦从通信终端10接收到请求语音合成的语音合成请求消息，数据发射机-接收机401就会将该消息输出到语言合成器406。与语音合成请求消息一起发送的是即时消息数据(即时消息收发)或电子邮件的文本数据。

一旦接收到来自中继设备20的呼叫消息，媒体处理应用402就会发送一个响应消息。所述呼叫消息包括呼叫方通信终端的通信终端标识符和IP地址。当在稍后时刻接收到来自中继设备20的分组时，媒体处理应用402将会按照发送方IP地址来对每一个分组进行分类(sort)，并且在语音数据存储设备403中，每个接收到的经分类的分组依照相应IP地址而被存储在通信终端的存储器存储空间中。该存储处理在每次接收到来自中继设备20的分组时执行。一旦接收到来自中继设备20的终止信息，媒体处理应用402就会发送一个用于确认该终止消息的响应消息。此外，媒体处理应用402还会命令语音数据存储设备403将所存储的分组存入一个数据文件。

如果在语音数据存储设备403上注册了用于语音合成的数据文件，那么语音合成DB引擎404将会从语音数据存储设备403获取数据文件，以便创建用于语音合成的数据库。所生成的数据库存储在语音合成DB 405中。

一旦接收到来自通信终端10的语音合成请求消息，语言合成器406就从语音合成DB 405中获取用于发射方通信终端10的语音合成的数据，以便执行语音合成处理。该语音合成消息则被传送到接收方通信终端10。

图8是显示由中继设备20的通信控制器203执行的简化通信控制处理的流程图。如图所示，在该通信控制处理中，一旦接收到来自通信终端10的注册请求，通信控制器203首先执行注册处理(SA1)。其中举例来说，该注册请求是在开启移动通信终端10的时候发送的。在完成注册处理之后，通信控制器203等待另一个控制消息。

如果接收到控制消息并且接收到的控制消息是来自与这一中继设备20相连的通信终端10的呼叫消息，那么通信控制器203首先执行呼叫方处理(SA2)。通信控制器203随后执行一个判定处理(SA4)，以便根据存储在通信信息存储设备204中的信息来判定在与这一中继设备20相连的呼叫方通信终端10以及与另一个中继设备20相连的接收方通信终端10中是否有至少一个终端预订了语音合成服务。如果所述判定变为“是”，那么通信控制器203进行媒体处理设备连接处理(SA5)，以便与媒体处理设备40建立通信连接。通信控制器203接着执行用户数据传送和复制处理(SA6)。然后，通信控制器203执行用于终止该通信会话的终止处理(SA7)。如果步骤SA4的判定变为“否”，那么通信控制器203进行用户数据传送处理(SA8)。该用户数据传送处理是在每次接收到用户数据的时候执行的，然后，如果接收到终止消息，则执行终止处理(SA7)。

另一方面，如果接收到控制消息并且接收到的控制消息是来自另一个中继设备20的呼叫消息，那么通信控制器203首先执行接收方处理(SA3)。一旦通过该接收方处理在与这一中继设备20相连的通信终端10以及与另一个中继设备20相连的另一个通信终端10之间建立了通信连接，那么通信控制器203开始将从与这一中继设备相连的通信终端10接收的用户数据传送到另一个中继设备20，以及将从另一个中继设备20接收的用户数据传送到与这一中继设备20相连的通信终端10(SA8)。用户数据传送处理是在每次接收到用户数据的时候执行的，如果接收到终止消息，那么该例程进行终止处理(SA7)。在终止处理中，一旦接收到来自通信终端10的终止消息，通信控制器203就会终止与另一个中继设备20的通信。此外，如果这一中继设备20正与媒体处理设备40通信，那么通信控制器203还会终止与媒体处理设备40的通信。

图7A和7B是显示在通信系统中交换的数据流的序列图。图9-12分别显示的是注册处理(图8中的SA1)、呼叫方处理(图8中的SA2)、接收方处理(图8中的SA3)以及用户数据传送和复制处理(图8中的SA6)的详细流程。

接下来将会参考图7A和7B以及图9-12来给出在通信系统中执行的处理的实例。在这个处理中，两个通信终端10a和10b执行话音通信，并且在这一通信过程中，分组是在媒体处理设备40中存储的，而通信终端10a和10b中的每一个都会在通信终止之后发送语音合成请求消息。

在图7A的步骤S1中，通信终端10a和10b分别向中继设备20a和20b传送注册消息，例如在上电时传送，由此这些终端可以从网络N接收服务。每一个中继设备20a和20b都会将这个注册消息传送到预订信息DB 30。这时，每一个中继设备20a和20b都会向预订信息DB 30通告每一个中继设备20a和20b的IP地址，由此就可以找出与每一个通信终端10a和10b相连的中继设备。预订信息DB 30随后注册与相应通信终端10a和10b相连的中继设备20a和20b的IP地址，以此作为注册状态。

在步骤S2中，已接收到注册消息的预订信息DB 30提取每一个通信终端10a和10b的简档信息，以便将该简档信息发送到由注册消息通告的中继设备20a和20b的IP地址中的每一个IP地址(S2：图7A中的简档下载)。每一个中继设备20a和20b将接收到的简档信息注册在每一个中继设备20的简档信息管理DB 205中。

图9是显示由中继设备20的通信控制器203执行的注册处理流程的流程图。在该注册处理中，通信控制器203首先接收来自通信终端10的注册消息(SA11)。然后，通信控制器203将接收到的注册消息发送到预订信息DB(SA12)。在发送注册消息的过程中，通信控制器203将中继设备20的IP地址附加于该注册消息。

然后，通信控制器203确定是否接收到来自预订信息DB 30的简档信息(SA13)。重复执行该判定，直至接收到简档信息为止(SA13：否)。如果所述判定变为“是”，那么通信控制器203将接收到的简档信息注册在简档信息管理DB 205(SA14)中，以便结束注册处理。

如图7A所示，该注册处理是由中继设备20a和20b中的每一个执行的。

在图7A的步骤S3中，通信终端10a发送一个用于通信终端10b的呼叫消息。

在图7A的步骤S4中，中继设备20a通过发送接收机连接点询问来向预订信息DB30询问有关与通信终端10b相连的中继设备。

在图7A的步骤S5中，如果完成了通信终端10b的注册，那么预订信息DB 30确定通信终端10b与中继设备20b相连，用以将用于指示中继设备20b的信息发送到中继设备20a(S5：图7A中的接收机连接点响应)。

在图7A的步骤S6中，中继设备20a向被预订信息DB 30通告为与通信终端10b相连的中继设备的中继设备20b发送一个呼叫消息。在接收到该呼叫消息之后，中继设备20b将同一呼叫消息发送至通信终端10b，并且还记录接收到的呼叫消息的发射机地址。

在图7A的步骤S7中，如果通信终端10b能够对该呼叫消息做出响应，那么通信终端10b向中继设备20b发送一个响应消息。在附加了通信终端10b的IP地址和简档信息之后，中继设备20b将接收到的响应消息发送到中继设备20a。中继设备20a随后将响应消息发送到通信终端10a。在本实施例中，由于中继设备20b记录了在步骤S6中接收的呼叫消息的发射机地址，因此，中继设备20b可以向中继设备20a发送消息。

图10是显示由中继设备20的通信控制器203(在图7A所示的实例中是中继设备20a；因此，在这一处理的以下描述中将通信控制器203称为“通信控制器203a”)执行的呼叫方处理流程的流程图。在呼叫方处理中，通信控制器203a首先从作为呼叫方通信终端的通信终端10a接收一个呼叫消息(SA21)。通信控制器203a随后通过向预订信息数据库30发送接收机连接点询问来询问有关在呼叫消息中指定的接收方通信终端10b的连接点(SA22)。

然后，通信控制器203a确定是否从预订信息DB 30接收到关于接收机连接点的信息(SA23)。重复执行该判定，直至接收到关于该接收机连接点的信息(SA23：否)。如果该判定变为“是”，那么通信控制器203a会向由关于该接收机连接点的信息所指示的中继设备20(图7A所示实例中的中继设备20b)发送呼叫消息(SA24)。如图7A的步骤S6所示，该呼叫消息从中继设备20b传送到通信终端10b。

图11是显示由中继设备20的通信控制器203(也就是图7A所示实例中的中继设备20b；因此，这一处理的以下描述中将通信控制器203称为“通信控制器203b”)执行的接收方处理流程的流程图。在接收方处理中，通信控制器203b首先接收来自中继设备20a的呼叫消息(SA31)。通信控制器203b随后将呼叫消息发送到接收方通信终端10b(SA32)，并且等待对所发送呼叫消息的响应消息(SA33：否)。

一旦接收到来自通信终端10b的响应消息(SA33：是)，那么通信控制器203b会从简档信息管理DB 205中读取通信终端10b的简档信息(SA34)，将通信终端10b的IP地址以及所读取的简档信息附加于响应消息(SA35)，以及将响应消息连同附加信息一起发送到中继设备20a(SA36)，以结束该接收方处理。

另一方面，在图10的步骤SA25中，中继设备20a的通信控制器203a确定是否经由中继设备20b接收到来自通信终端10b的响应消息(SA25)。重复执行该判定，直至接收到该响应消息(SA25：否)。

如果该判定变为“是”，那么通信控制器203a在通信信息存储设备204中产生一个新纪录。特别地，通信控制器203a根据接收到的简档信息来获取通信终端10b的通信终端标识符，以及用于指示通信终端10b是否订阅了语音合成服务的预订信息。通信控制器203a随后在该新记录中存储通信终端10b的通信终端标识符、服务信息以及接收到的IP地址。该通信控制器203a还会从简档信息管理DB 205中读取与在SA21中接收的呼叫方消息所包含的IP地址(即通信终端10a的IP地址)相对应的简档信息，并且获取通信终端10a的通信终端标识符以及用于指示通信终端10a是否预订了语音合成服务的服务信息，以便将其连同通信终端10a的IP地址一起存入所述新记录(SA26)。

在本实例中，作为步骤SA26中执行的处理的结果，假设产生了如图4所示的通信信息存储设备204中的顶部记录，其中通信终端10a的通信终端标识符是“090AAAAAAAA”，并且通信终端10b的通信终端标识符是“090BBBBBBBB”。由此，在本实例中，通信终端10a和10b全都预订了语音合成服务。

通信控制器203a于是结束该呼叫方处理，以便让所述处理前进至图8中的步骤SA4的判定处理。

在该判定处理中，中继设备20a根据存储在通信信息存储设备204中的信息来判定呼叫方和接收方通信终端中的至少一个是否预订了语音合成服务。由于在本实例中，根据存储在通信信息存储设备204中的信息做出的判定是肯定的(图8中的SA4：是)，因此，中继设备20a将会产生一个呼叫消息，以便建立用于向媒体处理设备40执行传输的通信路径(S8：图7A中的呼叫，图8中的SA5)。如果确定呼叫方和接收方通信终端均未预订语音合成服务(图8中的SA4：否)，那么通信控制器203不会向媒体处理设备40发送呼叫消息。取而代之的是，通信控制器203进行用户数据传送处理(图8中的SA8)。

在图7A的步骤S9中，在接收到呼叫消息之后，媒体处理设备40会向中继设备20a传送一个响应消息，从而与中继设备20a建立通信路径。

在图7A的步骤S10中，如果将包含用户数据(语音数据)的分组从通信终端10a发送到了中继设备20a，那么中继设备20a会将该分组发送到与对应通信终端10b相连的中继设备20b。在本实例中，由于通信终端10a预订了语音合成服务，因此，中继设备20a将会复制该分组，以便将其传输到媒体处理设备40。如果将分组从通信终端10b经由中继设备20b发送到中继设备20a，那么，在本实例中，由于通信终端10b同样预订了语音合成服务，因此，中继设备20a将会复制该分组，以便将其传输到媒体处理设备40(S10a：图7A中的复制分组)。媒体处理设备40会按照原始发送端地址(即通信终端10a或10b的IP地址)来对接收到的分组进行分类，并且将每一个分组的数据存储在与通信终端标识符的相对应的存储器存储空间中，其中上述通信终端标识符则对应于语音数据存储设备403内的发送方地址。

图12是显示由通信控制器203a执行的用户数据传送和复制处理流程的流程图。在该处理中，通信控制器203a首先接收用户数据(SA61)。然后，通信控制器203a确定接收到的用户数据是否是从发送了在步骤SA21中接收的呼叫消息的呼叫方通信终端(即通信终端10a)发送的(SA62)。

如果该判定变为“是”，那么通信控制器203a将用户数据传送到接收方通信终端(即通信终端10b)(SA63)。通信控制器203a随后根据存储在通信信息存储设备204中的信息来确定通信终端10a是否预订了语音合成服务(SA64)。在本实例中，由于通信终端10a预订了语音合成服务，因此该判定变为“是”。由此，通信控制器203a使数据复制器202复制用户数据(SA65)，并且将所复制的用户数据经由数据发射机-接收机201发送到媒体处理设备40(SA66)，以便结束处理。如果步骤SA64的判定变为“否”，那么该例程将会返回到图8中的主处理。

另一方面，如果步骤SA62中的判定变为“否”，也就是说，如果接收到的用户数据是从通信终端10b发送的，那么通信控制器203a会将该用户数据传送到接收方通信终端(即通信终端10a)(SA67)。通信控制器203a随后根据存储在通信信息存储设备204中的信息来确定通信终端10b是否预订了语音合成服务(SA68)。在本实例中，由于通信终端10b预订了语音合成服务，因此该判定变为“是”。由此，通信控制器203a使数据复制器202复制用户数据(SA65)，并且将所复制的用户数据经由数据发射机-接收机201传送到媒体处理设备40(SA66)，以便结束处理。如果步骤SA68的判定变为“否”，那么该例程将会返回到图8中的主处理。该用户数据传送复制处理是在每次接收到用户数据的时候执行的。

在图7B的步骤S11中，如果用户输入了终止通信的指令，那么通信终端10a将会发送一个终止消息。一旦接收到终止消息，中继设备20a将该消息传送到中继设备20b。中继设备20b接着将该消息传送到通信终端10b。

在图7B的步骤S12中，在接收到终止话音通信的终止消息之后，通信终端10b将会向中继设备20b发送一个响应消息。一旦接收到响应消息，中继设备20b就会将该消息传送到中继设备20a。出于参考步骤S7描述的相同原因，中继设备20b能够将该消息发送到中继设备20a。

在图7B的步骤S13中，一旦接收到来自通信终端10a的终止消息，中继设备20a就会停止中继设备20a中的分组复制功能，并且向媒体处理设备40发送一个终止消息。

在图7B的步骤S14中，一旦接收到终止信息，媒体处理设备40就会传送一个响应消息，由此终止与中继设备20a的通信。在这种情况下，媒体处理设备40确定话音通信已经完成，并且已经存储在语音数据存储设备403中的每一个复制分组所包含的数据将被组合成一个数据文件。

在图7B的步骤S15中，如果接收到来自中继设备20b和媒体处理设备40两者的响应消息，那么中继设备20a会将该响应消息发送到通信终端10a，以便向其通告通信已经终止(步骤S11～S15与图8中的SA7相对应)。通信终端10a与10b之间的通信会话于是被终止。

在图7B的步骤S16中，媒体处理设备40根据与在语音数据存储设备403中存储的话音通信相关的数据文件来构建用于语音合成的数据库。

当通过电子邮件和即时消息之类的消息收发应用或者通过从通信终端10a或10b发送的消息数据来请求语音合成任务时，就会使用步骤S16中产生的语音合成DB。

在步骤S17中，通信终端10a向中继设备20a发送一个用于通信终端10b且包含了语音合成请求的消息。中继设备20a将接收到的消息传送到媒体处理设备40(S17：图7B中的语音合成请求消息)。

在步骤S18中，媒体处理设备40根据语音合成DB来产生一个反映了通信终端10a的用户的个体语音特征的语音合成的消息，以便将其经由中继设备20b传输到通信终端10b(S18：图7B中的语音合成的消息)。

在步骤S19中，通信终端10b向中继设备20b发送一个用于通信终端10a且包含了语音合成请求的消息。中继设备20b则将接收到的消息发送到媒体处理设备40(S19：图7B中的语音合成请求消息)。

在步骤S20中，媒体处理设备40根据语音合成DB来产生一个反映了通信终端10b的用户的个体语音特征的语音合成的消息，以便将其经由中继设备20a传输到通信终端10a(S20：图7B中的语音合成的消息)。

修改

上述实施例可以采用如下所述的方式进行修改。

在上述实施例中，如果通信终端10a呼叫通信终端10b，那么与通信终端10a相连的中继设备20a复制关于通信终端10a和10b两者的语音数据，并且中继设备20a会将所复制的语音数据发送到媒体处理设备40。但是，在这种情况下，由于中继设备20b与中继设备20a具有相同的结构，因此中继设备20b可以复制关于通信终端10a和10b两者的语音数据。作为替换，该系统可以被配置成让中继设备20a和20b中的每一个复制关于通信终端10a和10b两者的语音数据。在另一个替换方案中，每一个中继设备20a和20b分别可以复制关于通信终端10a的语音数据和关于通信终端10b的语音数据。

此外，在上述实施例中，所给出的描述是在通信终端10a与中继设备20a相连以及通信终端10b与中继设备20b相连的情况下进行的。但是，通信终端10a和10b两者也可以连接到同一个中继设备20。此外，至少一个通信终端10可以连接到中继设备20。换言之，通信终端之一可以连接到与中继设备20不具有相同功能的常规中继设备。

在上述实施例中，其中存储了传送到媒体处理设备40的话音通信所包含的所有数据片段，但是也可以只存储所传送数据中的选定片段。该选择可以依照已存储数据与所接收数据的比较来进行，其中在发音和含义方面与已存储数据相等同或相类似的数据片段将被丢弃。在这种情况下，媒体处理设备40的媒体处理应用402可以具有一个判定器(determiner)，用来确定接收机接收的语音数据片段是否与任何已存储的语音数据片段相对应，如果该判定器发现这种对应关系，那么媒体处理应用402就可以使用接收到的语音数据片段来盖写存储的语音数据片段。

优选地，如果已存储的语音数据片段包含背景噪声，并且新接收的与已存储数据片段相同或相似的数据片段具有高于已存储的数据片段的音质，那么可以使用新接收的数据片段来替换已存储的语音数据片段。在这种情况下，媒体处理应用402可以具有噪声测量器，用于测量接收到的语音数据片段中包含的噪声量以及在相应的已存储语音数据片段中包含的噪声量，如果接收到的语音数据片段中的噪声量少于相应的已存储语音数据片段中的噪声量，那么该语音数据存储设备403就可以用接收到的语音数据片段来盖写已存储的语音数据片段。依照这一结构，就能够在优化数据库大小的同时提供更高质量的语音合成数据库。

优选地，在这里可以优先存储在语音合成消息中频繁使用的数据片段，以免因为输入了新的数据片段而导致对频繁使用的数据片段进行替换。

在上述实施例中，存储了传送至媒体处理设备40的话音通信中包含的所有数据片段，但在其被存储之前，可以消除诸如背景噪声之类的非期望声音。在这种情况下，媒体处理应用402可以具有一个噪声滤波器，用于移除语音数据中包含的背景噪声，并且语音数据存储设备403可以在由噪声滤波器移除了噪声之后存储语音数据。依照这种结构，就可以只存储必要的数据片段。

优选地，在数据被存储之前，不但可以消除背景噪声，而且还可以消除静默数据。

在上述实施例中，数据是按照发送方IP地址在中继设备上复制的，并且数据是按照发送方IP地址在媒体处理设备上存储的。但是，在复制数据和存储数据的过程中，也可以使用别的标识符。例如，在这里可以使用Ethernet^TM中的MAC(介质访问控制)地址、ATM(异步传输模式)中的VCI(虚通道标识符)或IMSI(国际移动用户标识)。此外，也可以使用通信终端的通信终端标识符。依照这一修改，本实施例中的通信系统就可以设置在除了采用IP的网络(例如因特网)之外的其他网络中。

在上述实施例中，是以预订信息为基础来确定是否在中继设备上复制数据以及在媒体处理设备上存储所复制的数据的。作为替换，呼叫方通信终端可以发送一个用于记录语音数据(也就是复制和存储数据)的指令，由此，在媒体处理设备上就只记录由通信终端所指示的语音数据。在这种情况下，如果数据发射机-接收机201接收到来自通信终端10的复制指令，那么中继设备20的通信控制器203可以使数据复制器202复制经由数据发射机-接收机201而从通信终端10接收的语音数据。依照这一修改，所要记录的语音数据就可由通信终端自由指示。

优选地，在语音通信结束之后将允许用户指示是否记录语音数据。在这种情况下，只有在给出了用于将数据文件添加到数据库中的指令的情况下，语音合成DB引擎404才会从语音数据存储设备403中获取数据文件，以便创建用于语音合成的数据库。

在上述实施例中，在媒体处理设备上存储的是预订了语音合成服务的通信终端的语音数据，但对预订了该服务的通信终端的频繁联系的对应方(correspondent)来说，其语音数据同样是可以存储的。特别地，可以存储若干个最频繁的对应方的语音数据，由此，如果消息是从这几个最频繁的对应方之一发送的，就发送语音合成的消息。在这种情况下，如果在某个时段中在通信终端之间执行的呼叫的次数超出了某个阈值，那么即使在通信终端10a预订了语音合成服务而通信终端10b没有预订语音合成服务的情况下，与通信终端10a相连的中继设备20的通信控制器203也可以使数据复制器202复制从通信终端10b接收的语音数据。依照这一修改，即使对应通信终端没有预订语音合成服务，也还是可以从对应的通信终端传送语音合成的消息。

在上述实施例中，媒体处理设备会在发送请求消息的时候执行语音合成处理，以便自动发送合成的消息。但是，在将该语音合成的消息发送到对应方之前，就可以在呼叫方通信终端上检查该消息。特别地，可以在呼叫方通信终端上再现该语音合成的消息。依照这一修改，呼叫方通信终端的用户可以确认该合成消息是否具有足够程度的个体语音特征，以便确定是否发送该消息。

在上述实施例中，媒体处理设备将语音数据存储在不同的文件中，此外，所存储的语音数据文件可以通过语音识别来进行处理，并且所识别的文本和语音数据文件可以按相互关联的方式来存储。

在前述中，在依照本发明的基于话音通信过程中的语音数据来构建用于语音合成的数据库的通信系统中，使用通信终端执行的对话被用于构建用于语音合成的数据库。因此，在这个通信系统中，用户不必花费很长时间来进行记录，并且也不必具有用于记录的专业工作室。由此，依照这个根据本发明的基于话音通信过程中的语音数据来构建用于语音合成的数据库的通信系统中，用于语音合成的数据库是很容易创建的，而不会让用户觉察到正在进行用于语音合成的记录。

此外，用于语音合成的数据库是根据使用通信终端的人类主体所维持的对话来构建的。由此，根据本发明，可以提供一种语音合成数据库构建方法，其强调的是再现人类主体语音特征过程中的个体性。

此外，由于没有使用专用文本来构建数据库，因此，可以提供与人类主体的日常会话更为接近的合成数据。

如果通信终端10是个人计算机之类的固定终端，那么中继设备20将会是固定通信网络的交换站。在这种情况下，由于不需要位置注册或是连接点询问，因此在这里不必提供预订信息DB 30。在这种情况下，中继设备20自身就可以存储简档信息。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 构建语音合成数据库的通信系统及其中继设备和中继方法 [P] . 中国专利： CN101515455B . 2012.06.13
2. 构建语音合成数据库的通信系统及其中继设备和中继方法 [P] . 中国专利： CN101515455A . 2009-08-26
3. Communication system for voice database construction for speech synthesis, the relay device and relay method [P] . 日本专利： JP5406358B2 . 2014-02-05

机译：用于语音合成的语音数据库构建的通信系统，中继设备和中继方法
4. Communication system for speech synthesis for voice database construction, relay method and relay apparatus [P] . 日本专利： JP5162495B2 . 2013-03-13

机译：用于语音数据库构建的语音合成通信系统，中继方法和中继设备
5. COMMUNICATION SYSTEM, RELAY DEVICE, AND RELAY METHOD FOR CONSTRUCTING VOICE DATABASE FOR VOICE SYNTHESIS [P] . 日本专利： JP2013047851A . 2013-03-07

机译：用于构建语音合成的语音数据库的通信系统，中继设备和中继方法