首页> 中国专利> 基于电子书的人物语调识别方法、电子设备及存储介质

基于电子书的人物语调识别方法、电子设备及存储介质

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明公开了一种基于电子书的人物语调识别方法、电子设备及存储介质，该方法包括：针对电子书文本进行分析处理，根据分析结果识别电子书文本中包含的人物类实体；获取人物类实体在电子书文本中的关联文本信息，根据获取到的关联文本信息确定人物类实体的人物属性信息；获取与人物类实体相对应的对话文本信息，根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息。该方式能够识别出人物类实体，并确定与人物类实体相对应的人物属性信息，进而确定与该人物类实体对应的对话文本信息的人物语调，由于人物属性与人物语调之间具有特定的对应关系，因此，根据人物属性来识别人物语调能够提升语调识别的精确性。

著录项

公开/公告号CN112966491A

专利类型发明专利
公开/公告日2021-06-15

原文格式PDF
申请/专利权人掌阅科技股份有限公司;
展开▼

申请/专利号CN202110277150.7
发明设计人丁廷震;
展开▼

申请日2021-03-15
分类号G06F40/205(20200101);G06F40/284(20200101);G06F40/216(20200101);G06F40/242(20200101);G06F40/295(20200101);G06F40/30(20200101);G06F16/35(20190101);
代理机构11276 北京市浩天知识产权代理事务所(普通合伙);
代理人刘兰兰
地址 100124 北京市朝阳区四惠大厦2029E
入库时间 2023-06-19 11:26:00

说明书

技术领域

本发明涉及计算机领域，具体涉及一种基于电子书的人物语调识别方法、电子设备及存储介质。

背景技术

目前，随着有声读物的日益普及，越来越多的用户开始从看书转换为听书，相应的，在制作有声读物的过程中，需要针对电子书执行文本转语音的操作。

通常情况下，直接调用开源的文本转语音工具实现语音合成处理。但是，发明人在实现本发明的过程中发现，通过现有方式合成的语音较为死板，无法模拟人类说话时的真实语调。由此可见，现有方式无法准确识别电子书中的各个人物的语调特征，从而导致有声读物无法真实模拟人类说话的特点。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于电子书的人物语调识别方法、电子设备及存储介质。

根据本发明的一个方面，提供了一种基于电子书的人物语调识别方法，该方法包括：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

根据本发明的另一方面，提供了一种电子设备，该电子设备包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行以下操作：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

根据本发明的又一方面，提供了一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使所述处理器执行以下操作：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

在本发明提供的基于电子书的人物语调识别方法、电子设备及存储介质中，首先，识别电子书文本中包含的人物类实体；然后，根据人物类实体在电子书文本中的关联文本信息确定人物类实体的人物属性信息；最后，获取与人物类实体相对应的对话文本信息，根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息。由此可见，该方式能够识别出人物类实体，并确定与人物类实体相对应的人物属性信息，进而确定与该人物类实体对应的对话文本信息的人物语调，由于人物属性与人物语调之间具有特定的对应关系，例如，男性与女性的语调各不相同，年轻人与老年人的语调也各不相同，因此，根据人物属性来识别人物语调能够提升语调识别的精确性。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明一个实施例提供的基于电子书的人物语调识别方法的流程图；

图2示出了本发明另一个实施例提供的基于电子书的人物语调识别方法的流程图；

图3示出了根据本发明另一个实施例的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例一

图1示出了本发明一个实施例提供的基于电子书的人物语调识别方法的流程图。如图1所示，该方法包括以下步骤：

步骤S110：针对电子书文本进行分析处理，根据分析结果识别电子书文本中包含的人物类实体。

具体的，可以针对电子书文本进行分词处理等各类处理，从而根据分词结果识别电子书中包含的人物类实体。具体实施时，可以先识别出电子书文本中包含的命名实体，由于命名实体包含时间、地点、人物等多种类型，相应的，进一步从命名实体中筛选人物类实体。其中，人物类实体在电子书中通常具有出现频次高、经常与动词等谓语成分同时出现于同一个语句中的特点，因此，根据上述特点，统计各个分词的出现频次、与动词的搭配次数等信息，进而确定属于人物类实体的分词。

步骤S120：获取人物类实体在电子书文本中的关联文本信息，根据获取到的关联文本信息确定人物类实体的人物属性信息。

其中，人物类实体在电子书文本中的关联文本信息主要是指：人物类实体在电子书文本中的上下文信息，具体的，该关联文本信息可以为包含人物类实体的语句、段落等内容。

由于该关联文本信息中包含与人物类实体相关的描述内容，如动作词、情感词等内容，因此，基于获取到的关联文本信息能够确定人物类实体的人物属性信息。具体的，可以根据预先设置的属性特征词集合确定人物类实体的人物属性信息，该属性特征词集合用于存储与各类人物属性相对应的特征词。或者，也可以基于预先训练得到的属性识别模型确定人物类实体的人物属性信息，本发明对具体实现细节不作限定。

其中，人物属性信息的内涵可以由本领域技术人员灵活设定，例如，可以包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度。

步骤S130：获取与人物类实体相对应的对话文本信息，根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息。

具体的，可以基于引号、冒号等对话类标点符号提取与人物类实体相对应的对话文本信息，相应的，根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息。由于人物属性信息与人物语调信息之间具有固定的对应关系，因此，基于人物属性信息能够准确识别与对话文本信息相匹配的人物语调信息，进而为后续的语音合成操作提供便利，有利于提升合成语音的音质效果。

由此可见，该方式能够识别出人物类实体，并确定与人物类实体相对应的人物属性信息，进而确定与该人物类实体对应的对话文本信息的人物语调，由于人物属性与人物语调之间具有特定的对应关系，例如，男性与女性的语调各不相同，年轻人与老年人的语调也各不相同，因此，根据人物属性来识别人物语调能够提升语调识别的精确性。

实施例二

图2示出了本发明另一个实施例提供的基于电子书的人物语调识别方法的流程图。如图2所示，该方法包括以下步骤：

步骤S200：根据预先获取到的与人物类实体相对应的样本语义单元，训练属性识别模型。

其中，样本语义单元包括：含有人物类实体的词组、语句、和/或段落等。由此可见，样本语义单元主要是指：用于描述人物类实体的描述信息，具体可以为动作类描述信息、外貌类描述信息、情感类描述信息等多种。

具体的，通过以下方式训练属性识别模型：首先，预先获取与人物类实体相对应的样本语义单元；将样本语义单元中的人物类实体替换为预设标签，提取样本语义单元中包含的与维度属性相对应的属性描述信息，得到与样本语义单元相对应的训练样本；针对训练样本进行属性标注，根据标注后的训练样本训练属性识别模型。其中，考虑到单个人物所对应的描述信息数量有限，实际情况中，电子书中针对同一人物的出场描述通常仅有几句话，从而导致样本数量较少，为了在样本稀疏的情况下提升训练效果，在本实施例中，通过将样本语义单元中的人物类实体替换为预设标签，能够实现不同样本中的人物类实体的统一，进而实现样本的扩充，提升训练准确性。其中，预设标签用于作为人物类实体的代号，由于模型训练过程中，人物类实体的具体名称，如“张三”、“李四”等，并不会对模型的训练结果造成影响，因此，将不同的样本语义单元中的“张三”、“李四”等人物类实体统一为字母或符号形式的预设标签。例如，在一个具体示例中，可通过英文字母M代替所有的人物类实体，从而使不同人物所对应的多个样本语义单元能够一起进行模型训练。

另外，本实施例中的人物属性信息具体包括多个属性维度，例如，包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度。相应的，上述属性识别模型具体包括多个分别对应于不同的属性维度的属性维度识别模型，如包括：性别维度识别模型、年龄维度识别模型、角色类型维度识别模型、以及情感类型维度识别模型。相应的，在针对样本语义单元进行属性标注时，根据待训练的属性维度识别模型所对应的属性维度，针对该样本语义单元进行与该属性维度相对应的标注处理。例如，当属性维度为性别维度时，将各个样本语义单元分别标注为男性性别或女性性别；当属性维度为年龄维度时，将各个样本语义单元分别标注为年轻、年幼或年老；当属性维度为角色维度时，将各个样本语义单元分别标注为主角色、配角、正派或反派等；当属性维度为情感类型维度时，将各个样本语义单元分别标注为急躁、非急躁、平和、激动、喜悦或悲伤等。另外，在提取样本语义单元中包含的与维度属性相对应的属性描述信息时，侧重于从维度属性的特点出发，提取与该维度属性强相关的属性描述信息。

在一种可选的实现方式中，当维度属性为角色类型维度时，与维度属性相对应的属性描述信息包括：与电子书文本中的主角色进行交互时的交互动作信息；其中，电子书文本中的主角色根据出现频次确定。具体的，由于主角色通常在电子书文本中会多次出现，因此，统计各个人物类实体在电子书文本中的出现频次，将出现频次最高的人物类实体的角色维度属性确定为主角色。在确定出主角色的基础上，可以进一步根据出现频次确定出若干个配角，例如，出现频次仅次于主角的人物即为配角。另外，还需要确定出正派角色或反派角色。发明人在实现本发明的过程中发现，无论是正派角色还是反派角色，通常会与主角发生互动，根据人物与主角发生互动时的交互类型即可确定该人物为正派或反派。相应的，根据与电子书文本中的主角色进行交互时的交互动作信息确定人物类实体的角色维度属性。例如，可以将交互动作信息与预设的正派交互动作集合以及反派交互动作集合进行匹配，若与正派交互动作集合匹配成功，则确定该人物类实体为正派；若与反派交互动作集合匹配成功，则确定该人物类实体为反派。其中，正派交互动作集合包括一些用于表示互动良好的动词，如帮助、解救等；反派交互动作集合包括一些用于表示互动不好的动词，如砍、杀、打架等。

步骤S210：针对电子书文本进行分析处理，根据分析结果识别电子书文本中包含的人物类实体。

具体的，针对电子书文本进行分词处理，根据分词结果识别电子书中包含的人物类实体。具体实施时，先识别出电子书文本中包含的命名实体，由于命名实体包含时间、地点、人物等多种类型，相应的，进一步从命名实体中筛选人物类实体。其中，命名实体可通过多种方式进行识别，例如，可通过预先训练的实体识别模型进行识别，本发明对此不作限定。

其中，人物类实体在电子书中通常具有出现频次高、经常与动词等谓语成分同时出现于同一个语句中的特点，因此，根据上述特点，统计各个分词的出现频次、与动词的搭配次数等信息，进而确定属于人物类实体的分词。

在一个具体示例中，可以通过以下方式识别电子书文本中的人物类实体，下述识别方式既可以应用于从已获取的命名实体中提取人物类实体，也可以用于直接从电子书文本中提取人物类实体，本发明对具体细节不作限定。该识别方式具体包括：统计电子书文本中包含的各个词语单元的出现频次、和/或与各个词语单元相对应的动词的数量；将出现频次大于第一频次阈值、和/或动词的数量大于第二数量阈值的词语单元识别为人物类实体。其中，词语单元是指：由多个顺次出现的文字构成的文字组合。由此可见，词语单元由两个或更多个文字构成，并且，所谓顺次出现是指：词语单元内部的各个文字之间具有固定的顺序关系，且在该词语单元内部未掺杂其他无关文字。例如，假设电子书文本中包含“夏天”这一人物类实体，统计“夏天”这一词语单元的出现频次时应注意以下两点：首先，词语单元中的各个文字的顺序不能颠倒，如“天夏”不统计在内；其次，词语单元内部不得出现无关文字，如“夏一天”不统计在内。除根据出现频次确定人物类实体之外，还可以根据与各个词语单元相对应的动词的数量来确定人物类实体：通常，对于任一人名而言，其必然对应于多个不同的动词，如“夏天走过来”中的“走”、“夏天微微一笑”中的“笑”等，通过统计该词语单元与不同动词之间的组合次数，即可确定该词语单元是否为人物类实体。

另外，在统计电子书文本中包含的各个词语单元的出现频次时，为了降低内存，提升处理速度，通过构建词典树的方式进行统计。具体的，根据电子书文本中包含的各个语句，构建与语句中的词语单元相对应的词典树；根据已构建的词典树，统计电子书文本中包含的各个词语单元的出现频次。其中，词典树包括：前缀树和/或后缀树，且词语单元中包含的文字数量不大于预设单元阈值。考虑到人名通常不超过四个字，因此，预设单元阈值可以设置为4，从而仅针对不超过4个字的词语单元进行统计，进而降低待处理的数据量。其中，前缀树是指：根据多个句首相同的句子构建的字典树，适用于人名出现于句首的情况；后缀树是指：根据多个句尾相同的句子构建的字典树，适用于人名出现于句尾的情况。考虑到人名大多出现于句首，因此，可以主要通过前缀树来统计人名出现于句首的频次。

步骤S220：获取人物类实体在电子书文本中的关联文本信息，根据获取到的关联文本信息确定人物类实体的人物属性信息。

其中，人物类实体在电子书文本中的关联文本信息是指：与人物类实体相关联的文本内容，具体根据人物类实体在电子书文本中对应的上下文信息确定。具体实施时，可以通过以下方式获取人物类实体在电子书文本中的关联文本信息：获取电子书文本中与该人物类实体相对应的语义单元；将获取到的语义单元作为人物类实体在电子书文本中的关联文本信息；其中，语义单元包括：词组、语句、和/或段落等。其中，人物属性信息的内涵可以由本领域技术人员灵活设定，例如，可以包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度。

具体的，在根据获取到的关联文本信息确定人物类实体的人物属性信息时，可通过以下两种方式中的至少一种实现：

在第一种方式中，将获取到的关联文本信息与预设的属性特征词集合进行匹配，根据匹配结果确定人物类实体的人物属性信息。由于本实施例中的人物属性信息具体包括多个属性维度，相应的，属性特征词集合包括以下中的至少一个：性别特征词集合、年龄特征词集合、角色特征词集合、以及情感特征词集合。其中，性别特征词集合用于存储与性别特征相关的词汇，具体包括：用于指示性别的称谓词。例如，哥哥、伯父、姑妈等称谓词能够明确指示人物性别。年龄特征词集合用于存储与年龄特征相关的词汇，具体包括：与年龄相关的称谓词。例如，老僧、老衲、长老等以“老”字开头的称谓词用于指示人物为老人，用于指示人物为老人的称谓词还包括：爷爷、奶奶等；另外，小少爷、小公主等称谓词用于指示人物为小孩或年轻人。同理，角色特征词集合用于存储与角色特征相关的词汇，具体包括：少侠、女侠等用于指示人物为正派的称谓词，反贼、老贼等用于指示人物为反派的称谓词。情感特征词集合与上述各个集合类似，用于存储与情感特征相关的词汇，具体包括：悲伤、伤痛、绝望等用于指示负面情感的词汇，以及喜上眉梢、乐不可支等用于指示正面情感的词汇。通过将获取到的关联文本信息与预设的属性特征词集合进行匹配，能够准确确定人物类实体的人物属性信息。若某一人物类实体对应的关联文本信息中包含与上述属性特征词集合中的内容相匹配的词汇，则根据该匹配的词汇确定该人物类实体的人物属性信息。例如，若某一人物类实体对应的关联文本信息中包含与上述属性特征词集合中的“哥哥”相匹配的词汇，则确定该人物类实体的人物属性信息为男性。

在第二种方式中，将获取到的关联文本信息输入预先训练得到的属性识别模型，根据输出结果确定人物类实体的人物属性信息。其中，属性识别模型通过步骤S200中的实现方式实现。具体的，属性识别模型包括多个属性维度对应的模型，分别将关联文本信息输入各个属性维度所对应的模型中，从而得到与各个属性维度相对应的预测结果。

上述的两种方式既可以单独使用，也可以结合使用。当二者结合使用时，考虑到属性特征词集合的实现方式准确性较高，一旦关联文本信息命中了属性特征词集合中的词汇，则能够准确确定人物属性。因此，先通过属性特征词集合的实现方式进行处理，若关联文本信息未命中属性特征词集合中任一的词汇，再通过属性识别模型进行识别。

步骤S230：获取与人物类实体相对应的对话文本信息。

具体的，与人物类实体相对应的对话文本信息是指：由人物类实体作为说话人时所对应的说话内容。例如，张三说道：“你好啊”，其中，人物类实体张三作为说话人，其对应的对话文本信息即为“你好啊”。

在获取与人物类实体相对应的对话文本信息时，可通过以下方式中的至少一种实现：

在一种可选的实现方式中，根据标点符号获取与人物类实体相对应的对话文本信息。其中，标点符号主要是指：冒号、引号等用于表示说话内容的信息。通过冒号、引号等能够准确识别与人物类实体相对应的对话文本信息。例如，若人物类实体的后面紧跟着出现了冒号以及引号，则引号内的内容即为对话文本信息。

在一种可选的实现方式中，根据预设的对话文本获取模型，获取与人物类实体相对应的对话文本信息。其中，对话文本获取模型通过预先提取包含对话文本信息的样本内容进行训练的方式得到。相应的，通过对话文本获取模型能够准确预测与人物类实体相对应的对话文本信息。

步骤S240：根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息。

由于人物属性信息与人物语调信息之间具有固定的对应关系，因此，基于人物属性信息能够准确识别与对话文本信息相匹配的人物语调信息，进而为后续的语音合成操作提供便利，有利于提升合成语音的音质效果。

具体的，在根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息时，生成与人物属性信息相对应的语调特征标签，为对话文本信息设置语调特征标签。其中，语调特征标签用于指示对应内容的语调特征，语调特征具体包括：音色、音量、情感等各种内容，具体的，语调特征标签包括以下中的至少一类：情感类标签、性别类标签、年龄类标签、以及角色类标签。其中，每种类型的标签又可以进一步细分为多个种类，例如，情感类标签进一步细分为：喜、怒、哀、乐、急躁、不急躁等多个种类；性别类标签进一步细分为：男性标签以及女性标签；年龄类标签进一步细分为：年老类标签、年轻类标签、年幼类标签等。角色类标签进一步细分为：正派类标签、反派类标签等。

另外，可选的，在根据人物类实体的人物属性信息，识别与对话文本信息相匹配的人物语调信息之后，进一步根据对话文本信息的语调特征标签，执行文本转语音处理，得到与对话文本信息相对应的语音合成结果。其中，当接收到用户触发的语音播放指令时，根据语音合成结果执行语音播放处理。由此可见，本实施例中的语调特征标签用于提供给TTS(Text To Speech，从文本到语音)软件实现语音合成处理。考虑到机器合成的语音存在着发音死板、与真实说话方式存在差别的缺陷，为了提升合成语音的音质，通过语调特征标签使合成后的语音的语调与特征标签相匹配，从而提升合成语音的真实性，使合成语音的情感更加丰富细腻。

综上可知，该方式能够识别出人物类实体，并确定与人物类实体相对应的人物属性信息，进而确定与该人物类实体对应的对话文本信息的人物语调，由于人物属性与人物语调之间具有特定的对应关系，因此，根据人物属性来识别人物语调能够提升语调识别的精确性。其中，通过将人物属性信息划分为多个属性维度，能够更加准确地描述人物的多元化特征，并且，通过训练多个分别与各个属性维度相对应的属性识别模型的方式能够准确识别人物的属性。除属性识别模型外，还可以借助属性特征词集合进行识别。其中，由于属性特征词集合的识别结果非常准确，因此，可以将属性特征词集合作为第一重识别逻辑，将属性识别模型作为第二重识别逻辑，从而有利于提升最终的结果准确性。

实施例三

本申请实施例提供了一种非易失性计算机存储介质，所述计算机存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于电子书的人物语调识别方法。

可执行指令具体可以用于使得处理器执行以下操作：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

在一种可选的实现方式中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息包括：

生成与所述人物属性信息相对应的语调特征标签，为所述对话文本信息设置所述语调特征标签；

其中，所述语调特征标签包括以下中的至少一类：情感类标签、性别类标签、年龄类标签、以及角色类标签。

在一种可选的实现方式中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息之后，进一步包括：

根据所述对话文本信息的语调特征标签，执行文本转语音处理，得到与所述对话文本信息相对应的语音合成结果；

其中，当接收到用户触发的语音播放指令时，根据所述语音合成结果执行语音播放处理。

在一种可选的实现方式中，所述根据分析结果识别所述电子书文本中包含的人物类实体包括：

统计所述电子书文本中包含的各个词语单元的出现频次、和/或与各个词语单元相对应的动词的数量；

将出现频次大于第一频次阈值、和/或动词的数量大于第二数量阈值的词语单元识别为人物类实体。

在一种可选的实现方式中，所述统计所述电子书文本中包含的各个词语单元的出现频次包括：

根据电子书文本中包含的各个语句，构建与语句中的词语单元相对应的词典树；

根据已构建的词典树，统计所述电子书文本中包含的各个词语单元的出现频次；

其中，所述词典树包括：前缀树和/或后缀树，且所述词语单元中包含的文字数量不大于预设单元阈值。

在一种可选的实现方式中，所述根据获取到的关联文本信息确定所述人物类实体的人物属性信息包括：

将获取到的关联文本信息与预设的属性特征词集合进行匹配，根据匹配结果确定所述人物类实体的人物属性信息；和/或，

将获取到的关联文本信息输入预先训练得到的属性识别模型，根据输出结果确定所述人物类实体的人物属性信息。

在一种可选的实现方式中，所述方法执行之前，进一步包括：

预先获取与人物类实体相对应的样本语义单元；

将所述样本语义单元中的人物类实体替换为预设标签，提取所述样本语义单元中包含的与所述维度属性相对应的属性描述信息，得到与所述样本语义单元相对应的训练样本；

针对所述训练样本进行属性标注，根据标注后的训练样本训练所述属性识别模型。

在一种可选的实现方式中，所述属性识别模型包括多个分别对应于不同的属性维度的属性维度识别模型；

并且，所述不同的属性维度包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度；

则所述属性特征词集合包括以下中的至少一个：性别特征词集合、年龄特征词集合、角色特征词集合、以及情感特征词集合；

其中，所述性别特征词集合包括：用于指示性别的称谓词，所述年龄特征词集合包括：与年龄相关的称谓词。

在一种可选的实现方式中，所述提取所述样本语义单元中包含的与所述维度属性相对应的属性描述信息包括：

当所述维度属性为角色类型维度时，与所述维度属性相对应的属性描述信息包括：与电子书文本中的主角色进行交互时的交互动作信息；其中，所述电子书文本中的主角色根据出现频次确定。

在一种可选的实现方式中，所述获取所述人物类实体在所述电子书文本中的关联文本信息包括：

根据所述人物类实体在所述电子书文本中的上下文信息，获取所述电子书文本中与所述人物类实体相对应的语义单元；将获取到的语义单元作为所述人物类实体在所述电子书文本中的关联文本信息；其中，所述语义单元包括：词组、语句、和/或段落；

并且，所述获取与所述人物类实体相对应的对话文本信息包括：根据标点符号和/或预设的对话文本获取模型，获取与所述人物类实体相对应的对话文本信息。

实施例四

图3示出了根据本发明另一个实施例的一种电子设备的结构示意图，本发明具体实施例并不对电子设备的具体实现做限定。

如图3所示，该电子设备可以包括：处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。

其中：处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304，用于与其它设备比如客户端或其它服务器等的网元通信。处理器302，用于执行程序310，具体可以执行上述基于电子书的人物语调识别方法实施例中的相关步骤。

具体地，程序310可以包括程序代码，该程序代码包括计算机操作指令。

处理器302可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器306，用于存放程序310。存储器306可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序310具体可以用于使得处理器302执行以下操作：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

在一种可选的实现方式中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息包括：

生成与所述人物属性信息相对应的语调特征标签，为所述对话文本信息设置所述语调特征标签；

其中，所述语调特征标签包括以下中的至少一类：情感类标签、性别类标签、年龄类标签、以及角色类标签。

在一种可选的实现方式中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息之后，进一步包括：

根据所述对话文本信息的语调特征标签，执行文本转语音处理，得到与所述对话文本信息相对应的语音合成结果；

其中，当接收到用户触发的语音播放指令时，根据所述语音合成结果执行语音播放处理。

在一种可选的实现方式中，所述根据分析结果识别所述电子书文本中包含的人物类实体包括：

统计所述电子书文本中包含的各个词语单元的出现频次、和/或与各个词语单元相对应的动词的数量；

将出现频次大于第一频次阈值、和/或动词的数量大于第二数量阈值的词语单元识别为人物类实体。

在一种可选的实现方式中，所述统计所述电子书文本中包含的各个词语单元的出现频次包括：

根据电子书文本中包含的各个语句，构建与语句中的词语单元相对应的词典树；

根据已构建的词典树，统计所述电子书文本中包含的各个词语单元的出现频次；

其中，所述词典树包括：前缀树和/或后缀树，且所述词语单元中包含的文字数量不大于预设单元阈值。

在一种可选的实现方式中，所述根据获取到的关联文本信息确定所述人物类实体的人物属性信息包括：

将获取到的关联文本信息与预设的属性特征词集合进行匹配，根据匹配结果确定所述人物类实体的人物属性信息；和/或，

将获取到的关联文本信息输入预先训练得到的属性识别模型，根据输出结果确定所述人物类实体的人物属性信息。

在一种可选的实现方式中，所述方法执行之前，进一步包括：

预先获取与人物类实体相对应的样本语义单元；

针对所述训练样本进行属性标注，根据标注后的训练样本训练所述属性识别模型。

在一种可选的实现方式中，所述属性识别模型包括多个分别对应于不同的属性维度的属性维度识别模型；

并且，所述不同的属性维度包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度；

则所述属性特征词集合包括以下中的至少一个：性别特征词集合、年龄特征词集合、角色特征词集合、以及情感特征词集合；

其中，所述性别特征词集合包括：用于指示性别的称谓词，所述年龄特征词集合包括：与年龄相关的称谓词。

在一种可选的实现方式中，所述提取所述样本语义单元中包含的与所述维度属性相对应的属性描述信息包括：

在一种可选的实现方式中，所述获取所述人物类实体在所述电子书文本中的关联文本信息包括：

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明还公开了A1.一种基于电子书的人物语调识别方法，其中，所述方法包括：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

A2.根据A1所述的方法，其中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息包括：

生成与所述人物属性信息相对应的语调特征标签，为所述对话文本信息设置所述语调特征标签；

其中，所述语调特征标签包括以下中的至少一类：情感类标签、性别类标签、年龄类标签、以及角色类标签。

A3.根据A2所述的方法，其中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息之后，进一步包括：

根据所述对话文本信息的语调特征标签，执行文本转语音处理，得到与所述对话文本信息相对应的语音合成结果；

其中，当接收到用户触发的语音播放指令时，根据所述语音合成结果执行语音播放处理。

A4.根据A1-3任一所述的方法，其中，所述根据分析结果识别所述电子书文本中包含的人物类实体包括：

统计所述电子书文本中包含的各个词语单元的出现频次、和/或与各个词语单元相对应的动词的数量；

将出现频次大于第一频次阈值、和/或动词的数量大于第二数量阈值的词语单元识别为人物类实体。

A5.根据A4所述的方法，其中，所述统计所述电子书文本中包含的各个词语单元的出现频次包括：

根据电子书文本中包含的各个语句，构建与语句中的词语单元相对应的词典树；

根据已构建的词典树，统计所述电子书文本中包含的各个词语单元的出现频次；

其中，所述词典树包括：前缀树和/或后缀树，且所述词语单元中包含的文字数量不大于预设单元阈值。

A6.根据A1-5任一所述的方法，其中，所述根据获取到的关联文本信息确定所述人物类实体的人物属性信息包括：

将获取到的关联文本信息与预设的属性特征词集合进行匹配，根据匹配结果确定所述人物类实体的人物属性信息；和/或，

将获取到的关联文本信息输入预先训练得到的属性识别模型，根据输出结果确定所述人物类实体的人物属性信息。

A7.根据A6所述的方法，其中，所述方法执行之前，进一步包括：

预先获取与人物类实体相对应的样本语义单元；

针对所述训练样本进行属性标注，根据标注后的训练样本训练所述属性识别模型。

A8.根据A7所述的方法，其中，所述属性识别模型包括多个分别对应于不同的属性维度的属性维度识别模型；

并且，所述不同的属性维度包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度；

则所述属性特征词集合包括以下中的至少一个：性别特征词集合、年龄特征词集合、角色特征词集合、以及情感特征词集合；

其中，所述性别特征词集合包括：用于指示性别的称谓词，所述年龄特征词集合包括：与年龄相关的称谓词。

A9.根据A8所述的方法，其中，所述提取所述样本语义单元中包含的与所述维度属性相对应的属性描述信息包括：

A10.根据A1-9任一所述的方法，其中，所述获取所述人物类实体在所述电子书文本中的关联文本信息包括：

B11.一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行以下操作：

针对电子书文本进行分析处理，根据分析结果识别所述电子书文本中包含的人物类实体；

获取所述人物类实体在所述电子书文本中的关联文本信息，根据获取到的关联文本信息确定所述人物类实体的人物属性信息；

获取与所述人物类实体相对应的对话文本信息，根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息。

B12.根据B11所述的电子设备，其中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息包括：

生成与所述人物属性信息相对应的语调特征标签，为所述对话文本信息设置所述语调特征标签；

其中，所述语调特征标签包括以下中的至少一类：情感类标签、性别类标签、年龄类标签、以及角色类标签。

B13.根据B11所述的电子设备，其中，所述根据所述人物类实体的人物属性信息，识别与所述对话文本信息相匹配的人物语调信息之后，进一步包括：

根据所述对话文本信息的语调特征标签，执行文本转语音处理，得到与所述对话文本信息相对应的语音合成结果；

其中，当接收到用户触发的语音播放指令时，根据所述语音合成结果执行语音播放处理。

B14.根据B11-13任一所述的电子设备，其中，所述根据分析结果识别所述电子书文本中包含的人物类实体包括：

统计所述电子书文本中包含的各个词语单元的出现频次、和/或与各个词语单元相对应的动词的数量；

将出现频次大于第一频次阈值、和/或动词的数量大于第二数量阈值的词语单元识别为人物类实体。

B15.根据B14所述的电子设备，其中，所述统计所述电子书文本中包含的各个词语单元的出现频次包括：

根据电子书文本中包含的各个语句，构建与语句中的词语单元相对应的词典树；

根据已构建的词典树，统计所述电子书文本中包含的各个词语单元的出现频次；

其中，所述词典树包括：前缀树和/或后缀树，且所述词语单元中包含的文字数量不大于预设单元阈值。

B16.根据B11-15任一所述的电子设备，其中，所述根据获取到的关联文本信息确定所述人物类实体的人物属性信息包括：

将获取到的关联文本信息与预设的属性特征词集合进行匹配，根据匹配结果确定所述人物类实体的人物属性信息；和/或，

将获取到的关联文本信息输入预先训练得到的属性识别模型，根据输出结果确定所述人物类实体的人物属性信息。

B17.根据B16所述的电子设备，其中，所述方法执行之前，进一步包括：

预先获取与人物类实体相对应的样本语义单元；

针对所述训练样本进行属性标注，根据标注后的训练样本训练所述属性识别模型。

B18.根据B17所述的电子设备，其中，所述属性识别模型包括多个分别对应于不同的属性维度的属性维度识别模型；

并且，所述不同的属性维度包括以下属性维度中的至少一个：性别维度、年龄维度、角色类型维度、以及情感类型维度；

则所述属性特征词集合包括以下中的至少一个：性别特征词集合、年龄特征词集合、角色特征词集合、以及情感特征词集合；

其中，所述性别特征词集合包括：用于指示性别的称谓词，所述年龄特征词集合包括：与年龄相关的称谓词。

B19.根据B18所述的电子设备，其中，所述提取所述样本语义单元中包含的与所述维度属性相对应的属性描述信息包括：

B20.根据B11-19任一所述的电子设备，其中，所述获取所述人物类实体在所述电子书文本中的关联文本信息包括：

C21.一种计算机存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使处理器执行如A1-10任一所述的方法。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于电子书的人物语调识别方法、电子设备及存储介质 [P] . 中国专利： CN112966491A . 2021-06-15
2. 基于电子书的人物展示方法、电子设备及计算机存储介质 [P] . 中国专利： CN108182232B . 2018.10.23
3. METHOD FOR IDENTIFYING EXTERNAL ELECTRONIC DEVICE BASED ON POWER INFORMATION, ELECTRONIC DEVICE SUPPORTING SAME, AND STORAGE MEDIUM [P] . 韩国专利： KR20200026534A . 2020-03-11

机译：基于电力信息，电子设备支持相同和存储介质的外部电子设备识别方法
4. METHOD OF IDENTIFYING EXTERNAL ELECTRONIC DEVICE BASED ON POWER INFORMATION AND ELECTRONIC DEVICE AND STORAGE MEDIUM FOR SUPPORTING SAME [P] . 美国专利： US2020073455A1 . 2020-03-05

机译：基于电力信息和电子设备及存储介质的外部电子设备识别方法
5. METHOD OF IDENTIFYING EXTERNAL ELECTRONIC DEVICE BASED ON POWER INFORMATION AND ELECTRONIC DEVICE AND STORAGE MEDIUM FOR SUPPORTING SAME [P] . 世界知识产权组织专利： WO2020050501A1 . 2020-03-12

机译：基于电力信息和电子设备及存储介质的外部电子设备识别方法