首页> 中国专利> 多音字的注音方法及计算机存储介质

多音字的注音方法及计算机存储介质

摘要

本发明实施例提供一种多音字的注音方法及计算机存储介质。其中,所述方法包括:对待注音的多音字语句的语义特征进行编码,获得多音字语句的第一语义特征信息;基于多音字语句中的多音字的全局位置信息,对第一语义特征信息进行注意力处理,获得多音字语句的包含全局位置信息的第二语义特征信息;基于多音字语句中的多音字的相对位置信息,对第一语义特征信息进行注意力处理,获得多音字语句的包含相对位置信息的第三语义特征信息;基于多音字语句的分词特征信息、第二语义特征信息,以及第三语义特征信息,对多音字语句中的多音字的读音进行标注,获得多音字的读音的标注结果。通过本实施例,能够有效提高多音字的注音效率和注音准确率。

著录项

  • 公开/公告号CN112989821A

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利权人 北京世纪好未来教育科技有限公司;

    申请/专利号CN202110392713.7

  • 发明设计人 汪光璟;贺刚;杨嵩;

    申请日2021-04-13

  • 分类号G06F40/289(20200101);G06F40/30(20200101);G06F16/33(20190101);G06N3/02(20060101);G06N3/08(20060101);

  • 代理机构11545 北京合智同创知识产权代理有限公司;

  • 代理人李杰;舒道宏

  • 地址 100086 北京市海淀区中关村大街32号蓝天和盛大厦1702-03室

  • 入库时间 2023-06-19 11:29:13

说明书

技术领域

本发明实施例涉及人工智能领域,尤其涉及一种多音字的注音方法及计算机存储介质。

背景技术

在教学场景下,语言教学系统常常需要对作为中文普通话教学材料或读物的中文文本中的中文字符进行读音标注,进行注音后的中文文本通常作为教学拼音读物或者作为教学场景语音合成系统的输入。由于常用中文字符存在一定数量的多音字,即同一个汉字在不同语境中具有不同的读音,例如,“很多人都(dōu)喜欢古都(dū)西安”。多音字的正确注音,对于中文普通话教学材料或读物的正确性和有效性,具有非常重要的意义。

现有教学场景下的中文普通话文本注音,大多使用人工标注的方式,并由人工根据上下文对文本中的多音字进行注音,或者使用注音工具进行注音,而注音工具在对多音字进行注音时,无法根据文本内容对多音字的读音做出正确判断,都是给出一个默认读音,然后由人工进行多音字读音校对。

目前,也有一些使用神经网络模型的方法,对多音字进行读音标注,这类任务称为多音字消歧,然而,现有技术仍然存在以下缺点:

(1)每次输入一句话,只能输出一个多音字的注音,如果一句话中存在多个多音字,则需要进行多次重复输入,来完成对所有多音字的注音,因此,会导致注音耗时长,进而导致注音效率低。

(2)对于单字词的多音字的注音效果较差,比如“为”,由于单字词只包含一个字,只能在句子中根据上下文语义进行注音,这对于多音字的注音准确率也非常有限。

由此可见,如何有效提高多音字的注音效率和注音准确率成为当前亟待解决的技术问题。

发明内容

有鉴于此,本发明实施例所解决的技术问题之一在于提供一种多音字的注音方法及计算机存储介质,用以解决上述技术问题至少之一。

本发明实施例提供一种多音字的注音方法。所述方法包括:对待注音的多音字语句的语义特征进行编码,以获得所述多音字语句的第一语义特征信息;基于所述多音字语句中的多音字的全局位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述全局位置信息的第二语义特征信息;基于所述多音字语句中的多音字的相对位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述相对位置信息的第三语义特征信息;基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果。

本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有可读程序,所述可读程序包括:用于对待注音的多音字语句的语义特征进行编码,以获得所述多音字语句的第一语义特征信息的指令;用于基于所述多音字语句中的多音字的全局位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述全局位置信息的第二语义特征信息的指令;用于基于所述多音字语句中的多音字的相对位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述相对位置信息的第三语义特征信息的指令;用于基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果的指令。

根据本发明实施例提供的多音字的注音方案,使用注意力机制,将所述多音字语句中的多音字的全局位置信息和相对位置信息引入所述多音字语句的语义特征信息中,不仅能够利用所述多音字语句中的多音字与所述多音字语句中的每个字符的位置关系,而且还能够使得所述多音字语句中的多音字相互感知,从而能有效提高多音字语句中的多音字的注音效率和注音准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1示出了根据本发明实施例的多音字的注音方法的步骤流程图;

图2示出了根据本发明实施例的多音字注音模型的结构示意图。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

实施例一

参照图1,示出了根据本发明实施例的多音字的注音方法的步骤流程图。

具体地,本发明实施例提供的多音字的注音方法包括以下步骤:

在步骤S101中,对待注音的多音字语句的语义特征进行编码,以获得所述多音字语句的第一语义特征信息。

本实施例中,所述待注音的多音字语句可理解为等待进行读音标注的多音字语句,例如,“在古都西安”,“我们都喜欢古都西安”等。所述语义特征可理解为所述待注音的多音字语句所蕴含的意义的特征。所述多音字语句的第一语义特征信息可为所述多音字语句的语义特征向量,或者所述多音字语句的语义特征向量构成的语义特征矩阵。

在一些可选实施例中,在对待注音的多音字语句的语义特征进行编码时,通过多音字注音模型中的编码器的字符嵌入层,对所述待注音的多音字语句中的中文字符进行编码,以获得所述中文字符的字符嵌入码;通过所述编码器的卷积层,基于所述中文字符的字符嵌入码,对所述中文字符的语义特征进行初步提取,以获得所述中文字符的初步提取的语义特征信息;基于所述中文字符的初步提取的语义特征信息,确定所述多音字语句的第一语义特征信息。籍此,通过所述中文字符的初步提取的语义特征信息,能够准确地确定所述多音字语句的第一语义特征信息。

在一个具体的例子中,所述多音字注音模型可以是任意适当的可实现特征提取或目标对象检测的神经网络模型,包括但不限于卷积神经网络、增强学习神经网络、对抗神经网络中的生成网络等。神经网络中具体结构的设置可以由本领域技术人员根据实际需求适当设定,如卷积层的层数、卷积核的大小、通道数等。所述编码器的作用是将一个不定长的输入序列转换成一个定长的背景向量,所述背景向量包含了输入序列的信息,常用的编码器是循环神经网络。所述字符嵌入层随机初始化,将输入的中文字符编码为固定长度的字符嵌入码,也即是字符向量。所述字符嵌入层的网络参数会在训练过程中更新。所述中文字符的初步提取的语义特征信息可为所述中文字符的初步提取的语义特征向量。

在一个具体的例子中,在基于所述中文字符的初步提取的语义特征信息,确定所述多音字语句的第一语义特征信息时,基于所述中文字符的初步提取的语义特征向量,确定所述多音字语句的语义特征矩阵。

在一些可选实施例中,在基于所述中文字符的初步提取的语义特征信息,确定所述多音字语句的第一语义特征信息时,通过所述编码器的双向长短时记忆网络,基于所述中文字符的初步提取的语义特征信息,对所述中文字符的语义特征进行再次提取,以获得所述中文字符的再次提取的语义特征信息;基于所述中文字符的再次提取的语义特征信息,确定所述多音字语句的第一语义特征信息。籍此,通过所述中文字符的再次提取的语义特征信息,能够更准确地确定所述多音字语句的第一语义特征信息。

在一个具体的例子中,所述双向长短时记忆网络(BidirectionalLong Short-Term Memory,Bi-LSTM)是一种循环神经网络(RNN)的变种,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。所述中文字符的再次提取的语义特征信息可为所述中文字符的再次提取的语义特征向量。

在一个具体的例子中,在通过所述编码器的双向长短时记忆网络,基于所述中文字符的初步提取的语义特征信息,对所述中文字符的语义特征进行再次提取时,通过所述的双向长短时记忆网络中的前向长短时记忆网络,对所述中文字符的初步提取的语义特征信息进行语义特征的前向提取,以获得所述中文字符的前向的语义特征信息;通过所述的双向长短时记忆网络中的后向长短时记忆网络,对所述中文字符的初步提取的语义特征信息进行语义特征的后向提取,以获得所述中文字符的后向的语义特征信息;基于所述中文字符的前向的语义特征信息和所述中文字符的后向的语义特征信息,确定所述中文字符的再次提取的语义特征信息。

在一个具体的例子中,在基于所述中文字符的前向的语义特征信息和所述中文字符的后向的语义特征信息,确定所述中文字符的再次提取的语义特征信息时,对所述中文字符的前向的语义特征向量和所述中文字符的后向的语义特征向量进行拼接,以获得所述中文字符的再次提取的语义特征向量。

在一个具体的例子中,在基于所述中文字符的再次提取的语义特征信息,确定所述多音字语句的第一语义特征信息时,基于所述中文字符的再次提取的语义特征向量,确定所述多音字语句的语义特征矩阵。

在步骤S102中,基于所述多音字语句中的多音字的全局位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述全局位置信息的第二语义特征信息。

在本实施例中,所述全局位置信息可理解为全局位置编码,例如,多音字语句“在古都西安”的编码为“01234”,那么全局位置编码可以表示为“00200”。所述全局位置编码表征多音字语句中每个多音字在整句中的全局位置信息。所述全局位置编码可由多音字语句的检测环节提供。所述注意力处理可以使得神经网络模型具备专注于其输入的某个子集的能力,即可以选择特定的输入。所述第二语义特征信息可为所述多音字语句的包含所述全局位置信息的语义特征向量。

在一些可选实施例中,在基于所述多音字语句中的多音字的全局位置信息,对所述多音字语句的第一语义特征信息进行注意力处理时,通过多音字注音模型中的全局位置注意力层,确定所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述全局位置信息的关联度;通过所述全局位置注意力层,基于所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述全局位置信息的关联度,对所述第一语义特征信息进行加权求和,以获得所述第二语义特征信息。籍此,通过使用注意力机制,将所述多音字语句中的多音字的全局位置信息引入所述多音字语句的语义特征信息中,能够利用所述多音字语句中的多音字与所述多音字语句中的每个字符的位置关系,进而使得多音字注音模型可以一次性标注多音字语句中所有多音字的读音,从而提高多音字语句中的多音字的注音效率。

在一个具体的例子中,多音字全局位置编码可为

其中,

在步骤S103中,基于所述多音字语句中的多音字的相对位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述相对位置信息的第三语义特征信息。

在本实施例中,所述相对位置信息可理解为相对位置编码,例如,多音字语句“我们都喜欢古都西安”的编码为“012345678”,那么相对位置编码可以表示为“001000100”。所述相对位置编码表征多音字语句中多个多音字之间的相对位置信息。所述相对位置编码可由多音字语句的检测环节提供。所述第三语义特征信息可为所述多音字语句的包含所述相对位置信息的语义特征向量。

在一些可选实施例中,在基于所述多音字语句中的多音字的相对位置信息,对所述多音字语句的第一语义特征信息进行注意力处理时,通过多音字注音模型中的相对位置注意力层,确定所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述相对位置信息的关联度;通过所述相对位置注意力层,基于所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述相对位置信息的关联度,对所述第一语义特征信息进行加权求和,以获得所述第三语义特征信息。籍此,通过使用注意力机制,将所述多音字语句中的多音字的相对位置信息引入所述多音字语句的语义特征信息中,能够使得所述多音字语句中的多音字相互感知,从而能有效提高多音字语句中的多音字的注音准确率。

在一个具体的例子中,多音字相对位置编码可为

其中,

在步骤S104中,基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果。

在本实施例中,所述多音字语句的分词特征信息可为所述多音字语句的分词特征矩阵。通过对所述多音字语句进行分词,可以找出多音字所在的词,根据分词特征信息进行注音,这对于包含多音字的多字词效果较好,比如“银行”,其中“行”的读音为“háng”,“人行道”中的“行”读音为“xíng”。此外,使用多音字语句的词级别特征(多音字语句的分词特征信息)和字级别特征(多音字语句的第二语义特征信息和第三语义特征信息),能够提高对于包含多音字的多字词和单字词的注音准确率。

在一些可选实施例中,在基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注之前,所述方法还包括:对所述多音字语句进行分词,以获得所述多音字语句的词序列;基于预先配置的词与词嵌入码之间的映射关系,确定所述词序列中的词所对应的词嵌入码;基于所述词序列中的词所对应的词嵌入码,确定所述多音字语句的分词特征信息。籍此,通过预先配置的词与词嵌入码之间的映射关系,能够准确地确定所述词序列中的词所对应的词嵌入码,进而能够准确地确定所述多音字语句的分词特征信息。

在一个具体的例子中,所述预先配置的词与词嵌入码之间的映射关系可为词与词嵌入码之间的映射表。所述词嵌入码可为分词特征向量。在基于所述词序列中的词所对应的词嵌入码,确定所述多音字语句的分词特征信息时,可基于所述词序列中的每个词所对应的词嵌入码,构成所述多音字语句的分词特征矩阵。

在一些可选实施例中,在基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注时,对所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息进行加权拼接,以获得加权拼接后的特征信息;通过多音字注音模型中的全连接层,对所述加权拼接后的特征信息进行映射处理,以获得所述多音字语句的多音字特征信息;基于所述多音字语句的多音字特征信息,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果。籍此,通过多音字注音模型中的全连接层,对所述加权拼接后的特征信息进行映射处理,能够准确地获得所述多音字语句的多音字特征信息。此外,通过所述多音字语句的多音字特征信息,对所述多音字语句中的多音字的读音进行标注,能够准确地获得所述多音字语句中的多音字的读音的标注结果。

在一个具体的例子中,将多音字语句的分词特征矩阵、包含多音字全局位置信息的语义特征向量,以及包含多音字相对位置信息的语义特征向量进行加权拼接:

其中,

然后,将加权拼接后的特征向量输入全连接层,通过全连接层,对加权拼接后的特征向量进行映射处理,以获得所述多音字语句的多音字特征向量,并基于所述多音字语句的多音字特征向量,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果。

在一些可选实施例中,在基于所述多音字语句的多音字特征信息,对所述多音字语句中的多音字的读音进行标注时,通过所述多音字注音模型中的归一化层,对所述多音字语句的多音字特征信息进行归一化处理,以获得所述多音字语句中的多音字的读音概率;基于所述多音字语句中的多音字的读音概率,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果。籍此,通过所述多音字语句中的多音字的读音概率,对所述多音字语句中的多音字的读音进行标注,能够准确地获得所述多音字语句中的多音字的读音的标注结果。

在一个具体的例子中,所述多音字注音模型中的归一化层输出当前多音字语句中每个多音字的所有可能读音的概率,选取概率值最大的读音为该多音字的读音。

在一个具体的例子中,如图2所示,展示了本实施例提供的多音字注音模型的结构以及基于该结构的多音字注音流程。具体地,多音字的注音流程如下:首先,对多音字语句进行分词,以获得多音字语句的词序列;对多音字语句的词序列中的分词进行查表,以获得所述词序列中的词所对应的词嵌入码;基于所述词序列中的词所对应的词嵌入码,确定所述多音字语句的分词特征矩阵。然后,通过多音字注音模型中的编码器的字符嵌入层,对所述待注音的多音字语句中的中文字符进行编码,以获得所述中文字符的字符嵌入码;通过所述编码器的卷积层,基于所述中文字符的字符嵌入码,对所述中文字符的语义特征进行初步提取,以获得所述中文字符的初步提取的语义特征向量;通过所述编码器的双向长短时记忆网络,基于所述中文字符的初步提取的语义特征向量,对所述中文字符的语义特征进行再次提取,以获得所述中文字符的再次提取的语义特征向量;基于所述中文字符的再次提取的语义特征向量,确定所述多音字语句的第一语义特征向量。接着,基于所述多音字语句中的多音字的全局位置编码,对所述多音字语句的第一语义特征向量进行注意力处理,以获得所述多音字语句的包含所述全局位置信息的第二语义特征向量;基于所述多音字语句中的多音字的相对位置编码,对所述多音字语句的第一语义特征向量进行注意力处理,以获得所述多音字语句的包含所述相对位置信息的第三语义特征向量。最后,对所述多音字语句的分词特征矩阵、所述第二语义特征向量,以及所述第三语义特征向量进行加权拼接,以获得加权拼接后的特征向量;通过多音字注音模型中的全连接层,对所述加权拼接后的特征向量进行映射处理,以获得所述多音字语句的多音字特征向量;通过所述多音字注音模型中的归一化层,对所述多音字语句的多音字特征向量进行归一化处理,以获得所述多音字语句中的多音字的读音概率;基于所述多音字语句中的多音字的读音概率,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果。本实施例提供的多音字注音方法极大提高多音字语句中的多音字的注音准确率和注音效率,减少人工干预,降低人工成本。

根据本发明实施例提供的多音字的注音方案,使用注意力机制,将所述多音字语句中的多音字的全局位置信息和相对位置信息引入所述多音字语句的语义特征信息中,不仅能够利用所述多音字语句中的多音字与所述多音字语句中的每个字符的位置关系,而且还能够使得所述多音字语句中的多音字相互感知,从而能有效提高多音字语句中的多音字的注音效率和注音准确率。

本实施例提供的多音字的注音方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。

实施例二

本发明实施例还提供一种计算机存储介质,所述计算机存储介质存储有可读程序,所述可读程序包括:用于对待注音的多音字语句的语义特征进行编码,以获得所述多音字语句的第一语义特征信息的指令;用于基于所述多音字语句中的多音字的全局位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述全局位置信息的第二语义特征信息的指令;用于基于所述多音字语句中的多音字的相对位置信息,对所述多音字语句的第一语义特征信息进行注意力处理,以获得所述多音字语句的包含所述相对位置信息的第三语义特征信息的指令;用于基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果的指令。

可选地,所述用于对待注音的多音字语句的语义特征进行编码的指令,包括:用于通过多音字注音模型中的编码器的字符嵌入层,对所述待注音的多音字语句中的中文字符进行编码,以获得所述中文字符的字符嵌入码的指令;用于通过所述编码器的卷积层,基于所述中文字符的字符嵌入码,对所述中文字符的语义特征进行初步提取,以获得所述中文字符的初步提取的语义特征信息的指令;用于基于所述中文字符的初步提取的语义特征信息,确定所述多音字语句的第一语义特征信息的指令。

可选地,所述用于基于所述中文字符的初步提取的语义特征信息,确定所述多音字语句的第一语义特征信息的指令,包括:用于通过所述编码器的双向长短时记忆网络,基于所述中文字符的初步提取的语义特征信息,对所述中文字符的语义特征进行再次提取,以获得所述中文字符的再次提取的语义特征信息的指令;用于基于所述中文字符的再次提取的语义特征信息,确定所述多音字语句的第一语义特征信息的指令。

可选地,所述用于基于所述多音字语句中的多音字的全局位置信息,对所述多音字语句的第一语义特征信息进行注意力处理的指令,包括:用于通过多音字注音模型中的全局位置注意力层,确定所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述全局位置信息的关联度的指令;用于通过所述全局位置注意力层,基于所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述全局位置信息的关联度,对所述第一语义特征信息进行加权求和,以获得所述第二语义特征信息的指令。

可选地,所述用于基于所述多音字语句中的多音字的相对位置信息,对所述多音字语句的第一语义特征信息进行注意力处理的指令,包括:用于通过多音字注音模型中的相对位置注意力层,确定所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述相对位置信息的关联度的指令;用于通过所述相对位置注意力层,基于所述第一语义特征信息中的每个中文字符的语义特征信息分别与所述相对位置信息的关联度,对所述第一语义特征信息进行加权求和,以获得所述第三语义特征信息的指令。

可选地,所述可读程序还包括:用于基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注之前,对所述多音字语句进行分词,以获得所述多音字语句的词序列的指令;用于基于预先配置的词与词嵌入码之间的映射关系,确定所述词序列中的词所对应的词嵌入码的指令;用于确定所述词序列中的词所对应的词嵌入码为所述多音字语句的分词特征信息的指令。

可选地,所述用于基于所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息,对所述多音字语句中的多音字的读音进行标注的指令,包括:用于对所述多音字语句的分词特征信息、所述第二语义特征信息,以及所述第三语义特征信息进行加权拼接,以获得加权拼接后的特征信息的指令;用于通过多音字注音模型中的全连接层,对所述加权拼接后的特征信息进行映射处理,以获得所述多音字语句的多音字特征信息的指令;用于基于所述多音字语句的多音字特征信息,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果的指令。

可选地,所述用于基于所述多音字语句的多音字特征信息,对所述多音字语句中的多音字的读音进行标注的指令,包括:用于通过所述多音字注音模型中的归一化层,对所述多音字语句的多音字特征信息进行归一化处理,以获得所述多音字语句中的多音字的读音概率的指令;用于基于所述多音字语句中的多音字的读音概率,对所述多音字语句中的多音字的读音进行标注,以获得所述多音字语句中的多音字的读音的标注结果的指令。

通过本申请实施例提供的计算机存储介质,使用注意力机制,将所述多音字语句中的多音字的全局位置信息和相对位置信息引入所述多音字语句的语义特征信息中,不仅能够利用所述多音字语句中的多音字与所述多音字语句中的每个字符的位置关系,而且还能够使得所述多音字语句中的多音字相互感知,从而能有效提高多音字语句中的多音字的注音效率和注音准确率。

需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。

上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的教师风格预测模型的训练方法。此外,当通用计算机访问用于实现在此示出的教师风格预测模型的训练方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的教师风格预测模型的训练方法的专用计算机。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。

以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号