首页> 中国专利> 文本创作的辅助方法、装置及服务器

文本创作的辅助方法、装置及服务器

摘要

本发明提供了一种文本创作的辅助方法、装置及服务器,涉及深度学习技术领域,包括:从预先训练得到的创作辅助模型集中确定目标创作辅助模型;获取文本属性参数,通过目标创作辅助模型基于文本属性参数生成初稿文本;从预先训练得到的修改辅助模型集中确定目标修改辅助模型;基于初稿文本确定待修改文本和待修改文本对应的修改参数,通过目标修改辅助模型根据待修改文本和修改参数生成已修改文本;根据初稿文本和已修改文本确定目标文本。本发明可以较好地辅助用户进行高效地创作,同时使生成的文本更好地满足用户需求。

著录项

说明书

技术领域

本发明涉及深度学习技术领域,尤其是涉及一种文本创作的辅助方法、装置及服务器。

背景技术

随着深度学习技术的发展,自然语言处理技术的各个研究方向都有比较大的进展,其中,工业应用的人工智能创作是自然语言处理技术一个重要且热门的应用方向,例如智能创作诗歌、歌词、小说、新闻稿等。但是,由于文学作品创作涉及到人类对艺术的审美以及人类的创造性,不仅仅是基于历史数据得到的统计规律上的辞藻组合,更集成了人类对新鲜事物、具体场景的感受,而这些正是人工智能创作尚且欠缺的能力。另外,人工智能创作在创作较长的文本时,经常存在前后文矛盾或无中心思想的问题。综上所述,现有的人工智能创作生成的文本无法满足用户需求。

发明内容

有鉴于此,本发明的目的在于提供一种文本创作的辅助方法、装置及服务器,可以较好地辅助用户进行高效地创作,同时使生成的文本更好地满足用户需求。

第一方面,本发明实施例提供了一种文本创作的辅助方法,所述方法包括:从预先训练得到的创作辅助模型集中确定目标创作辅助模型;获取文本属性参数,通过所述目标创作辅助模型基于所述文本属性参数生成初稿文本;从预先训练得到的修改辅助模型集中确定目标修改辅助模型;基于所述初稿文本确定待修改文本和所述待修改文本对应的修改参数,通过所述目标修改辅助模型根据所述待修改文本和所述修改参数生成已修改文本;根据所述初稿文本和所述已修改文本确定目标文本。

在一种实施方式中,所述创作辅助模型集包括整体推荐模型、叙事推荐模型、实时推荐模型中的一种或多种;所述文本属性参数的类型包括文本特征、情节描述文本、上文单句文本中的一种或多种;不同创作辅助模型对应的文本属性参数的类型不同。

在一种实施方式中,所述整体推荐模型对应的文本属性参数的类型为文本特征,所述文本特征包括内容控制特征和格式控制特征;所述通过所述目标创作辅助模型基于所述文本属性参数生成初稿文本的步骤,包括:如果所述目标创作辅助模型为所述整体推荐模型,将所述文本特征输入至所述整体推荐模型,通过所述整体推荐模型内的编码器基于所述内容控制特征进行编码得到第一编码结果,以及通过所述整体推荐模型内的解码器基于所述格式控制特征对所述第一编码结果进行解码得到初稿文本;其中,所述整体推荐模型采用seq2seq模型;所述内容控制特征至少包括文本风格、文本情绪、文本标签;所述格式控制特征至少包括文本韵脚、段落属性。

在一种实施方式中,所述叙事推荐模型对应的文本属性参数的类型为情节描述文本;所述通过所述目标创作辅助模型基于所述文本属性参数生成初稿文本的步骤,包括:如果所述目标创作辅助模型为所述叙事推荐模型,将所述情节描述文本输入至所述叙事推荐模型,通过所述叙事推荐模型内的编码器对所述情节描述文本进行编码得到第二编码结果,以及通过所述叙事推荐模型内的解码器对所述第二编码结果进行解码得到初稿文本;其中,所述叙事推荐模型采用seq2seq模型。

在一种实施方式中,所述实时推荐模型对应的文本属性参数的类型为上文单句文本;所述通过所述目标创作辅助模型基于所述文本属性参数生成初稿文本的步骤,包括:如果所述目标创作辅助模型为所述实时推荐模型,将所述上文单句文本输入至所述实时推荐模型,通过所述实时推荐模型基于所述上文单句文本生成一个或多个下文单句文本,将所述上文单句文本与各个所述下文单句文本的组合作为初稿文本;其中,所述实时推荐模型采用自回归语言模型。

在一种实施方式中,所述修改辅助模型集包括段落推荐模型、单句文本推荐模型、词汇推荐模型中的一种或多种。

在一种实施方式中,如果所述目标修改辅助模型为所述段落推荐模型,所述待修改文本包括段落上下文本;所述通过所述目标修改辅助模型根据所述待修改文本和所述修改参数生成已修改文本的步骤,包括:将所述段落上下文本和所述修改参数输入至所述段落推荐模型,通过所述段落推荐模型按照所述修改参数对所述段落上下文本进行修改,得到一个或多个已修改文本;所述修改参数包括第一关键词、段落行数、段落字数、段落韵脚、段落声调;其中,所述段落推荐模型采用seq2seq模型。

在一种实施方式中,如果所述目标修改辅助模型为所述单句文本推荐模型,所述待修改文本包括待修改单句文本;所述通过所述目标修改辅助模型根据所述待修改文本和所述修改参数生成已修改文本的步骤,包括:将所述待修改单句文本、所述修改参数、所述待修改单句文本对应的第一上文单句文本和第一下文单句文本输入至所述单句文本推荐模型,通过所述单句文本推荐模型根据所述第一上文单句文本、所述第一下文单句文本和所述修改参数对所述待修改单句文本进行修改,得到一个或多个已修改文本;所述修改参数包括第二关键词、单句字数、单句韵脚、单句声调;其中,所述单句文本推荐模型采用seq2seq模型。

在一种实施方式中,如果所述修改辅助模型为所述词汇推荐模型,所述待修改文本包括待修改词汇;所述通过所述目标修改辅助模型根据所述待修改文本和所述修改参数生成已修改文本的步骤,包括:将所述待修改词汇、所述修改参数、所述待修改词汇所在单句文本对应的第二上文单句文本和第二下文单句文本输入至所述词汇推荐模型,通过所述词汇推荐模型根据所述待修改词汇、所述修改参数、所述第二上文单句文本和所述第二下文单句文本,输出一个或多个已修改文本;所述修改参数包括词汇韵脚、词汇声调;其中,所述已修改文本包括第一类词汇、第二类词汇和第三类词汇中的一种或多种,所述第一类词汇为满足所述修改参数的替换词汇,所述第二类词汇为满足所述修改参数的意向词汇、所述第三类词汇为所述待修改词汇对应的近义词汇和/或反义词汇。

在一种实施方式中,所述方法还包括:获取所述用户上传的选定词和押韵限定规则;通过预先配置的押韵辅助功能根据所述选定词和所述押韵限定规则输出多个押韵词汇;基于各个所述押韵词汇的押韵次数计算各个所述押韵词汇的热度值,并按照各个所述押韵词汇的热度值对各个所述押韵词汇进行排序;根据排序结果从各个所述押韵词汇中确定所述选定词对应的目标押韵词汇。

在一种实施方式中,所述方法还包括:获取所述用户上传的待检索文本;其中,所述待检索文本包括待检索词汇或待检索单句文本;如果所述待检索文本包括所述待检索词汇,通过预先配置的灵感检索辅助功能检索出多个第一可选单句文本;其中,所述第一可选单句文本包含所述待检索词汇;如果所述待检索文本包括所述待检索单句文本,通过所述灵感检索辅助功能检索出多个第二可选单句文本;其中,所述第二可选单句文本与所述待检索单句文本之间的相似度高于预设相似阈值。

在一种实施方式中,所述目标文本至少包括歌词文本。

第二方面,本发明实施例还提供一种文本创作的辅助装置,所述装置包括:第一模型确定模块,用于从预先训练得到的创作辅助模型集中确定目标创作辅助模型;初稿生成模块,用于获取文本属性参数,通过所述目标创作辅助模型基于所述文本属性参数生成初稿文本;第二模型确定模块,用于从预先训练得到的修改辅助模型集中确定目标修改辅助模型;初稿修改模块,用于基于所述初稿文本确定待修改文本和所述待修改文本对应的修改参数,通过所述目标修改辅助模型根据所述待修改文本和所述修改参数生成已修改文本;文本确定模块,用于根据所述初稿文本和所述已修改文本确定目标文本。

第三方面,本发明实施例还提供一种服务器,包括处理器和存储器;所述存储器上存储有计算机程序,所述计算机程序在被所述处理器运行时执行如第一方面提供的任一项所述的方法。

第四方面,本发明实施例还提供一种计算机存储介质,用于储存为第一方面提供的任一项所述方法所用的计算机软件指令。

本发明实施例提供的一种文本创作的辅助方法、装置及服务器,从预先训练得到的创作辅助模型集中确定目标创作辅助模型,以及从预先训练得到的修改辅助模型集中确定目标修改辅助模型,如果获取到文本属性参数,将通过目标创作辅助模型基于文本属性参数生成初稿文本,再基于初稿文本确定待修改文本和待修改文本对应的修改参数,从而通过目标修改辅助模型根据待修改文本和修改参数生成已修改文本,并根据初稿文本和已修改文本确定目标文本。上述方法利用创作辅助模型集和修改辅助模型集,实现用户与AI(Artificial Intelligence,人工智能)的协同创作,本发明实施例通过目标创作辅助模型基于文本属性参数生成相应的初稿文本,再通过目标修改辅助模型基于修改参数对初稿文本中的待修改文本进行修改,从而得到用户所需的目标文本,本发明实施例充分地发挥了AI的辅助功能,较好地结合用户和AI各自的创作优势,不仅可以高效地辅助用户进行文本创作,还可以使得到的目标文本更为优质,较好地满足用户需求。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种文本创作的辅助方法的流程示意图;

图2为本发明实施例提供的一种智能歌词辅助创作系统的框架图;

图3为本发明实施例提供的一种创作阶段的辅助功能图;

图4为本发明实施例提供的一种修改阶段的辅助功能图;

图5为本发明实施例提供的一种辅助工具的示意图;

图6为本发明实施例提供的一种文本创作的辅助装置的结构示意图;

图7为本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前,自然语言处理技术的各个研究方向都有比较大的进展,例如神经机器翻译、自然语言理解、文本分类、文本生成等。另外,近年来雨荨拉你语言模型在自然语言处理中的应用越来越广泛,因为其神经网络参数较多,并且在大规模的文本上进行预训练,旨在学习自然语言中最基本的统计特征,所以具有较高的语言流畅性和长文本的相关性。在使用预训练语言模型作为下游任务模型的初始化参数,并进行微调,既能保留预训练中学到了文本特征,又可以针对下游任务进行学习,因此能够获得较好的结果。

在实际应用中,歌词创作是人工智能创作研究的重点方向。现有技术中歌词创作主要包括人类创作歌词和AI创作歌词两种方式,现分别对人类创作歌词和AI创作歌词的特点进行陈述:(1)人类创作歌词:首先确定中心思想,然后围绕中心思想撰写主歌副歌等,其中副歌是一首歌的精华部分,通常直接表达了创作者的情绪或思想。在实际中,创作者写完歌词草稿后会不断修改歌词,从而达到更好的用词、押韵、对账、或者与旋律的匹配等。并且在整个歌词创作过程中,创作者可能会参考其他的资料已辅助自己创作,诸如通过查阅字典找到押韵词、通过查阅优质的作品来帮助语言表达或触发灵感等,由此可见歌词创作过程较为耗时耗力,尤其对于经验不足的创作者来说,歌词创作更是一件具有挑战性的事。(2)AI创作歌词:AI创作歌词的主要原理是将大量的歌词预料输入到深度学习模型(诸如自回归语言模型)中,深度学习模型通过优化参数学习自然语言的统计特征,按字符迭代生成整个歌词文本,也即AI创作歌词主要是基于统计规律,在学习大量歌词文本后,深度学习模型可以获知字符间的出现规律,能够基于上下文给出当前位置各个字符的概率,从而生成出较为流畅的文本。

结合上述人类创作歌词和AI创作歌词的特点,可以总结出上述人类创作歌词和AI创作歌词的缺点,具体的:(1)人类创作歌词:虽然较为擅长逻辑性和创作性,但是受创作者的记忆水平限制。而且人类创作歌词通常在阅读大量作品之后,此时创作者才更可能积累经验和产生新的灵感,产出更好的文学作品,然而这种累计经验不仅需要较长时间,而且增加了初学创作者产出优质歌词的难度。另外,在创作过程中,还需要查阅资料或依靠经验使歌词能够更为连贯,使句与句之间更为押韵。然而,记忆大量作品和歌词押韵对于AI来说是非常简单的。(2)AI创作歌词:AI创作歌词虽然拥有很好的语言统计知识和超强的记忆力,能够写出比较优美流畅的语句,但是AI缺乏语言的创作性,很难基于现有预料学习的知识产生新的富有创造性的表达方式,而文学作品的艺术性在于创造性。另外AI创作歌词的过程中,通常没有明确的中心点,可能导致生成的文本存在上下文矛盾的问题,而且AI很难识别这种逻辑不一致的情况,然而这对人类来说是很容易做到的。

基于此,本发明实施提供了一种文本创作的辅助方法、装置及服务器,可以较好地辅助用户进行高效地创作,同时使生成的文本更好地满足用户需求。

为便于对本实施例进行理解,首先对本发明实施例所公开的一种文本创作的辅助方法进行详细介绍,参见图1所示的一种文本创作的辅助方法的流程示意图,该方法主要包括以下步骤S102至步骤S110:

步骤S102,从预先训练得到的创作辅助模型集中确定目标创作辅助模型。在一种实施方式中,可以通过预设页面展示创作辅助模型集中的各个创作辅助模型的标识,其中,创作辅助模型集可以包括整体推荐模型、叙事推荐模型、实时推荐模型等多种创作辅助模型,用户可以从展示的各个标识中选择所需的创作辅助模型作为目标创作辅助模型,例如,将用户触控操作或点选操作对应的创作辅助模型作为目标创造辅助模型。

步骤S104,获取文本属性参数,通过目标创作辅助模型基于文本属性参数生成初稿文本。在一种实施方式中,不同创作辅助模型对应的文本属性参数的类型不同,可以获取用户针对目标创作辅助模型上传的文本属性参数。例如,整体推荐模型对应的文本属性参数的类型为文本特征,该文本特征可以用于描述文本情绪、文本风格等特征,从而通过整体推荐模型生成符合上述文本特征的初稿文本;叙事推荐模型对应的文本属性参数的类型为情节描述文本,该情节描述文本可以用于描述故事情节,从而通过叙事推荐模型按照该故事情节生成相应的初稿文本;实时推荐模型对应的文本属性参数的类型为上文单句文本,从而通过实时推荐模型生成与该上文单句文本连接流畅的下文单句文本。可选的,可以通过预设页面提示用户上传与目标创作辅助模型对应的文本属性参数,从而获取到所需的文本属性参数,进而生成相应的初稿文本。

步骤S106,从预先训练得到的修改辅助模型集中确定目标修改辅助模型。在一种实施方式中,可以通过预设页面展示修改辅助模型集中的各个修改辅助模型的标识,其中,修改辅助模型集可以包括段落推荐模型、单句文本推荐模型、词汇推荐模型等多种修改辅助模型,以便于用户从预设页面中选择所需的创作辅助模型作为目标创造辅助模型。

步骤S108,基于初稿文本确定待修改文本和待修改文本对应的修改参数,通过目标修改辅助模型根据待修改文本和修改参数生成已修改文本。在一种可选的实施方式中,可以展示初稿文本,以便于用户从初稿文本中选择需要进行修改润色的文本,该文本即为上述待修改文本,其中,待修改文本可以包括段落上下文、待修改单句文本或待修改词汇等,针对不同的待修改文本,用户需要上传不同的修改参数,并将待修改文本和修改参数输入至目标修改辅助模型,从而利用目标修改辅助模型输出相应的已修改文本。

步骤S110,根据初稿文本和已修改文本确定目标文本。其中,目标文本至少包括歌词文本,还可以包括文言文文本、诗歌文本、作文文本等。在一种实施方式中,将初稿文本中待修改文本替换为已修改文本,即可得到所需的目标文本。

考虑到人工智能创作技术比较擅长的是统计分析,可理解为其“记忆力”很强,但是缺乏对事物的理解,而人类的逻辑性和理解能力较强,却缺乏记忆大量文本的能力,基于此,本发明实施例提供的文本创作的辅助方法,利用创作辅助模型集和修改辅助模型集,实现用户与AI(Artificial Intelligence,人工智能)的协同创作,本发明实施例通过目标创作辅助模型基于文本属性参数生成相应的初稿文本,再通过目标修改辅助模型基于修改参数对初稿文本中的待修改文本进行修改,从而得到用户所需的目标文本,本发明实施例充分地发挥了AI的辅助功能,较好地结合用户和AI各自的创作优势,不仅可以高效地辅助用户进行文本创作,还可以使得到的目标文本更为优质,较好地满足用户需求。

为歌词创作为例,在现有技术中,歌词创作通常需要对歌词草稿不断的进行迭代修改,直到满意为止。为此,本发明实施例将歌词创作分为创作和修改两个阶段,并利用人工智能创作来辅助创作者并提升这两个阶段创作的效率。在一种实施方式中,上述文本创作的辅助方法可以应用于智能歌词辅助创作系统,参见图2所示的一种智能歌词辅助创作系统的框架图,该智能歌词辅助创作系统配置有创作阶段的创作辅助模型集和修改阶段的修改辅助模型集,创作阶段包括实现整体推荐、叙事推荐、实时推荐等辅助功能的创作辅助模型,创作辅助模型集内的创作辅助模型可用于在创作阶段辅助用户生成初稿文本,修改阶段包括实现段落推荐、单句文本推荐、词汇推荐等辅助功能的修改辅助模型,修改辅助模型集内的修改辅助模型可用于在修改阶段辅助用户对初稿文本内的段落、语句、词汇进行修改,从而得到满足用户需求的目标文本。另外,图2还示意出了智能歌词辅助创作系统还配置有押韵辅助工具和灵感检索辅助功能,以为用户提供所需的押韵词汇或激发用户灵感。在具体实现时,创作阶段主要产出初版歌词(也即,上述初稿文本),初版歌词具体了歌词整体需要表达的思想及组织结构,修改阶段主要是对初版歌词进行段落、语句、词汇的修改润色,另外在创作阶段和修改阶段用户需要押韵辅助工具、灵感检索辅助功能等工具帮助检索相关信息以便高效的创作。

对于创作阶段,本发明实施例提供的创作辅助模型集包括整体推荐模型、叙事推荐模型、实时推荐模型中的一种或多种,文本属性参数的类型包括文本特征、情节描述文本、上文单句文本中的一种或多种,其中,不同创作辅助模型对应的文本属性参数的类型不同。例如,整体推荐模型对应的文本属性参数的类型为文本特征,叙事推荐模型对应的文本属性参数的类型为情节描述文本,实时推荐模型对应的文本属性参数的类型为上文单句文本。

为便于理解,参见图3所示的一种创作阶段的辅助功能图,基于此,本发明实施例提供了一些通过目标创作辅助模型基于文本属性参数生成初稿文本的实施方式,参见如下方式(一)至方式(三):

方式(一),整体推荐:整体推荐是针对没有写词基础并且也没有具体想表达的思想的用户,此时用户只需要配置想要生成的歌词的文本特征,该系统则会利用整体推荐模型为用户生成一首符合文本特征的初稿文本,其中,文本特征包括内容控制特征和格式控制特征,内容控制特征至少包括文本风格、文本情绪、文本标签,格式控制特征至少包括文本韵脚、段落属性,上述文本标签可以理解为关键词(例如,爱情),段落属性可以包括主副歌属性、该段落的行数或字数、该段落的韵脚或声调等。在具体实现时,如果目标创作辅助模型为整体推荐模型,将文本特征输入至整体推荐模型,通过整体推荐模型内的编码器基于内容控制特征进行编码得到第一编码结果,以及通过整体推荐模型内的解码器基于格式控制特征对第一编码结果进行解码得到初稿文本。请继续参见图3,整体推荐模型的输入为文本特征,文本特征包括歌词的风格(也即,上述文本风格)、表达的情绪状态(也即,上述文本情绪)、希望歌词里出现的标签(也即,上述文本标签)等内容控制特征,还包括整首歌词的韵脚(也即,上述文本韵脚)和每段歌词的属性(也即,上述段落属性)等格式控制特征,整体推荐模型的输出为符合上述文本特征的整首歌词(也即,上述初稿文本)。

在一种可选的实施方式中,整体推荐模型采用seq2seq模型,seq2seq模型由编码器和解码器组成,该编码器和解码器的实现形式可以为Transformer神经网络结构。其中,编码器将输入编码为中间表示向量,解码器用于结合编码器的输出和已经解码出的部分序列,解码出下一个输出字符。在具体实现时,文本特征中的文本风格、文本情绪、文本标签等内容控制特征,以“风格情绪标签”的数据样式输入至seq2seq模型的编码器,并在seq2seq模型的编码器中进行编码,文本韵脚、段落属性等格式控制特征将在seq2seq模型的解码器中进行解码,具体的,可以按照文本韵脚和段落属性(诸如,段落分隔符)等限制逐字生成初稿文本。

另外,为了提升整体推荐模型的语言流畅性和前后歌词语句的相关性,本发明实施例并未直接训练seq2seq模型,而是用预训练的语言模型参数初始化编解码器(encoder和decoder)。可选的,预训练语言模型是使用大量的无监督文本语料进行训练的GPT(Generative Pre-Training)模型,该GPT模型是自回归语言模型,即利用已经出现的词预测未来的词,并对预测词的概率计算MLP(Multi-Layer Perceptron,多层感知)损失优化模型参数。因为GPT模型的参数较多,且预训练文本很大,所以本发明实施例采用这种方式对seq2seq模型进行训练,可以使训练得到的整体推荐模型更能抓住长文本歌词之间的相关性,并且提升生成的语言流畅性。

方式(二),叙事推荐:叙事推荐是针对存在想表达的故事或思想,但是缺乏歌词创作功底的用户,此时用户只需要输入一段希望歌词描述的情节描述文本(也可称之为,故事文本),叙事推荐模型会针对该情节描述文本为用户生成一首歌词,从而得到嵌入有该故事文本的歌词。在具体实现时,如果目标创作辅助模型为叙事推荐模型,将情节描述文本输入至叙事推荐模型,通过叙事推荐模型内的编码器对情节描述文本进行编码得到第二编码结果,以及通过叙事推荐模型内的解码器对第二编码结果进行解码得到初稿文本。请继续参见图3,叙事推荐模型的输入为故事文本,输出为根据故事文本扩展生成的整首歌词。

在一种可选的实施方式中,叙事推荐模型采用seq2seq模型。具体的,seq2seq模型的编码器将故事文本编码得到第二编码结果,并将第二编码结果输入到seq2seq模型的解码器中,该解码器将逐字符对第二编码结果进行解码,从而得到整首歌词。在实际应用中,叙事推荐模型的训练过程可参照前述整体推荐模型的训练过程,本发明实施例在此不再赘述。

方式(三),实时推荐:实时推荐针对有一定创作基础的用户,可以在用户逐行撰写歌词时,为用户推荐下一行歌词。本发明实施例通过实时推荐模型根据用户撰写的上文单句文本,生成后续的一个或多个下文单句文本。如果用户满意实时推荐模型推荐的下文单句文本,则用户可直接采用该下文单句文本,若用户不满意实时推荐模型推荐的下文单句文本,还可以从下文单句文本中获取启发,从而实现歌词续写。在具体实现时,如果目标创作辅助模型为实时推荐模型,将上文单句文本输入至实时推荐模型,通过实时推荐模型基于上文单句文本生成一个或多个下文单句文本,将上文单句文本与各个下文单句文本的组合作为初稿文本。请继续参见图3,实时推荐模型的输入为上文单句文本,输出为下文单句文本。

在一种可选的实施方式中,实时推荐模型采用自回归语言模型。在实际应用中,可以基于预训练的自回归语言模型在歌词预料上的微调,并且将上文单句文本作为微调好的自回归语言模型的前缀,然后再逐字符地生成后续的下文单句文本。在一种实施方式中,可以通过采样的方式向用户返回多个下文单句文本,供用户选择。

在创作阶段,用户创作歌词通常存在以下三种创作困境:(1)用户对写歌词无从下笔,也没有具体要写的内容;(2)用户希望描述某一故事,但将该故事撰写成歌词较为困难;(3)用户有一定的创作基础,但是在创作歌词的过程中会遇到卡顿思索的情况。针对上述创作困境,本发明实施例提供了上述三种辅助功能,具体为上述整体推荐、叙事推荐、实时推荐。其中整体推荐根据用户输入的文本特征为用户生成整首歌词,叙事推荐根据用户输入的故事文本为用户扩展生成一首歌词;实时推荐根据用户撰写的上文单句文本实时推荐下文单句文本。本发明实施例可以在创作阶段较好地辅助用户解决多种创作的困境,使歌词创作的创作者不仅包括专业创作人,还可以包括普通用户,本发明实施例可以使具有创作意愿的用户生成多样化的歌词。

对于修改阶段,本发明实施例提供过的修改辅助模型集包括段落推荐模型、单句文本推荐模型、词汇推荐模型中的一种或多种。

为便于理解,参见图4所示的一种修改阶段的辅助功能图,基于此,本发明实施例提供了一些通过目标修改辅助模型根据待修改文本和修改参数生成已修改文本的实施方式,参见如下方式(a)至方式(c):

方式(a),段落推荐:段落推荐的应用场景为用户对某段歌词的内容或格式不满意,可以根据段落上下文和用户设置的修改参数,利用段落推荐模型推荐新的候选段落集合(也即,上述已修改文本),用户可以从其中选择所需的段落进行替换。具体的,如果目标修改辅助模型为段落推荐模型,则待修改文本包括段落上下文本,此时可以将段落上下文本和修改参数输入至段落推荐模型,通过段落推荐模型按照修改参数对段落上下文本进行修改,得到一个或多个已修改文本。其中,修改参数包括第一关键词、段落行数、段落字数、段落韵脚、段落声调。请继续参见图4,段落推荐模型的输入为上下文歌词,以及第一关键词、段落行数、段落字数、段落韵脚、段落声调等修改参数,段落推荐模型的输出为新的候选段落集合。

在一种可选的实施方式中,段落推荐模型采用seq2seq模型。在实际应用中,段落推荐模型的输入数据的数据样例为:“上下文关键词”,其中,“”为分隔符,输入数据输入至seq2seq模型的编码器进行编码,并在解码器实现“行数、字数、韵脚、声调”格式约束,采样生成新的候选段落集合供用户选择,上述约束作用于限制解码器生成对应字符的概率,例如,可以根据行数和字数,在对应的位置上生成句内分隔符和段落结尾符,根据韵脚和声调限制生成每个单句文本的最后一个字符。例如,例如用户上传的段落韵脚为“言前辙”,尾字声调为“四声”,并包含“爱情”关键词的段落。段落推荐模型的输出示例为:“若没有你的那一点浪漫;也许我注定不能回头看;因为爱情早就已经变得冷淡;为何总要留下一些遗憾”。

方式(b),单句文本推荐:单句文本推荐的应用场景为用户对某句歌词不满意,此时可以根据该待修改单句文本的上下文和用户设置的修改参数,为用户推荐新的单句文本集合,用户可以选择所需的单句文本进行替换。具体的,如果目标修改辅助模型为单句文本推荐模型,待修改文本包括待修改单句文本,此时可以将待修改单句文本、修改参数、待修改单句文本对应的第一上文单句文本和第一下文单句文本输入至单句文本推荐模型,通过单句文本推荐模型根据第一上文单句文本、第一下文单句文本和修改参数对待修改单句文本进行修改,得到一个或多个已修改文本。其中,第一上文单句文本和第二下文单句文本可统称为上下文歌词,修改参数包括第二关键词、单句字数、单句韵脚、单句声调。请继续参见图4,单句文本推荐模型的输入为上下文歌词、第二关键词、单句字数、单句韵脚、单句声调等修改参数,语句推荐模型的输出为新的单句文本集合。例如单句韵脚“一七辙”,尾字声调“三声”,第二关键词“校园”,单句文本推荐模型的输出示例为:“每当我独自坐在校园座椅”。

在一种可选的实施方式中,单句文本推荐模型采用seq2seq模型。可选的,单句文本推荐模型的训练过程可参见段落推荐模型的训练过程,两者区别在于输入输出的不同,具体训练过程本发明实施例不再赘述。

方式(c),词汇推荐:词汇推荐的应用场景为用户对某一词汇或短语不满意,可以推荐额外可填入的词汇,或推荐可填入的意象词,或推荐近义词/反义词等相关词。具体的,如果修改辅助模型为词汇推荐模型,待修改文本包括待修改词汇,此时可以将待修改词汇、修改参数、待修改词汇所在单句文本对应的第二上文单句文本和第二下文单句文本输入至词汇推荐模型,通过词汇推荐模型根据待修改词汇、修改参数、第二上文单句文本和第二下文单句文本,输出一个或多个已修改文本。其中,所在单句文本、第二上文单句文本和第二下文单句文本可统称为上下文歌词,修改参数包括词汇韵脚、词汇声调,上述已修改文本包括第一类词汇、第二类词汇和第三类词汇中的一种或多种,第一类词汇为满足修改参数的替换词汇,第二类词汇为满足修改参数的意向词汇、第三类词汇为待修改词汇对应的近义词汇和/或反义词汇。请继续参见图4,词汇推荐模型的输入为上下文歌词,以及词汇韵脚、词汇声调等修改参数,词汇推荐模型的输出为新的候选词汇集合,用户可从中选择所需的词汇进行替换。

在修改阶段,用户修改歌词通常存在以下三种修改需求:(1)用户对某段歌词不满意;(2)用户对某句歌词不满意;(3)用户对某词汇不满意。针对上述修改需求,本发明实施例提供了上述三种辅助功能,具体为上述段落推荐、单句文本推荐、词汇推荐等,其中段落推荐、单句文本推荐、词汇推荐可以根据韵脚、声调、关键词等修改参数,分别为用户推荐候选段落集合、候选单句文本集合、候选词汇集合,供用户选择填入初始文本中。本发明实施例提供的修改阶段的辅助功能可以帮助用户润色推敲初稿文本,帮助用户在修改初稿文本时提供建议和灵感。

另外,在文本创作的整个过程中,用户还可能遇到如下问题:(1)如何满足押韵需求;(2)如何获知某段文本在历史文本语料中的具体应用。为此,本发明实施例提供的智能歌词辅助创作系统还配置有押韵辅助工具(也可称之为押韵辅助功能)和灵感检索辅助功能(也可称之为灵感检索辅助功能)。参见图5所示的一种辅助工具的示意图。其中,押韵辅助工具输入为选定词、韵脚和声调等押韵限定规则,输出为押韵词汇集合;灵感检索辅助功能的输入为待检索词汇或待检索单句文本等待检索文本,输出为第一可选单句文本集合或第二可选单句文本集合,第一可选单句文本集合内的可选单句文本包含待检索词汇,第二可选单句文本集合内的可选单句文本与待检索单句文本之间的相似度高于预设相似阈值。

为使歌词更为顺口流畅,歌词创作过程中通常会考虑句子之间的押韵,但是用户考虑单押、双押可能需要查阅相关资料而导致花费额外的时间。为此,本发明实施例可以通过押韵辅助工具为用户提供押韵词汇集合,以便于用户从中选择所需的目标押韵词汇。在一种实施方式中,首先获取用户上传的选定词和押韵限定规则,然后通过预先配置的押韵辅助功能根据选定词和押韵限定规则输出多个押韵词汇,再基于各个押韵词汇的押韵次数计算各个押韵词汇的热度值,并按照各个押韵词汇的热度值对各个押韵词汇进行排序,从而根据排序结果从各个押韵词汇中确定选定词对应的目标押韵词汇。此时用户只需要输入想要押韵的选定词,押韵辅助工具即可为用户检索出符合押韵限定规则(诸如,与该选定词韵脚相同)的押韵词汇集合,从而节省很多创作时间。例如检索到双押词“爱情”,则会统计所有歌词语料里的以“爱情”为结尾押韵的次数,该押韵次数即代表其热度值,此时可以按照热度值由高到低的顺序对押韵词汇进行排序,供用户选择。

为辅助用户快速检索指定文本在现有语料里使用的方法或类似的文本,例如用户指定一个待检索词汇,期待获取该待检索词汇在历史的歌词语料里使用的上下文;或用户指定一个待检索单句文本,期待获取与该待检索单句文本类似的单句文本,从而获取创作灵感。在一种实施方式中,首先获取用户上传的待检索文本。如果待检索文本包括待检索词汇,通过预先配置的灵感检索辅助功能检索出多个第一可选单句文本,以便于用户了解该待检索词汇在之前的创作者是如何使用该待检索词汇;如果待检索文本包括待检索单句文本,通过灵感检索辅助功能检索出多个第二可选单句文本,以激发用户的创作灵感。

通过上述押韵辅助功能和灵感检索辅助功能,可以有效降低歌词创作的难度,还可以提升歌词创作的效率,用户可以把更多的时间精力放在思考歌词创造性的表达上。

综上所述,本发明实施例至少具有以下特点:

(1)在人类创作歌词的过程中,充分发挥AI的辅助功能,实现AI和人类较好地协同创作。另外,还能够较好地结合人类和AI各自的创作优势,更容易创作优秀的作品,并且提高歌词创作的效率,让普通用户也可以创作出优质作品。

(2)创作阶段的辅助功能可以帮助用户解决多种创作的困境,而且有效降低了歌词创作的门槛,还可以生成多样化的歌词。

(3)修改阶段的辅助功能可以帮助用户润色推敲作品,为用户修改提供建议和灵感。

(4)灵感检索辅助功能可以为用户检索现有的优质相关语料,以弥补用户记忆受限问题,帮助并启发用户进行修改。押韵辅助功能可以在用户考虑押韵用词的时候,不再局限于自己的知识库,或翻阅字典等,为用户提供多样的符合条件的词语。

对于前述实施例提供的文本创作的辅助方法,本发明实施例提供了一种文本创作的辅助装置,参见图6所示的一种文本创作的辅助装置的结构示意图,该装置主要包括以下部分:

第一模型确定模块602,用于从预先训练得到的创作辅助模型集中确定目标创作辅助模型。

初稿生成模块604,用于获取文本属性参数,通过目标创作辅助模型基于文本属性参数生成初稿文本。

第二模型确定模块606,用于从预先训练得到的修改辅助模型集中确定目标修改辅助模型。

初稿修改模块608,用于基于初稿文本确定待修改文本和待修改文本对应的修改参数,通过目标修改辅助模型根据待修改文本和修改参数生成已修改文本。

文本确定模块610,用于根据初稿文本和已修改文本确定目标文本。

本发明实施例提供过的上述文本创作的辅助装置,利用创作辅助模型集和修改辅助模型集,实现用户与AI(Artificial Intelligence,人工智能)的协同创作,本发明实施例通过目标创作辅助模型基于文本属性参数生成相应的初稿文本,再通过目标修改辅助模型基于修改参数对初稿文本中的待修改文本进行修改,从而得到用户所需的目标文本,本发明实施例充分地发挥了AI的辅助功能,较好地结合用户和AI各自的创作优势,不仅可以高效地辅助用户进行文本创作,还可以使得到的目标文本更为优质,较好地满足用户需求。

在一种实施方式中,在一种实施方式中,创作辅助模型集包括整体推荐模型、叙事推荐模型、实时推荐模型中的一种或多种;文本属性参数的类型包括文本特征、情节描述文本、上文单句文本中的一种或多种;不同创作辅助模型对应的文本属性参数的类型不同。

在一种实施方式中,整体推荐模型对应的文本属性参数的类型为文本特征,文本特征包括内容控制特征和格式控制特征;初稿生成模块604还用于:如果目标创作辅助模型为整体推荐模型,将文本特征输入至整体推荐模型,通过整体推荐模型内的编码器基于内容控制特征进行编码得到第一编码结果,以及通过整体推荐模型内的解码器基于格式控制特征对第一编码结果进行解码得到初稿文本;其中,整体推荐模型采用seq2seq模型;内容控制特征至少包括文本风格、文本情绪、文本标签;格式控制特征至少包括文本韵脚、段落属性。

在一种实施方式中,叙事推荐模型对应的文本属性参数的类型为情节描述文本;初稿生成模块604还用于:如果目标创作辅助模型为叙事推荐模型,将情节描述文本输入至叙事推荐模型,通过叙事推荐模型内的编码器对情节描述文本进行编码得到第二编码结果,以及通过叙事推荐模型内的解码器对第二编码结果进行解码得到初稿文本;其中,叙事推荐模型采用seq2seq模型。

在一种实施方式中,实时推荐模型对应的文本属性参数的类型为上文单句文本;初稿生成模块604还用于:如果目标创作辅助模型为实时推荐模型,将上文单句文本输入至实时推荐模型,通过实时推荐模型基于上文单句文本生成一个或多个下文单句文本,将上文单句文本与各个下文单句文本的组合作为初稿文本;其中,实时推荐模型采用自回归语言模型。

在一种实施方式中,修改辅助模型集包括段落推荐模型、单句文本推荐模型、词汇推荐模型中的一种或多种。

在一种实施方式中,如果目标修改辅助模型为段落推荐模型,待修改文本包括段落上下文本;初稿修改模块608还用于:将段落上下文本和修改参数输入至段落推荐模型,通过段落推荐模型按照修改参数对段落上下文本进行修改,得到一个或多个已修改文本;修改参数包括第一关键词、段落行数、段落字数、段落韵脚、段落声调;其中,段落推荐模型采用seq2seq模型。

在一种实施方式中,如果目标修改辅助模型为单句文本推荐模型,待修改文本包括待修改单句文本;初稿修改模块608还用于:将待修改单句文本、修改参数、待修改单句文本对应的第一上文单句文本和第一下文单句文本输入至单句文本推荐模型,通过单句文本推荐模型根据第一上文单句文本、第一下文单句文本和修改参数对待修改单句文本进行修改,得到一个或多个已修改文本;修改参数包括第二关键词、单句字数、单句韵脚、单句声调;其中,单句文本推荐模型采用seq2seq模型。

在一种实施方式中,如果修改辅助模型为词汇推荐模型,待修改文本包括待修改词汇;初稿修改模块608还用于:将待修改词汇、修改参数、待修改词汇所在单句文本对应的第二上文单句文本和第二下文单句文本输入至词汇推荐模型,通过词汇推荐模型根据待修改词汇、修改参数、第二上文单句文本和第二下文单句文本,输出一个或多个已修改文本;修改参数包括词汇韵脚、词汇声调;其中,已修改文本包括第一类词汇、第二类词汇和第三类词汇中的一种或多种,第一类词汇为满足修改参数的替换词汇,第二类词汇为满足修改参数的意向词汇、第三类词汇为待修改词汇对应的近义词汇和/或反义词汇。

在一种实施方式中,上述装置还包括押韵辅助模块,用于:获取用户上传的选定词和押韵限定规则;通过预先配置的押韵辅助功能根据选定词和押韵限定规则输出多个押韵词汇;基于各个押韵词汇的押韵次数计算各个押韵词汇的热度值,并按照各个押韵词汇的热度值对各个押韵词汇进行排序;根据排序结果从各个押韵词汇中确定选定词对应的目标押韵词汇。

在一种实施方式中,上述装置还包括灵感辅助模块,用于:获取用户上传的待检索文本;其中,待检索文本包括待检索词汇或待检索单句文本;如果待检索文本包括待检索词汇,通过预先配置的灵感检索辅助功能检索出多个第一可选单句文本;其中,第一可选单句文本包含待检索词汇;如果待检索文本包括待检索单句文本,通过灵感检索辅助功能检索出多个第二可选单句文本;其中,第二可选单句文本与待检索单句文本之间的相似度高于预设相似阈值。

在一种实施方式中,目标文本至少包括歌词文本。

本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。

本发明实施例提供了一种服务器,具体的,该服务器包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法。

图7为本发明实施例提供的一种服务器的结构示意图,该服务器100包括:处理器70,存储器71,总线72和通信接口73,所述处理器70、通信接口73和存储器71通过总线72连接;处理器70用于执行存储器71中存储的可执行模块,例如计算机程序。

其中,存储器71可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口73(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。

总线72可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。

其中,存储器71用于存储程序,所述处理器70在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器70中,或者由处理器70实现。

处理器70可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器70中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器70可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器71,处理器70读取存储器71中的信息,结合其硬件完成上述方法的步骤。

本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见前述方法实施例,在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号