首页> 中国专利> 用于学习外语的设备及使用其提供外语学习服务的方法

用于学习外语的设备及使用其提供外语学习服务的方法

摘要

用于学习外语的设备及使用其提供外语学习服务的方法。本发明涉及一种外语学习设备及通过使用该设备提供外语学习服务的方法。该外语学习设备可包括:接口模块,其从语音人工智能(AI)设备接收学习者的话语语音信息,执行语音合成,并发送所合成的话语语音信息;学习者话语分析模块,其存储并分析话语历史的日志;评估模块,其针对学习者的话语语音信息通过会话水平计算算法计算评估指标的分数,并评估会话水平;以及学习交谈模块,其存储场景模型,并在学习者与虚拟说话者之间的学习交谈期间,根据学习者的所说语句的意图和在评估模块中评估的学习者的话语语音信息的会话水平来确定虚拟说话者的回答话语语句,并且使交谈流前进。

著录项

  • 公开/公告号CN112819664A

    专利类型发明专利

  • 公开/公告日2021-05-18

    原文格式PDF

  • 申请/专利权人 乐金信世股份有限公司;

    申请/专利号CN202011153817.4

  • 申请日2020-10-26

  • 分类号G06Q50/20(20120101);G10L13/02(20130101);G10L25/60(20130101);G09B5/06(20060101);G09B19/06(20060101);

  • 代理机构11127 北京三友知识产权代理有限公司;

  • 代理人赵彤;刘久亮

  • 地址 韩国首尔

  • 入库时间 2023-06-19 11:02:01

说明书

相关申请的交叉引用

本申请要求于2019年10月31日向韩国知识产权厅提交的韩国专利申请No.10-2019-0137882的优先权和权益,其全部内容通过引用合并于此。

技术领域

本申请涉及一种用于学习外语的设备以及使用该设备提供外语学习服务的方法,该用于学习外语的设备使用户能够通过与虚拟说话者进行交谈来学习外语会话。

背景技术

随着国际化时代的到来,对于包括英语在内的各种外语的教育的需求和供给不断增加,关于教育方法的研究与开发也越来越活跃。具体而言,随着在早期开始学习的人员数量和生活在国外的人员数量增加,以及居住在韩国的外国人的数量增加,语言技能(尤其是会话技能)的重要性也日益增加。传统的灌输式教育难以提高语言技能,并且为了提高实际进行会话的能力,需要一种有效的教育方法。

近来,随着计算机技术的发展,已经开发了使用计算机和网络的大量语言教育方法,但是因为相对于会话实践,用户难以独自用计算机进行学习,因此难以进行有效的学习。此外,一些语言学习服务公司提供基于应用AI的应用程序的会话学习服务,但这仅是学习应用程序中所储存的单词、简短语句或简短单向会话的水平,或通过模仿它们的发音来学习语言的水平,并且由于技术实现水平的限制,无法通过类似于人类对话的自由交谈进行会话学习。因此,直到现在,如果人们希望通过自由交谈进行会话课程,那么他们中的大多数人都依赖于离线课程,由母语说话者进行辅导,电话/视频英语课程等。然而,在这种类型的会话课堂中,由于人们仅在相应的时间学习语言,因此不可能进行充分的会话练习,并且由于进行充足的会话练习的价格较高,因此存在经济负担的限制。另外,存在的问题在于,由于教师的素质和工作流失率高,难以连续地管理学习质量。

发明内容

本申请被设想为提供一种用于使得用户能够通过与虚拟说话者的自由交谈来学习外语会话的学习外语的设备以及通过使用该设备来提供外语学习服务的方法。

本申请被设想为提供一种用于学习外语的设备及通过使用该设备提供外语学习服务的方法,其中,多个交谈流根据学习者所说的所说语句的意图、会话的水平、会话的类型、会话功能等来分支,以执行自然交谈。

本申请被设想为提供一种用于学习外语的设备及通过使用该设备提供外语学习服务的方法,其中,通过提供对学习者的会话水平的数值分析来准确地诊断学习者的会话水平,并且根据该会话水平生成适当的交谈流,或者使得学习者能够复习或附加地学习不足的表达。

本申请的示例性实施方式提供了一种外语学习设备,该外语学习设备通过与虚拟说话者的交谈为学习者提供外语学习服务,该外语学习设备包括:接口模块,其从对从学习者接收到的话语语音进行语音识别(话语到文本(STT))的语音人工智能(AI)设备接收学习者的话语语音信息,并且对与通过语音AI设备接收到的学习者的话语语音信息相对应的虚拟说话者的话语语音信息执行语音合成(文本到话语(TTS)),并发送所合成的话语语音信息;学习者话语分析模块,其存储并分析与学习者的话语语音信息有关的话语历史的日志;评估模块,其针对学习者的话语语音信息通过会话水平计算算法计算一个或更多个评估指标中的每一个的分数,并评估会话水平;以及学习交谈模块,其存储用于学习交谈流的场景模型,并在学习者与虚拟说话者之间的学习交谈期间,基于场景模型根据学习者的所说语句的意图和在评估模块中评估的学习者的话语语音信息的会话水平,来确定虚拟说话者的回答话语语句,并且使交谈流前进。

本申请的另一示例性实施方式提供了一种由外语学习设备通过与虚拟说话者的交谈向学习者提供外语学习服务的方法,该方法包括:通过学习者终端从学习者接收针对多个预设外语学习主题中的任何一个的选择输入;通过学习者终端在屏幕上显示与所选择主题相对应的至少一个场景模型中所包括的脚本语句,或者以虚拟说话者的话语语音形式向学习者提供脚本语句;接收学习者响应于脚本语句所说的话语语音信息;将学习者的话语语音信息与响应于场景模型预设的回答集进行比较,通过会话水平计算算法计算一个或更多个评估指标中的每一个的分数,并计算学习者的话语语音信息的会话水平分数;以及基于场景模型和学习者的话语语音信息的评估的会话水平分数,根据与学习者的话语语音信息相对应的所说语句的意图,确定虚拟说话者的回答话语语句,并且为学习者提供所确定的回答话语语句。

另外,在技术方案中并未列出本发明的全部特征。参照以下特定的示例性实施方式,将更加清楚地理解本发明的各种特征以及根据这些特征的优点和效果。

按照根据本发明示例性实施方式的外语学习设备和通过使用该外语学习设备提供外语学习服务的方法,可以通过与虚拟说话者的自由交谈来执行外语会话学习,从而有效地执行外语会话学习,而不受时间和空间限制。

按照根据本发明示例性实施方式的外语学习设备和通过使用该外语学习设备提供外语学习服务的方法,多个交谈流基于学习者的所说语句的意图和会话水平,根据相应交谈类型、交谈功能或主题而分支,使得学习者能够与虚拟说话者进行自由交谈。因此,学习者可以像学习者实际上正在与母语说话者交谈一样进行交谈,从而提高会话学习的效果。

按照根据本发明示例性实施方式的外语学习设备和通过使用该外语学习设备提供外语学习服务的方法,可以通过使用AI对学习者的会话水平进行数值分析和诊断。因此,可以根据学习者的水平进行自由交谈或会话学习,或推荐定制的学习内容。

附图说明

图1是例示了根据本发明示例性实施方式的外语学习系统的示意图。

图2是例示了根据本发明示例性实施方式的外语学习设备的框图。

图3是例示了根据本发明示例性实施方式的外语学习设备的语句相似度算法的示意图。

图4是例示了根据本发明示例性实施方式的外语学习设备中从优秀学习者的学习交谈中选择附加推荐语句的示意图。

图5是例示了根据本发明示例性实施方式的根据外语学习设备的所说语句的意图来确定场景模型的前进路径的示意图。

图6是例示了根据本发明示例性实施方式的通过使用外语学习设备的场景设计模块来设计场景模型的方法的示意图。

图7的(A)是例示了根据本发明示例性实施方式的通过使用外语学习设备的场景设计模块来设置设计交谈流所需的各个功能节点而设计的场景模型的示意图。

图7的(B)是例示了根据本发明示例性实施方式的通过将图7的(A)的场景模型与来自外部内容服务器的内容连接来配置新场景模型的情况的示意图。

图8和图9是例示了根据本发明示例性实施方式的学习外语的方法的流程图。

具体实施方式

在下文中,将详细描述示例性实施方式,使得本领域技术人员能够参照附图容易地实现本发明。然而,在详细描述本发明的示例性实施方式时,省略了对本文结合的已知功能和配置的详细描述,以避免不必要地混淆本发明的主题。此外,贯穿整个附图,具有相似功能或作用的部分由相同的附图标记表示。

在整个说明书中,当描述元件“联接”到另一元件时,该元件可以“直接联接”到另一元件或通过第三元件“间接联接”到另一元件。此外,除非明确地相反描述,否则词语“包括”和诸如“包括于”或“所包括”之类的变体将被理解为暗示包括提及元件,而不是排除任何其他元件。另外,说明书中描述的术语“器”、“仪”和“模块”表示用于处理至少一种功能和操作的单元,并且能够由硬件组件或软件组件及其组合来实现。

图1是例示了根据本发明示例性实施方式的外语学习系统的示意图。参照图1,根据本发明示例性实施方式的外语学习系统可以包括学习者的终端1、语音人工智能(AI)设备10和外语学习设备100。

在下文中,将参照图1描述根据本发明示例性实施方式的外语学习系统。

学习者终端1可以执行包括外语学习应用程序在内的各种应用程序,并通过视觉或听觉上显示正在运行的应用程序来向用户提供正在运行的应用程序。学习者终端1可以包括用于视觉上显示外语学习应用程序等的显示单元,并且可以包括接收用户的输入的输入单元、通过网络与服务器或另一终端进行通信的通信单元、存储至少一个程序和相关数据的存储器、以及执行程序的过程。此外,学习者终端1还可以包括识别用户所说的语音的麦克风、输出从外语学习应用程序提供的声音的扬声器等。

如图所示,学习者终端1可以是诸如智能电话和平板PC之类的移动终端,并且依据示例性实施方式,还可以包括诸如台式计算机之类的固定装置。具体而言,学习者终端1可以包括移动电话、智能电话、语音识别扬声器、笔记本计算机(膝上型计算机)、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、平板个人计算机(PC)、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)和头戴式显示器(HMD)、等等。根据示例性实施方式,学习者终端1还可以用用于学习外语的专用终端装置来实现。

同时,学习者终端1可以通过通信网络与外语学习设备100连接。这里,通信网络可以包括有线网络和无线网络,并且具体而言,通信网络可以包括诸如局域网(LAN)、城域网(MAN)和广域网(WAN)之类的各种网络。此外,通信网络还可以包括公知的万维网(WWW)。但是,根据本发明的通信网络不限于所列出的网络,并且可以包括公知的无线数据网络、公知的电话网络、公知的有线或无线电视网络等。

外语学习设备100可以是单个或多个服务提供服务器(或服务提供方),并且根据示例性实施方式,外语学习设备100可以通过可安装在学习者终端1中的外语学习应用程序与学习者终端1连接。外语学习设备100可以响应于来自学习者终端1的请求来提供外语学习服务,并且可以以与虚拟说话者交谈的形式提供外语学习服务,以使学习者能够自然地提高外语会话技能。在此,由外语学习设备100提供的外语可以是英语、日语、中文等,并且根据示例性实施方式以各种方式选择由外语学习设备100提供的外语。

外语学习设备100可以识别从学习者终端1接收到的学习者的语音(语音到文本(STT)),并将语音转换为文本,以便以学习者与虚拟说话者交谈的形式提供外语学习服务。然后,外语学习设备100可以从转换后的字符来分析学习者的意图,并且语音合成(文本到话语(TTS))虚拟说话者需要与学习者说的脚本,并为学习者终端1提供合成的声音。

外语学习设备100或学习者终端1可以包括直接执行STT和TTS的语音AI模块。然而,根据示例性实施方式,可以实现单独的语音AI设备10以执行STT和TTS。这里,语音AI设备10还可以是提供语音AI分析/处理功能的外部服务器。

语音AI设备10可以支持用于STT和TTS的应用程序接口(API)。因此,当学习者讲话时,学习者终端1可以向语音AI设备10提供学习者的语音,并请求将学习者的语音转换为文本。然后,语音AI设备10可以为外语学习设备100提供与学习者的语音相对应的语音信息。

外语学习设备100可以响应于学习者的话语语音信息来确定虚拟说话者要回答的回答话语语句。然后,外语学习设备100可以为语音AI设备10提供回答话语语句,并请求用语音合成回答话语语句。在这种情况下,语音AI设备10可以合成与回答话语语句相对应的语音,并为学习者终端1提供合成的语音。

语音AI设备10可以通过合成由语音操作方等记录的语料的方法来生成与文本相对应的语音数据。然而,根据示例性实施方式,也可以利用诸如机器学习或深度学习的人工智能。即,语音AI设备10可以通过机器学习或深度学习文本以及与文本相对应的语音数据来计算音素的数据权重,并利用该数据权重来执行语音合成。根据示例性实施方式,还可以通过在语音AI设备10中进一步包括高速缓存器等来实现,以最小化语音合成请求。

图2是例示了根据本发明示例性实施方式的外语学习设备100的框图。参照图2,根据本发明示例性实施方式的外语学习设备100可以包括接口模块110、学习者话语分析模块120、评估模块130、学习交谈模块140、学习功能模块150和场景设计模块160。

在下文中,将参照图2描述根据本发明示例性实施方式的外语学习设备100。

接口模块110可以被配置为将外语学习设备100链接到学习者终端1和语音AI设备10。接口模块110可以将学习者所说的语音输入学习者终端1中或者将虚拟说话者要说的回答话语输入学习者终端1。因此,接口模块110可以控制语音AI设备10,以执行STT或TTS、意图分析等,以提供外语学习服务。

具体而言,当学习者讲话时,接口模块110从外语学习设备100的内部或外部的语音AI设备10接收话语语音信息,该话语语音信息包括通过话语识别(STT)并转换学习者的话语语音而获得的文本。此外,当外语学习设备100期望选择虚拟说话者回答的回答话语语句并为学习者提供所选择的回答话语语句时,接口模块110可以向语音AI设备10发送文本形式的回答话语语句。在这种情况下,语音AI设备10可以语音合成(TTS)回答话语语句,并且用语音形式的回答话语语句来发送给学习者终端1。

同时,除了语音AI设备10之外,接口模块110还可以被实现为与各种设备链接。例如,接口模块110可以被配置为与内容提供服务器(未示出)链接。在这种情况下,接口模块110可以从内容提供服务器接收各种附加的学习内容,诸如与场景模型结合提供的场景交谈内容以及场景交谈内容的一组回答。此外,接口模块110还可以被配置为与另一AI服务器和开放应用程序接口(API)服务器链接。

学习者语音分析模块120可以存储通过接口模块110输入的学习者的话语语音信息,并且生成、存储和分析与话语语音信息相关的话语历史的日志等。这里,学习者话语分析模块120可以通过区分每个学习者和由每个学习者执行的每个场景模型来生成话语语音信息和话语历史。

评估模块130可以通过使用会话水平计算算法来评估学习者的会话技能。即,评估模块130可以将会话水平计算算法应用于学习者的话语语音信息,并且针对会话水平计算算法中包括的每个评估指标计算。此后,评估模块130可以通过使用针对每个评估指标的分数来计算会话水平分数。在此,评估模块130可以评估关于学习者所说的每个语句的话语语音信息的会话水平,或者针对学习者的整个交谈语句评话会话水平。

具体而言,在评估模块130中使用的会话水平计算算法可以包括语句相似度算法、上下文相似度算法、话语流畅度算法等。

首先,语句相似度算法可以评估学习者的话语语音信息和与所存储的场景模型的每个脚本语句相对应的回答集之间的语句相似度。回答集可以包括作为每个脚本语句的回答的代表性语句和适合作为替代回答的多个推荐语句。因此,语句相似度算法可以确定学习者的话语语音信息与场景模型中预设的回答集的相似程度,并评估学习者的会话水平。

根据示例性实施方式,为了应用语句相似度算法,首先,可以生成相似度确定模型,该相似度确定模型是通过将与场景模型的每个脚本语句相对应的回答集中包括的单词之间的语义相似度转换为向量值并且将向量值转换成数值的方法来训练的。如图3所示,在示例性实施方式中,可以生成通过将word2vec方法应用于回答集而训练的相似度确定模型。当应用相似性确定模型时,可以用数值地表示学习者的话语语音信息与预设回答集的相似程度。因此,评估模型130可以将学习者的话语语音信息应用于相似度确定模型,并且通过学习者的话语语音信息与回答集之间的语句相似度向量距离值,来计算学习者的话语语音信息的语句相似度分数。在示例性实施方式中,在预设语句相似度分数参考值之后,当语句相似度分数等于或大于参考值时,评估模型130可以确定学习者的话语语音信息是适当的,并且当语句相似度分数小于参考值时,评估模型130可以确定学习者的话语语音信息是不合适的。在示例性实施方式中,在预设了多个语句相似度水平区间参考值之后,评估模型130可以检查语句相似度分数对应于哪个水平区间并计算语句相似度评估指标的水平。

上下文相似度算法可以评估学习者的话语语音信息与学习者与虚拟说话者间的前后问答之间的交谈上下文相似度。即,在虚拟说话者和学习者进行会话的情况下,学习者不知道场景模型中预设的回答集,因此学习者可以做出没有包括在回答集中的随机回答。在这种情况下,学习者的话语内容不包含在回答集中,但是可能适合交谈前后上下文。因此,为了准确地评估学习者的会话水平,需要确定上下文相似度。

上下文相似度算法可以通过以如下方法学习上下文确定模型来生成上下文确定模型,该方法将解释场景模型中的情形或主题的脚本或交谈语句中的单词、在为学习者提供指导的先前脚本或交谈语句中使用的单词、以及在响应于单词学习者所说出的语句中的单词连接,并将单词之间的语义相似度转换为向量值以及将向量值转换为数值。然后,评估模型130可以通过将学习者的话语语音信息应用于上下文确定模型来计算上下文相似度分数。在示例性实施方式中,在预设了上下文相似度分数参考值之后,当上下文相似度分数等于或大于参考值时,评估模型130可以确定保持交谈上下文,并且当上下文相似度分数小于参考值时,评估模型130可以确定话语语音信息不适合于交谈上下文。此外,示例性实施方式也是可能是通过在预设了多个上下文相似度水平区间参考值之后检查上下文相似度分数对应于哪个水平区间,来计算上下文相似度评估指标的水平。

话语流利度算法可以通过将学习者的话语语音信息的话语流利度计算为包括发音准确度、话语速度等的指标的分数,来确定学习者的话语语音信息的话语流利度。

即,话语流利度算法可以通过学习单个或多个母语说话者的参考话语语音的发音信息、话语速度信息等来生成话语流利度模型。然后,可以将关于从学习者的话语语音信息中提取的学习者的发音信息、话语速度等的信息应用于话语流利度模型。在这种情况下,可以通过将关于学习者的发音信息、话语速度等的信息与参考话语语音的发音信息、话语速度等进行比较,来计算关于学习者的发音信息、话语速度等的信息的指标值。通过这样,可以计算学习者的话语流利度分数。在示例性实施方式中,可以通过将学习者的发音语音波形与参考话语语音的发音语音波形进行比较来计算话语流利度分数。

除了语句相似度算法、上下文相似度算法和话语流利度算法之外,评估模块130中也可以包括用于评估学习者的会话水平的其他评估指标算法。

同时,评估模块130可以通过输入经由语句相似度算法、上下文相似度算法和话语流利度算法计算出的评估指数分数,来基于监督学习方法生成评估模型。然后,评估模块130可以通过将学习者的话语语音信息输入评估模型来计算学习者的会话水平分数。即,可以通过利用机器学习或深度学习方法基于每个评估指标分数来计算相应会话水平分数。这里,为了生成评估模型,可以利用通过在执行监督学习期间基于每个英语教师的评估指数分数执行评估而获得的现有评估数据。可以在会话学习应用程序的画面上以百分比显示在评估模块130中计算出的分数,以便学习者立即检查分数。但是,当显示分数干扰学习者的学习热情时,可以不单独显示分数。

根据示例性实施方式,如图4所示,除了在场景模型中预设的回答集之外,评估模块130还可以向相应回答集附加地设置与基于学习者的回答的每个脚本语句相对应的推荐语句。即,评估模块130可以从存储在学习者话语分析模块120中的多个学习者的学习历史中选择已经获得预设分数或更高分数的优秀学习者。然后,可以选择优秀学习者的历史中所存储的话语语音信息作为与场景模型的每个脚本语句相对应的推荐语句。这里,所选择的推荐语句可以附加地包括在与场景模型的每个脚本语句相对应的回答集中。通过这种方式,可以扩展回答集的数据,并且除了教科书回答之外,还可以充分反映时代经常使用的口头语体中实际使用的回答。即,可以更准确地评估学习者的会话水平。

学习交谈模块140可以存储用于外语学习交谈流的预设场景模型。此外,学习交谈模块140可以在学习者与虚拟说话者之间的学习交谈期间基于场景模型来推进交谈流。在现有的会话学习应用程序中,存储了多个预设场景(例如,图5的(A)中的A1-B1、A2-B2、A3-B3或A1-B1-A2、A2-B2-A3),以仅使得能够以短语句或在一个方向进行短交谈流,并且学习者通过使用预设声场景来学习会话,因此难以实现自然的学习交谈。

然而,存储在学习交谈模块140中的场景模型可以以诸如交谈类型、交谈功能、主题或任务之类的单元来配置,并且被配置为使得这些单元根据学习者的选择而彼此连接,并且交谈以各种方向扩展或改变以使交谈流前进。因此,类似于与母语说话者的会话课程,学习者可以与虚拟说话者进行更自然的会话学习。

图5的(B)例示了扩展的场景模型的示例性实施方式。在本示例性实施方式中,场景模型以交谈类型和主题为单位配置,但是除此之外,场景模型也可以以另一个必要的参考单元进行配置。此外,可以预设并存储场景模型,但是也可以由外语学习设备100中包括的场景设计模块160来设计场景模型。

在基于场景模型使交谈流前进的过程中,学习交谈模块140可以根据学习者所说语句的意图和在评估模块130中评估的话语语音信息的会话水平,来确定虚拟说话者的回答话语语音语句和交谈流方向,并使交谈流前进。例如,在示例性实施方式中,在学习者的会话水平为75%的情况下,学习交谈模块140可以确定与场景模型中的下一种情形相对应的虚拟说话者的回答话语语句,以继续使交谈流前进。然而,在学习者的会话水平在50%至75%的区段的情况下,学习交谈模块140可以提取推荐语句和学习者所说的语句中的关键词,并且确定以另一种形式改变后的重新问题作为虚拟说话者的回答话语语句,以引导学习者说出类似于回答集的适当回答。此外,在学习者的会话水平小于50%的情况下,学习交谈模块140可以确定虚拟说话者的回答话语语句,使得学习者可以学习适合于当前交谈情形的推荐语句。例如,学习交谈模块140可以以提供提示、提供推荐语句的完整语句、以语音给出适当的推荐语句然后提供指导的形式,来确定虚拟说话者的回答话语语句,使得学习者反复地重复适当的推荐语句,提供语句模式/表达学习等。通过这种方式,学习交谈模块140可以引导难以针对相应目的进行交谈的学习者首先完全意识到适当的语句。

学习功能模块150可以根据学习者的水平为学习者终端1提供学习内容。即,学习功能模块150可以被配置为在学习交谈流期间或在学习交谈流终止之后,使学习者根据在评估模块130中评估的学习者的每个所说的语句或全部交谈语句的会话水平,来复习或附加地学习包括学习外语所需的单词、语句、表达、发音等的学习内容。

在示例性实施方式中,学习功能模块150可以实现为使得学习者完全意识到与被确定为学习者的会话水平分数低于预设值的每个脚本语句和脚本语句的回答集有关的单词、语句、发音、表达等。例如,学习功能模块150可以通过虚拟说话者播放相应学习内容的发音,并请求学习者反复重复该发音。否则,学习功能模块150可以播放学习者自己的话语语音并请求学习者再次说出来。除了前述方法之外,学习功能模块150可以以各种方法执行针对学习者的复习或附加学习功能。

场景设计模块160可以通过使用交谈类型或交谈功能节点来设计、组合、改变和管理适合于学习者与虚拟说话者之间的交谈流的场景模型。场景模型可以以交谈类型、主题、任务或学习者和虚拟说话者可以说的其他分类为单位,包括每个脚本语句和与该脚本语句相对应的预设回答集。回答集可以包括作为每个脚本语句的回答的代表性语句和可以适合作为替代回答的多个推荐语句。此外,场景模型可以被配置为根据学习者所说的语句的意图,针对与相应交谈类型、交谈功能或其他分类相对应的每个节点分支成多个前进路径。

在示例性实施方式中,场景设计模块160还可以提供用于设计聊天机器人会话的用户界面(UI)或用户体验(UX),以设计新的场景模块。在示例性实施方式中,用于设计聊天机器人会话的UI可以通过在基于无编码的web画布上以拖放方法适当地设置多个所需功能节点并可视地配置场景模型的交谈流来设计场景模型,并且立即将设计的场景模型反映给学习服务。此外,可以通过连接交谈流(即,场景模型)进行自然而充分的交谈主题。

图6是例示了根据本发明示例性实施方式的被配置为针对具有九种交谈功能节点类型的场景模型设计聊天机器人会话的场景设计模块160的图。

在示例性实施方式中,这九个交谈功能节点可以包括听节点161、讲节点162、时隙节点163、轮播节点164、跳转节点165、分割节点166、功能节点167、应用程序接口(API)节点168和模板节点169。此外,在另一示例性实施方式中,场景设计模块160还可以被配置为包括多于或少于九个交谈功能节点类型。

听节点161可以具有被配置为从通过在语音AI设备10中对学习者的所说语句的意图执行分析而获得的学习者的话语语音信息中了解学习者的交谈意图的功能。讲节点162可以被配置为使期望回答响应于学习者的所说语句而被确定为要被说出来。时隙节点163可以被配置为再次询问问题,以从学习者获得附加信息或引导来自学习者的准确回答,并且轮播节点164可以被配置为通过向学习者提供选择视图功能使学习者能够从多个选项中选择选项。跳转节点165可以被配置为通过连接不同的场景模型来改变/切换交谈流,并且分割节点166可以被配置为依据条件对交谈流进行分支。

功能节点167可以被配置为处理数据,并且还可以通过编码来实现所需的功能。API节点167可以支持与外部API的连接并且执行数据解析和连接映射,并且该配置可以使外部学习内容与场景模型的连接容易。

在示例性实施方式中,API节点168可以被配置为当设置了通用资源定位符(URL)参数时以树的形式显示信息。API节点168可以通过Restful API发送和接收遗留数据,并且可以仅通过在工作期间进行简单设置而连接系统。模板节点169是与在与学习者交谈期间执行语音识别、语音合成和意图分析的单独语音AI设备10连接的功能节点,以解决每个语音AI设备10支持不同模板的问题,以在学习者和虚拟说话者之间顺利进行学习交谈。依据不同的语音AI设备10,模板节点可以被配置为通过利用与不同的语音AI设备10相对应的模板来进行交谈学习。因此,模板节点使外语学习设备100能够根据不同的语音AI设备设计场景模型,从而在不受影响的情况下进行相同的聊天机器人交谈流。在场景设计期间,根据示例性实施方式的场景设计模块160可以通过按照拖放方法在web画布上根据交谈流设置具有所需功能的节点,输入相应内容并连接各个节点,来设计场景模型。

场景设计模块160可以被配置为通过将附加的学习内容应用于场景模型的每个节点来设计新的场景模型。场景设计模块160还可以支持通过接口模块110和/或API节点与其他AI服务器、内容提供服务器、开放API支持服务器等的连接。在示例性实施方式中,场景设计模块160可以通过连接从外部内容提供服务器或内容市场平台提供的各种内容来设计场景模型。例如,场景设计模块160可以设计场景模型,以通过连接由气象局的服务器提供的天气信息、由高速公路公司的服务器提供的交通信息等来执行交谈流。

图7的(A)是例示了根据本发明示例性实施方式的通过使用外语学习设备的场景设计模块来设置设计交谈流所需的各个功能节点而设计的场景模型的示意图。具体而言,图7的(A)例示了场景模型的示例性实施方式,其中以拖放形式在场景设计模块160的web画布上设计、连接和设置用于设计用于问候的交谈流所需的各个功能节点。图7的(A)和图7的(B)中相同的节点类型是具有九种功能节点类型当中的相同功能的节点,并且T1表示听节点、T2表示分割节点、T3表示讲节点、T4表示功能节点、T5表示跳转节点、T6表示API节点、T7表示时隙节点、T8表示轮播节点、并且T9表示模板节点。

图7的(B)是例示了根据本发明示例性实施方式的通过将图7的(A)中设计的场景模型与来自外部内容服务器的内容连接来配置新的场景模型的情况的示意图。图7的(B)表示示例性实施方式,其中,通过组合从气象局的服务器接收的天气内容和针对预存储的问候交谈流的场景模型中的天气问候,在web画布上形成与天气问候有关的新的场景模型。如图7的(B)所示,从气象局的服务器接收的天气内容可以组合到图7的(A)的问候交谈流的场景模型中。然后,甚至可以通过在Web画布上配置天气问候场景模型来连接任务建议。

图8和图9是例示了根据本发明示例性实施方式的通过使用外语学习设备来提供外语学习服务的方法的流程图。

参照图8,外语学习设备可以通过使用针对每种交谈类型或交谈功能的节点来设计适合于学习者与虚拟说话者之间的交谈流的场景模型(S10)。外语学习设备100可以提供用于设计场景模型的场景模型设计工具160,并且可以通过使用场景模型设计工具160来设计场景模型,以在以交谈类型、交谈功能或者学习者和虚拟说话者可以交谈的其他分类为单位的节点中包括每个脚本语句和与脚本语句相对应的预设回答集。在示例性实施方式中,场景模型可以被设计为根据响应于脚本语句输入的学习者所说的语句的意图,针对与相应交谈类型和交谈功能相对应的每个节点,分支到多个前进路径中。回答集可以包括作为每个脚本语句的回答的代表性语句和可以适合于作为替代回答的多个推荐语句。

在示例性实施方式中,场景模型设计工具160可以提供用于设计聊天机器人交谈的UI或UX,以用于设计新的场景模型。在此,用于设计聊天机器人会话的UI可以提供能够通过以下来设计场景模型的界面:通过在基于无编码的web画布上以拖放方法适当地设置多个所需功能节点,并可视地配置场景模型的交谈流,并立即将设计的场景模型反映给学习服务。此外,当使用用于设计聊天机器人交谈的UI时,还可以通过连接交谈流(即,场景模型)来进行自然而充分的交谈主题。上面已经参照图6和图7描述了通过使用场景模型设计工具160来生成场景模型的特定示例,因此将省略其详细描述。

同时,场景模型设计工具160可以支持与其他AI服务器、内容提供服务器、开放式API支持服务器等的连接。在示例性实施方式中,场景模型设计工具160可以通过连接在外部内容提供服务器或内容市场平台中提供的各种内容来设计场景模型。例如,场景设计模块160可以设计场景模型,以通过连接由气象局的服务器提供的天气信息、由高速公路公司的服务器提供的交通信息等来执行交谈流。此外,根据示例性实施方式,可以从外部内容提供服务器、内容市场平台等提供场景模型,并且在这种情况下,可以省略设计场景模型的操作S10。

外语学习设备100可以通过学习者终端1从学习者接收针对多个预设外语学习主题中的任何一个的选择输入(S20)。在示例性实施方式中,除了期望的外语学习主题之外,学习者还可以选择交谈类型或其他参考的多个菜单项之一,并且外语学习设备100可以提供与学习者的选择输入相对应的外语学习。

具体而言,外语学习设备100可以在屏幕上显示与通过学习者终端1选择的主题相对应的至少一个场景模型中包括的脚本语句,或者以虚拟说话者的话语语音的形式为学习者提供脚本语句(S30)。外语学习设备100可以向学习者解释与学习者选择的主题相对应的场景模型中的情形,并请求学习者与虚拟说话者根据该情形进行交谈。场景模型可以以交谈类型、主题、交谈或学习者和虚拟说话者可以交谈的其他类别为单位包括每个脚本语句和与该脚本语句相对应的预设回答集。此外,场景模型可以被配置为根据学习者所说语句的意图,针对与相应交谈类型、交谈功能或其他分类相对应的每个节点分支成多个前进路径。回答集可以包括作为对每个脚本语句的回答的代表性语句和可以代替代表性语句适合于作为替代回答的多个推荐语句。

学习者可以针对与所选主题相对应的至少一个场景模型,响应于显示在屏幕上或通过虚拟说话者所提供的脚本语句而讲话,并且外语学习设备100可以接收学习者响应于脚本语句所说的话语语音信息(S40)。根据示例性实施方式,学习者可以通过语音AI设备10接收作为与学习者所说的语音相对应的文本的话语语音信息。即,语音AI设备10可以被设置为链接在外语学习设备100和学习者终端1之间,并且可以在语音AI设备10中话语识别(STT)或话语合成(TTS)学习者所说的语音或虚拟说话者要说的回答语音,并发送给外语学习设备100或学习者终端1。在示例性实施方式中,当学习者说话时,外语学习设备100可以接收包括通过从外语学习设备100的内部或外部语音AI设备10对学习者所说的语音进行话语识别和转换(STT)而获得的文本的所说语音信息。此外,当外语学习设备100期望选择虚拟说话者要回答的回答话语语句并向学习者提供所选择的回答话语语句时,外语学习设备100可以向语音AI设备10发送文本形式的回答话语语句,并且语音AI设备10可以话语合成(TTS)回答话语语句并以语音的形式向学习者终端1发送所合成的回答话语语句。

在此,外语学习设备100可以存储学习者的输入话语信息,并且生成、存储和分析与话语语音信息有关的话语历史的日志等。在这种情况下,外语学习设备100可以通过区分每个学习者和由每个学习者执行的每个场景模型来生成话语语音信息和话语历史。

此后,外语学习设备100可以将响应于场景模型的学习者的话语语音信息与预设的回答集进行比较,并通过会话水平计算算法计算每个评估指标的分数。即,外语学习设备100可以将会话水平计算算法应用于学习者的话语语音信息,并且计算会话水平计算算法中所包括的每个评估指标的分数。此外,外语学习设备100可以从每个评估指标的分数来评估学习者的话语语音信息的会话水平,并计算会话水平分数(S50),并且外语学习设备100可以评估学习者所说的每个语句的话语语音信息,或评估学习者的全部交谈语句的会话水平。

会话水平计算算法可以包括评估指标算法,诸如语句相似度算法、上下文相似度算法和话语流利度算法。然而,以上已经描述了每种评估指标算法,因此将省略其详细描述。

同时,在计算会话水平分数的操作S50中,可以通过输入经由语句相似度算法、上下文相似度算法和话语流利度算法计算出的评估指标分数,基于监督学习方法来生成评估模型,然后可以通过将学习者的话语语音信息输入评估模型来计算学习者的会话水平分数。根据示例性实施方式,除了语句相似度算法、上下文相似度算法和话语流利度算法之外,外语学习设备100还可以通过包括用于评估学习者的会话水平的其他评估指标算法来计算学习者的会话水平分数。

此外,在计算会话水平分数的操作S50中,可以利用通过输入经由语句相似度算法、上下文相似度算法和话语流利度算法计算出的评估指标分数而基于监督学习方法所生成的评估模型,然后,可以通过将学习者的话语语音信息输入评估模型来计算学习者的会话水平分数。即,可以利用机器学习或深度学习方法,基于每个评估指标分数来计算相应会话水平分数。这里,为了生成评估模型,可以利用通过在执行监督学习期间基于每个英语教师的评估指标分数进行评估而获得的现有评估数据。由外语学习设备100计算出的分数可以以百分比显示在会话学习应用程序的画面上,以便学习者立即检查分数,并且当显示分数干扰学习者的学习热情时,可以不单独显示分数。

根据示例性实施方式,外语学习设备100可以从多个学习者的学习历史当中选择已经获得预设分数或更高分数的优秀学习者,并且可以附加地选择优秀学习者的历史中所存储的所说语句,作为与场景模型的每个脚本语句相对应的推荐语句,并将所选的推荐语句包括在与场景模型的每个脚本语句相对应的回答集中。也就是说,除了教科书回答之外,还可以基于优秀学习者的回答,扩展回答集的数据池,以反映出在口头语体中实际使用的回答等,并且通过该配置,可以提供类似于人之间真实交谈的自然交谈学习。

然后,外语学习设备100可以基于场景模型和针对学习者的话语语音信息而评估的会话水平分数,根据与学习者的话语语音信息相对应的所说语句的意图来确定虚拟说话者的回答话语语句,并向学习者提供所确定的回答话语语句(S60)。在此,外语学习设备100可以存储用于外语学习交谈流的预设场景模型,并且在学习者与虚拟说话者之间的学习交谈期间基于场景模型使交谈流前进。在现有的会话学习应用程序中,存储了多个预设场景(例如,图5的(A)中的A1-B1、A2-B2、A3-B3或A1-B1-A2、A2-B2-A3),以仅使得能够以短语句或在一个方向进行短交谈流,并且学习者通过使用预设场景来学习会话,因此难以实现自然的学习交谈。然而,存储在外语学习设备100中的场景模型可以以交谈类型、主题,任务等为单位进行配置,并且被配置为使得根据学习者的选择将这些单元彼此连接,并交谈在各个方向扩展或改变,以使交谈流前进。因此,类似于与母语说话者的会话课程,学习者可以与虚拟说话者进行更自然的会话学习。图5的(B)例示了扩展场景模型的示例性实施方式。在本示例性实施方式中,场景模型以交谈类型和交谈功能为单位进行配置,但是除此之外,场景模型也可以以其他所需的参考单元进行配置。

在基于场景模型使交谈流前进的处理中,外语学习设备100可以根据学习者的所说语句的意图和话语语音信息的会话水平,来确定虚拟说话者的回答话语语句和交谈流方向并使交谈流前进。例如,在示例性实施方式中,在学习者的会话水平是75%的情况下,外语学习设备100可以确定与场景模型中的下一种情形相对应的虚拟说话者的回答话语语句以继续使交谈流前进;并且,在学习者的会话水平在50%至75%的区段的情况下,外语学习设备100可以提取推荐语句和学习者的所说语句中的关键词,并确定以另一种形式改变后的重新问题作为虚拟说话者的回答话语语句,以引导学习者说出类似于回答集的适当回答。此外,在学习者的会话水平小于50%的情况下,外语学习设备100可以以如下的形式确定虚拟说话者的回答话语语句并引导难以关于相应对象进行交谈的学习者首先实际上要意识到语句:提供提示,提供推荐语句的完整语句,以语音给出适当的推荐语句,然后提供指导使得学习者反复重复适当的推荐语句,提供语句模式/表达学习等使得学习者可以学习适合于当前交谈情形的推荐语句。

根据示例性实施方式,外语学习设备100可以在学习交谈流期间或学习交谈流终止之后,使学习者根据学习者的所评估的会话水平复习或附加地学习包括学习外语所需的单词、语句、表达、发音等的学习内容。在示例性实施方式中,外语学习设备100可以实现为使得学习者充分意识到与被确定为学习者的会话水平分数低于预设值的每个脚本语句以及该脚本语句的回答集相关的单词、语句、发音、表达等。在示例性实施方式中,外语学习设备100可以通过虚拟说话者播放相应学习内容的发音,并且请求学习者反复重复该发音。否则,外语学习设备100还可以播放学习者自己的话语语音并请求学习者再次说出来,并以除了上述方法之外的各种方法为学习者执行复习或附加的学习功能。

具体而言,参照图9,当外语学习设备100从评估模块130接收到会话水平分数时(S61),外语学习设备100可以将会话水平分数与参考值进行比较(S62)。在此,当会话水平分数等于或大于参考值时,外语学习设备100可以根据场景模型提取下一个脚本语句,并继续进行与虚拟说话者的交谈(S63)。在这种情况下,可以根据与学习者的话语语音信息相对应的所说语句的意图来确定场景模型的前进路径。即,外语学习设备100可以将学习者的所说语句与针对场景模型中预设的每个前进路径的回答集进行比较,并且根据针对每个前进路径的回答集当中被确定为对应于学习者的所说语句的回答集的前进路径中进行场景模型。

同时,当会话水平分数小于参考值时,虚拟说话者可以通过再次询问交谈来对学习者进行话语引导,该再次询问交谈包括向学习者给出关键词的提示并且听并重复基于响应语句的语句。

具体而言,当会话水平分数等于或大于极限值并且小于参考值时(S64),外语学习设备100可以基于响应语句执行TTS,找到回答集中与学习者的所说语句最相似的推荐语句,然后再次向学习者询问含义(S65)。即,由于关于学习者的所说内容的STT可能是不正确的,因此可以再次向学习者确认正确的含义。

同时,当会话水平分数小于极限值时,学习者可以学习针对脚本语句的设定回答(S66)。即,由于学习者的会话水平低,因此外语学习设备100可以使学习者意识到并学习相应脚本语句和与该脚本语句相对应的设定回答。

根据示例性实施方式,如图8所示,在学习者与虚拟说话者之间的交谈终止之后,外语学习设备100可以根据学习者的话语语音信息的会话水平分数来推荐适合于学习者的难度水平和主题的学习内容(S70)。

本发明可以实现为记录有程序的介质中的计算机可读代码。计算机可读介质可以持续存储计算机可执行程序,或者临时存储计算机可执行程序以用于执行或下载。此外,介质可以是组合了单个或几个硬件的形式的各种记录装置或存储装置,并且不限于直接连接到特定计算机系统的介质,而是也可以分布在网络中。介质的示例可以是被配置为存储程序命令的介质,包括诸如硬盘、软盘和磁带之类的磁介质,诸如只读光盘存储器(CD-ROM)和数字视频盘(DVD)之类的光记录介质,诸如软光盘(floptical disk)之类的磁光介质、只读存储器(ROM)、随机存取存储器(RAM)和闪存。此外,介质的另一示例可以包括在分发应用程序的应用商店、提供发布各种软件、服务器等的站点中管理的记录介质或存储介质。因此,在所有方面都不应限制性地解释详细描述,并且应当以示例性方式来考虑详细描述。本发明的范围应由所附权利要求的合理解释来确定,并且所有的变型包括在本发明的等同范围内的本发明的范围内。

本发明不限于前述示例性实施方式和附图。显然,本领域技术人员可以在本技术精神的范围内进行各种变型、修改或替换。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号