首页> 中国专利> 歌唱姿态的纠正方法、装置、电子设备及存储介质

歌唱姿态的纠正方法、装置、电子设备及存储介质

摘要

本公开示例提供的歌唱姿态的纠正方法、装置、电子设备及存储介质,通过获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息,通过利用该纠正信息,可协助用户对自身歌唱姿态进行有效纠正,便于其提高歌唱水平。

著录项

  • 公开/公告号CN112241653A

    专利类型发明专利

  • 公开/公告日2021-01-19

    原文格式PDF

  • 申请/专利权人 北京百度网讯科技有限公司;

    申请/专利号CN201910641969.X

  • 发明设计人 李彤辉;

    申请日2019-07-16

  • 分类号G06K9/00(20060101);G06K9/62(20060101);

  • 代理机构11205 北京同立钧成知识产权代理有限公司;

  • 代理人朱颖;刘芳

  • 地址 100085 北京市海淀区上地十街10号百度大厦2层

  • 入库时间 2023-06-19 09:35:27

说明书

技术领域

本公开涉及计算机技术,尤其涉及一种歌唱姿态的纠正方法、装置、电子设备及存储介质。

背景技术

音乐是人们必不可缺的文化娱乐方式,歌唱是其中最为普及的一种娱乐行为类型。提高歌唱水平,能够有效提高自身音乐素养,也能够达到更好的娱乐效果。

在现有技术中,提高歌唱水平的方式一般包括两种,一种为线下教学,用户通过与老师面对面进行歌唱姿态纠正的方式,提高自身唱歌水平。但是,采用这样的方式成本较高,且教学时间不够灵活;另一种则为用户通过歌唱教学视频自行学习并进行姿态的纠正,这样的方式效率很低,很难实现对于水平的提升。

因此,需要一种新的可用于纠正用户歌唱姿态的方法,以有效帮助用户提高歌唱水平。

发明内容

针对上述问题,本公开提供了一种歌唱姿态的纠正方法、装置、电子设备及存储介质。

第一方面,本公开示例提供了一种歌唱姿态的纠正方法,包括:

歌唱姿态的纠正方法,其特征在于,包括:

获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;

利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;

采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息。

在其他可选的示例中,所述获取若干歌唱姿态样本,包括:

采集同一首歌曲在多个采样时刻的多个歌唱姿态样本;

所述利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型,包括:

利用每一采样时刻的多个歌唱姿态样本,对所述预设模型进行训练,获得所述训练完毕的模型。

在其他可选的示例中,所述采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息,包括:

采集用户在歌唱歌曲时,多个采样时刻的姿态特征数据;

利用所述训练完毕的模型对所述各采样时刻的姿态特征数据进行处理,获得每个采样时刻的输出结果;

根据所述每个采样时刻的输出结果,输出纠正信息。

在其他可选的示例中,所述输出纠正信息,包括:

根据利用训练完毕的模型对姿态特征数据进行处理所获得的输出结果,确定包括姿态矫正建议在内的纠正信息。

在其他可选的示例中,所述歌唱姿态样本为嘴部姿态样本;所述姿态特征数据为嘴部姿态特征数据。

在可选的示例中,所述嘴部姿态样本包括嘴部开合样本和开合角度样本;所述嘴部姿态特征数据包括嘴部开合状态数据和开合角度数据。其他

第二方面,本公开示例提供了一种歌唱姿态的评价装置,包括:

数据采集模块,用于获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;

数据处理模块,用于利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;

数据采集模块,还用于采集用户在歌唱时的姿态特征数据,以使所述数据处理模块利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息。

在其他可选的示例中,所述歌唱姿态样本为嘴部姿态样本;所述姿态特征数据为嘴部姿态特征数据。

第三方面,本公开示例提供了一种电子设备,所述电子设备包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如前任一所述的方法。

第四方面,本公开示例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如前任一所述的方法。

本公开示例提供的歌唱姿态的纠正方法、装置、电子设备及存储介质,通过获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息,通过利用该纠正信息,可协助用户对自身歌唱姿态进行有效纠正,便于其提高歌唱水平。

附图说明

图1为本公开所基于的一种网络架构的示意图;

图2为本公开提供的一种歌唱姿态的纠正方法的流程示意图;

图3为本公开提供的另一种歌唱姿态的纠正方法的流程示意图;

图4为本公开提供的一种歌唱姿态的纠正装置的结构示意图;

图5为本公开提供的一种电子设备的硬件结构示意图。

具体实施方式

为使本公开示例的目的、技术方案和优点更加清楚,下面将结合本公开示例中的附图,对本公开示例中的技术方案进行清楚、完整地描述。

音乐是人们必不可缺的文化娱乐方式,歌唱是其中最为普及的一种娱乐行为类型。提高歌唱水平,能够有效提高自身音乐素养,也能够达到更好的娱乐效果。

在现有技术中,提高歌唱水平的方式一般包括两种,一种为线下教学,用户通过与老师面对面进行歌唱姿态纠正的方式,提高自身唱歌水平。但是,采用这样的方式成本较高,且教学时间不够灵活;另一种则为用户通过歌唱教学视频自行学习并进行姿态的纠正,这样的方式效率很低,很难实现对于水平的提升。

因此,需要一种新的可用于纠正用户歌唱姿态的方法,以有效帮助用户提高歌唱水平。

针对上述问题,本公开提供了一种歌唱姿态的纠正方法、装置、电子设备及存储介质,其通过采集用户歌唱时的姿态特征数据,并将姿态特征数据输入至训练完毕的模型中,以输出并获得用户歌唱的姿态纠正信息,从而便于用户根据纠正信息对姿态进行有效纠正,进而提高歌唱水平。本公开提供的歌唱姿态的纠正方法、装置、电子设备及存储介质能够应用于多种场景,这些场景包括但不限于:在线歌唱教学、KTV歌唱点评或评价、发声矫正等。

图1为本公开所基于的一种网络架构的示意图,如图1所示,本公开基于的网络架构可包括歌唱姿态的纠正装置1、网络以及服务器2,其中的歌唱姿态的纠正装置1可用于执行下述各实施方式中所述的纠正方法,以实现对纠正信息的生成。

其中,网络用以在歌唱姿态的纠正装置1和服务器2之前提供通信链路的介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

需要说明的是,上述的歌唱姿态的纠正装置1可为具备逻辑处理功能的硬件设备或电子设备,如计算机,又如移动平板电脑等,也可为软件。相应的,服务器2具体可为设置在云端的服务器组或服务器集群,其可提供有数据的存储、搜索、计算、处理等功能。

特别的,当歌唱姿态的纠正装置1为软件时,其可以安装在上述所列举的相应的电子设备中,即歌唱姿态的纠正装置1为的软件形式可以是安装在计算机、移动平台电脑等电子设备中的软件。此外,歌唱姿态的纠正装置1还可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块,在此不做具体限定。

一方面,本公开示例提供了一种歌唱姿态的纠正方法,图2为本公开提供的一种歌唱姿态的纠正方法的流程示意图。

如图2所示,该歌唱姿态的纠正方法包括:

步骤101、获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据。

本公开所基于的歌唱姿态的纠正方法的执行主体为上述的歌唱姿态的纠正装置。

首先,纠正装置可通过与服务器的交互获取到其中存储的歌唱姿态样本。具体来说,歌唱姿态样本是指采用正确姿态进行歌唱的用户的姿态特征,通过预先采集大量用户在进行歌唱时的姿态特征数据,并对这些姿态特征数据进行标定处理,以区分其中的正确姿态和非正确姿态,获得若干歌唱姿态特征数据以及对应的标定数据。这些数据将存储在服务器中,以供纠正装置调取使用。其中,被标定为正确姿态的歌唱姿态特征数据和相应的标定数据将被纠正装置调取以作为歌唱姿态样本。

步骤102、利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型。

具体来说,在本公开提供的示例中,纠正装置中可设置有待训练的预设模型,该预设模型可为神经网络模型。利用歌唱姿态样本,可对预设模型进行训练,以使预设模型得到收敛。其中,对于预设模型的收敛判定可采用如下方式,若全部的歌唱姿态样本中的歌唱姿态特征数据输入至模型而输出的标定结果,与歌唱姿态样本中的标定数据保持一致,则确定预设模型已收敛,即得到收敛后的训练完毕的模型。

步骤103、采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息。

纠正装置可接受用户触发的纠正操作,并采集用户在歌唱时的姿态特征数据,以利用训练完毕的模型对姿态特征数据进行处理。

具体来说,基于应用场景的不同,该采集用户在歌唱时姿态特征数据的操作可基于不同的触发方式。例如,当本公开示例基于线上的歌唱教授场景时,该采集用户在歌唱时的姿态特征数据的操作具体可为接收用户自行上传的歌唱视频,并从该歌唱视频中识别并解析用户的姿态特征数据;当本公开示例基于线下的KTV的歌唱评价或纠错场景时,该采集用户在歌唱时的姿态特征数据的操作具体可为启动承载有纠错装置的电子设备的摄像头或拍摄单元,通过摄像头或拍摄单元实时采集用户在歌唱时的姿态特征数据。

随后,可将该姿态特征数据输入至训练完毕的模型,并输出相应的结果和纠正信息。其中,纠正信息具体指代的是该采集获得的用户的姿态特征数据与采用正确歌唱姿势进行歌唱的歌唱姿态样本中的姿态特征数据之间的差值或差异度。

进一步的,本公开可选示例中,歌唱姿态样本为嘴部姿态样本,其包括但不限于:嘴部姿态样本包括嘴部开合样本和开合角度样本;

相应的,姿态特征数据为嘴部姿态特征数据,其包括但不限于嘴部开合状态数据和开合角度数据。

也就是说,在本公开示例中,通过利用训练完毕的模型可对于采集得到的用户在歌唱时的嘴部开合状态数据和开合角度数据,与嘴部开合样本和开合角度样本分别进行比对,并获得比对结果,该比对结果包括“一致”和“不一致”的比对结果,还可包括“开合角度过大”的比对结果。相应的,根据这些结果可向用户输出纠错信息,如“需要增大嘴部开合角度”或“需要减少嘴部开合角度”等。

本公开示例提供的歌唱姿态的纠正方法,通过获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息,通过利用该纠正信息,可协助用户对自身歌唱姿态进行有效纠正,便于其提高歌唱水平。

结合前述的各实现方式,图3为本公开提供的另一种歌唱姿态的纠正方法的流程示意图,如图3所示,该歌唱姿态的纠正方法包括:

步骤201、采集同一首歌曲在多个采样时刻的多个歌唱姿态样本;

步骤202、利用每一采样时刻的多个歌唱姿态样本,对所述预设模型进行训练,获得所述训练完毕的模型。

步骤203、采集用户在歌唱歌曲时,多个采样时刻的姿态特征数据;

步骤204、利用所述训练完毕的模型对所述各采样时刻的姿态特征数据进行处理,获得每个采样时刻的输出结果;

步骤205、根据所述每个采样时刻的输出结果,输出纠正信息。

与前述示例类似的是,本公开所基于的歌唱姿态的纠正方法的执行主体为上述的歌唱姿态的纠正装置。

与前述示例不同的是,纠正装置通过与服务器的交互获取到歌唱姿态样本是属于同一首歌曲的。在本公开示例中,多个歌唱姿态样本是基于同一首歌曲的,纠正装置可基于该同一首歌曲的多个歌唱姿态样本对预设模型进行训练,以得到可用于纠正用户在歌唱该歌曲时的歌唱姿态的训练完毕的模型。此外,纠正装置还可调取其他歌曲的歌唱姿态样本并对预设模型进行类似的训练。也就是说,在本公开示例中,针对不同的歌曲可采用不同的模型对用户的歌唱姿态进行纠正。

具体来说,本示例中的歌唱姿态样本是指同一首歌曲在多个采样时刻的歌唱姿态特征数据以及相应的标定数据。其中的多个采样时刻是指在同一首歌中随机抽取采样的时刻,在每一采样时刻均对大量用户在进行歌唱时的姿态特征数据进行采集,并对采集的姿态特征数据进行标定处理和存储。纠正装置将从服务器中调取该首歌在各个采样时刻的正确姿态的歌唱姿态特征数据以及对应的标定数据,以作为该首歌的各个歌唱姿态样本。

随后,纠正装置中可设置有待训练的预设模型,该预设模型可为神经网络模型。利用歌唱姿态样本,可对预设模型进行训练,以使预设模型得到收敛。其中,对于预设模型的收敛判定可采用如下方式,若该歌曲的全部采样时刻的全部歌唱姿态样本中的歌唱姿态特征数据输入至模型而输出的标定结果,与标定数据保持一致,则确定预设模型已收敛,即得到收敛后的训练完毕的模型。

纠正装置可接受用户触发的纠正操作,并采集用户在歌唱时的姿态特征数据,以利用训练完毕的模型对姿态特征数据进行处理。与前述示例不同的是,在本公开示例中,纠正装置可获取到用户所歌唱的歌曲,并调用相应的训练完毕的模型,以对用户歌唱时的姿态特征数据进行处理。

在本示例中,首先纠正装置采集用户在歌唱歌曲时,多个采样时刻的姿态特征数据,该采样时刻可与歌唱姿态样本中的采样时刻一一对应。也就是说,若歌唱姿态样本对应的采样时刻分别为第1秒、第3秒和第5秒等基数秒,那么采集的用户歌唱时的姿态特征数据的采样时刻也应为第1秒、第3秒和第5秒等基数秒。

随后,可利用所述训练完毕的模型对所述各采样时刻的姿态特征数据进行处理,获得每个采样时刻的输出结果。最后,根据所述每个采样时刻的输出结果,以确定包括姿态矫正建议在内的纠正信息。

具体的,在本公开示例中,输出的纠正信息是基于全部采样时刻的输出结果决定的。举例来说,本公开示例中的歌唱姿态样本为嘴部姿态样本,如嘴部姿态样本包括嘴部开合样本和开合角度样本等,而姿态特征数据为嘴部姿态特征数据,如嘴部开合状态数据和开合角度数据。

也就是说,通过利用训练完毕的模型可对于采集得到的用户在歌唱时的嘴部开合状态数据和开合角度数据,与嘴部开合样本和开合角度样本分别进行比对,并获得比对结果,该比对结果包括“一致”和“不一致”的比对结果,还可包括“开合角度过大”的比对结果。

特别的,在本示例中,针对每一采样时刻均可获得一个对比结果,在输出每一采样时刻的纠正信息的同时,还可结合多个采样时刻可获得对于用户歌唱该首歌曲的纠正信息,在输出该首歌曲的纠正信息时刻参考一系列采样时刻的纠正信息,如当发现在每一个采样时刻的纠正信息均为“需要增大嘴部开合角度”时,则可给出“歌唱时嘴部姿态有误,建议增大嘴部开合角度”的纠正信息;如当发现在连续的采样时刻,“需要增大嘴部开合角度”和“需要减少嘴部开合角度”间隔出现,则可给出“尝试倾听重音小节,并在重音小节开始演唱”的纠正信息。

本公开示例提供的歌唱姿态的纠正方法,通过获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息,通过利用该纠正信息,可协助用户对自身歌唱姿态进行有效纠正,便于其提高歌唱水平。

第二方面,本公开示例提供了一种歌唱姿态的纠正装置,图4为本公开提供的一种歌唱姿态的纠正装置的结构示意图,如图4所示,该歌唱姿态的纠正装置包括:

数据采集模块10,用于获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;

数据处理模块20,用于利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;

数据采集模块10,还用于采集用户在歌唱时的姿态特征数据,以使所述数据处理模块20利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息。

在其他可选的示例中,所述数据采集模块10,用于采集同一首歌曲在多个采样时刻的多个歌唱姿态样本;

数据处理模块20,用于利用每一采样时刻的多个歌唱姿态样本,对所述预设模型进行训练,获得所述训练完毕的模型。

在其他可选的示例中,所述数据采集模块10,用于采集用户在歌唱歌曲时,多个采样时刻的姿态特征数据;

数据处理模块20,用于利用所述训练完毕的模型对所述各采样时刻的姿态特征数据进行处理,获得每个采样时刻的输出结果;根据所述每个采样时刻的输出结果,输出纠正信息。

在其他可选的示例中,所述数据处理模块20,具体用于根据利用训练完毕的模型对姿态特征数据进行处理所获得的输出结果,确定包括姿态矫正建议在内的纠正信息。

在其他可选的示例中,所述歌唱姿态样本为嘴部姿态样本;所述姿态特征数据为嘴部姿态特征数据。

在其他可选的示例中,所述嘴部姿态样本包括嘴部开合样本和开合角度样本;所述嘴部姿态特征数据包括嘴部开合状态数据和开合角度数据。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的控制设备的具体工作过程以及相应的有益效果,可以参考前述方法示例中的对应过程,在此不再赘述。

本公开提供的歌唱姿态的纠正装置,通过获取若干歌唱姿态样本,其中,所述歌唱姿态样本包括歌唱姿态特征数据以及姿态标定数据;利用歌唱姿态样本对预设模型进行训练,获得训练完毕的模型;采集用户在歌唱时的姿态特征数据,并利用训练完毕的模型对姿态特征数据进行处理,输出纠正信息,通过利用该纠正信息,可协助用户对自身歌唱姿态进行有效纠正,便于其提高歌唱水平。

第三方面,本公开示例提供了一种控制设备,图5为本公开提供的一种电子设备的硬件结构示意图,如图5所示,本公开提供了一种电子设备,包括:

一个或多个处理器42;

存储装置41,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处器执行,使得所述一个或多个处理器实现如前任一所述的方法。

所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,控制设备的结构中包括处理器和存储器,所述存储器用于存储支持控制设备执行上述第一方面中设备的控制方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述控制设备还可以包括通信接口,用于控制设备与其他设备或通信网络通信。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的控制设备的具体工作过程以及相应的有益效果,可以参考前述方法示例中的对应过程,在此不再赘述。

第四方面,本公开示例提供了一种存储介质,用于储存控制设备所用的计算机软件指令,其包含用于执行上述第一方面中设备的控制方法为控制设备所涉及的程序。

本领域普通技术人员可以理解:实现上述各方法示例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法示例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各示例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述各示例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各示例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各示例技术方案的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号