首页> 中国专利> 假音识别方法、假音还原方法、电子设备及存储介质

假音识别方法、假音还原方法、电子设备及存储介质

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本申请公开了一种假音识别方法、假音还原方法、电子设备及存储介质。该方法包括：获取待分析语音信息；对所述待分析语音信息进行驻波检测，得到驻波信息，和/或，对所述待分析语音信息进行音域检测，得到音域信息；将所述驻波信息和/或所述音域信息与对应的预设信息比对，得到所述待分析语音信息的假音识别结果。该方法能够减少假音还原过程中超发的曝光量。通过该方法，能够确定待分析语音信息是否为假音。

著录项

公开/公告号CN114927139A

专利类型发明专利
公开/公告日2022-08-19

原文格式PDF
申请/专利权人游密科技（深圳）有限公司;
展开▼

申请/专利号CN202210287916.4
发明设计人崔洋洋;余俊澎;
展开▼

申请日2022-03-22
分类号G10L25/51(2013.01);G10L25/78(2013.01);
代理机构深圳市智圈知识产权代理事务所(普通合伙) 44351;
代理人吕静
地址 518000 广东省深圳市南山区粤海街道科技园社区科苑路16号东方科技大厦2401
入库时间 2023-06-19 16:25:24

法律信息

法律状态公告日

法律状态信息

法律状态
2022-09-06

实质审查的生效 IPC(主分类):G10L25/51 专利申请号:2022102879164 申请日:20220322

实质审查的生效

说明书

技术领域

本申请涉及互联网信息处理技术领域，更具体地，涉及一种假音识别方法、假音还原方法、电子设备及存储介质。

背景技术

语音转换是通过软件对各种声音进行更变，并由音响设备发出，完成将语音转换为不同的声音。

日常生活中通过语音信息进行欺骗的行为极度普遍，例如电话诈骗或网络视频诈骗等。通过对真实语音信息进行假音处理，得到假音信息，然后通过假音信息混淆人们的听觉，从而使得受害人被假音信息欺骗，行骗人通过假音信息保护自己不被发现。因此，亟需一种假音识别方案，以确定语音信息是否为假音。

发明内容

鉴于上述问题，本申请实施例提出了一种假音识别方法、假音还原方法、电子设备及存储介质，以提供一种假音识别方案。

第一方面，本申请实施例提供了一种假音识别方法，包括：获取待分析语音信息；对所述待分析语音信息进行驻波检测，得到驻波信息，和/或，对所述待分析语音信息进行音域检测，得到音域信息；将所述驻波信息和/或所述音域信息与对应的预设信息比对，得到所述待分析语音信息的假音识别结果。

第二方面，本申请实施例提供了一种假音还原方法，所述方法包括：确定待处理假音信息的假音信息；若所述假音信息与预设假音信息不匹配，则通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息；输出所述还原语音信息。

第三方面，本申请实施例提供一种假音识别装置，包括：语音获取模块，用于获取待分析语音信息；假音检测模块，用于对所述待分析语音信息进行驻波检测，得到驻波信息，和/或，对所述待分析语音信息进行音域检测，得到音域信息；识别结果获得模块，用于将所述驻波信息和/或所述音域信息与对应的预设信息比对，得到所述待分析语音信息的假音识别结果。

第四方面，本申请实施例提供一种假音还原装置，包括：确定模块，用于确定待处理假音信息的假音信息；假音还原模块，用于若所述假音信息与预设假音信息不匹配，则通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息；输出模块，用于输出所述还原语音信息。

第五方面，本申请实施例提供了一种电子设备，包括处理器以及存储器；一个或多个程序被存储在存储器中并被配置为由处理器执行以实现上述的方法。

第六方面，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质中存储有程序代码，其中，在程序代码被处理器运行时执行上述的方法。

第七方面，本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述的方法。

本申请实施例提供的一种假音识别方法、假音还原方法、电子设备及存储介质，通过将待分析语音信息的驻波信息和/或音域信息与对应的预设信息进行比对，得到能反映待分析语音信息是否为假音的假音识别结果，从而实现了对待分析语音进行假音识别。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请实施例提出的一种电子设备的结构示意图；

图2示出了本申请实施例提出的一种假音识别方法的流程图；

图3示出了本申请实施例提出的一种假音还原方法的流程图；

图4示出了本申请实施例中一种声音回放方法的流程图；

图5示出了本申请实施例提出的一种假音识别装置的框图；

图6示出了本申请实施例提出的一种假音还原装置的框图；

图7示出了本申请实施例提出的一种计算机可读存储介质的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在以下的描述中，所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

语音转换是通过软件对各种声音进行更变，并由音响设备发出，完成将语音转换为不同的声音，其中包括对声音声纹、声调和声色等进行调整，达到有效转换的目的。

日常生活中电话诈骗较为普遍，网络骗子在进行诈骗时一般利用假音对人们进行诈骗，假音容易混淆人们的听觉，同时很好的保护了网络骗子。因此，亟需一种假音识别和假音还原方案，帮助用户分析语音信息是否为假音，并在语音信息为假音时，对语音信息进行还原。

为了解决上述问题，发明人提出了本申请提供的假音识别方法、假音还原方法、电子设备及存储介质，通过将待分析语音信息的驻波信息和/或音域信息与对应的预设信息进行比对，得到能反映待分析语音信息是否为假音的假音识别结果，从而实现了对待分析语音进行假音识别。

同时，在待处理假音信息的假音信息与预设假音信息不匹配时，通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息。实现了对待处理假音信息的还原。

在对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及一种应用环境进行介绍。

请参阅1，图1示出了本申请实施例提出的一种电子设备的结构示意图；电子设备100包括处理器102以及存储器104。其中，该存储器104中存储有可以执行前述实施例中内容的程序，而处理器102可以执行该存储器104中存储的程序。

其中，处理器102可以包括一个或者多个用于处理数据的核以及消息矩阵单元。处理器102利用各种接口和线路连接整个电子设备100内的各个部分，通过运行或执行存储在存储器104内的指令、程序、代码集或指令集，以及调用存储在存储器104内的数据，执行电子设备100的各种功能和处理数据。可选地，处理器102可以采用数字信号处理(DigitalSignal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(Programmable Logic Array，PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(Central Processing Unit，CPU)、图像处理器(GraphicsProcessing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器102中，单独通过一块通信芯片进行实现。

存储器104可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所获取的数据(如，待推荐数据以及操作方式)等。

电子设备100还可以包括网络模块以及屏幕，网络模块用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯，例如和音频播放设备进行通讯。网络模块可包括各种现有的用于执行这些功能的电路元件，例如，天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。网络模块可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。屏幕可以进行界面内容的显示以及进行数据交互。

在一些实施例中，电子设备100还可以包括有：外设接口和至少一个外围设备。处理器102、存储器104和外设接口106之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外设接口连接。具体地，外围设备包括：射频组件108、定位组件112、摄像头114、音频组件116、显示屏118以及电源122等中的至少一种

外设接口106可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器102和存储器104。在一些实施例中，处理器102、存储器104和外设接口106被集成在同一芯片或电路板上；在一些其他实施例中，处理器102、存储器104和外设接口106中的任意一个或两个可以在单独的芯片或电路板上实现，本申请实施例对此不加以限定。

射频组件108用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频组件108通过电磁信号与通信网络以及其他通信设备进行通信。射频组件108将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频组件108包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频组件108可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频组件108还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

定位组件112用于定位电子设备的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件112可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

摄像头114用于采集图像或视频。可选地，摄像头114包括前置摄像头和后置摄像头。通常，前置摄像头设置在电子设备100的前面板，后置摄像头设置在电子设备100的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头114还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频组件116可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器102进行处理，或者输入至射频组件108以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在电子设备100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器102或射频组件108的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频组件114还可以包括耳机插孔。

显示屏118用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏118是触摸显示屏时，显示屏118还具有采集在显示屏118的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器102进行处理。此时，显示屏118还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏118可以为一个，设置电子设备100的前面板；在另一些实施例中，显示屏118可以为至少两个，分别设置在电子设备100的不同表面或呈折叠设计；在又一些实施例中，显示屏118可以是柔性显示屏，设置在电子设备100的弯曲表面上或折叠面上。甚至，显示屏118还可以设置成非矩形的不规则图形，也即异形屏。显示屏118可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，机发光二极管)等材质制备。

电源122用于为电子设备100中的各个组件进行供电。电源122可以是交流电、直流电、一次性电池或可充电电池。当电源122包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

下面将结合附图具体描述本申请的各实施例。

请参阅图2，图2示出了本申请实施例提出的一种假音识别方法的流程图，该方法可以应用于电子设备，该方法包括：

S110、获取待分析语音信息。

在本申请中，任何待进行假音分析的语音信息均可以作为待分析语音信息。不同的应用场景中，待分析语音信息的可以不同，例如，在对未知语音信息进行识别，确定未知语音信息是否为假音时，未知语音信息即是待分析语音信息，再如，在对已经过假音处理的已知语音信息进行假音分析，检测假音分析的准确性时，该已知语音信息即为待分析语音信息。

待分析语音信息可以是电子设备自己生成的，也可以是电子设备从其他平台或服务器获取的；待分析语音信息可以是较长的语音信息，例如持续10分钟以上，也可以是较短的语音信息，例如持续5分钟以内。待分语音信息可以是各种语言的语音信息，例如中文、英文、法文或俄文等。

S120、对所述待分析语音信息进行驻波检测，得到驻波信息，和/或，对所述待分析语音信息进行音域检测，得到音域信息。

S130、将所述驻波信息和/或所述音域信息与对应的预设信息比对，得到所述待分析语音信息的假音识别结果。

在本申请中，假音识别结果可以包括待分析语音信息为假音或待分析语音信息不为假音。可以对待分析语音信息进行驻波检测，得到驻波信息，驻波信息对应的预设信息可以包括预设驻波信息，例如，驻波信息可以包括待分析语音信息的驻波长短，对应的预设驻波信息包括预设驻波长短。

还可以对待分析语音信息进行音域检测，得到音域信息，音域信息对应的预设信息可以包括预设音域信息，例如，音域信息可以包括待分析语音信息的声音粗细信息和声音高低信息，对应的预设驻波信息包括预设声音粗细信息和预设声音高低信息。

在本申请中，当驻波信息与预设驻波信息不匹配时，确定待分析语音信息为假音，示例的，待分析语音信息的驻波长短大于预设驻波信息中的预设驻波长短，驻波信息与预设驻波信息不匹配，确定待分析语音信息为假音。

在另一些实施例中，当音域信息与预设音域信息不匹配时，确定待分析语音信息为假音，示例的，待分析语音信息的声音粗细信息与预设声音粗细信息不匹配(在预设声音粗细信息为预设声音粗细区间时，若声音粗细信息不在预设声音粗细区间内，则声音粗细信息与预设声音粗细信息不匹配)或声音高低信息与预设声音高低信息不匹配(在预设声音高低信息为预设声音高低区间时，若声音高低信息不在预设声音高低区间内，则声音高低信息与预设声音高低信息不匹配)，确定待分析语音信息为假音。其中，声音粗细信息与预设声音粗细信息不匹配和声音高低信息与预设声音高低信息不匹配两种情况发生其一，则确定待分析语音信息为假音信息。

在本申请其他实施例中，可以在驻波信息与对应的预设驻波信息不匹配，且音域信息与对应的预设音域信息不匹配时，确定待分析语音信息为假音，也可以在在驻波信息与对应的预设驻波信息不匹配和音域信息与对应的预设音域信息不匹配两者发生其一时，确定待分析语音信息为假音。

在一些实施例中，电子设备可以具有语音导入单元和语音分析单元，其中，语音导入单元用于获取待分析语音信息，语音分析单元用于执行本实施了中S120和S130的步骤，得到假音识别结果。

本申请实施例提供了假音识别方法，通过获取待分析语音信息；对所述待分析语音信息进行驻波检测，得到驻波信息，和/或，对所述待分析语音信息进行音域检测，得到音域信息；将所述驻波信息和/或所述音域信息与对应的预设信息比对，得到所述待分析语音信息的假音识别结果。实现了对待分析语音信息进行假音识别。

请参阅图3，图3示出了本申请实施例提出的一种假音还原方法的流程图，该方法可以应用于电子设备，该方法包括：

S210、确定待处理假音信息的假音信息。

待处理假音信息可以是指通过本申请的假音识别方法得到的假音识别结果为假音的待分析语音信息，待处理假音信息还可以是指通过其他现有手段对不为假音的语音信息进行假音处理，获得的假音信息。

电子设备可以是基于录制的不为假音的语音信息生成的待处理假音信息，也可以是在服务器或其他平台获取的待处理假音信息，本申请不做限定。

在本申请中，假音信息可以包括声音频率信息和音调信息的至少一者，假音信息还可以包括其他信息，例如音色信息等。

S220、若所述假音信息与预设假音信息不匹配，则通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息。

在本实施例中，在假音信息包括声音频率信息时，预设假音信息可以包括预设声音频率信息，在假音信息包括声调信息时，预设假音信息可以包括预设声调信息。换而言之，在本申请中，检测待处理假音信息的声音频率信息与预设声音频率信息是否匹配，和/或，检测待处理假音信息的声调信息与预设声调信息是否匹配。

在本申请中，当待处理假音信息的声音频率信息与预设声音频率信息不匹配时，确定假音信息与预设假音信息不匹配；在另一些实施例中，在待处理假音信息的声调信息与预设声调信息不匹配时，确定假音信息与预设假音信息不匹配；在又一些实施例中，待处理假音信息的声音频率信息与预设声音频率信息不匹配，且，待处理假音信息的声调信息与预设声调信息不匹配时，确定假音信息与预设假音信息不匹配。

当确定假音信息与预设假音信息不匹配时，则通过训练获得的假音还原模型对待处理假音进行还原，得到还原语音信息。

其中，假音还原模型可以包括声音频率还原模型和音调还原模型中的至少一者，声音频率还原模型用于对待处理假音信息中的声音频率进行调整，实现还原，声调还原模型用于对待处理假音信息中的声调进行调整，实现还原。

可选地，所述假音信息包括声音频率信息，所述预设假音信息包括预设声音频率信息，所述假音还原模型包括声音频率还原模型；所述若所述假音信息与预设假音信息不匹配，则通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息，包括：若所述声音频率信息与所述预设声音频率信息不匹配，则通过声音频率还原模型对所述待处理假音信息进行还原处理，得到还原语音信息。

在本申请中，预设声音频率信息可以是一个预设声音频率区间，在预设声音频率区间不包括声音频率信息时，声音频率信息与预设声音频率信息不匹配，其中，在本申请中的声音频率可以是指待处理假音信息中的说话间隔。

声音频率还原模型可以是根据训练样本对初始模型(例如神经网络模型或其他分析算法等)进行训练获得。对待处理假音信息进行还原处理可以是指对待处理假音信息的声音频率进行调整，例如在声音频率信息过高时，在说话间隔中加入空白，以增加说话间隔，降低声音频率，或者，在声音频率过低时，对说话间隔进行修剪，以减少说话间隔，增加声音频率。

可选地，所述假音信息包括音调信息，所述预设音调信息包括预设音调信息，所述假音还原模型包括音调还原模型；所述若所述假音信息与预设假音信息不匹配，则通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息，包括：若所述音调信息与所述预设音调信息不匹配，则通过所述音调还原模型对所述待处理假音信息进行还原处理，得到还原语音信息。

在本申请中，预设音调信息可以是一个预设音调区间，在预设音调区间不包括音调信息时，音调信息与预设音调信息不匹配。

音调还原模型可以是根据训练样本对初始模型(例如神经网络模型或其他分析算法等)进行训练获得。对待处理假音信息进行还原处理可以是指对待处理假音信息的音调进行调整，例如，音调过低时，调高音调，或者，音调过高时，调低音调。

对待处理语音信息可以均执行音调还原和声音频率的还原过程，得到还原语音信息，也可以执行音调还原和声音频率还原的其中一者，得到还原语音信息。示例的，声音频率信息与预设声音频率信息不匹配时，确定假音信息与预设假音信息不匹配，对待处理假音信息进行声音频率的还原过程，得到还原语音信息；在另一些实施例中，在待处理假音信息的声调信息与预设声调信息不匹配时，确定假音信息与预设假音信息不匹配，对待处理假音信息进行音调的还原过程，得到还原语音信息；在又一些实施例中，待处理假音信息的声音频率信息与预设声音频率信息不匹配，且，待处理假音信息的声调信息与预设声调信息不匹配时，确定假音信息与预设假音信息不匹配，对待处理假音信息进行声音频率和音调的还原过程，得到还原语音信息。

在本申请一些实施例中，在得到还原语音信息后，可以执行以下步骤：

对所述还原语音信息进行音频调整操作，得到第一训练语音样本；基于所述第一训练语音样本以及所述还原语音信息，对所述声音频率还原模型进行训练，获得更新后的声音频率还原模型；以及，

对所述还原语音信息进行音调调整操作，得到第二训练语音样本；基于所述第二训练语音样本以及所述还原语音信息，对所述音调还原模型进行训练，获得更新后的音调还原模型。

在本申请中，第一训练语音样本可以包括声音频率被调高和调低的多个语音信息，第二训练样本可以包括声调被调高和调低的多个语音信息。通过第一训练语音样本以及第二训练样本，分别对对音调还原模型和声音频率还原模型进行更新，保证音调还原模型和声音频率还原模型准确率较高，且更适用于不断变化的假音场景。

S230、输出所述还原语音信息。

得到还原语音信息后，输出还原语音信息，便于用户直接收听还原语音信息。

在本申请中，电子设备还可以具有假音分析单元、假音还原单元以及训练单元，上文所述的语音导入单元用于导入待处理假音信息，假音还原单元用于执行S220和S230的步骤，得到还原语音信息，训练单元用于执行本实施例中声音频率还原模型的训练和更新过程，以及执行音调还原模型的训练和更新过程。

在本该实施例中，通过对待处理假音信息进行假音还原，将待处理假音信息还原为正常的不含有假音的还原语音信息，便于用户收听不含有假音的还原语音信息。

请参阅图4，图4示出了本申请实施例中一种声音回放方法的流程图，该方法可以应用于电子设备，该方法包括：

S310、存储所述还原语音信息。

S320、响应于回放操作，播放对应所述回放操作的还原语音信息。

得到还原语音信息之后，可以将其存储于电子设备的本地存储空间，在接收到用户发送的回放操作时，回放还原语音信息，便于用户多次收听还原语音信息，以实现对还原语音信息进行身份识别或信息获取等操作。

请参阅图5，图5示出了本申请实施例提出的一种假音识别装置的框图，该装置500包括：

语音获取模块510，用于获取待分析语音信息；

假音检测模块520，用于对所述待分析语音信息进行驻波检测，得到驻波信息，和/或，对所述待分析语音信息进行音域检测，得到音域信息；

识别结果获得模块530，用于将所述驻波信息和/或所述音域信息与对应的预设信息比对，得到所述待分析语音信息的假音识别结果。

请参阅图6，图6示出了本申请实施例提出的一种假音还原装置的框图，该装置600包括：

确定模块610，用于确定待处理假音信息的假音信息；

假音还原模块620，用于若所述假音信息与预设假音信息不匹配，则通过假音还原模型对所述待处理假音信息进行还原处理，得到还原语音信息；

输出模块630，用于输出所述还原语音信息。

可选地，所述假音信息包括声音频率信息，所述预设假音信息包括预设声音频率信息，所述假音还原模型包括声音频率还原模型；

假音还原模块620，还用于若所述声音频率信息与所述预设声音频率信息不匹配，则通过声音频率还原模型对所述待处理假音信息进行还原处理，得到还原语音信息。

可选地，装置600还包括：

第一更新模块，用于对所述还原语音信息进行音频调整操作，得到第一训练语音样本；基于所述第一训练语音样本以及所述还原语音信息，对所述声音频率还原模型进行训练，获得更新后的声音频率还原模型。

可选地，所述假音信息包括音调信息，所述预设音调信息包括预设音调信息，所述假音还原模型包括音调还原模型；

假音还原模块620，还用于若所述音调信息与所述预设音调信息不匹配，则通过所述音调还原模型对所述待处理假音信息进行还原处理，得到还原语音信息。

可选地，装置600还包括：

第二更新模块，用于对所述还原语音信息进行音调调整操作，得到第二训练语音样本；基于所述第二训练语音样本以及所述还原语音信息，对所述音调还原模型进行训练，获得更新后的音调还原模型。

可选地，装置600还包括：

回放模块，用于存储所述还原语音信息；响应于回放操作，播放对应所述回放操作的还原语音信息。

需要说明的是，本申请中装置实施例与前述方法实施例是相互对应的，装置实施例中具体的原理可以参见前述方法实施例中的内容，此处不再赘述。

参考图7，图7示出了本申请实施例提出的一种计算机可读存储介质的结构示意图。该计算机可读存储介质900中存储有程序代码，该程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质900可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质900包括非易失性计算机可读存储介质(non-transitory computer-readable storage medium)。计算机可读存储介质900具有执行上述方法中的任何方法步骤的程序代码910的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码910可以例如以适当形式进行压缩。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实现方式中描述的方法。

综上，本申请实施例提供的一种假音识别方法、假音还原方法、电子设备及存储介质，通过将待分析语音信息的驻波信息和/或音域信息与对应的预设信息进行比对，得到能反映待分析语音信息是否为假音的假音识别结果，从而实现了对待分析语音进行假音识别。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 音声识别装置、音声识别方法、存储音声识别程序的非暂时性计算机可读介质 [P] . 中国专利： CN110942770A . 2020-03-31
2. 室内多径假目标识别方法、装置、电子设备以及存储介质 [P] . 中国专利： CN111220959B . 2022-01-11
3. Performance tone providing apparatus, performance tone providing system, communication terminal for use in the system, performance tone providing method, program for implementing the method, and storage medium storing the program [P] . 美国专利： US2003177886A1 . 2003-09-25

机译：演奏音提供装置，演奏音提供系统，系统中使用的通信终端，演奏音提供方法，用于实现该方法的程序以及存储该程序的存储介质
4. METHOD AND APPARATUS FOR SELECTIVELY SENDING A FALSE SYSTEM INFORMATION TONE ON A TELEPHONE LINE [P] . CA2423396C . 2008-01-22

机译：在电话线上选择性发送假系统信息音的方法和装置
5. SYSTEM AND METHOD FOR AVOIDING FALSE CONVERGENCE IN THE PRESENCE OF TONES IN A TIME-DOMAIN ECHO CANCELLATION PROCESS [P] . 欧洲知识产权局专利： EP0829147B1 . 2007-09-26

机译：在时域回声消除过程中避免有音存在的假收敛的系统和方法