首页> 中国专利> 一种跟读模式语音采集方法、系统、设备和存储介质

一种跟读模式语音采集方法、系统、设备和存储介质

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明提供一种跟读模式语音采集方法、系统、设备和存储介质。该方法包括：步骤1：录入被采集人员的身份信息；步骤2：在本地跟读模板库中选择跟读模板，调用跟读模板界面，在所述界面上播放跟读语音内容并展示跟读语音波形和跟读字幕，以供被采集人员通过头戴式耳机收听所述跟读语音内容并进行跟读；步骤3：实时接收USB拾音器发送的被采集人员的跟读语音信息，检测所述跟读语音信息的语音质量和语音时长是否符合要求，若符合要求，则保存所述被采集人员的身份信息和跟读语音信息。本发明旨在解决特殊情况下(例如遇到被采集人员不识字的情况)的语音采集问题。

著录项

公开/公告号CN112684999A

专利类型发明专利
公开/公告日2021-04-20

原文格式PDF
申请/专利权人中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院;
展开▼

申请/专利号CN202011538558.7
发明设计人杨绪魁;闫红刚;李静涛;牛铜;何振华;陈琦;魏雪娟;
展开▼

申请日2020-12-23
分类号G06F3/16(20060101);G06F16/61(20190101);
代理机构41111 郑州大通专利商标代理有限公司;
代理人张立强
地址 450000 河南省郑州市高新区科学大道62号
入库时间 2023-06-19 10:41:48

说明书

技术领域

本发明涉及公安语音采集技术领域，尤其涉及一种跟读模式语音采集方法、系统、设备和存储介质。

背景技术

随着经济社会的发展，电信诈骗案件呈逐年上升趋势，公安部门为了应对这种非接触性、隐蔽性和跨区域性的作案特点，需要借助一种新型的技术手段来辅助侦破，声纹库的建设被提上日程。每个人的声音中都包含各自独特的生物特征声纹信息，通过声纹的提取和鉴别，实现犯罪分子的身份排查和确认，很大程度上辅助案件的侦破工作。

声纹库建设的前提条件是语音采集，通过采集大量不同人员的声音，建立基础声纹库，用采集到的未知声音与基础声纹库中的海量声纹进行比对，从而确定未知声音的身份。

语音采集的场景一般是在一个相对安静的环境下，准备一套采集装置和设备，为被采集人员提供纸质或电子文本，被采集人朗读两分钟有效时长后完成采集，因为每句话之间会有间隔时间，采集过程会大于两分钟。但在实际的采集过程中，会出现被采集人员不识字的情况，对一个不识字的人员来讲，不能朗读文本，持续进行两分钟以上的采集会变得十分困难，而且在采集的过程中不能出现第二个人的声音，也就意味着采集工作人员不能提示，如果采集过程中出现了问题还要重来一遍，因为要建立基础的声纹库，被采集人员的采集任务还不能被忽略，这种特殊情况成为困扰基础采集工作人员的棘手问题。对于这种情况，亟需一种高效切实可行的采集方法，既能解决特殊人员的采集问题，又能让采集语音符合时长和质量要求。

发明内容

针对在被采集人员不识字，现有的语音采集方法无法进行语音采集的问题，本发明提供一种跟读模式语音采集方法、系统、设备和存储介质，高效解决特殊情况下的语音采集问题。

第一方面，本发明提供一种跟读模式语音采集方法，包括：

步骤1：录入被采集人员的身份信息；

步骤2：在本地跟读模板库中选择跟读模板，调用跟读模板界面，在所述界面上播放跟读语音内容并展示跟读语音波形和跟读字幕，以供被采集人员通过头戴式耳机收听所述跟读语音内容并进行跟读；

步骤3：实时接收USB拾音器发送的被采集人员的跟读语音信息，检测所述跟读语音信息的语音质量和语音时长是否符合要求，若符合要求，则保存所述被采集人员的身份信息和跟读语音信息。

进一步地，还包括：创建若干个跟读模板，形成本地跟读模板库，其中，所述跟读模板的创建过程包括：

提示用户录入待创建跟读模板的标题和跟读文本；其中，所述跟读文本分行录入，每行不超过15个字符；

在所述跟读文本录入完成之后，生成所述跟读文本的跟读语音；其中，相邻两行的跟读文本所对应的相邻两句跟读语音之间预留有时间间隔；

根据所述跟读语音和所述跟读文本生成跟读字幕，所述标题、跟读字幕和所述跟读语音构成一个新的跟读模板。

进一步地，在创建跟读模板之前，还包括：

提示用户输入用户账号和用户密码，并判断输入的用户账号和用户密码是否相匹配，若正确匹配，认为用户具有跟读模板管理权限，则继续创建跟读模板。

第二方面，本发明提供一种跟读模式语音采集系统，包括：

人员信息录入模块，用于录入被采集人员的身份信息；

跟读模板调用模块，用于在本地跟读模板库中选择跟读模板，调用跟读模板界面，在所述界面上播放跟读语音内容并展示跟读语音波形和跟读字幕，以供被采集人员通过头戴式耳机收听所述跟读语音内容并进行跟读；

音频采集管理模块，用于实时接收USB拾音器发送的被采集人员的跟读语音信息，检测所述跟读语音信息的语音质量和语音时长是否符合要求，若符合要求，则保存所述被采集人员的身份信息和跟读语音信息。

进一步地，还包括：跟读模板管理模块，用于在本地跟读模板库中创建、删除、修改和查询跟读模板；其中，跟读模板的创建过程包括：

提示用户录入待创建跟读模板的标题和跟读文本；其中，所述跟读文本分行录入，每行不超过15个字符；

在所述跟读文本录入完成之后，生成所述跟读文本的跟读语音；其中，相邻两行的跟读文本所对应的相邻两句跟读语音之间预留有时间间隔；

根据所述跟读语音和所述跟读文本生成跟读字幕，所述标题、跟读字幕和所述跟读语音构成一个新的跟读模板。

第三方面，本发明提供一种跟读模式语音采集设备，包括：USB拾音器、头戴式耳机和上述的跟读模式语音采集系统；

通过所述头戴式耳机收听所述跟读模式语音采集系统播放的跟读语音内容；

通过所述USB拾音器接收被采集人员的跟读语音信息，并将所述跟读语音信息发送至所述跟读模式语音采集系统。

第四方面，本发明提供一种计算机存储介质，所述存储介质上存储有指令，当所述指令被计算机运行时，使得计算机执行上述的跟读模式语音采集方法。

本发明的有益效果：

本发明实施例提供的跟读模式语音采集方法，旨在解决特殊情况下的语音采集问题，遇到被采集人员不识字的情况，根据具体的采集场景，选择相应的跟读模板，通过头戴式耳机音频播放设备播放准备好的跟读音频，被采集人听到以后，跟读听到的每句播放内容，USB拾音器接收到采集被采集人员的语音信息以后，输出到跟读模式语音采集系统，跟读模式语音采集系统若判断得知语音信息的音频质量和时长符合要求，则对被采集人员的身份信息和语音信息进行保存，完成此次采集过程。

附图说明

图1为本发明实施例提供的一种跟读模式语音采集方法的流程示意图；

图2为本发明实施例提供的创建跟读模板的流程示意图；

图3为本发明实施例提供的一种跟读模式语音采集系统的结构框图；

图4为本发明实施例提供的一种跟读模式语音采集设备的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1所示，本发明实施例提供一种跟读模式语音采集方法，包括以下步骤：

S101：在跟读模式语音采集系统中录入被采集人员的身份信息；

具体地，身份信息可以是被采集人员的姓名、性别和身份证号等信息；录入身份信息的目的是为了后续步骤便于把被采集人员的身份信息和声音信息进行对应。可以理解的是，录入重复的身份信息会被提示。

S102：在跟读模式语音采集系统的本地跟读模板库中选择跟读模板，调用跟读模板界面，在所述界面上播放跟读语音内容并展示跟读语音波形和跟读字幕，以供被采集人员通过头戴式耳机收听所述跟读语音内容并进行跟读；

S103：跟读模式语音采集系统实时接收USB拾音器发送的被采集人员的跟读语音信息，检测所述跟读语音信息的语音质量和语音时长是否符合要求，若符合要求，则保存所述被采集人员的身份信息和跟读语音信息。

本发明实施例提供的跟读模式语音采集方法，旨在解决特殊情况下的语音采集问题，遇到被采集人员不识字的情况，根据具体的采集场景，选择相应的跟读模板(例如，被采集人员为四川人，则可以选择四川方言的跟读模板)，通过头戴式耳机音频播放设备播放准备好的跟读音频，被采集人听到以后，跟读听到的每句播放内容，USB拾音器接收到采集被采集人员的语音信息以后，输出到跟读模式语音采集系统，跟读模式语音采集系统若判断得知语音信息的音频质量和时长符合要求，则对被采集人员的身份信息和语音信息进行保存，完成此次采集过程。

实施例2

在上述实施例1的基础上，本发明实施例还提供一种跟读模式语音采集方法，与上述实施例的不同之处在于，本发明实施例提供了本地跟读模板库的构建方式，具体包括：创建若干个跟读模板，形成本地跟读模板库；

具体地，根据实际情况进行创建，例如可涉及各个行业和领域，包括各种方言和普通话类型等，尽量覆盖多种应用场景。

其中，如图2所示，所述跟读模板的创建过程包括：

S201：提示用户录入待创建跟读模板的标题和跟读文本；其中，所述跟读文本分行录入，每行不超过15个字符；

具体地，在录入跟读文本时，尽量选择简单不拗口的内容，以便于被采集人员听清播放的语音内容。由于在后续生成跟读语音时，是根据录入的多行跟读文本合成而来，因此，通过限定每行文本的字符数，可以确保每句语音都能够使得被采集人员有足够的反应时间跟读。

S202：在所述跟读文本录入完成之后，生成所述跟读文本的跟读语音；其中，相邻两行的跟读文本所对应的相邻两句跟读语音之间预留有时间间隔；

具体地，时间间隔的时长可以由上一句语音的长度决定，若上一句语音长度较长，则预留较长时间间隔，以供被采集人员做好下一句语音的跟读准备。

S203：根据所述跟读语音和所述跟读文本生成跟读字幕，所述标题、跟读字幕和所述跟读语音构成一个新的跟读模板。

可以理解的是，可以设置跟读模板管理的用户权限，只有具有权限的用户才能管理跟读模板，例如对跟读模板进行创建、删除、修改和查询等。

因此，作为一种可实施方式，在创建跟读模板之前，还包括：提示用户输入用户账号和用户密码，并判断输入的用户账号和用户密码是否相匹配，若正确匹配，认为用户具有跟读模板管理权限，则继续创建跟读模板。

实施例3

如图3所示，本发明实施例提供一种跟读模式语音采集系统，包括：人员信息录入模块、跟读模板管理模块、跟读模板调用模块和音频采集管理模块；其中：

人员信息录入模块，用于录入被采集人员的身份信息；

跟读模板管理模块，用于在本地跟读模板库中创建、删除、修改和查询跟读模板；

音频采集管理模块，用于实时接收USB拾音器发送的被采集人员的跟读语音信息，检测所述跟读语音信息的语音质量和语音时长是否符合要求，若符合要求，则保存所述被采集人员的身份信息和跟读语音信息

作为一种可实施方式，跟读模板的创建过程包括：提示用户录入待创建跟读模板的标题和跟读文本；其中，所述跟读文本分行录入，每行不超过15个字符；在所述跟读文本录入完成之后，生成所述跟读文本的跟读语音；其中，相邻两行的跟读文本所对应的相邻两句跟读语音之间预留有时间间隔；根据所述跟读语音和所述跟读文本生成跟读字幕，所述标题、跟读字幕和所述跟读语音构成一个新的跟读模板。

实施例4

如图4所示，本发明实施例提供一种跟读模式语音采集设备，其特征在于，包括：USB拾音器、头戴式耳机和上述实施例中的跟读模式语音采集系统；

通过所述头戴式耳机收听所述跟读模式语音采集系统播放的跟读语音内容；

具体地，头戴式耳机为语音播放设备，通过3.5毫米语音播放口与计算机设备相连接，用于播放跟读模式语音采集系统的跟读模板音频，头戴式耳机对被采集人员耳朵具有很好的包裹功能，最大限度的隔绝外界对被采集人员的干扰。

需要注意的是，为了避免对USB拾音器的声音采集有影响，只需将头戴式耳机的音频播放接口与计算机设备相连接，其音频输入接口不需与计算机设备相连接。另外，对头戴式耳机的播放音量要有所控制，音量不能过大，避免头戴式耳机播放的声音被USB拾音器采集，影响采集质量。可以理解的是，头戴式耳机也可以采用蓝牙耳机，通过蓝牙通信与计算机设备相连接。

通过所述USB拾音器接收被采集人员的跟读语音信息，并将所述跟读语音信息发送至所述跟读模式语音采集系统。

具体地，USB拾音器为语音采集设备，使用多麦克风阵列技术，用来对声场的空间特性采样并处理，具备高精度、高品质录音功能。内置降噪算法，实现回声抑制、混响抑制及语音增强，且对人声语谱无明显影响。USB拾音器有效采集距离大于1米，采用USB插口，免驱动安装即插即用，连接计算机设备的USB接口以后，有指示灯显示设备处于通电状态，通过USB拾音器可以采集高保真的语音数据，最大程度保留每个人的声纹特征。

采用本发明实施例提供的跟读模式语音采集设备的进行语音采集的工作过程如下：

(1)在计算机设备上安装跟读模式语音采集系统(例如安装在电脑windows操作系统下)，将USB拾音器插入计算机设备上的USB接口，将头戴式耳机播放接口插入计算机设备的音频输出口；

(2)输入用户账号和用户密码，登录跟读模式语音采集系统；

具体地，由于系统界面会显示头戴式耳机和USB拾音器的连接状态，例如正常连接、异常连接和未连接系统，因此，登录成功后，可以先查看下它们的连接状态，确保连接状态正常。

(3)登录成功后，首先，通过跟读模式语音采集系统录入被采集人员的身份信息；然后，在本地跟读模板库中选择跟读模板，调用跟读模板界面，在所述界面上播放跟读语音内容并展示跟读字幕；

具体地，一般根据跟读模板的标题选择跟读模板。由于跟读字幕根据跟读语音生成，因此二者具有时间上的对应关系，拖动跟读语音，跟读字幕会做相应的调整。可以理解，采集工作人员可以根据跟读字幕查看跟读状态。此外，在跟读模板调用界面上，设置有音频播放控制操作，具有播放、暂停和拖动播放等功能。

(4)界面上播放的跟读语音内容通过计算机设备的音频输出口进入被采集人员的头戴式耳机中，供被采集人员收听。

(5)被采集人员通过头戴式耳机收听到跟读语音内容后，对听到的每句话进行跟读，USB拾音器对被采集人员的语音进行采集，并把接收到的语音信息输出到跟读模式语音采集系统中，跟读模式语音采集系统的跟读模板调用界面上会展示被采集人员的跟读语音波形。

具体地，被采集人员戴上头戴式耳机以后，可以先播放一些测试音频，保证耳机有声音输出；并调整头戴式耳机的播放音频的音量大小，保证被采集人员可以清晰听到，而且不被USB拾音器所接收。在准备就绪后，就可以开始播放跟读模板。可以理解，在采集过程中尽量保持安静，避免杂音被USB拾音器采集进来。

(6)跟读模式语音采集系统实时接收USB拾音器发送的被采集人员的跟读语音信息，检测所述跟读语音信息的语音质量和语音时长是否符合要求，若符合要求，则保存所述被采集人员的身份信息和跟读语音信息，完成本次采集过程。若不符合要求，则按照上述过程，再次采集即可。

具体地，跟读模式语音采集系统在采集过程中，会对采集到的音频质量进行实时判断，对语音数据录音时长、信噪比、平均能量等信息进行比对，如果音频不符合设定条件则进行提示；而且跟读模式语音采集系统具有实时判断说话人数的功能，因此在录制一个人声音的时候不能出现多人的声音。在语音有效时长录制满足要求以后，可以结束本次采集，结束本次采集以后，跟读模式语音采集系统会把被采集人员的身份信息和跟读音频信息进行关联并保存。其中，音频信息会生成WAV格式保存到系统中，可以后续进行播放、删除和下载等操作。

本发明实施例还提供一种计算机存储介质，所述存储介质上存储有指令，当所述指令被计算机运行时，使得计算机执行本发明上述实施例提供的跟读模式语音采集方法。

可以理解，所述计算机存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、电载波信号和电信信号等。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种跟读模式语音采集方法、系统、设备和存储介质 [P] . 中国专利： CN112684999A . 2021-04-20
2. 一种语音交互设备的语音采集方法、系统及存储介质 [P] . 中国专利： CN108010518A . 2018-05-08
3. INFORMATION ACQUISITION DEVICE, INFORMATION COLLECTING DEVICE, INFORMATION ACQUISITION METHOD, INFORMATION COLLECTING METHOD, PROGRAM, STORAGE MEDIUM, AND INFORMATION COLLECTING SYSTEM [P] . 日本专利： JP2007265378A . 2007-10-11

机译：信息采集设备，信息采集设备，信息采集方法，信息采集方法，程序，存储介质和信息采集系统
4. VOICE SIGNAL ACQUISITION METHOD AND APPARATUS, ELECTRONIC DEVICE, AND STORAGE MEDIUM [P] . WO2021114953A1 . 2021-06-17

机译：语音信号采集方法和装置，电子设备和存储介质
5. VOICE SYNTHESIZING SYSTEM, VOICE SYNTHESIZING METHOD, SERVER, STORAGE MEDIUM, PROGRAM TRANSMITTING DEVICE, VOICE SYNTHETIC DATA STORAGE MEDIUM AND VOICE OUTPUTTING EQUIPMENT [P] . 日本专利： JP2002023777A . 2002-01-25

机译：语音合成系统，语音合成方法，服务器，存储介质，程序传输设备，语音合成数据存储介质和语音输出设备