首页> 中国专利> 录音设备及利用该录音设备进行声音处理与录入的方法

录音设备及利用该录音设备进行声音处理与录入的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种录音设备，包括麦克风、声卡、A/D转换器、及声音处理单元。所述麦克风用于采集外界的声音数据，并将所采集的声音数据传送给声卡。所述A/D转换器用于将所采集的声音数据从模拟形式转换为数字形式。所述声音处理单元用于判断周围环境的变化，并根据周围环境的变化实时计算出录入声音强度的阈值，以在录音者的声音强度小于上述阈值时进行提醒。本发明还提供一种利用上述录音设备进行声音处理与录入的方法。本发明可以判断周围环境的变化，并根据周围环境的变化实时计算出录入声音强度的阈值，以在录音者的声音强度过小时进行提醒。

著录项

公开/公告号CN102376303A

专利类型发明专利
公开/公告日2012-03-14

原文格式PDF
申请/专利权人国基电子(上海)有限公司;鸿海精密工业股份有限公司;
展开▼

申请/专利号CN201010253228.3
发明设计人康宏;丁国治;吕启明;
展开▼

申请日2010-08-13
分类号G10L11/06(20060101);G11C7/16(20060101);
代理机构
代理人
地址 201613 上海市松江出口加工区南乐路1925号
入库时间 2023-12-18 04:38:40

法律信息

法律状态公告日

法律状态信息

法律状态
2018-03-13

专利权的转移 IPC(主分类):G10L25/93 登记生效日:20180224 变更前: 变更后: 变更前:

专利申请权、专利权的转移
2014-03-12

授权

授权
2012-04-25

实质审查的生效 IPC(主分类):G10L11/06 申请日:20100813

实质审查的生效
2012-03-14

公开

公开

说明书

技术领域

本发明涉及一种声音录入技术，特别是在噪音环境下进行声音处理与录入的录音设备及方法。

背景技术

随着科技的飞速发展，具有音频信息(例如声音)录入功能的电子产品越来越多的进入了我们的生产、生活和各种各样的社会活动实践。当前，对所录入的音频信息的质量要求越来越高。例如，重要社会活动中关键音频信息的任何录入失误均会导致无可挽回的重大损失。然而，音频录入的场所是随机的、无法预知的。不同场所的周围环境不同，因此，噪音的强度也是不同的。例如，办公室的噪音强度就会比大街或者生产车间的噪音强度小得多。

在办公室等噪音较小的安静的地方进行音频录入操作时，即使有效音频(例如录音者的声音)的强度(即音量)很小，所录入的音频信息的清晰度也会很高。然而，在大街或者生产车间等噪音较大的场所进行音频录入操作时，就需要有效音频的强度足够大，才能在录入的音频信息中分辨出无效音频(噪音)及有效音频(录音者的声音)。

通常，在音频录入的过程中，周围的环境可能会随时发生变化。例如，录音者可能会从较为安静的办公室走到了生产车间。虽然周围环境的噪音强度发生了变化，可是录音者却没有下意识地放大说话的音量，即增加有效音频的强度。如此，必然造成所录入的音频信息的质量下降，即在进入生产车间之后所录入的音频信息中不能清晰的分辨出无效音频(噪音)及有效音频(录音者的声音)。

发明内容

鉴于以上内容，有必要提供一种录音设备，其能判断周围环境的变化，并根据周围环境的变化实时计算出录入声音强度的阈值，以在录音者的声音强度过小时进行提醒。

此外，还有必要提供一种利用上述录音设备进行声音处理与录入的方法，其通过判断周围环境的变化，实时计算出录入声音强度的阈值，以在录音者的声音强度过小时进行提醒。

一种录音设备，用于进行声音处理与录入。该录音设备包括用于采集外界声音数据的麦克风及声音处理单元。该声音处理单元用于根据录音开始时周围初始环境的声音强度P1，及初始环境下录入声音强度的阈值T1、T2计算周围当前环境下录入声音强度的阈值，以实时更新上述阈值T1、T2，并当所采集的声音数据的强度小于当前环境下录入声音强度的阈值T2时，提示录入声音无效，及当所采集的声音数据的强度大于或者等于当前环境下录入声音强度的阈值T2时，将上述声音数据记录到一个存储单元中。

一种利用上述的录音设备进行声音处理与录入的方法，包括： (a)计算录音开始时周围初始环境的声音强度P1，并根据该初始环境的声音强度P1计算出该初始环境下录入声音强度的阈值T1及T2； (b)采集一段声音数据；(c)根据上述初始环境的声音强度P1，初始环境下录入声音强度的阈值T1、T2计算周围当前环境下录入声音强度的阈值，以更新上述阈值T1、T2；(d)当上述采集的声音数据的强度小于当前环境下录入声音强度的阈值T2时，提示录入声音无效，以告知录音者需要提高说话音量重新录音；及(e)当上述声音数据的强度大于或者等于当前环境下录入声音强度的阈值T2时，将上述声音数据记录到一个存储单元中。

本发明提供的录音设备及利用该录音设备进行声音处理与录入的方法可以判断周围环境的变化，并根据周围环境的变化实时计算出录入声音强度的阈值，以在录音者的声音强度过小时进行提醒。

附图说明

图1是本发明录音设备较佳实施例的硬件架构图。

图2是本发明录音设备较佳实施例中声音处理单元的功能模块图。

图3是本发明利用上述的录音设备进行声音处理与录入的方法较佳实施例的流程图。

图4是上述图3中步骤S14的子流程图。

主要元件符号说明

录音设备 1

麦克风 10

声卡 11

A/D转换器 12

声音处理单元 13

声音强度计算模块 130

数据计算模块 131

循环判断模块 132

筛选模块 133

计数模块 134

比较模块 135

阈值更新模块 136

提示模块 137

声音录入模块 138

声音排除模块 139

存储单元 14

中央处理器 15

服务器 2

具体实施方式

参阅图1所示，是本发明录音设备较佳实施例的硬件架构图。所述录音设备1可以是录音笔、手机、对讲机、或者电脑等。该录音设备1 包括麦克风10、声卡11、A/D转换器12、及声音处理单元13。所述的麦克风10用于采集外界的声音数据，并将所采集的声音数据传送给声卡11。所述的A/D转换器12用于将所采集的声音数据从模拟形式转换为数字形式。所述的声音处理单元13包括多个功能模块(详见图 2)，用于判断周围环境的变化，并根据周围环境的变化实时计算出录入声音强度的阈值，以在录音者的声音强度小于上述阈值时进行提醒。

此外，所述录音设备1还包括用于存储声音处理单元13中各功能模块的存储单元14，如硬盘等，以及用于执行声音处理单元13中各功能模块的中央处理器(central processing unit)15。

所述录音设备1与一台服务器2相连接，将所录入的声音数据传送给该服务器2，以使服务器2输出所录入的声音数据。

参阅图2所示，是本发明录音设备1较佳实施例中声音处理单元 13的功能模块图。所述声音处理单元13包括声音强度计算模块130、数据计算模块131、循环判断模块132、筛选模块133、计数模块 134、比较模块135、阈值更新模块136、提示模块137、声音录入模块 138、及声音排除模块139。

所述的声音强度计算模块130用于计算录音开始时周围初始环境的声音强度P1，以及在录音过程中每间隔一个固定的时间S秒，计算周围当前环境的声音强度P2，从而得到多个P2。本实施例，所述S秒为0.167秒。

所述的数据计算模块131用于根据上述初始环境的声音强度P1计算出该初始环境下录入声音强度的阈值T1及T2。所述 T1＝P1+δ_speak。所述T2＝P1+δ_silence。其中，δ_speak与δ_silence 是两个预设值，分别代表在正常情况下，录音者的声音的最大分贝值与最小分贝值。本实施例中，所述δ_speak为11，所述δ_silence为5。进一步的，该数据计算模块131还用于计算每一个P2与T1之间的差的绝对值，即|P2-T1|的值。

所述的循环判断模块132用于判断上述声音强度计算模块130计算P2的次数是否到达了n次，并在没有达到n次的情况下，通知声音强度计算模块130间隔S秒后，继续计算当前环境的声音强度P2。本实施例中，所述n为30。

所述的筛选模块133用于当上述声音强度计算模块130计算P2的次数到达了n次的情况下，筛选出所有使得|P2-T1|的值大于一个常量C 的每一个声音强度P2。本实施例，所述常量C为6。

所述的计数模块134用于计算出使得|P2-T1|的值大于所述常量C 的声音强度P2的个数count。

所述的比较模块135用于将上述count与n/2的值相比较，确定是否count＞＝n/2，以判断周围当前环境相较于周围初始环境是否发生了变化。如上所述，本实施例中，n为30。

所述的阈值更新模块136用于当周围当前环境相较于周围初始环境发生变化时，即count＞＝n/2时，计算出使得|P2-T1|的值大于所述常量C的所有声音强度P2的和sum，由此计算出周围当前环境的声音强度P3，并根据该声音强度P3计算出当前环境下的录入声音强度的阈值，以更新录入声音强度的阈值T1、T2。本实施例中，所述 P3＝sum/count。因此，更新后所述T1＝P3+δ_speak， T2＝P3+δ_silence。此外，所述的阈值更新模块136还用于当周围当前环境相较于周围初始环境没有发生变化时，即count＜n/2时，将上述初始环境下录入声音强度的阈值T1、T2作为出当前环境下的录入声音强度的阈值。

所述的提示模块137用于将所采集的声音数据的强度与上述T2进行比较，当所采集的声音数据的强度小于T2时，提示该采集的声音数据无效，以告知录音者需要提高说话音量重新录音。

所述的声音录入模块138用于当所采集的声音数据的强度大于或者于T2时，将该声音数据存储于存储单元14中。

所述的声音排除模块139用于将存储于存储单元14中的声音数据的字长与一个预定的长度值length相比较，并于该声音数据的字长大于所述预定的长度值length时，将该声音数据从存储单元14中删除。本实施例中，所述length＝80k。应该可以了解，人类的语言是由各个片段组成。例如，当某个人说一句很长的话时，该人不可能一口气将该句话讲完，而一定会在间隔一段时间后停顿一下。根据经验值，该间隔的时间为5秒钟。而在正常语速下，每秒钟说话的字长也是一定的。根据经验值，每秒钟说话的字长为16k。因此，可以计算得出，正常情况下，某一段声音数据的字长大约是80k(5*16k)。因此，当存储于存储单元14中的声音数据的字长太长，例如大于80k时，可以认定该声音数据并不是有效的声音数据。

参阅图3所示，是本发明利用上述的录音设备进行声音处理与录入的方法较佳实施例的流程图。

步骤S10，声音处理单元13计算周围初始环境的声音强度P1，并根据该声音强度P1得到该初始环境下录入声音强度的阈值T1、T2。所述T1＝P1+δ_speak。所述T2＝P1+δ_silence。其中，δ_speak与 δ_silence是两个预设值，分别代表在正常情况下，录音者的声音的最大分贝值与最小分贝值。本实施例中，所述δ_speak为11，所述 δ_silence为5。

步骤S11，录音者利用录音设备1开始执行声音录入操作。

步骤S12，麦克风10采集一段声音数据，并将该声音数据传送给声卡11。

步骤S13，A/D转换器12将上述声音数据从模拟形式转换为数字形式。

步骤S14，声音处理单元13根据上述初始环境的声音强度P1，初始环境下录入声音强度的阈值T1、T2计算周围当前环境下录入声音强度的阈值，以更新上述阈值T1、T2。该步骤的详细流程图请参见下述的图4。

步骤S15，声音处理单元13判断上述声音数据的强度是否大于当前环境下录入声音强度的阈值T2。当上述声音数据的强度小于当前环境下录入声音强度的阈值T2时，流程进入步骤S16。否则，当上述声音数据的强度大于或者等于当前环境下录入声音强度的阈值T2时，流程进入步骤S17。

在步骤S16中，声音处理单元13停止此段声音数据的录入操作，及/或者提示录入声音无效，以告知录音者需要提高说话音量重新录音。

在步骤S17中，声音处理单元13将上述声音数据记录到存储单元 14中。

步骤S18，声音处理单元13判断上述声音数据的长度是否大于一个预定的长度值length。本实施例中，所述length＝80k。应该可以了解，人类的语言是由各个片段组成。例如，当某个人说一句很长的话时，该人不可能一口气将该句话讲完，而一定会在间隔一段时间后停顿一下。根据经验值，该间隔的时间为5秒钟。而在正常语速下，每秒钟说话的字长也是一定的。根据经验值，每秒钟说话的字长为16k。因此，可以计算得出，正常情况下，某一段声音数据的字长大约是80k (5*16k)。因此，当存储于存储单元14中的声音数据的字长太长，例如大于80k时，可以认定该声音数据并不是有效的声音数据。当上述声音数据的长度大于所述预定的长度值length时，流程进入步骤S 19 及S20。否则，若上述声音数据的长度小于或者等于所述预定的长度值 length时，流程进入步骤S21。

在步骤S19，声音处理单元13从存储单元14中删除上述声音数据，并于步骤S20中，声音处理单元13提示声音录入无效。

在步骤S21中，存储单元14将存储于其中的声音数据传送给服务器2。

步骤S22，麦克风10判断声音录入操作是否结束。若声音录入操作没有结束，则流程返回步骤S12。否则，若声音录入操作结束，则流程进入步骤S23。

在步骤S23中，服务器2输出所录入的声音。

参阅图4所示，是上述图3中步骤S14的子流程图。

步骤S140，声音处理单元13计算出周围当前环境的声音强度 P2。

步骤S141，声音处理单元13计算出|P2-T1|的值。

步骤S142，声音处理单元13判断声音强度P2是否已经计算了n 次。本实施例中，所述n为30。当声音强度P2没有计算n次时，间隔 S秒后返回步骤S140，以得到n个声音强度P2。本实施例中，所述S 秒为0.167秒。否则，当声音强度P2已经计算了n次的情况下，流程进入步骤S143。

在步骤S143中，声音处理单元13筛选出使得|P2-T1|的值大于一个常量C的每一个声音强度P2。

步骤S144，声音处理单元13计算出使得|P2-T1|的值大于所述常量 C的所有声音强度P2的个数count。

步骤S145，声音处理单元13判断是否count＞＝n/2。如上所述，n 为30。当count＜n/2时，流程进入步骤S 146。否则，在count＞＝n/2的情况下，流程进入步骤S147。

在步骤S146中，声音处理单元13判断周围当前环境相较于周围初始环境没有发生变化，因此将上述初始环境下录入声音强度的阈值 T1、T2作为当前环境下的录入声音强度的阈值。

在步骤S147中，声音处理单元13判断周围当前环境相较于周围初始环境发生了变化，计算出使得|P2-T1|的值大于所述常量C的所有声音强度P2的和sum，并计算出周围当前环境的声音强度 P3＝sum/count。

步骤S148，声音处理单元13根据上述计算出来的声音强度P3计算出当前环境下的录入声音强度的阈值T1、T2。其中，所述 T1＝P3+δ_speak。所述T2＝P3+δ_silence。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 录音设备及利用该录音设备进行声音处理与录入的方法 [P] . 中国专利： CN102376303B . 2014.03.12
2. 录音设备及利用该录音设备进行声音处理与录入的方法 [P] . 中国专利： CN102376303A . 2012-03-14
3. SOUND PROCESSOR AND RECORDING DEVICE [P] . 日本专利： JP2009276528A . 2009-11-26

机译：声音处理器和录音设备
4. TIMBER RECORDING METHOD, AUDIO EQUIPMENT AND TIMER RECORDING METHOD OF AUDIO EQUIPMENT [P] . 日本专利： JPH11306615A . 1999-11-05

机译：录音设备的声音记录方法，录音设备和定时记录方法
5. MOVES ABSORBING SUSPENSION SYSTEM BACK PLAYING FOR RECORDING EQUIPMENT. [P] . NL8401832A . 1985-01-16

机译：将吸收式悬挂系统进行回放，以进行录音设备的回放。