首页> 中国专利> 录音设备及利用该录音设备进行声音处理与录入的方法

录音设备及利用该录音设备进行声音处理与录入的方法

摘要

本发明提供一种录音设备,包括麦克风、声卡、A/D转换器、及声音处理单元。所述麦克风用于采集外界的声音数据,并将所采集的声音数据传送给声卡。所述A/D转换器用于将所采集的声音数据从模拟形式转换为数字形式。所述声音处理单元用于判断周围环境的变化,并根据周围环境的变化实时计算出录入声音强度的阈值,以在录音者的声音强度小于上述阈值时进行提醒。本发明还提供一种利用上述录音设备进行声音处理与录入的方法。本发明可以判断周围环境的变化,并根据周围环境的变化实时计算出录入声音强度的阈值,以在录音者的声音强度过小时进行提醒。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-13

    专利权的转移 IPC(主分类):G10L25/93 登记生效日:20180224 变更前: 变更后: 变更前:

    专利申请权、专利权的转移

  • 2014-03-12

    授权

    授权

  • 2012-04-25

    实质审查的生效 IPC(主分类):G10L11/06 申请日:20100813

    实质审查的生效

  • 2012-03-14

    公开

    公开

说明书

技术领域

本发明涉及一种声音录入技术,特别是在噪音环境下进行声音处理 与录入的录音设备及方法。

背景技术

随着科技的飞速发展,具有音频信息(例如声音)录入功能的电子 产品越来越多的进入了我们的生产、生活和各种各样的社会活动实践。 当前,对所录入的音频信息的质量要求越来越高。例如,重要社会活动 中关键音频信息的任何录入失误均会导致无可挽回的重大损失。然而, 音频录入的场所是随机的、无法预知的。不同场所的周围环境不同,因 此,噪音的强度也是不同的。例如,办公室的噪音强度就会比大街或者 生产车间的噪音强度小得多。

在办公室等噪音较小的安静的地方进行音频录入操作时,即使有效 音频(例如录音者的声音)的强度(即音量)很小,所录入的音频信息 的清晰度也会很高。然而,在大街或者生产车间等噪音较大的场所进行 音频录入操作时,就需要有效音频的强度足够大,才能在录入的音频信 息中分辨出无效音频(噪音)及有效音频(录音者的声音)。

通常,在音频录入的过程中,周围的环境可能会随时发生变化。例 如,录音者可能会从较为安静的办公室走到了生产车间。虽然周围环境 的噪音强度发生了变化,可是录音者却没有下意识地放大说话的音量, 即增加有效音频的强度。如此,必然造成所录入的音频信息的质量下 降,即在进入生产车间之后所录入的音频信息中不能清晰的分辨出无效 音频(噪音)及有效音频(录音者的声音)。

发明内容

鉴于以上内容,有必要提供一种录音设备,其能判断周围环境的变 化,并根据周围环境的变化实时计算出录入声音强度的阈值,以在录音 者的声音强度过小时进行提醒。

此外,还有必要提供一种利用上述录音设备进行声音处理与录入的 方法,其通过判断周围环境的变化,实时计算出录入声音强度的阈值, 以在录音者的声音强度过小时进行提醒。

一种录音设备,用于进行声音处理与录入。该录音设备包括用于采 集外界声音数据的麦克风及声音处理单元。该声音处理单元用于根据录 音开始时周围初始环境的声音强度P1,及初始环境下录入声音强度的 阈值T1、T2计算周围当前环境下录入声音强度的阈值,以实时更新上 述阈值T1、T2,并当所采集的声音数据的强度小于当前环境下录入声 音强度的阈值T2时,提示录入声音无效,及当所采集的声音数据的强 度大于或者等于当前环境下录入声音强度的阈值T2时,将上述声音数 据记录到一个存储单元中。

一种利用上述的录音设备进行声音处理与录入的方法,包括: (a)计算录音开始时周围初始环境的声音强度P1,并根据该初始环境 的声音强度P1计算出该初始环境下录入声音强度的阈值T1及T2; (b)采集一段声音数据;(c)根据上述初始环境的声音强度P1,初 始环境下录入声音强度的阈值T1、T2计算周围当前环境下录入声音强 度的阈值,以更新上述阈值T1、T2;(d)当上述采集的声音数据的 强度小于当前环境下录入声音强度的阈值T2时,提示录入声音无效, 以告知录音者需要提高说话音量重新录音;及(e)当上述声音数据的 强度大于或者等于当前环境下录入声音强度的阈值T2时,将上述声音 数据记录到一个存储单元中。

本发明提供的录音设备及利用该录音设备进行声音处理与录入的方 法可以判断周围环境的变化,并根据周围环境的变化实时计算出录入声 音强度的阈值,以在录音者的声音强度过小时进行提醒。

附图说明

图1是本发明录音设备较佳实施例的硬件架构图。

图2是本发明录音设备较佳实施例中声音处理单元的功能模块图。

图3是本发明利用上述的录音设备进行声音处理与录入的方法较佳 实施例的流程图。

图4是上述图3中步骤S14的子流程图。

主要元件符号说明

录音设备          1

麦克风            10

声卡              11

A/D转换器         12

声音处理单元      13

声音强度计算模块  130

数据计算模块      131

循环判断模块      132

筛选模块          133

计数模块          134

比较模块          135

阈值更新模块      136

提示模块          137

声音录入模块      138

声音排除模块      139

存储单元          14

中央处理器        15

服务器            2

具体实施方式

参阅图1所示,是本发明录音设备较佳实施例的硬件架构图。所述 录音设备1可以是录音笔、手机、对讲机、或者电脑等。该录音设备1 包括麦克风10、声卡11、A/D转换器12、及声音处理单元13。所述 的麦克风10用于采集外界的声音数据,并将所采集的声音数据传送给 声卡11。所述的A/D转换器12用于将所采集的声音数据从模拟形式转 换为数字形式。所述的声音处理单元13包括多个功能模块(详见图 2),用于判断周围环境的变化,并根据周围环境的变化实时计算出录 入声音强度的阈值,以在录音者的声音强度小于上述阈值时进行提醒。

此外,所述录音设备1还包括用于存储声音处理单元13中各功能 模块的存储单元14,如硬盘等,以及用于执行声音处理单元13中各功 能模块的中央处理器(central processing unit)15。

所述录音设备1与一台服务器2相连接,将所录入的声音数据传送 给该服务器2,以使服务器2输出所录入的声音数据。

参阅图2所示,是本发明录音设备1较佳实施例中声音处理单元 13的功能模块图。所述声音处理单元13包括声音强度计算模块130、 数据计算模块131、循环判断模块132、筛选模块133、计数模块 134、比较模块135、阈值更新模块136、提示模块137、声音录入模块 138、及声音排除模块139。

所述的声音强度计算模块130用于计算录音开始时周围初始环境 的声音强度P1,以及在录音过程中每间隔一个固定的时间S秒,计算 周围当前环境的声音强度P2,从而得到多个P2。本实施例,所述S秒 为0.167秒。

所述的数据计算模块131用于根据上述初始环境的声音强度P1计 算出该初始环境下录入声音强度的阈值T1及T2。所述 T1=P1+δ_speak。所述T2=P1+δ_silence。其中,δ_speak与δ_silence 是两个预设值,分别代表在正常情况下,录音者的声音的最大分贝值与 最小分贝值。本实施例中,所述δ_speak为11,所述δ_silence为5。 进一步的,该数据计算模块131还用于计算每一个P2与T1之间的差 的绝对值,即|P2-T1|的值。

所述的循环判断模块132用于判断上述声音强度计算模块130计 算P2的次数是否到达了n次,并在没有达到n次的情况下,通知声音 强度计算模块130间隔S秒后,继续计算当前环境的声音强度P2。本 实施例中,所述n为30。

所述的筛选模块133用于当上述声音强度计算模块130计算P2的 次数到达了n次的情况下,筛选出所有使得|P2-T1|的值大于一个常量C 的每一个声音强度P2。本实施例,所述常量C为6。

所述的计数模块134用于计算出使得|P2-T1|的值大于所述常量C 的声音强度P2的个数count。

所述的比较模块135用于将上述count与n/2的值相比较,确定是 否count>=n/2,以判断周围当前环境相较于周围初始环境是否发生了 变化。如上所述,本实施例中,n为30。

所述的阈值更新模块136用于当周围当前环境相较于周围初始环 境发生变化时,即count>=n/2时,计算出使得|P2-T1|的值大于所述常 量C的所有声音强度P2的和sum,由此计算出周围当前环境的声音强 度P3,并根据该声音强度P3计算出当前环境下的录入声音强度的阈 值,以更新录入声音强度的阈值T1、T2。本实施例中,所述 P3=sum/count。因此,更新后所述T1=P3+δ_speak, T2=P3+δ_silence。此外,所述的阈值更新模块136还用于当周围当前 环境相较于周围初始环境没有发生变化时,即count<n/2时,将上述初 始环境下录入声音强度的阈值T1、T2作为出当前环境下的录入声音强 度的阈值。

所述的提示模块137用于将所采集的声音数据的强度与上述T2进 行比较,当所采集的声音数据的强度小于T2时,提示该采集的声音数 据无效,以告知录音者需要提高说话音量重新录音。

所述的声音录入模块138用于当所采集的声音数据的强度大于或 者于T2时,将该声音数据存储于存储单元14中。

所述的声音排除模块139用于将存储于存储单元14中的声音数据 的字长与一个预定的长度值length相比较,并于该声音数据的字长大 于所述预定的长度值length时,将该声音数据从存储单元14中删除。 本实施例中,所述length=80k。应该可以了解,人类的语言是由各个 片段组成。例如,当某个人说一句很长的话时,该人不可能一口气将该 句话讲完,而一定会在间隔一段时间后停顿一下。根据经验值,该间隔 的时间为5秒钟。而在正常语速下,每秒钟说话的字长也是一定的。根 据经验值,每秒钟说话的字长为16k。因此,可以计算得出,正常情况 下,某一段声音数据的字长大约是80k(5*16k)。因此,当存储于存 储单元14中的声音数据的字长太长,例如大于80k时,可以认定该声 音数据并不是有效的声音数据。

参阅图3所示,是本发明利用上述的录音设备进行声音处理与录入 的方法较佳实施例的流程图。

步骤S10,声音处理单元13计算周围初始环境的声音强度P1,并 根据该声音强度P1得到该初始环境下录入声音强度的阈值T1、T2。 所述T1=P1+δ_speak。所述T2=P1+δ_silence。其中,δ_speak与 δ_silence是两个预设值,分别代表在正常情况下,录音者的声音的最 大分贝值与最小分贝值。本实施例中,所述δ_speak为11,所述 δ_silence为5。

步骤S11,录音者利用录音设备1开始执行声音录入操作。

步骤S12,麦克风10采集一段声音数据,并将该声音数据传送给 声卡11。

步骤S13,A/D转换器12将上述声音数据从模拟形式转换为数字 形式。

步骤S14,声音处理单元13根据上述初始环境的声音强度P1,初 始环境下录入声音强度的阈值T1、T2计算周围当前环境下录入声音强 度的阈值,以更新上述阈值T1、T2。该步骤的详细流程图请参见下述 的图4。

步骤S15,声音处理单元13判断上述声音数据的强度是否大于当 前环境下录入声音强度的阈值T2。当上述声音数据的强度小于当前环 境下录入声音强度的阈值T2时,流程进入步骤S16。否则,当上述声 音数据的强度大于或者等于当前环境下录入声音强度的阈值T2时,流 程进入步骤S17。

在步骤S16中,声音处理单元13停止此段声音数据的录入操作, 及/或者提示录入声音无效,以告知录音者需要提高说话音量重新录 音。

在步骤S17中,声音处理单元13将上述声音数据记录到存储单元 14中。

步骤S18,声音处理单元13判断上述声音数据的长度是否大于一 个预定的长度值length。本实施例中,所述length=80k。应该可以了 解,人类的语言是由各个片段组成。例如,当某个人说一句很长的话 时,该人不可能一口气将该句话讲完,而一定会在间隔一段时间后停顿 一下。根据经验值,该间隔的时间为5秒钟。而在正常语速下,每秒钟 说话的字长也是一定的。根据经验值,每秒钟说话的字长为16k。因 此,可以计算得出,正常情况下,某一段声音数据的字长大约是80k (5*16k)。因此,当存储于存储单元14中的声音数据的字长太长, 例如大于80k时,可以认定该声音数据并不是有效的声音数据。当上 述声音数据的长度大于所述预定的长度值length时,流程进入步骤S 19 及S20。否则,若上述声音数据的长度小于或者等于所述预定的长度值 length时,流程进入步骤S21。

在步骤S19,声音处理单元13从存储单元14中删除上述声音数 据,并于步骤S20中,声音处理单元13提示声音录入无效。

在步骤S21中,存储单元14将存储于其中的声音数据传送给服务 器2。

步骤S22,麦克风10判断声音录入操作是否结束。若声音录入操 作没有结束,则流程返回步骤S12。否则,若声音录入操作结束,则流 程进入步骤S23。

在步骤S23中,服务器2输出所录入的声音。

参阅图4所示,是上述图3中步骤S14的子流程图。

步骤S140,声音处理单元13计算出周围当前环境的声音强度 P2。

步骤S141,声音处理单元13计算出|P2-T1|的值。

步骤S142,声音处理单元13判断声音强度P2是否已经计算了n 次。本实施例中,所述n为30。当声音强度P2没有计算n次时,间隔 S秒后返回步骤S140,以得到n个声音强度P2。本实施例中,所述S 秒为0.167秒。否则,当声音强度P2已经计算了n次的情况下,流程 进入步骤S143。

在步骤S143中,声音处理单元13筛选出使得|P2-T1|的值大于一 个常量C的每一个声音强度P2。

步骤S144,声音处理单元13计算出使得|P2-T1|的值大于所述常量 C的所有声音强度P2的个数count。

步骤S145,声音处理单元13判断是否count>=n/2。如上所述,n 为30。当count<n/2时,流程进入步骤S 146。否则,在count>=n/2的 情况下,流程进入步骤S147。

在步骤S146中,声音处理单元13判断周围当前环境相较于周围 初始环境没有发生变化,因此将上述初始环境下录入声音强度的阈值 T1、T2作为当前环境下的录入声音强度的阈值。

在步骤S147中,声音处理单元13判断周围当前环境相较于周围 初始环境发生了变化,计算出使得|P2-T1|的值大于所述常量C的所有 声音强度P2的和sum,并计算出周围当前环境的声音强度 P3=sum/count。

步骤S148,声音处理单元13根据上述计算出来的声音强度P3计 算出当前环境下的录入声音强度的阈值T1、T2。其中,所述 T1=P3+δ_speak。所述T2=P3+δ_silence。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号