首页> 中国专利> 掩蔽声产生设备、存储有掩蔽声信号的存储介质、掩蔽声再现设备以及程序

掩蔽声产生设备、存储有掩蔽声信号的存储介质、掩蔽声再现设备以及程序

摘要

本发明的目的是在确保向其发射掩蔽声的空间中良好的掩蔽效果的情况下,减轻在该空间中的人感觉到的不适程度。在叠加处理中,CPU(21)提取人声声音信号X

著录项

  • 公开/公告号CN103238179A

    专利类型发明专利

  • 公开/公告日2013-08-07

    原文格式PDF

  • 申请/专利权人 雅马哈株式会社;

    申请/专利号CN201180056474.2

  • 申请日2011-11-25

  • 分类号G10K11/178;

  • 代理机构北京天昊联合知识产权代理有限公司;

  • 代理人陈源

  • 地址 日本静冈县

  • 入库时间 2024-02-19 19:37:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-11-12

    未缴年费专利权终止 IPC(主分类):G10K11/178 授权公告日:20150715 终止日期:20181125 申请日:20111125

    专利权的终止

  • 2015-07-15

    授权

    授权

  • 2013-09-04

    实质审查的生效 IPC(主分类):G10K11/178 申请日:20111125

    实质审查的生效

  • 2013-08-07

    公开

    公开

说明书

技术领域

本发明涉及一种通过产生掩蔽声来防止泄漏的声音被听到的技术。

背景技术

已经提出了各种利用掩蔽效果来防止泄漏的声音被听到的技术。掩蔽效果是这样一种现象,当两种声音通过同一空间传播时,一个声音(掩蔽声)作为该空间中的聆听者听到另一声音(目标声音)的阻碍。这种类型的多个技术都是向通过墙或屏而与作为目标声音的源头的扬声器所处的空间相邻的空间发射掩蔽声。

专利文献1公开了一种通过处理目标声音的声音波形来产生用于防止作为目标声音的人声被听到的掩蔽声的技术。在该文献公开的掩蔽方法中,表示人声的声音信号被分成多个区间中的多个段,每段对应于一个音素。通过随机重新布置多个划分段的位置而得到的声音信号被再现为掩蔽声。通过该技术得到的声音的意思无法被理解,尽管它听起来像人声。将这种声音用作掩蔽声可提供比在使用诸如环境声之类的具有宽频谱的声音的情况下更好的掩蔽效果。

现有技术文献

专利文献

专利文献1:JP-B-4324104

专利文献2:JP-A-2008-107706

发明内容

本发明所要解决的问题

但是,通过以对应于一个音素的区间为单位随机地重新布置人声的音素而从人声得到的声音本身会造成不熟悉的听觉感受。因此,存在这样的问题,由专利文献1公开的技术产生的声音信号所生成的掩蔽声会造成空间中的聆听者感觉到不舒适。

本发明的一个目的是降低空间中的人感觉到的不舒适程度,同时确保该空间中的良好的掩蔽效果。

解决问题的手段

本发明提供了一种掩蔽声产生设备,包括:获取单元,其获取表示语音的声音信号序列;以及产生单元,其包括叠加单元,所述叠加单元提取所述声音信号序列的不同区间中的多个声音信号序列并且在时间轴上相互叠加所提取的声音信号序列,其中所述产生单元从通过所述获取单元的获取和所述叠加单元的处理而得到的声音信号序列产生掩蔽声信号。在本发明中,通过叠加单元的处理得到的声音信号序列是通过将原始声音信号序列的不同区间中的声音信号序列相互叠加而得到的。虽然声音信号序列整体上是原始声音信号序列的打乱版本,但是每个不同区间中的音素的顺序保持与原始声音信号序列中的相同。因此,本发明所得到的掩蔽声不会使聆听者感觉到不舒服,同时能够提供与以对应于一个音素的区间为单位随机地重新布置表示人声的声音信号而获得的掩蔽声相同水平的掩蔽效果。由此,本发明可以在确保空间中的良好掩蔽效果的同时降低在该空间中的人感觉到的不舒适程度。

在一个优选方式中,所述叠加单元包括移位及添加单元,所述移位及添加单元执行移位处理,并输出通过将经过移位处理的声音信号序列和原始的未经过移位处理的声音信号序列加在一起而获得的声音信号序列,其中所述移位处理是将处理对象声音信号序列中基准位置之前的声音信号序列与处理对象声音信号序列中基准位置之后的声音信号序列互换的处理。通过该方式获取的掩蔽声同样地不会使聆听者感觉到不舒服,同时能够提供与以对应于一个音素的区间为单位随机地重新布置表示人声的声音信号而获得的掩蔽声相同水平的掩蔽效果。由此,该方式可以在确保空间中良好的掩蔽效果的同时降低在该空间中的人感觉到的不舒适程度。

在另一个优选方式中,所述叠加单元包括移位及添加单元,所述移位及添加单元执行多个移位处理,并输出通过将由所述多个移位处理得到的多个声音信号序列加在一起而获得的声音信号序列,其中所述多个移位处理是将处理对象声音信号序列中不同基准位置之前的各声音信号序列分别与处理对象声音信号序列中各基准位置之后的各声音信号序列互换的多个处理。在该情况下,由于多个移位单元利用不同基准位置来执行移位处理,因此规定时间内掩蔽声信号中包含的音素数量可以增多,由此能够以源声音信号被更大程度地打乱的方式产生掩蔽声。

在另一个优选方式中,所述叠加单元包括划分及添加单元,该划分及添加单元在时间轴上将处理对象声音信号序列划分成具有更短时长的各声音信号序列,并且将划分后的各声音信号序列加在一起,并且输出通过所述划分及添加单元和所述移位及添加单元的多个处理而得到的声音信号序列。通过该方式得到的掩蔽声同样地不会使聆听者感觉到不舒服,同时能够提供与以对应于一个音素的区间为单位随机地重新布置表示人声的声音信号而获得的掩蔽声相同水平的掩蔽效果。由此,该方式可以在确保空间中良好的掩蔽效果的同时降低在该空间中的人感觉到的不舒适程度。

在另一个优选方式中,所述叠加单元包括:划分及添加单元,其在时间轴上将处理对象声音信号序列划分成具有更短时长的声音信号序列,并且将划分后的声音信号序列加在一起;多个移位单元,其执行多个移位处理,所述多个移位处理是将通过所述划分及添加单元的处理而得到的声音信号序列中不同基准位置之前的各声音信号序列分别与该声音信号序列中各基准位置之后的各声音信号序列互换的多个移位处理;以及相加单元,其将通过所述多个移位单元的处理而得到的各声音信号序列加在一起。该方式使得能够进一步增加规定时间内掩蔽声信号中包含的音素的数量。

在另一个优选方式中,掩蔽声产生设备包括用于跳过由划分及添加单元执行的处理的单元。例如,当要用于产生掩蔽声信号的声音信号的持续时间较短时,优选地使用该单元来跳过由划分及添加单元执行的处理。这是因为由划分及添加单元执行的处理缩短了声音信号序列的时长,同时具有增加规定时间内声音信号序列中包含的音素数量的效果。

在又一个优选方式中,所述叠加单元包括:多个移位单元,其执行多个移位处理,所述多个移位处理是将各处理对象声音信号序列中不同基准位置之前的各声音信号序列分别与各处理对象声音信号序列中基准位置之后的各声音信号序列互换的多个处理;多个反向单元,其在时间轴上使得通过所述多个移位单元的多个处理而得到的每一个处理对象声音信号序列的划分的多个区间中的每一个中的声音信号序列的布置顺序反向,并产生布置顺序反向后的声音信号序列;以及相加单元,其将通过所述多个反向单元的多个处理而得到的各声音信号序列加在一起。在该情况下,优选地,多个反向单元在时间轴上使每个区间中的声音信号序列的布置顺序反向,从而使得声音信号序列的多个区间之间的边界的设置被设定成彼此不同。该方式使得能够以源声音信号被更大程度地打乱的方式产生掩蔽声。

附图说明

图1是示出了包含根据本发明一个实施例的掩蔽声产生设备的掩蔽系统的配置的框图。

图2是示出了掩蔽声产生设备如何操作的流程图。

图3图示出掩蔽声产生设备如何处理声音信号。

图4图示出掩蔽声产生设备如何处理声音信号。

图5图示出由掩蔽声产生设备执行的移位及添加处理的细节。

图6图示出由根据本发明另一实施例的掩蔽声产生设备执行的移位及添加处理的细节。

图7图示出由根据本发明又一实施例的掩蔽声产生设备执行的移位及添加处理的细节。

图8是示出了根据本发明第二实施例的掩蔽声产生设备如何操作的流程图。

具体实施方式

下文将参考附图来描述本发明的实施例。

<实施例1>

图1示出了包括根据本发明第一实施例的掩蔽声产生设备10的掩蔽系统的配置。掩蔽声产生设备10是这样的设备:从N类声音信号X-n(n=1至N)中产生具有时长T4(例如,1分钟)的掩蔽声的声音信号Z-n(n=1至N;N:大于或等于1的自然数),其中N类声音信号X-n(n=1至N)表示通过使具有各种语音特征的N个朗读者在时长T1(例如,2分钟;T1>T4)内轮流朗读包含各种音素(辅音和元音)的文章而得到的朗读声;并且在存储介质30中存储所产生的声音信号Z-n(n=1至N)。掩蔽声再现设备50是这样的设备:在存储有声音信号Z-n(n=1至N)的存储介质30被插入掩蔽声再现设备50时,选择并再现存储在存储介质30中的这N类声音信号Z-n(n=1至N)中的一个,并使得扬声器52朝着以中间隔着屏51的方式彼此相邻的空间A和B中的一个(在图1的示例中是空间B)发射再现声音。

掩蔽声产生设备10的麦克风11拾取朗读声并且输出表示其波形的模拟信号。A/D转换单元12将从文章朗读的开始到结束从麦克风11输出的模拟信号转换成数字声音信号X-n,并且在存储单元13中存储所得到的声音信号X-n。控制单元14逐个地获取存储单元13中存储的N类声音信号X-n(n=1至N),从获取的声音信号X-n产生具有时长T4的掩蔽声的声音信号Z-n,并将所产生的声音信号Z-n输出至写入控制单元15。下文将详细描述控制单元14的配置。写入控制单元15将从控制单元14提供来的声音信号Z-n以及其特有的识别信息In存储在存储介质30中。

接下来,将详细描述控制单元14的配置。控制单元14具有CPU21、RAM22和ROM23。CPU21在使用RAM22作为工作区的同时,运行ROM23中存储的掩蔽声产生程序24。掩蔽声产生程序24是赋予CPU21以下两个功能的程序。

a1.获取功能

这是从存储单元13获取其中存储的每个声音信号X-n(n=1至N)的功能。

a2.产生功能

这是根据从存储单元13获取的每个声音信号X-n产生掩蔽声的声音信号Z-n、并向写入控制单元15输出所产生的声音信号Z-n的功能。

接下来,将描述该实施例的操作。图2是示出了该实施例的操作的流程图。图2所示的步骤S10是一个由CPU21利用上述获取功能来执行的步骤。步骤S11-S23是由CPU21利用上述产生功能来执行的步骤。首先,CPU21获取存储单元13中存储的N类声音信号X-n(n=1至N)中的一个声音信号X-n,并将其存储在RAM22中(S10)。

随后,如图3的(A)所示,CPU21消除无声区间中的声音信号以及不期望声音区间中的声音信号,并且产生作为剩余区间的连接的具有时长T1’(T1’<T1)的声音信号X11-n(S11)。

随后,如图3的(B)所示,CPU21执行对在高于或者等于语音频带的上限频率fc1(例如,3400Hz)的频带中的声音信号X-n进行衰减的LPF(低通滤波)处理、以及对在低于或者等于语音频带的下限频率fc2(例如,100Hz)的频带中的声音信号X-n进行衰减的HPF(高通滤波)处理,并且采用处理结果作为声音信号X12-n(S12)。

随后,如图3的(C)所示,CPU21对声音信号X12-n执行叠加处理(S13)。叠加处理是提取声音信号X12-n的不同区间中的声音信号,将提取的声音信号在时间轴上彼此叠加,并且输出得到的叠加的声音信号的处理。更具体地说,在叠加处理中,CPU21从存储在RAM22中的时长为T1’的声音信号X12-n中提取时长为T1’/2的前半个声音信号以及时长为T1’/2的后半个声音信号。随后,CPU21以它们的首位置和尾位置被设置成彼此一致的方式将前半个声音信号和后半个声音信号彼此叠加,并且采用得到的时长为T1’/2的声音信号作为叠加处理结果(声音信号X13-n)。

随后,如图3的(D)所示,CPU21执行反向处理(S14)。反向处理是将声音信号X13-n(叠加处理结果)按照相邻区间以时间t(例如,100ms)彼此重叠的方式划分成具有固定长度的L个区间Di(i=1至L)中的声音信号,并且在时间轴上对每个区间Di中的声音信号的布置顺序进行反向的处理。数量L等于(T1’/2–t)/(T2+t),其中T2例如等于500ms。

更具体地说,在反向处理中,CPU21切出第一区间D1中的声音信号XD1,第一区间D1的起始点是存储在RAM22中的具有时长T1’/2的声音信号X13-n的起始点并且结束点是比起始点晚时间2t+T2的点。随后,CPU21切出第二区间D2中的声音信号XD2,第二区间D2的起始点是比声音信号X13-n起始点晚时间t+T2(即,比第一区间D1的结束点早时间t)的点并且结束点是比起始点晚时间2t+T2的点。随后,类似地,CPU21按序切出第三区间D3中的声音信号XD3、第四区间D4中的声音信号XD4,…,第(L–1)区间DL-1中的声音信号XDL-1以及第L区间DL中的声音信号XDL。随后,CPU21在时间轴上对每个区间Di中的声音信号XDi的布置顺序进行反向,并采用L个布置顺序反向后的声音信号XD’i(i=1至L)作为接下来将要执行的标准化处理的处理对象。

如图3的(E)所示,CPU21执行标准化处理(S15)。标准化处理是使得作为反向处理的处理结果的声音信号XD’i(i=1至L)的音量时间变化落入预定范围内的处理。更具体地说,在标准化处理中,CPU21计算存储在RAM22中的第一至第L区间Di(i=1至L)中所有声音信号XD’i(i=1至L)的有效值RMSA以及各个区间Di中的各自的有效值RMSDi。随后,CPU21采用有效值RMSA除以区间Di的有效值RMSDi之商作为每个区间Di的校正系数Si,并且将每个区间Di中的声音信号XD’i乘以校正系数Si。随后,CPU21采用通过乘以校正系数Si(i=1至L)得到的L个声音信号XD’’i(i=1至L)作为接下来将要执行的淡出淡入组合处理的处理对象。

随后,如图4的(F)所示,CPU21执行淡出淡入组合处理(S16)。淡出淡入组合处理是一个重新组合作为标准化处理的处理结果的L个声音信号XD’’i(i=1至L)以使得相邻声音信号的边界流畅地连接的处理。更具体地说,在淡出淡入组合处理中,CPU21将存储在RAM22中的L个声音信号XD’’i(i=1至L)中的每一个乘以窗函数W。窗函数W用于通过柔和地衰减每一个声音信号XD’’i的起始点侧部分和结束点侧部分来流畅地将每一个声音信号XD’’i与紧挨着的前面的和紧挨着的后面的区间中的声音信号进行组合。在将每个声音信号XD’’i(i=1至L)乘以窗函数W之后,CPU21将每个区间Di中作为将声音信号XD’’i和窗函数W相乘的结果的声音信号XD’’i×W与紧挨着的前面的和紧挨着的后面的区间中的声音信号以重叠时间为t的方式组合起来。CPU21采用如此组合的时长为T1’/2的声音信号来作为淡出淡入组合处理的处理结果(声音信号X16-n)。

随后,如图4的(G)所示,CPU21执行移位及添加处理(S17)。移位及添加处理是这样的处理:将声音信号X16-n(淡出淡入组合处理的处理结果)的基准位置之前的声音信号与声音信号X16-n的基准位置之后的声音信号进行互换(移位处理),随后将移位处理后的声音信号和原始的未经过移位处理的声音信号X16-n加在一起。

更具体地说,如图5所示,CPU21产生存储在RAM22中的时长为T1’/2的声音信号X16-n的M个(例如,2个)副本,也就是说,产生M个(M=2)声音信号Xa16-n和Xb16-n。CPU21从声音信号Xa16-n的从起始点至结束点布置的样本数据中选择基准位置Pa。CPU21将声音信号Xa16-n的从起始点至基准位置Pa的样本数据向后移位,将声音信号Xa16-n的从基准位置Pa至结束点的样本数据放置在向后移位后的样本数据之前,并且连接这两组样本数据以产生声音信号Xa16’-n。

而且,CPU21从声音信号Xb16-n的从起始点至结束点布置的样本数据中选择不同于基准位置Pa的基准位置Pb。CPU21将声音信号Xb16-n的从起始点至基准位置Pb的样本数据向后移位,将声音信号Xb16-n的从基准位置Pb至结束点的样本数据放置在向后移位后的样本数据之前,并且连接这两组样本数据以产生声音信号Xb16’-n。随后,CPU21在声音信号X16-n、Xa16’-n和Xb16’-n的起始位置和结束位置被设置成彼此一致的情况下将它们加在一起,并采用相加结果作为移位及添加处理的处理结果(声音信号X17-n)。

随后,如图4的(H)所示,CPU21执行语速转换处理(S18)。在语速转换处理中,CPU21通过在时间轴方向上延长存储在RAM22中的作为移位处理的处理结果的时长为T1’/2的声音信号X17-n,来产生时长为T3(T3>T1’/2)的声音信号X18-n。对于语速转换处理的具体过程,可参考专利文献2。

随后,如图4的(I)所示,CPU21执行对高于或等于频率fc1的频带中的声音信号X18-n进行衰减的LPF处理、以及对低于或等于频率fc2的频带中的声音信号X18-n进行衰减的HPF处理,并采用处理结果作为声音信号X19-n(S19)。

随后,如图4的(J)所示,CPU21对声音信号X19-n执行时长调节处理(S20)。在时长调节处理中,CPU21从存储在RAM22中的作为LPF处理和HPF处理的处理结果的声音信号X19-n切出具有上述时长T4(T4<T3)的声音信号X20-n(步骤S18)。

随后,如图4的(K)所示,CPU21对声音信号X20-n执行整体水平调节处理(S21)。在整体水平调节处理中,CPU21将存储在RAM22中的作为时长调节处理的处理结果的具有时长T4的整个声音信号X20-n乘以水平调节校正系数P,并采用相乘结果作为整体水平调节处理的处理结果(声音信号X21-n)。

随后,CPU21将声音信号X21-n(整体水平调节处理的处理结果)输出至写入控制单元15作为掩蔽声声音信号Z-n(S22)。写入控制单元15在插入到写入控制单元15中的存储介质30中存储从CPU21输出的声音信号Z-n。

随后,CPU21判断是否已经获取了存储单元13中存储的所有N类声音信号X-n(n=1至N)(S23)。如果存储单元13中剩余没有被获取的声音信号X-n(S23:否),则CPU21返回步骤S10。CPU21从存储单元13中获取未获取的声音信号X-n,将其写入RAM22,并再次执行后续处理。另一方面,如果已经获取了存储单元13中存储的所有N类声音信号X-n(n=1至N)(S23:是),则CPU21结束处理。

上述实施例提供了下述优势。在该实施例中,与专利文献1所公开的进行以对应于一个音素的区间为单位随机地重新布置表示人声的声音信号的处理的技术不同。相反,在该实施例中,从人声的声音信号的获取到掩蔽声声音信号的产生的一系列处理包括叠加处理(S13)和移位及添加处理(S17)。通过包括叠加处理(S13)和移位及添加处理(S17)的一系列处理所得到的声音信号的再现声音不会使聆听者感觉不舒服,而同时提供了与以对应于一个音素的音程为单位随机地重新布置表示人声的声音信号而获得的掩蔽声相同水平的掩蔽效果。由此,该实施例在确保良好的掩蔽效果的同时可降低空间B中的人感觉到的不舒适程度。

<实施例1的修改>

下面将描述对上述第一实施例的修改。

(1)在上述实施例中,每次从存储单元13获取一类声音信号X-n,并且从该类声音信号X-n产生一类声音信号Z-n。但是,可以从存储单元13一起获取R(2≤R≤N)类声音信号X-n,对获取的R类声音信号X-n中的每一个执行步骤S11-S21的一系列处理,并将通过作为处理结果所得到的R类声音信号进行相加而得到的声音信号作为掩蔽声声音信号Z-n。即使空间A中存在具有不同语音特征的多个说话者,该实施例也可通过广泛适应多个说话者而在空间B中提供良好掩蔽效果。

(2)上述实施例可修改成,从存储单元13获取的声音信号X-n变成移位及添加处理的处理对象(步骤S17),而不执行步骤S11-S16和S18-S21中的任何处理,并且通过移位及添加处理得到的声音信号被用作掩蔽声声音信号Z-n。即使如在本实施例中那样,通过对人声的声音信号X-n仅仅执行移位及添加处理而不执行叠加处理所得到的声音信号X-n被用作掩蔽声声音信号Z-n,也可降低在空间B中的人感觉到的不舒适程度,同时确保良好的掩蔽效果。可以将从存储单元13获取的声音信号X-n作为叠加处理(步骤S13)的处理对象,而不执行步骤S11、S12和S14-S21中的任何处理,并且采用通过叠加处理得到的声音信号作为掩蔽声声音信号Z-n。即使如在本实施例中那样,通过对人声的声音信号X-n仅仅执行叠加处理而不执行移位及添加处理所得到的声音信号被用作掩蔽声声音信号Z-n,也可降低在空间B中的人感觉到的不舒适程度,同时确保良好的掩蔽效果。而且,其中根据例如在操作单元(未示出)上进行的操作而跳过叠加处理(步骤S13)或移位及添加处理(步骤S17)的配置也是可行的。

(3)在上述实施例的叠加处理(步骤S13)中,CPU21从存储在RAM22中的时长为T1’的声音信号X12-n中提取时长为T1’/2的前半个声音信号以及时长为T1’/2的后半个声音信号。随后,CPU21通过按照这两个声音信号的首位置和尾位置被设置成彼此一致的方式将它们相互叠加来产生时长为T1’/2的声音信号X13-n。但是,CPU21可通过从存储在RAM中的声音信号X12-n中提取末尾部分和开头部分彼此有重叠的时长为T1’/2的两个声音信号,并且按照其首位置和尾位置被设置成彼此一致的方式彼此叠加这两个声音信号,来产生时长为T1’/2的声音信号X13-n。而且,从声音信号X12-n中提取的声音信号的数量不限于两个;可提取三个或者更多个声音信号并将其相互叠加。并且从声音信号X12-n中提取的多个声音信号的长度不需要总是相等。例如,CPU21可通过将时长为T1’的声音信号X12-n分成比T1’/2长时间T5(T5<T1’/2)的声音信号以及比T1’/2短时间T5的声音信号,并且将划分后的两个声音信号相互叠加,来产生声音信号X13-n。

(4)在上述实施例的移位及添加处理(步骤S17)中,产生了声音信号X16-n的两个副本。但是,声音信号X16-n的副本的数量M可以是一个或者大于等于三个。在声音信号X16-n的副本的数量M为多个时,可以产生对于各个副本声音信号Xa16-n、Xb16-n、Xc16-n、…而言唯一的随机数,并且利用所产生的随机数来确定基准位置Pa、Pb、Pc、…。作为另一种替换方案,可以提供包含指示多个基准位置Pa、Pb、Pc、…的数据的表格,并且针对各个声音信号Xa16-n、Xb16-n、Xc16-n、…从表格中选择基准位置Pa、Pb、Pc、…。

(5)在上述实施例的移位及添加处理(步骤S17)中,对声音信号X16-n的各副本执行移位处理,并且经过移位处理的声音信号和原始的未经过移位处理的声音信号被加在一起。但是,如图6所示,可以产生声音信号X16-n的M’个副本(M’:大于或等于2的自然数;例如,假设M’=2),对仅仅这M’(M’=2)个副本声音信号Xa16-n和Xb16-n中的每一个执行上述移位处理,并采用通过将M’个经过移位处理的声音信号Xa16’-n和Xb16’-n相加在一起而得到的声音信号,作为移位及添加处理的处理结果。该实施例也可降低在空间B中的人感觉到的不舒适程度,同时确保良好的掩蔽效果。

(6)在上述实施例的移位及添加处理(步骤S17)中,对声音信号X16-n的各副本执行移位处理,并且经过移位处理的声音信号和原始的未经过移位处理的声音信号被加在一起。但是,如图7所示,可以产生声音信号X16-n的M’’个副本(M’’:大于或等于1的自然数;例如,假设M’’=2),针对包括原始声音信号X16-n和M’’(M’’=2)个副本声音信号Xa16-n和Xb16-n的(M+1)个声音信号X16-n、Xa16-n和Xb16-n中的每一个执行上述移位处理,并且采用通过将(M’’+1)个经过移位处理的声音信号X16’-n、Xa16’-n和Xb16’-n加在一起而得到的声音信号,作为移位及添加处理的处理结果。该实施例也能够降低在空间B中的人感觉到的不舒适程度,同时确保了良好的掩蔽效果。

(7)在上述实施例的反向处理(步骤S14)中,作为叠加处理的处理结果的声音信号X13-n被分成多个区间中的声音信号,并且每个区间中划分的声音信号的布置顺序在时间轴上反向。然而,可以将整个声音信号X13-n的布置顺序在时间轴上反向,而不将声音信号X13-n划分成多个区间中的声音信号。在这种情况下,省略标准化处理(步骤S15)和淡出淡入组合处理(步骤S16)是合适的。

在上述实施例中,反向处理(S14)、标准化处理(S15)、淡出淡入组合处理(S16)以及移位及添加处理(S17)以这样的顺序来执行。然而,如下面将要在第二实施例中所描述的那样,上述实施例可修改为使得按照移位及添加处理(S17)、标准化处理(S15)、反向处理(S14)和淡出淡入组合处理(S16)的顺序来执行它们。

<实施例2>

图8是示出了根据本发明第二实施例的掩蔽声产生设备如何操作的流程图。在该流程图中,具有第一实施例(参见图2)中的对应步骤的步骤将分配有与第一实施例中的对应步骤相同的步骤编号Sxx。

在第一实施例中,如图2所示,掩蔽声产生程序24包括叠加处理(S13)和移位及添加处理(S17)。这些处理的每一个都是一个提取处理对象声音信号序列的不同区间中的声音信号序列并且在时间轴上将其相互叠加的处理,并且具有如下效果:尽管所产生的声音信号序列整体上是原始声音信号序列的打乱版本,然而所产生的声音信号序列中,不同区间中的每个区间中的音素的顺序基本上保持与原始声音信号序列中的相同。该实施例与第一实施例的第一个不同之处在于,在该实施例中,进行布置以使得能够根据例如在操作单元上进行的操作来跳过叠加处理(S13)。

如果没有跳过叠加处理(S13),则由于叠加处理(S13)而在时长上是LPF处理和HPF处理(步骤S12)所产生的声音信号序列的一半的声音信号序列,变成图8所示的多个宏处理M_1至M_J的处理对象。如果跳过叠加处理(S13),则通过LPF处理和HPF处理(步骤S12)得到的声音信号序列变成图8所示的多个宏处理M_1至M_J的处理对象。

该实施例中产生的掩蔽声信号具有取决于作为图8所示的多个宏处理M_1至M_J的处理对象的声音信号序列的长度的周期。为了防止聆听者感觉到不舒服,优选地,所产生的掩蔽声信号具有长周期。为此,优选地,作为掩蔽声信号的源的声音信号X-n具有长持续时间。然而,可能出现这样的情况,即,很难设置长记录时间,并且要用于产生掩蔽声信号的声音信号X-n的持续时间变短。在这种情况下,叠加处理(S13)的执行不是优选的,这是因为所产生的掩蔽声信号的周期比执行叠加处理之前短。鉴于此,在该实施例中,当要用于掩蔽声信号的产生的声音信号X-n的持续时间较短时,叠加处理(S13)被跳过以防止掩蔽声信号的周期变短。

在跳过叠加处理(S13)时,用于打乱声音信号序列的一个单元丢失。然而,在该实施例中,在每个宏处理M_1至M_J中执行作为第一实施例的移位及添加处理(S17)的一部分的移位处理(S17’),并且从这些宏处理M_1至M_J的结果之和产生掩蔽声信号。多个宏处理M_1至M_J以及将它们的处理结果加在一起的处理具有打乱声音信号序列的作用。因此,即使跳过叠加处理(S13)也能产生不会造成不舒服的掩蔽声。

该实施例与第一实施例的第二个不同之处在于,在该实施例中,进行布置以产生作为叠加处理(S13)的结果的声音信号序列或作为LPF处理和HPF处理(S12)(跳过了叠加处理)的结果的声音信号序列的(J–1)个副本,利用由原始声音信号序列和各副本组成的J个声音信号序列来分别执行多个宏处理M_1至M_J,并且通过在时间轴上相互叠加J个处理结果声音信号序列而得到的声音信号序列被传递至语速转换处理(S18)。在多个宏处理M_1至M_J的每一个中,移位处理(S17’)、标准化处理(S15)、反向处理(S14)以及淡出淡入组合处理(S16)依次执行。所产生的声音信号序列的数量J和将要执行的多个宏处理M_1至M_J的数量J可由在操作单元(未示出)上进行的操作来指定。

在上述第一实施例中,按照反向处理(S14)、标准化处理(S15)、淡出淡入组合处理(S16)以及移位及添加处理(S17)的顺序执行。相反,在该实施例中,在多个宏处理M_1至M_J的每一个中,按照移位处理(S17’)、标准化处理(S15)、反向处理(S14)以及淡出淡入组合处理(S16)的顺序执行。这也是该实施例与上述第一实施例之间的一个差别。

移位处理(S17’)是一个将处理对象声音信号序列的基准位置Pa之前的部分与基准位置之后的另一部分进行互换的处理。不同于上述第一实施例的移位及添加处理(S17),该移位处理(S17’)不执行对原始声音信号序列的添加。为什么在多个宏处理M_1至M_J的每一个中执行移位处理(S17’)而不是移位及添加处理(S17)的原因如下。如果在多个宏处理M_1至M_J的每一个中执行移位及添加处理(S17),则通过每次移位及添加处理(S17)得到的声音信号序列应该包含原始声音信号序列的分量。因此,当多个宏处理M_1至M_J的处理结果被加在一起时,原始声音信号序列的重复感将被强调出来。为了防止这种情况,在多个宏处理M_1至M_J的每一个中执行移位处理(S17’),该移位处理(S17’)不执行对原始声音信号序列的添加。

在本实施例中,移位处理(S17’)中使用的基准位置Pa对于多个宏处理M_1至M_J而言有所不同。因此,各个宏处理M_1至M_J的多个移位处理(S17’)产生了J个声音信号序列,其中的每个声音信号序列都是由多个音素组成的音素序列,并且其中各个音素在时间轴上的位置在各个声音信号序列之间不相同。在通过各个移位处理(S17’)得到的这J个声音信号序列的每一个中,虽然各个音素在时间轴上的位置相对于原始声音信号序列中的相应音素的位置有所偏离,但是音素的顺序基本上保持与原始声音信号序列中的音素顺序相同。即,在通过各个移位处理(S17’)得到的这J个声音信号序列的每一个中,音素的顺序保持与原始声音信号序列中的音素顺序相同,仅除原始声音信号的最后一个音素之后紧跟着其首音素之外。可以构想出各种手段作为用于在各个宏处理之间改变基准位置Pa的单元。在本实施例中,根据在操作单元(未示出)上进行的操作来独立地设置多个宏处理M_1至M_J的各个移位处理(S17’)的基准位置Pa。

在多个宏处理M_1至M_J的每一个中,对通过移位处理(S17’)得到的声音信号序列执行标准化处理(S15)。在标准化处理(S15)中,处理对象声音信号序列被划分成多个区间内的多个部分以使得相邻区间以固定时间t相互重叠,这与上述第一实施例的反向处理(S14)的方式相同。在标准化处理(S15)中,执行标准化,其中针对各个区间计算用于得到各个区间常数的声音信号有效值RMS的校正系数,并且将各个区间中的声音信号乘以针对各个区间计算出的校正系数。标准化的计算方法基本上与上述第一实施例相同。然而,在该实施例中,为了防止过度标准化,将校正系数乘以某一缓和系数,并且最终校正系数被限制成落入由预定的上限值和下限值所限定的范围内。

在本实施例中,在标准化处理(S15)中用于将处理对象声音信号序列划分成多个区间中的多个部分的边界被设置成对于各个宏处理而言彼此不同。更具体地说,在本实施例中,在各个宏处理M_1至M_J的各标准化处理(S15)中,声音信号序列的划分的单区间长度(或区间数量)被设置成对于各个宏处理而言彼此不同。可以构想出各种手段作为用于将声音信号序列的划分的单区间长度(或区间数量)设置成对于各个宏处理而言彼此不同的单元。在本实施例中,根据在操作单元(未示出)上进行的操作来对各个宏处理独立地设置单区间长度(或区间数量)。

在宏处理M_1至M_J的每一个中,对作为标准化处理(S15)的处理结果的声音信号序列执行反向处理(S14)。在反向处理(S14)中,使标准化后的声音信号序列的多个区间的每一个中的声音信号样本的布置顺序反向。在声音信号序列的单区间长度对于各宏处理而言彼此不同的情况下,在各个宏处理M_1至M_J的各反向处理(S14)中,区间中的声音信号样本的布置顺序被反向以使得区间长度对于各个宏处理而言不同。

在本实施例中,根据例如在操作单元上进行的操作来进行布置以使得能够在多个宏处理M_1至M_J的一部分(例如,宏处理M_J)中禁止反向处理(S14)的执行。禁止执行多个宏处理M_1至M_J中的一部分使得能够防止最终产生的声音信号中特殊语调的出现。

在多个宏处理M_1至M_J的每一个中,在执行反向处理(S14)之后,执行淡出淡入组合处理(S16),淡出淡入组合处理(S16)在时间轴上连接作为反向处理(S14)的处理结果的各个区间中的相邻声音信号序列,由此产生固定时间t的重叠。所得到的声音信号序列是各个宏处理M_1至M_J的处理结果,而且通过在时间轴上相互叠加这些声音信号序列而得到的声音信号序列变成语速转换处理(S18)的处理对象。

语速转换处理(S18)以及随后将要执行的多个处理与上述第一实施例的那些处理相同。

上文已经详细描述了本实施例。

本实施例提供了与第一实施例相同的优势。而且,在该实施例中,叠加处理(S13)可跳过,并且通过对作为LPF处理和HPF处理的叠加处理(S13)的结果的声音信号序列进行复制来产生期望数量(J)的声音信号序列,随后对期望数量(J)的声音信号序列进行多个宏处理M_1至M_J。由此,如下文举例的那样,该实施例能够根据各种情况以不同方式来使用掩蔽声产生设备。

a.如果作为掩蔽声信号的源的声音信号的持续时间相对较长则执行叠加处理(S13),并且如果该持续时间相对较短则跳过叠加处理(S13)。

b.在跳过叠加处理(S13)的情况下,宏处理M_1至M_J的数量J以及要针对各个宏处理M_1至M_J产生的声音信号序列的数量J被增大以增加一个周期的掩蔽声信号中包含的音素数量。

c.在利用通过将从多人的声音信号得到的掩蔽声信号加在一起而得到的信号来产生最终掩蔽声的情况下,宏处理M_1至M_J的数量J以及要针对各个宏处理M_1至M_J产生的声音信号序列的数量J可以减小。在这种情况下,叠加处理(S13)可跳过。

d.在从一个人的声音信号产生的掩蔽声信号被输出作为掩蔽声的情况下,优选地不跳过叠加处理(S13)。在要用于产生掩蔽声信号的声音信号的持续时间较短并且跳过了叠加处理(S13)的情况下,优选地增大宏处理M_1至M_J的数量J以及要针对各个宏处理M_1至M_J产生的声音信号序列的数量J。

<实施例2的修改>

与上述第一实施例相同的修改对于第二实施例而言也是可行的。专用于第二实施例的其它修改如下。

(1)宏处理M_1至M_J的数量J以及要被产生为各个宏处理M_1至M_J的处理对象的声音信号序列的数量J可以是预定数量,而不是根据在操作单元上进行的操作所确定的数量。

(2)可以在掩蔽声产生设备中存储一个表格,在该表格中,表示是否跳过叠加处理(S13)的信息以及宏处理M_1至M_J的数量J和要被产生为各个宏处理M_1至M_J的处理对象的声音信号序列的数量J与诸如提供作为掩蔽声信号源的声音信号的人数以及每个声音信号提供者的声音信号记录时间之类的参数关联,并且根据各参数的值和该表格来自动确定数量J。

(3)将在多个宏处理M_1至M_J的各个移位处理(S17’)中使用的基准位置Pa可由掩蔽声产生设备自己确定,而不是根据在操作单元上进行的操作来确定。一个示例方法是,确定将声音信号序列划分成(J+1)个相等的部分的J个边界位置,并且采用这些边界位置作为用于多个宏处理M_1至M_J的各个移位处理(S17’)的基准位置Pa。另一示例方法是,确定将声音信号序列划分成J个相等的部分的J个边界位置,并且采用这些边界位置和声音信号序列的首位置,作为用于多个宏处理M_1至M_J的各个移位处理(S17’)的基准位置Pa。当基准位置Pa位于首位置时,整个声音信号序列处于基准位置Pa之后,而基准位置Pa之前不存在任何东西。因此,当基准位置Pa之前的部分和之后的部分互换时可以获得与原始声音信号序列相同的声音信号序列。

(4)在多个宏处理M_1至M_J的每一个的标准化处理(S15)中,声音信号序列的划分的区间的数量可由掩蔽声产生设备自己确定,而不是根据在操作单元上进行的操作来确定。一个示例方法是,通过按照升序布置彼此互质(prime)的多个数而得到的一个序列,从该序列中选择J个高阶数,并采用这些数作为多个宏处理M_1至M_J的每一个的标准化处理(S15)中的声音信号序列的划分的区间的数量。

(5)掩蔽声产生设备可被配置成总是不执行叠加处理(S13)。

(6)在第二实施例中,用于移位处理(S17’)的基准位置Pa以及标准化处理(S15)(以及反向处理(S14))中的声音信号序列的多个区间之间的边界都被设置成对于各个宏处理而言不相同。可替换地,可以仅仅将基准位置Pa和边界之一设置成对于各个宏处理而言不相同。

(7)在第二实施例中,通过使得声音信号序列的划分的区间长度(或者区间数量)对于各个宏处理不同,来将标准化处理(S15)(以及反向处理(S14))中声音信号序列的多个区间之间的边界设置成对于各个宏处理不同。可替换地,可以仅仅使区间之间的边界的位置对于各个宏处理彼此不同,而使声音信号序列的划分的区间长度(或者区间数量)保持相同。

(8)虽然在第二实施例中J个宏处理M_1至M_J并行执行,但是它们可按照例如宏处理M_1、宏处理M_2、…的顺序依次执行。即,在本发明中,多个移位单元(J个宏处理M_1至M_J的多个移位处理(S17’))无需总是同时并行操作,而是可以依次操作。多个反向单元(J个宏处理M_1至M_J的多个反向处理(S14))也是如此。

(9)在第二实施例中,可跳过叠加处理(S13)。替换配置是可行的,在替换配置中根据在操作单元上进行的操作来跳过J个宏处理M_1至M_J中的每一个的叠加处理(S13)和移位处理(S17’)。

<可应用于实施例1和实施例2两者的修改>

(1)根据上述每个实施例的掩蔽声产生设备所运行的程序可被提供为记录至计算机可读记录介质,例如磁记录介质(例如,磁带或磁盘(HDD或FD))、光记录介质(例如,光盘(CD或DVD))、磁光记录介质或者半导体存储器。可通过诸如因特网之类的网络下载该程序。

(2)可以在记录介质中记录根据上述各实施例中的每一个的掩蔽声产生设备所产生的掩蔽声信号,并且为了声音掩蔽而在地理上远离掩蔽声产生设备的远方位置再现记录在记录介质上的掩蔽声信号。在该情况下,掩蔽声信号可记录在任意类型的记录介质中,即,任意类型的计算机可读记录介质,例如磁记录介质(例如,磁带或磁盘(HDD或FD))、光记录介质(例如,光盘(CD或DVD))、磁光记录介质以及半导体存储器。可通过诸如因特网之类的网络下载这种掩蔽声信号的文件。

本申请基于2010年11月25日提交的日本专利申请No.2010-262250、2011年3月2日提交的日本专利申请No.2011-044873以及2011年11月18日提交的日本专利申请No.2011-252833,上述日本专利申请的公开通过引用并入本文中。

工业实用性

根据本发明的掩蔽声产生设备可以在确保向其发射掩蔽声的空间中的良好掩蔽效果的同时,降低在该空间中的人感觉到的不适程度。

对参考数字和标号的描述

10…掩蔽声产生设备;11…麦克风;12…A/D转换单元;13…存储单元;14…控制单元;15…写入控制单元;21…CPU;22…RAM;23…ROM;24…掩蔽声产生程序;30…存储介质;50…掩蔽声再现设备;51…屏;52…扬声器。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号