首页> 中国专利> 基于语音短命令和声纹技术解除手机锁屏的方法

基于语音短命令和声纹技术解除手机锁屏的方法

摘要

本发明提供一种基于语音短命令和声纹技术解除手机锁屏的方法,在预置阶段,用户输入预置语音口令,并将其执行快速傅立叶变化,然后确定一通过阈值,在解锁阶段,用户输入解锁语音口令,并将其执行快速傅立叶变化,计算所述解锁语音口令频域信号与所述预置语音口令频域信号的差异值,通过比较差异值是否小于通过阈值来判定是否解锁手机,通过语音短命令和声纹认证技术解除手机锁屏状态,既方便快捷又保证了手机使用的安全性,在此基础上对差异值的计算进行了规定,引入分帧加窗,MFCC系数计算和矢量量化处理技术,使用户的声音特性能够更准确的提取和比较,提高了便捷性和安全性上的用户体验。

著录项

  • 公开/公告号CN102647521A

    专利类型发明专利

  • 公开/公告日2012-08-22

    原文格式PDF

  • 申请/专利权人 福州博远无线网络科技有限公司;

    申请/专利号CN201210097083.1

  • 发明设计人 刘德建;关胤;余志鹏;吴拥民;

    申请日2012-04-05

  • 分类号H04M1/725(20060101);G10L17/00(20060101);

  • 代理机构福州市鼓楼区京华专利事务所(普通合伙);

  • 代理人宋连梅

  • 地址 350000 福建省福州市福州开发区星发路8号火炬创新大厦四层403A室

  • 入库时间 2023-12-18 07:51:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-01-27

    专利权的转移 IPC(主分类):H04M1/725 登记生效日:20160106 变更前: 变更后: 申请日:20120405

    专利申请权、专利权的转移

  • 2013-10-09

    授权

    授权

  • 2012-10-03

    实质审查的生效 IPC(主分类):H04M1/725 申请日:20120405

    实质审查的生效

  • 2012-08-22

    公开

    公开

说明书

【技术领域】

本发明涉及一种基于语音短命令和声纹技术解除手机锁屏的方法。

【背景技术】

现有手机大都是通过触摸动作,光照判断,密码保护等技术达到解除锁 屏状态的目的。采用触摸动作,光照判断等技术解除手机锁屏,手机不具有 安全性,任何人都可以解锁手机,而采用密码保护的方式解除手机锁屏,虽 然可以防止其他非授权用户使用手机,但操作时不够方便快捷。

公开号为102148899A,公开日为2011-8-10的发明专利,是将用户输入 指令波形与手机系统已有解锁声音指令的波形(也就是时域信号)进行比对, 判断是否吻合来决定是否解锁,通过比对波形得到吻合或者为80%-100%吻 合,这是不可能实现的,因为同一个人在不同时刻讲述相同的一个词或者一 句话,其波形差异也很大,因此,该发明不具备可实施性。

【发明内容】

本发明要解决的技术问题,在于提供一种基于语音短命令和声纹技术解 除手机锁屏的方法,既方便快捷又保证了手机使用的安全性,在此基础上对 差异值的计算进行了规定,引入分帧加窗,MFCC系数计算和矢量量化处理 技术,使用户的声音特性能够更准确的提取和比较,提高了便捷性和安全性 上的用户体验。

本发明通过以下两种技术方案来解决上述技术问题的:

方案一:一种基于语音短命令和声纹技术解除手机锁屏的方法,包括预 置阶段和解锁阶段,所述预置阶段包括如下步骤:

步骤1、用户输入预置语音口令,所述语音口令在手机中的保存形式为 时域信号;

步骤2、将保存形式为时域信号的所述预置语音口令的音频数据执行快 速傅立叶变换,将所述预置语音口令的音频数据变换成预置语音口令的频域 信号;

步骤3、在用户手机系统中提供一默认的通过阈值或由用户设定一通过 阈值;

所述解锁阶段包括如下步骤:

步骤4、用户输入解锁语音口令,所述语音口令在手机中的保存形式为 时域信号;

步骤5、将保存形式为时域信号的所述解锁语音口令的音频数据执行快 速傅里叶变换,所述解锁语音口令的音频数据变换成解锁语音口令的频域信 号谱;

步骤6、计算所述解锁语音口令频域信号与所述预置语音口令频域信号 的差异值;

步骤7、判断所述差异值是否小于所述通过阈值,如果是,则解除手机 锁屏状态,如果否,则提示解锁失败。

进一步地,所述差异值通过求欧氏距离获得。

方案二:一种基于语音短命令和声纹技术解除手机锁屏的方法,包括预 置阶段和解锁阶段,所述预置阶段包括如下步骤:

步骤10、用户输入预置语音口令,所述预置语音口令在手机中的保存 形式为时域信号;

步骤11、将保存形式为时域信号的所述预置语音口令的音频数据进行 分帧加窗处理,并计算预置语音口令的帧数量N;

步骤12、对每一帧预置语音口令执行快速傅里叶变换,每一帧预置语 音口令对应变换成一预置语音口令的频域信号;

步骤13、用X个Mel频标上线性分布的三角窗滤波器,对各预置语音 口令的频域信号依次滤波,滤波后,每一预置语音口令的频域信号均获得对 应的X个能量值;所述X为自然数,1≤X≤128;

步骤14、对前Y1帧预置语音口令中每一帧预置语音口令对应的X个能 量值求预置语音口令的噪声能量均值,所述Y1为自然数,1≤Y1≤N;所述 求预置语音口令噪声能量均值的过程具体为:将第一帧预置语音口令对应的 X个能量值至第Y1帧预置语音口令对应的X个能量值分别求算数平均值, 得到预置语音口令的X个噪声能量均值,所述算术平均值的求解过程具体 为:即先对第一帧预置语音口令对应的第一个能量值至第Y1帧预置语音口 令对应的第一个能量值求算数平均值,得到预置语音口令的第一个噪声能量 均值,而后依次类推求算数平均值,完成后共得到预置语音口令的Y1个噪 声能量均值;

步骤15、在剩余的N-Y1帧预置语音口令中,每一帧预置语音口令对应 的X个能量值均分别相对应地减去预置语音口令的X个噪声能量均值,每 一帧预置语音口令均获得与之对应的X个降噪能量值;所述N-Y1是指将N 帧的预置语音口令去掉用于求噪声能量均值的第一帧至第Y1帧预置语音口 令;

步骤16、对剩余N-Y1帧预置语音口令中每一帧预置语音口令对应的X 个降噪能量值进行离散余弦变换,共获得预置语音口令的N-Y1个Z维 MFCC系数;所述Z为自然数,1≤Z≤128;

步骤17、对获得的预置语音口令的N-Y1个Z维MFCC系数进行矢量 量化,设置量化码本的长度为K,K为自然数,且1≤K≤128;则获得一量 化码本,该量化码本由K个Z维MFCC组成;

步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过 阈值;

所述解锁阶段包括如下步骤:

步骤20、用户输入解锁语音口令;所述解锁语音口令在手机中的保存 形式为时域信号;

步骤21、将保存形式为时域信号的所述解锁语音口令的音频数据进行 分帧加窗处理,并计算解锁语音口令的帧数量M;

步骤22、对每一帧解锁语音口令执行快速傅里叶变换,每一帧解锁语 音口令对应变换成一解锁语音口令的频域信号;

步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波, 滤波后,每一解锁语音口令的频域信号均获得对应的解锁语音口令的X个 能量值;

步骤24、对前Y2帧解锁语音口令中每一帧解锁语音口令对应的X个能 量值求解锁语音口令的噪声能量均值,所述求解锁语音口令噪声能量均值的 过程具体为:将第一帧解锁语音口令对应的X个解锁语音口令的能量值至 第Y2帧解锁语音口令对应的X个能量值分别求算数平均值,得到解锁语音 口令的X个噪声能量均值,所述算数平均值的求解过程具体为:即先对第 一帧解锁语音口令对应的第一个能量值至第Y2帧解锁语音口令对应的第一 个能量值求算数平均值,得到解锁语音口令的第一个噪声能量均值,而后依 次类推求算数平均值,完成后共得到X个解锁语音口令的噪声能量均值;

步骤25、在剩余的M-Y2帧解锁语音口令中,每一帧解锁语音口令对 应的X个能量均值分别相对应地减去解锁语音口令的X个噪声能量均值, 每一帧解锁语音口令均获得与之对应的X个降噪能量值;所述M-Y2是指 将M帧的解锁语音口令去掉用于求噪声能量均值的第一帧至第Y2帧解锁语 音口令;

步骤26、对剩余M-Y2帧解锁语音口令中每一帧解锁语音口令对应的X 个降噪能量值进行离散余弦变换,共获得解锁语音口令的M-Y2个Z维 MFCC系数;

步骤27、将解锁语音口令的每个Z维MFCC系数分别与所述预置语音 口令的量化码本进行一一比对,解锁语音口令共M-Y2个Z维MFCC系数, 则比对M-Y2轮,由于该量化码本由K个Z维MFCC组成,每一轮比对, 均获得K个距离值,并选取其中的最小距离值,即每一轮比对获得一个最 小距离值,全部比对完,共获得M-Y2个最小距离值,将M-Y2个最小距离 值求和并除以M-Y2,得到平均最小距离;所述比对为求欧氏距离;

步骤28、判断所述平均最小距离是否小于所述通过阈值,如果是,则 解除手机锁屏状态,如果否,则提示解锁失败。

进一步地,步骤11中,通过公式N=(L1-20)/10+1向下取整求得所 述预置语音口令的帧数量N,其中,公式中L1表示所述预置语音口令的音 频时长,L1的单位为毫秒,公式中的20表示帧长度为20毫秒,公式中的 10表示帧叠加为10毫秒。

进一步地,步骤21中,通过公式M=(L2-20)/10+1向下取整求得所 述解锁语音口令的帧数量M,其中,公式中L2表示所述解锁语音口令的音 频时长,L2的单位为毫秒,公式中的20表示帧长度为20毫秒,公式中的 10表示帧叠加为10毫秒。

进一步地,输入所述预置语音口令和所述解锁语音口令时,对所述预置 语音口令和所述解锁语音口令的信号采样率均为16000Hz。

进一步地,所述三角窗滤波器的Mel频标的个数24≤X≤39。

进一步地,所述三角窗滤波器是用24个Mel频标上线性分布的三角窗 滤波器,即X=24,所述三角窗滤波器的中心频率分别为:100,200,300, 400,500,600,700,800,900,1000,1149,1320,1516,1741,2000, 2297,2639,3031,3482,4000,4595,5278,6063,6964,带宽为:100, 100,100,100,100,100,100,100,100,124,160,184,211,242, 278,320,367,422,484,556,639,734,843,969,以上数值单位均为 Hz。

进一步地,所述三角窗滤波器是用39个Mel频标上线性分布的三角窗 滤波器,即X=39,所述三角窗滤波器的中心频率分别为:50,100,150, 200,260,320,390,460,530,610,700,790,890,990,1100,1210, 1340,1480,1610,1770,1930,2100,2280,2480,2680,2900,3140, 3380,3650,3930,4230,4560,4900,5260,5650,6060,6500,6970, 7470,带宽为:100,100,100,120,127,127,148,148,148,169,190, 190,233,233,254,254,296,296,275,339,339,360,381,424, 424,466,508,508,572,593,636,699,720,763,826,869,932, 996,1060,以上数值单位均为Hz。

进一步地,所述离散余弦变换的计算公式是:

其中En(j)表示第j个降噪能量值, 1≤j≤X,1≤i≤Z,i、j均为自然数。

进一步地,步骤11和步骤21中的加窗处理均为加汉明窗处理。

本发明具有如下优点:通过语音短命令和声纹认证技术解除手机锁屏状 态,既方便快捷又保证了手机使用的安全性,同时,引入分帧加窗,MFCC 系数计算和矢量量化处理技术,使用户的声音特性能够更准确的提取和比 较,提高了便捷性和安全性上的用户体验。

【具体实施方式】

本发明方案一的具体实施例如下:

一种基于语音短命令和声纹技术解除手机锁屏的方法,包括预置阶段和 解锁阶段,所述预置阶段包括如下步骤:

步骤1、用户输入预置语音口令,所述语音口令在手机中的保存形式为 时域信号;

步骤2、将保存形式为时域信号的所述预置语音口令的音频数据执行快 速傅立叶变换,将所述预置语音口令的音频数据变换成预置语音口令的频域 信号;

步骤3、在用户手机系统中提供一默认的通过阈值或由用户设定一通过 阈值;

所述解锁阶段包括如下步骤:

步骤4、用户输入解锁语音口令,所述语音口令在手机中的保存形式为 时域信号;

步骤5、将保存形式为时域信号的所述解锁语音口令的音频数据执行快 速傅里叶变换,所述解锁语音口令的音频数据变换成解锁语音口令的频域信 号谱;

步骤6、计算所述解锁语音口令频域信号与所述预置语音口令频域信号 的差异值;所述差异值通过求欧氏距离获得;

步骤7、判断所述差异值是否小于所述通过阈值,如果是,则解除手机 锁屏状态,如果否,则提示解锁失败。

本发明方案二的第一实施例如下:

一种基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于:包 括预置阶段和解锁阶段,所述预置阶段包括如下步骤:

步骤10、用户输入预置语音口令,所述预置语音口令在手机中的保存 形式为时域信号;对所述预置语音口令的信号采样率均为16000Hz;

步骤11、将保存形式为时域信号的所述预置语音口令的音频数据进行 分帧加窗处理,并计算预置语音口令的帧数量N;在本实施例中通过公式N =(L1-20)/10+1向下取整求得所述预置语音口令的帧数量N,其中,公式 中L1表示所述预置语音口令的音频时长,公式中的20表示帧长度为20毫 秒,公式中的10表示帧叠加为10毫秒;所述加窗处理为加汉明窗处理;

步骤12、对每一帧预置语音口令执行快速傅里叶变换,每一帧预置语 音口令对应变换成一预置语音口令的频域信号;

步骤13、用X个Mel频标上线性分布的三角窗滤波器,对各预置语音 口令的频域信号依次滤波,滤波后,每一预置语音口令的频域信号均获得对 应的X个能量值;所述X为自然数,1≤X≤128。更优地,所述三角窗滤 波器的Mel频标的个数24≤X≤39,选用该X范围的三角窗滤波器可以在 运算效率与对语音特性的描述能力之间获得合理的妥协,显然,滤波器数量 越大,即X的取值越大,对语音特性的描述就越精细,但运算效率会降低。

步骤14、对前Y1帧预置语音口令中每一帧预置语音口令对应的X个能 量值求预置语音口令的噪声能量均值,所述Y1为自然数,1≤Y1≤N;所述 求预置语音口令噪声能量均值的过程具体为:将第一帧预置语音口令对应的 X个能量值至第Y1帧预置语音口令对应的X个能量值分别求算数平均值, 得到预置语音口令的X个噪声能量均值,所述算术平均值的求解过程具体 为:即先对第一帧预置语音口令对应的第一个能量值至第Y1帧预置语音口 令对应的第一个能量值求算数平均值,得到预置语音口令的第一个噪声能量 均值,而后依次类推求算数平均值,完成后共得到预置语音口令的Y1个噪 声能量均值;

步骤15、在剩余的N-Y1帧预置语音口令中,每一帧预置语音口令对应 的X个能量值均分别相对应地减去预置语音口令的X个噪声能量均值,每 一帧预置语音口令均获得与之对应的X个降噪能量值;所述N-Y1是指将N 帧的预置语音口令去掉用于求噪声能量均值的第一帧至第Y1帧预置语音口 令;

步骤16、对剩余N-Y1帧预置语音口令中每一帧预置语音口令对应的X 个降噪能量值进行离散余弦变换,共获得预置语音口令的N-Y1个Z维 MFCC系数;所述Z为自然数,1≤Z≤128;所述离散余弦变换的计算公式 是:其中,对预置语音口令进行离散余弦变 换时,En(j)表示第j个预置语音口令的降噪能量值,1≤j≤X,1≤i≤Z,i、j均 为自然数;

步骤17、对获得的预置语音口令的N-Y1个Z维MFCC系数进行矢量 量化,设置量化码本的长度为K,K为大于等于1的自然数,且1≤K≤128; 则获得一量化码本,该量化码本由K个Z维MFCC组成;

步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过 阈值;

所述解锁阶段包括如下步骤:

步骤20、用户输入解锁语音口令,所述解锁语音口令在手机中的保存 形式为时域信号;对所述解锁语音口令的信号采样率均为16000Hz;

步骤21、将保存形式为时域信号的所述解锁语音口令的音频数据进行 分帧加窗处理,并计算解锁语音口令的帧数量M,在本实施例中通过公式 M=(L2-20)/10+1向下取整求得所述解锁语音口令的帧数量M,其中, 公式中L2表示所述解锁语音口令的音频时长,公式中的20表示帧长度为 20毫秒,公式中的10表示帧叠加为10毫秒;所述加窗处理为加汉明窗处 理;

步骤22、对每一帧解锁语音口令执行快速傅里叶变换,每一帧解锁语 音口令对应变换成一解锁语音口令的频域信号;

步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波, 滤波后,每一解锁语音口令的频域信号均获得对应的解锁语音口令的X个 能量值;

步骤24、对前Y2帧解锁语音口令中每一帧解锁语音口令对应的X个能 量值求解锁语音口令的噪声能量均值,所述求解锁语音口令噪声能量均值的 过程具体为:将第一帧解锁语音口令对应的X个解锁语音口令的能量值至 第Y2帧解锁语音口令对应的X个能量值分别求算数平均值,得到解锁语音 口令的X个噪声能量均值,所述算数平均值的求解过程具体为:即先对第 一帧解锁语音口令对应的第一个能量值至第Y2帧解锁语音口令对应的第一 个能量值求算数平均值,得到解锁语音口令的第一个噪声能量均值,而后依 次类推求算数平均值,完成后共得到X个解锁语音口令的噪声能量均值;

步骤25、在剩余的M-Y2帧解锁语音口令中,每一帧解锁语音口令对 应的X个能量均值分别相对应地减去解锁语音口令的X个噪声能量均值, 每一帧解锁语音口令均获得与之对应的X个降噪能量值;所述M-Y2是指 将M帧的解锁语音口令去掉用于求噪声能量均值的第一帧至第Y2帧解锁语 音口令;

步骤26、对剩余M-Y2帧解锁语音口令中每一帧解锁语音口令对应的X 个降噪能量值进行离散余弦变换,共获得解锁语音口令的M-Y2个Z维 MFCC系数;所述离散余弦变换的计算公式与预置语音口令所采用的离散余 弦变化的计算公式相同,即对解锁语音口令 进行离散余弦变换时,En(j)表示第j个解锁语音口令的降噪能量值,1≤j≤X, 1≤i≤Z,i、j均为自然数;

步骤27、将解锁语音口令的每个Z维MFCC系数分别与所述预置语音 口令的量化码本进行一一比对,解锁语音口令共M-Y2个Z维MFCC系数, 则比对M-Y2轮,由于该量化码本由K个Z维MFCC组成,每一轮比对, 均获得K个距离值,并选取其中的最小距离值,即每一轮比对获得一个最 小距离值,全部比对完,共获得M-Y2个最小距离值,将M-Y2个最小距离 值求和并除以M-Y2,得到平均最小距离;所述比对为求欧氏距离;

步骤28、判断所述平均最小距离是否小于所述通过阈值,如果是,则 解除手机锁屏状态,如果否,则提示解锁失败。

本发明的预置语音口令和解锁语音口令的信号采样率均采用16000Hz 时;这样可以在不影响语音音质的前提下,降低需处理的音频数据量,同时 也是大多数音频输入设备支持的采样频率。

本发明方案二的第二实施例如下:

在本实施例中,取X=24、Y1=3、Y2=3、Z=13、K=5

一种基于语音短命令和声纹技术解除手机锁屏的方法,其特征在于:包 括预置阶段和解锁阶段,所述预置阶段包括如下步骤:

步骤10、用户输入预置语音口令,所述预置语音口令在手机中的保存 形式为时域信号;对所述预置语音口令的信号采样率均为16000Hz;

步骤11、将保存形式为时域信号的所述预置语音口令的音频数据进行 分帧加窗处理,并计算预置语音口令的帧数量N;在本实施例中通过公式N =(L1-20)/10+1向下取整求得所述预置语音口令的帧数量N,其中,公式 中L1表示所述预置语音口令的音频时长,公式中的20表示帧长度为20毫 秒,公式中的10表示帧叠加为10毫秒;所述加窗处理为加汉明窗处理;

步骤12、对每一帧预置语音口令执行快速傅里叶变换,每一帧预置语 音口令对应变换成一预置语音口令的频域信号;

步骤13、用24个Mel频标上线性分布的三角窗滤波器,对各预置语音 口令的频域信号依次滤波,滤波后,每一预置语音口令的频域信号均获得对 应的24个能量值;所述24个Mel频标上线性分布的三角窗滤波器,其中 心频率分别为:100,200,300,400,500,600,700,800,900,1000, 1149,1320,1516,1741,2000,2297,2639,3031,3482,4000,4595, 5278,6063,6964,带宽为:100,100,100,100,100,100,100,100, 100,124,160,184,211,242,278,320,367,422,484,556,639, 734,843,969,以上数值单位均为Hz;

步骤14、对前3帧预置语音口令中每一帧预置语音口令对应的24个能 量值求预置语音口令的噪声能量均值,所述求预置语音口令噪声能量均值的 过程具体为:将第一帧预置语音口令对应的24个能量值至第3帧预置语音 口令对应的24个能量值分别求算数平均值,得到预置语音口令的24个噪声 能量均值,所述算术平均值的求解过程具体为:即先对第一帧预置语音口令 对应的第一个能量值至第3帧预置语音口令对应的第一个能量值求算数平 均值,得到预置语音口令的第一个噪声能量均值,而后依次类推求算数平均 值,完成后共得到预置语音口令的3个噪声能量均值;

步骤15、在剩余的N-3帧预置语音口令中,每一帧预置语音口令对应 的24个能量值均分别相对应地减去预置语音口令的24个噪声能量均值,每 一帧预置语音口令均获得与之对应的24个降噪能量值;所述N-3是指将N 帧的预置语音口令去掉用于求噪声能量均值的第一帧至第3帧预置语音口 令;

步骤16、对剩余N-3帧预置语音口令中每一帧预置语音口令对应的24 个降噪能量值进行离散余弦变换,共获得预置语音口令的N-3个13维 MFCC系数;所述离散余弦变换的计算公式是: 其中,对预置语音口令进行离散余弦变换时, En(j)表示第j个预置语音口令的降噪能量值,1≤j≤24,1≤i≤13,i、j均为自然 数;具体说明如下:

从剩余N-3帧预置语音口令中任取一帧预置语音口令对应的24个降噪 能量值,先取i=1,求得该帧预置语音口令的第一维MFCC系数,取i=13 时求得该帧预置语音口令的第13维MFCC系数,以次类推,i的取值从1 取至13时,共获得该帧预置语音口令对应的13维MFCC系数;将剩余M-3 帧预置语音口令的每一帧预置语音口令均通过所述散余弦变换计算公式计 算后,获得预置语音口令的N-3个13维MFCC系数;

步骤17、对获得的预置语音口令的N-3个13维MFCC系数进行矢量 量化,设置量化码本的长度为5,则获得一量化码本,该量化码本由5个13 维MFCC组成;过大的量化码本长度会导致计算时间的增加,而量化码本 长度不足则不足以刻画预置口令的语音特征,选择量化码本长度K=5时, 不仅计算时间短,同时也能有效刻画预置语音口令的语音特征;

步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过 阈值;

所述解锁阶段包括如下步骤:

步骤20、用户输入解锁语音口令,所述解锁语音口令在手机中的保存 形式为时域信号;对所述解锁语音口令的信号采样率均为16000Hz;

步骤21、将保存形式为时域信号的所述解锁语音口令的音频数据进行 分帧加窗处理,并计算解锁语音口令的帧数量M,在本实施例中通过公式 M=(L2-20)/10+1向下取整求得所述解锁语音口令的帧数量M,其中, 公式中L2表示所述解锁语音口令的音频时长,公式中的20表示帧长度为 20毫秒,公式中的10表示帧叠加为10毫秒;所述加窗处理为加汉明窗处 理;

步骤22、对每一帧解锁语音口令执行快速傅里叶变换,每一帧解锁语 音口令对应变换成一解锁语音口令的频域信号;

步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波, 滤波后,每一解锁语音口令的频域信号均获得对应的解锁语音口令的24个 能量值;

步骤24、对前3帧解锁语音口令中每一帧解锁语音口令对应的24个能 量值求解锁语音口令的噪声能量均值,所述求解锁语音口令噪声能量均值的 过程具体为:将第一帧解锁语音口令对应的24个解锁语音口令的能量值至 第3帧解锁语音口令对应的24个能量值分别求算数平均值,得到解锁语音 口令的24个噪声能量均值,所述算数平均值的求解过程具体为:即先对第 一帧解锁语音口令对应的第一个能量值至第3帧解锁语音口令对应的第一 个能量值求算数平均值,得到解锁语音口令的第一个噪声能量均值,而后依 次类推求算数平均值,完成后共得到24个解锁语音口令的噪声能量均值;

步骤25、在剩余的M-3帧解锁语音口令中,每一帧解锁语音口令对应 的24个能量均值分别相对应地减去解锁语音口令的24个噪声能量均值,每 一帧解锁语音口令均获得与之对应的24个降噪能量值;所述M-3是指将M 帧的解锁语音口令去掉用于求噪声能量均值的第一帧至第3帧解锁语音口 令;

步骤26、对剩余M-3帧解锁语音口令中每一帧解锁语音口令对应的24 个降噪能量值进行离散余弦变换,共获得解锁语音口令的M-3个13维 MFCC系数;所述离散余弦变换的计算公式与预置语音口令所采用的离散余 弦变化的计算公式相同,即对解锁语音口令 进行离散余弦变换时,En(j)表示第j个解锁语音口令的降噪能量值,1≤j≤24, 1≤i≤13,i、j均为自然数;

步骤27、将解锁语音口令的每个13维MFCC系数分别与所述预置语音 口令的量化码本进行一一比对,解锁语音口令共M-3个13维MFCC系数, 则比对M-3轮,由于该量化码本由5个13维MFCC组成,每一轮比对, 均获得5个距离值,并选取其中的最小距离值,即每一轮比对获得一个最小 距离值,全部比对完,共获得M-3个最小距离值,将M-3个最小距离值求 和并除以M-3,得到平均最小距离;所述比对为求欧氏距离;

现举例说明比对过程:假设K=5,M-3=6,则第一轮比对是:从解锁语 音口令的6个13维MFCC系数中先选出一个,并将其与预置语音口令量化 码本中的5个13维MFCC系数分别求欧氏距离,则产生5个距离值,选取 这5个距离值中最小的距离值作为第一轮比对的最小距离值;而后的第二轮 比对是:从剩余的未执行比对的5个解锁语音口令的13维MFCC系数中再 选出一个,并将其与预置语音口令量化码本中的5个13维MFCC系数分别 求欧氏距离,产生5个距离值,选取这5个距离值中最小的距离值作为第二 轮比对的最小距离值;以此类推,有6个解锁语音口令的13维MFCC系数, 则执行6轮比对;每一轮比对均获得5个距离值,并选取其中的最小距离值, 全部比对完,共获得6个最小距离值;

步骤28、判断所述平均最小距离是否小于所述通过阈值,如果是,则 解除手机锁屏状态,如果否,则提示解锁失败。

在本发明中,所述三角窗滤波器是也可以选用39个Mel频标上线性分 布的三角窗滤波器,即X=39,所述三角窗滤波器的中心频率分别为:50, 100,150,200,260,320,390,460,530,610,700,790,890,990, 1100,1210,1340,1480,1610,1770,1930,2100,2280,2480,2680, 2900,3140,3380,3650,3930,4230,4560,4900,5260,5650,6060, 6500,6970,7470,带宽为:100,100,100,120,127,127,148,148, 148,169,190,190,233,233,254,254,296,296,275,339,339, 360,381,424,424,466,508,508,572,593,636,699,720,763, 826,869,932,996,1060,以上数值单位均为Hz。当选用39个Mel频标 上线性分布的三角窗滤波器时,其原理与本发明方案二的实施例一与实施例 二均相同。

通过语音短命令和声纹认证技术解除手机锁屏状态,既方便快捷又保证 了手机使用的安全性,同时,引入分帧加窗,MFCC系数计算和矢量量化处 理技术,使用户的声音特性能够更准确的提取和比较,提高了便捷性和安全 性上的用户体验。

虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人 员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发 明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的 修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号