首页> 中国专利> 基于语音短命令和声纹技术解除手机锁屏的方法

基于语音短命令和声纹技术解除手机锁屏的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种基于语音短命令和声纹技术解除手机锁屏的方法，在预置阶段，用户输入预置语音口令，并将其执行快速傅立叶变化，然后确定一通过阈值，在解锁阶段，用户输入解锁语音口令，并将其执行快速傅立叶变化，计算所述解锁语音口令频域信号与所述预置语音口令频域信号的差异值，通过比较差异值是否小于通过阈值来判定是否解锁手机，通过语音短命令和声纹认证技术解除手机锁屏状态，既方便快捷又保证了手机使用的安全性，在此基础上对差异值的计算进行了规定，引入分帧加窗，MFCC系数计算和矢量量化处理技术，使用户的声音特性能够更准确的提取和比较，提高了便捷性和安全性上的用户体验。

著录项

公开/公告号CN102647521A

专利类型发明专利
公开/公告日2012-08-22

原文格式PDF
申请/专利权人福州博远无线网络科技有限公司;
展开▼

申请/专利号CN201210097083.1
发明设计人刘德建;关胤;余志鹏;吴拥民;
展开▼

申请日2012-04-05
分类号H04M1/725(20060101);G10L17/00(20060101);
代理机构福州市鼓楼区京华专利事务所(普通合伙);
代理人宋连梅
地址 350000 福建省福州市福州开发区星发路8号火炬创新大厦四层403A室
入库时间 2023-12-18 07:51:02

法律信息

法律状态公告日

法律状态信息

法律状态
2016-01-27

专利权的转移 IPC(主分类):H04M1/725 登记生效日:20160106 变更前: 变更后: 申请日:20120405

专利申请权、专利权的转移
2013-10-09

授权

授权
2012-10-03

实质审查的生效 IPC(主分类):H04M1/725 申请日:20120405

实质审查的生效
2012-08-22

公开

公开

说明书

【技术领域】

本发明涉及一种基于语音短命令和声纹技术解除手机锁屏的方法。

【背景技术】

现有手机大都是通过触摸动作，光照判断，密码保护等技术达到解除锁屏状态的目的。采用触摸动作，光照判断等技术解除手机锁屏，手机不具有安全性，任何人都可以解锁手机，而采用密码保护的方式解除手机锁屏，虽然可以防止其他非授权用户使用手机，但操作时不够方便快捷。

公开号为102148899A，公开日为2011-8-10的发明专利，是将用户输入指令波形与手机系统已有解锁声音指令的波形(也就是时域信号)进行比对，判断是否吻合来决定是否解锁，通过比对波形得到吻合或者为80％-100％吻合，这是不可能实现的，因为同一个人在不同时刻讲述相同的一个词或者一句话，其波形差异也很大，因此，该发明不具备可实施性。

【发明内容】

本发明要解决的技术问题，在于提供一种基于语音短命令和声纹技术解除手机锁屏的方法，既方便快捷又保证了手机使用的安全性，在此基础上对差异值的计算进行了规定，引入分帧加窗，MFCC系数计算和矢量量化处理技术，使用户的声音特性能够更准确的提取和比较，提高了便捷性和安全性上的用户体验。

本发明通过以下两种技术方案来解决上述技术问题的：

方案一：一种基于语音短命令和声纹技术解除手机锁屏的方法，包括预置阶段和解锁阶段，所述预置阶段包括如下步骤：

步骤1、用户输入预置语音口令，所述语音口令在手机中的保存形式为时域信号；

步骤2、将保存形式为时域信号的所述预置语音口令的音频数据执行快速傅立叶变换，将所述预置语音口令的音频数据变换成预置语音口令的频域信号；

步骤3、在用户手机系统中提供一默认的通过阈值或由用户设定一通过阈值；

所述解锁阶段包括如下步骤：

步骤4、用户输入解锁语音口令，所述语音口令在手机中的保存形式为时域信号；

步骤5、将保存形式为时域信号的所述解锁语音口令的音频数据执行快速傅里叶变换，所述解锁语音口令的音频数据变换成解锁语音口令的频域信号谱；

步骤6、计算所述解锁语音口令频域信号与所述预置语音口令频域信号的差异值；

步骤7、判断所述差异值是否小于所述通过阈值，如果是，则解除手机锁屏状态，如果否，则提示解锁失败。

进一步地，所述差异值通过求欧氏距离获得。

方案二：一种基于语音短命令和声纹技术解除手机锁屏的方法，包括预置阶段和解锁阶段，所述预置阶段包括如下步骤：

步骤10、用户输入预置语音口令，所述预置语音口令在手机中的保存形式为时域信号；

步骤11、将保存形式为时域信号的所述预置语音口令的音频数据进行分帧加窗处理，并计算预置语音口令的帧数量N；

步骤12、对每一帧预置语音口令执行快速傅里叶变换，每一帧预置语音口令对应变换成一预置语音口令的频域信号；

步骤13、用X个Mel频标上线性分布的三角窗滤波器，对各预置语音口令的频域信号依次滤波，滤波后，每一预置语音口令的频域信号均获得对应的X个能量值；所述X为自然数，1≤X≤128；

步骤14、对前Y₁帧预置语音口令中每一帧预置语音口令对应的X个能量值求预置语音口令的噪声能量均值，所述Y₁为自然数，1≤Y₁≤N；所述求预置语音口令噪声能量均值的过程具体为：将第一帧预置语音口令对应的 X个能量值至第Y₁帧预置语音口令对应的X个能量值分别求算数平均值，得到预置语音口令的X个噪声能量均值，所述算术平均值的求解过程具体为：即先对第一帧预置语音口令对应的第一个能量值至第Y₁帧预置语音口令对应的第一个能量值求算数平均值，得到预置语音口令的第一个噪声能量均值，而后依次类推求算数平均值，完成后共得到预置语音口令的Y₁个噪声能量均值；

步骤15、在剩余的N-Y₁帧预置语音口令中，每一帧预置语音口令对应的X个能量值均分别相对应地减去预置语音口令的X个噪声能量均值，每一帧预置语音口令均获得与之对应的X个降噪能量值；所述N-Y₁是指将N 帧的预置语音口令去掉用于求噪声能量均值的第一帧至第Y₁帧预置语音口令；

步骤16、对剩余N-Y₁帧预置语音口令中每一帧预置语音口令对应的X 个降噪能量值进行离散余弦变换，共获得预置语音口令的N-Y₁个Z维 MFCC系数；所述Z为自然数，1≤Z≤128；

步骤17、对获得的预置语音口令的N-Y₁个Z维MFCC系数进行矢量量化，设置量化码本的长度为K，K为自然数，且1≤K≤128；则获得一量化码本，该量化码本由K个Z维MFCC组成；

步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过阈值；

所述解锁阶段包括如下步骤：

步骤20、用户输入解锁语音口令；所述解锁语音口令在手机中的保存形式为时域信号；

步骤21、将保存形式为时域信号的所述解锁语音口令的音频数据进行分帧加窗处理，并计算解锁语音口令的帧数量M；

步骤22、对每一帧解锁语音口令执行快速傅里叶变换，每一帧解锁语音口令对应变换成一解锁语音口令的频域信号；

步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波，滤波后，每一解锁语音口令的频域信号均获得对应的解锁语音口令的X个能量值；

步骤24、对前Y₂帧解锁语音口令中每一帧解锁语音口令对应的X个能量值求解锁语音口令的噪声能量均值，所述求解锁语音口令噪声能量均值的过程具体为：将第一帧解锁语音口令对应的X个解锁语音口令的能量值至第Y₂帧解锁语音口令对应的X个能量值分别求算数平均值，得到解锁语音口令的X个噪声能量均值，所述算数平均值的求解过程具体为：即先对第一帧解锁语音口令对应的第一个能量值至第Y₂帧解锁语音口令对应的第一个能量值求算数平均值，得到解锁语音口令的第一个噪声能量均值，而后依次类推求算数平均值，完成后共得到X个解锁语音口令的噪声能量均值；

步骤25、在剩余的M-Y₂帧解锁语音口令中，每一帧解锁语音口令对应的X个能量均值分别相对应地减去解锁语音口令的X个噪声能量均值，每一帧解锁语音口令均获得与之对应的X个降噪能量值；所述M-Y₂是指将M帧的解锁语音口令去掉用于求噪声能量均值的第一帧至第Y₂帧解锁语音口令；

步骤26、对剩余M-Y₂帧解锁语音口令中每一帧解锁语音口令对应的X 个降噪能量值进行离散余弦变换，共获得解锁语音口令的M-Y₂个Z维 MFCC系数；

步骤27、将解锁语音口令的每个Z维MFCC系数分别与所述预置语音口令的量化码本进行一一比对，解锁语音口令共M-Y₂个Z维MFCC系数，则比对M-Y₂轮，由于该量化码本由K个Z维MFCC组成，每一轮比对，均获得K个距离值，并选取其中的最小距离值，即每一轮比对获得一个最小距离值，全部比对完，共获得M-Y₂个最小距离值，将M-Y₂个最小距离值求和并除以M-Y₂，得到平均最小距离；所述比对为求欧氏距离；

步骤28、判断所述平均最小距离是否小于所述通过阈值，如果是，则解除手机锁屏状态，如果否，则提示解锁失败。

进一步地，步骤11中，通过公式N＝(L₁-20)/10+1向下取整求得所述预置语音口令的帧数量N，其中，公式中L₁表示所述预置语音口令的音频时长，L₁的单位为毫秒，公式中的20表示帧长度为20毫秒，公式中的 10表示帧叠加为10毫秒。

进一步地，步骤21中，通过公式M＝(L₂-20)/10+1向下取整求得所述解锁语音口令的帧数量M，其中，公式中L₂表示所述解锁语音口令的音频时长，L₂的单位为毫秒，公式中的20表示帧长度为20毫秒，公式中的 10表示帧叠加为10毫秒。

进一步地，输入所述预置语音口令和所述解锁语音口令时，对所述预置语音口令和所述解锁语音口令的信号采样率均为16000Hz。

进一步地，所述三角窗滤波器的Mel频标的个数24≤X≤39。

进一步地，所述三角窗滤波器是用24个Mel频标上线性分布的三角窗滤波器，即X＝24，所述三角窗滤波器的中心频率分别为：100，200，300， 400，500，600，700，800，900，1000，1149，1320，1516，1741，2000， 2297，2639，3031，3482，4000，4595，5278，6063，6964，带宽为：100， 100，100，100，100，100，100，100，100，124，160，184，211，242， 278，320，367，422，484，556，639，734，843，969，以上数值单位均为 Hz。

进一步地，所述三角窗滤波器是用39个Mel频标上线性分布的三角窗滤波器，即X＝39，所述三角窗滤波器的中心频率分别为：50，100，150， 200，260，320，390，460，530，610，700，790，890，990，1100，1210， 1340，1480，1610，1770，1930，2100，2280，2480，2680，2900，3140， 3380，3650，3930，4230，4560，4900，5260，5650，6060，6500，6970， 7470，带宽为：100，100，100，120，127，127，148，148，148，169，190， 190，233，233，254，254，296，296，275，339，339，360，381，424， 424，466，508，508，572，593，636，699，720，763，826，869，932， 996，1060，以上数值单位均为Hz。

进一步地，所述离散余弦变换的计算公式是：

其中En(j)表示第j个降噪能量值， 1≤j≤X，1≤i≤Z，i、j均为自然数。

进一步地，步骤11和步骤21中的加窗处理均为加汉明窗处理。

本发明具有如下优点：通过语音短命令和声纹认证技术解除手机锁屏状态，既方便快捷又保证了手机使用的安全性，同时，引入分帧加窗，MFCC 系数计算和矢量量化处理技术，使用户的声音特性能够更准确的提取和比较，提高了便捷性和安全性上的用户体验。

【具体实施方式】

本发明方案一的具体实施例如下：

一种基于语音短命令和声纹技术解除手机锁屏的方法，包括预置阶段和解锁阶段，所述预置阶段包括如下步骤：

步骤1、用户输入预置语音口令，所述语音口令在手机中的保存形式为时域信号；

步骤2、将保存形式为时域信号的所述预置语音口令的音频数据执行快速傅立叶变换，将所述预置语音口令的音频数据变换成预置语音口令的频域信号；

步骤3、在用户手机系统中提供一默认的通过阈值或由用户设定一通过阈值；

所述解锁阶段包括如下步骤：

步骤4、用户输入解锁语音口令，所述语音口令在手机中的保存形式为时域信号；

步骤5、将保存形式为时域信号的所述解锁语音口令的音频数据执行快速傅里叶变换，所述解锁语音口令的音频数据变换成解锁语音口令的频域信号谱；

步骤6、计算所述解锁语音口令频域信号与所述预置语音口令频域信号的差异值；所述差异值通过求欧氏距离获得；

步骤7、判断所述差异值是否小于所述通过阈值，如果是，则解除手机锁屏状态，如果否，则提示解锁失败。

本发明方案二的第一实施例如下：

一种基于语音短命令和声纹技术解除手机锁屏的方法，其特征在于：包括预置阶段和解锁阶段，所述预置阶段包括如下步骤：

步骤10、用户输入预置语音口令，所述预置语音口令在手机中的保存形式为时域信号；对所述预置语音口令的信号采样率均为16000Hz；

步骤11、将保存形式为时域信号的所述预置语音口令的音频数据进行分帧加窗处理，并计算预置语音口令的帧数量N；在本实施例中通过公式N ＝(L₁-20)/10+1向下取整求得所述预置语音口令的帧数量N，其中，公式中L₁表示所述预置语音口令的音频时长，公式中的20表示帧长度为20毫秒，公式中的10表示帧叠加为10毫秒；所述加窗处理为加汉明窗处理；

步骤12、对每一帧预置语音口令执行快速傅里叶变换，每一帧预置语音口令对应变换成一预置语音口令的频域信号；

步骤13、用X个Mel频标上线性分布的三角窗滤波器，对各预置语音口令的频域信号依次滤波，滤波后，每一预置语音口令的频域信号均获得对应的X个能量值；所述X为自然数，1≤X≤128。更优地，所述三角窗滤波器的Mel频标的个数24≤X≤39，选用该X范围的三角窗滤波器可以在运算效率与对语音特性的描述能力之间获得合理的妥协，显然，滤波器数量越大，即X的取值越大，对语音特性的描述就越精细，但运算效率会降低。

步骤16、对剩余N-Y₁帧预置语音口令中每一帧预置语音口令对应的X 个降噪能量值进行离散余弦变换，共获得预置语音口令的N-Y₁个Z维 MFCC系数；所述Z为自然数，1≤Z≤128；所述离散余弦变换的计算公式是：其中，对预置语音口令进行离散余弦变换时，En(j)表示第j个预置语音口令的降噪能量值，1≤j≤X，1≤i≤Z，i、j均为自然数；

步骤17、对获得的预置语音口令的N-Y₁个Z维MFCC系数进行矢量量化，设置量化码本的长度为K，K为大于等于1的自然数，且1≤K≤128；则获得一量化码本，该量化码本由K个Z维MFCC组成；

步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过阈值；

所述解锁阶段包括如下步骤：

步骤20、用户输入解锁语音口令，所述解锁语音口令在手机中的保存形式为时域信号；对所述解锁语音口令的信号采样率均为16000Hz；

步骤21、将保存形式为时域信号的所述解锁语音口令的音频数据进行分帧加窗处理，并计算解锁语音口令的帧数量M，在本实施例中通过公式 M＝(L₂-20)/10+1向下取整求得所述解锁语音口令的帧数量M，其中，公式中L₂表示所述解锁语音口令的音频时长，公式中的20表示帧长度为 20毫秒，公式中的10表示帧叠加为10毫秒；所述加窗处理为加汉明窗处理；

步骤22、对每一帧解锁语音口令执行快速傅里叶变换，每一帧解锁语音口令对应变换成一解锁语音口令的频域信号；

步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波，滤波后，每一解锁语音口令的频域信号均获得对应的解锁语音口令的X个能量值；

步骤26、对剩余M-Y₂帧解锁语音口令中每一帧解锁语音口令对应的X 个降噪能量值进行离散余弦变换，共获得解锁语音口令的M-Y₂个Z维 MFCC系数；所述离散余弦变换的计算公式与预置语音口令所采用的离散余弦变化的计算公式相同，即对解锁语音口令进行离散余弦变换时，En(j)表示第j个解锁语音口令的降噪能量值，1≤j≤X， 1≤i≤Z，i、j均为自然数；

步骤28、判断所述平均最小距离是否小于所述通过阈值，如果是，则解除手机锁屏状态，如果否，则提示解锁失败。

本发明的预置语音口令和解锁语音口令的信号采样率均采用16000Hz 时；这样可以在不影响语音音质的前提下，降低需处理的音频数据量，同时也是大多数音频输入设备支持的采样频率。

本发明方案二的第二实施例如下：

在本实施例中，取X＝24、Y₁＝3、Y₂＝3、Z＝13、K＝5

一种基于语音短命令和声纹技术解除手机锁屏的方法，其特征在于：包括预置阶段和解锁阶段，所述预置阶段包括如下步骤：

步骤10、用户输入预置语音口令，所述预置语音口令在手机中的保存形式为时域信号；对所述预置语音口令的信号采样率均为16000Hz；

步骤12、对每一帧预置语音口令执行快速傅里叶变换，每一帧预置语音口令对应变换成一预置语音口令的频域信号；

步骤13、用24个Mel频标上线性分布的三角窗滤波器，对各预置语音口令的频域信号依次滤波，滤波后，每一预置语音口令的频域信号均获得对应的24个能量值；所述24个Mel频标上线性分布的三角窗滤波器，其中心频率分别为：100，200，300，400，500，600，700，800，900，1000， 1149，1320，1516，1741，2000，2297，2639，3031，3482，4000，4595， 5278，6063，6964，带宽为：100，100，100，100，100，100，100，100， 100，124，160，184，211，242，278，320，367，422，484，556，639， 734，843，969，以上数值单位均为Hz；

步骤14、对前3帧预置语音口令中每一帧预置语音口令对应的24个能量值求预置语音口令的噪声能量均值，所述求预置语音口令噪声能量均值的过程具体为：将第一帧预置语音口令对应的24个能量值至第3帧预置语音口令对应的24个能量值分别求算数平均值，得到预置语音口令的24个噪声能量均值，所述算术平均值的求解过程具体为：即先对第一帧预置语音口令对应的第一个能量值至第3帧预置语音口令对应的第一个能量值求算数平均值，得到预置语音口令的第一个噪声能量均值，而后依次类推求算数平均值，完成后共得到预置语音口令的3个噪声能量均值；

步骤15、在剩余的N-3帧预置语音口令中，每一帧预置语音口令对应的24个能量值均分别相对应地减去预置语音口令的24个噪声能量均值，每一帧预置语音口令均获得与之对应的24个降噪能量值；所述N-3是指将N 帧的预置语音口令去掉用于求噪声能量均值的第一帧至第3帧预置语音口令；

步骤16、对剩余N-3帧预置语音口令中每一帧预置语音口令对应的24 个降噪能量值进行离散余弦变换，共获得预置语音口令的N-3个13维 MFCC系数；所述离散余弦变换的计算公式是：其中，对预置语音口令进行离散余弦变换时， En(j)表示第j个预置语音口令的降噪能量值，1≤j≤24，1≤i≤13，i、j均为自然数；具体说明如下：

从剩余N-3帧预置语音口令中任取一帧预置语音口令对应的24个降噪能量值，先取i＝1，求得该帧预置语音口令的第一维MFCC系数，取i＝13 时求得该帧预置语音口令的第13维MFCC系数，以次类推，i的取值从1 取至13时，共获得该帧预置语音口令对应的13维MFCC系数；将剩余M-3 帧预置语音口令的每一帧预置语音口令均通过所述散余弦变换计算公式计算后，获得预置语音口令的N-3个13维MFCC系数；

步骤17、对获得的预置语音口令的N-3个13维MFCC系数进行矢量量化，设置量化码本的长度为5，则获得一量化码本，该量化码本由5个13 维MFCC组成；过大的量化码本长度会导致计算时间的增加，而量化码本长度不足则不足以刻画预置口令的语音特征，选择量化码本长度K＝5时，不仅计算时间短，同时也能有效刻画预置语音口令的语音特征；

步骤18、在用户手机系统提供一默认的通过阈值或由用户设定一通过阈值；

所述解锁阶段包括如下步骤：

步骤20、用户输入解锁语音口令，所述解锁语音口令在手机中的保存形式为时域信号；对所述解锁语音口令的信号采样率均为16000Hz；

步骤22、对每一帧解锁语音口令执行快速傅里叶变换，每一帧解锁语音口令对应变换成一解锁语音口令的频域信号；

步骤23、用所述三角窗滤波器对各解锁语音口令的频域信号依次滤波，滤波后，每一解锁语音口令的频域信号均获得对应的解锁语音口令的24个能量值；

步骤24、对前3帧解锁语音口令中每一帧解锁语音口令对应的24个能量值求解锁语音口令的噪声能量均值，所述求解锁语音口令噪声能量均值的过程具体为：将第一帧解锁语音口令对应的24个解锁语音口令的能量值至第3帧解锁语音口令对应的24个能量值分别求算数平均值，得到解锁语音口令的24个噪声能量均值，所述算数平均值的求解过程具体为：即先对第一帧解锁语音口令对应的第一个能量值至第3帧解锁语音口令对应的第一个能量值求算数平均值，得到解锁语音口令的第一个噪声能量均值，而后依次类推求算数平均值，完成后共得到24个解锁语音口令的噪声能量均值；

步骤25、在剩余的M-3帧解锁语音口令中，每一帧解锁语音口令对应的24个能量均值分别相对应地减去解锁语音口令的24个噪声能量均值，每一帧解锁语音口令均获得与之对应的24个降噪能量值；所述M-3是指将M 帧的解锁语音口令去掉用于求噪声能量均值的第一帧至第3帧解锁语音口令；

步骤26、对剩余M-3帧解锁语音口令中每一帧解锁语音口令对应的24 个降噪能量值进行离散余弦变换，共获得解锁语音口令的M-3个13维 MFCC系数；所述离散余弦变换的计算公式与预置语音口令所采用的离散余弦变化的计算公式相同，即对解锁语音口令进行离散余弦变换时，En(j)表示第j个解锁语音口令的降噪能量值，1≤j≤24， 1≤i≤13，i、j均为自然数；

步骤27、将解锁语音口令的每个13维MFCC系数分别与所述预置语音口令的量化码本进行一一比对，解锁语音口令共M-3个13维MFCC系数，则比对M-3轮，由于该量化码本由5个13维MFCC组成，每一轮比对，均获得5个距离值，并选取其中的最小距离值，即每一轮比对获得一个最小距离值，全部比对完，共获得M-3个最小距离值，将M-3个最小距离值求和并除以M-3，得到平均最小距离；所述比对为求欧氏距离；

现举例说明比对过程：假设K＝5，M-3＝6，则第一轮比对是：从解锁语音口令的6个13维MFCC系数中先选出一个，并将其与预置语音口令量化码本中的5个13维MFCC系数分别求欧氏距离，则产生5个距离值，选取这5个距离值中最小的距离值作为第一轮比对的最小距离值；而后的第二轮比对是：从剩余的未执行比对的5个解锁语音口令的13维MFCC系数中再选出一个，并将其与预置语音口令量化码本中的5个13维MFCC系数分别求欧氏距离，产生5个距离值，选取这5个距离值中最小的距离值作为第二轮比对的最小距离值；以此类推，有6个解锁语音口令的13维MFCC系数，则执行6轮比对；每一轮比对均获得5个距离值，并选取其中的最小距离值，全部比对完，共获得6个最小距离值；

步骤28、判断所述平均最小距离是否小于所述通过阈值，如果是，则解除手机锁屏状态，如果否，则提示解锁失败。

在本发明中，所述三角窗滤波器是也可以选用39个Mel频标上线性分布的三角窗滤波器，即X＝39，所述三角窗滤波器的中心频率分别为：50， 100，150，200，260，320，390，460，530，610，700，790，890，990， 1100，1210，1340，1480，1610，1770，1930，2100，2280，2480，2680， 2900，3140，3380，3650，3930，4230，4560，4900，5260，5650，6060， 6500，6970，7470，带宽为：100，100，100，120，127，127，148，148， 148，169，190，190，233，233，254，254，296，296，275，339，339， 360，381，424，424，466，508，508，572，593，636，699，720，763， 826，869，932，996，1060，以上数值单位均为Hz。当选用39个Mel频标上线性分布的三角窗滤波器时，其原理与本发明方案二的实施例一与实施例二均相同。

通过语音短命令和声纹认证技术解除手机锁屏状态，既方便快捷又保证了手机使用的安全性，同时，引入分帧加窗，MFCC系数计算和矢量量化处理技术，使用户的声音特性能够更准确的提取和比较，提高了便捷性和安全性上的用户体验。

虽然以上描述了本发明的具体实施方式，但是熟悉本技术领域的技术人员应当理解，我们所描述的具体的实施例只是说明性的，而不是用于对本发明的范围的限定，熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化，都应当涵盖在本发明的权利要求所保护的范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于语音短命令和声纹技术解除手机锁屏的方法 [P] . 中国专利： CN102647521B . 2013.10.09
2. 基于语音短命令和声纹技术解除锁屏状态的手机 [P] . 中国专利： CN202587121U . 2012-12-05
3. Voice identification method for cellular phone and cellular phone with voiceprint password [P] . 美国专利： US2004101112A1 . 2004-05-27

机译：手机语音识别方法及带有声纹密码的手机
4. Novel and innovative means of providing an anonymized and secure mechanism for speech-to-text conversion. This invention provides a versatile and extensible privacy layer that leverages existing cloud-based Automated Speech Recognition (ASR) services and can accommodate emerging speech-to-text technologies, such as Natural Language Processing (NLP), voice bots and other voice-based artificial intelligence interfaces. This invention also allows the latest and best-of-breed speech technologies to be applied to the legal, medical, financial, and other privacy-sensitive fields without sacrificing [P] . 美国专利： US2020005792A1 . 2020-01-02

机译：为语音到文本转换提供匿名和安全机制的新颖创新方法。本发明提供了一种通用且可扩展的隐私层，其利用了现有的基于云的自动语音识别（ASR）服务，并且可以适应新兴的语音到文本技术，例如自然语言处理（NLP），语音机器人和其他基于语音的人工语言。智能接口。本发明还允许在不牺牲法律，医学，金融和其他隐私敏感领域的情况下应用最新和最好的语音技术。
5. PUBLIC DEVICE AND METHOD FOR PROVIDING SERVICE BASED ON VOICE COMMAND, AND PUBLIC DEVICE FOR PROVIDING MOVING CHARACTER BASED ON VOICE COMMAND [P] . 韩国专利： KR20180084582A . 2018-07-25

机译：基于语音命令的提供服务的公共设备和方法，以及基于语音命令的提供移动字符的公共设备