首页> 中国专利> 使用可移动的语音标识卡的语音认证系统及语音认证方法

使用可移动的语音标识卡的语音认证系统及语音认证方法

摘要

一种使用可移动的语音标识卡的语音认证系统,包括:服务器侧,声纹数据库,用于存储所有被授权者的声纹;声纹更新装置,用于更新所述声纹数据库中的声纹;以及,声纹摘要生成器,用于根据客户端的请求生成声纹摘要;客户端,语音ID卡,用于存储某个被授权者的声纹;验证装置,用于根据来自服务器的声纹摘要执行对语音ID卡中的声纹的验证;音频装置,用于与用户进行语音交互;语音认证装置,用于识别来自所述语音ID卡的声纹与来自所述音频装置的声音是否来自同一个说话者。本发明通过利用存储在服务器侧的声纹摘要对语音标识卡中的声纹进行验证,可以显著防止语音ID卡在丢失或被盗时的误用。

著录项

  • 公开/公告号CN1905445A

    专利类型发明专利

  • 公开/公告日2007-01-31

    原文格式PDF

  • 申请/专利权人 国际商业机器公司;

    申请/专利号CN200510087172.8

  • 发明设计人 付国康;周宇辰;王志君;石锋;

    申请日2005-07-27

  • 分类号H04L9/32(20060101);H04L9/10(20060101);G06K9/00(20060101);

  • 代理机构11247 北京市中咨律师事务所;

  • 代理人于静;刘薇

  • 地址 美国纽约

  • 入库时间 2023-12-17 18:12:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-04

    未缴年费专利权终止 IPC(主分类):H04L 9/32 专利号:ZL2005100871728 申请日:20050727 授权公告日:20120215

    专利权的终止

  • 2012-02-15

    授权

    授权

  • 2007-03-28

    实质审查的生效

    实质审查的生效

  • 2007-01-31

    公开

    公开

说明书

技术领域

本发明涉及信息安全领域中的语音认证技术,具体地说,涉及使用可移动存储介质存储用户语音数据的语音认证系统及语音认证方法。

背景技术

语音认证技术在涉及信息安全的系统中被广泛地使用。通常,这些系统对于访问用户有一定的限制,当用户访问这些系统时,需要对访问用户进行认证。随着语音认证技术的出现,当用户使用信用卡购买商品时,或者访问受保护的计算机系统时,或者从银行获取交易信息时,可以通过他(她)的声音进行身份认证,即用麦克风或电话导入该用户的声音,由语音认证系统识别声音,以验证该用户是否是其自称的人。此外,这类基于语音认证的系统对于那些不太了解计算机知识的用户来说,也很容易使用。

通常,为了进行语音认证,语音认证系统要俘获说话者的声音、将其数字化、与存储的声音特性进行比较。一般地,语音认证系统主要包括:语音输入装置,如麦克风、电话等;模数转换器,用于对输入的声音进行数字化;高性能的计算机,用于执行语音认证处理;以及语音数据库,用于存储有关被授权者的声音特性的数据。

通常,在执行语音认证时,语音认证系统需要将说话者的声音的谐波频率、谐振频率以及说话者发出音素(语言的最小可区别声音)的方式与被授权者的数字声纹进行匹配。声纹是被授权者在向语音认证系统登记时创建的,其以数字文件的方式存储在语音认证系统的语音数据库中。语音认证系统根据说话者的声音和该说话者自称的人的声纹计算这两者的匹配程度,从而判定说话者是否是其自称的人。

在语音认证技术的实现中,虽然可以使用芯片来快速地处理用于语音认证的大量信息,但目前通用的方法是使可移植的软件系统来实现语音认证功能。

传统的语音认证系统都是基于客户机-服务器结构的,这需要巨大的存储器和功能强大的处理器来存储数据和执行模式匹配技术,以在服务器侧将即时语音与存储的被授权者的声纹进行比较。而且,通常语音模板的信息比其它类型的生物统计信息大得多,这就要求必须有快速的服务器和快速的筛选软件。同时,这也使得认证用户所需的时间较长。从而产生了在具有有限资源的客户端实现语音认证功能的需要。如果语音认证系统采用在客户端进行语音认证,则例如声纹的语音数据可以存储在称为语音标识(ID)卡的可移动存储介质中,该可移动存储介质例如可以是基于智能卡(smart card)的。当需要对用户进行认证时,由用户向认证系统提供语音ID卡,客户机根据该语音ID卡中存储的语音数据与该用户的声音进行匹配,从而实现语音认证。然而,为了增强信任和扩大应用范围,上述使用可移动存储介质的语音认证系统还必须解决以下问题。

第一,语音ID卡的安全问题。将被授权者的声纹等语音数据存储在可移动存储介质中的最大问题就是该移动存储介质本身的安全,因为移动存储介质容易丢失、被盗和误用。

第二,防止数据窃用的问题。由于采用语音认证技术的系统都涉及机密信息,而目前也出现了允许访问机密系统的技术,因此担心黑客是否会危害语音认证系统。例如,通过播放某个人的声音录音骗取普通的语音认证系统的认证。现在,许多复杂的系统都创建详细的声纹信息,从而不会容易地与录制的声音进行匹配。但是,一些高精度的声音模拟器生成的声音在许多情况下仍然能够骗过纯粹的语音认证系统。

第三,一致的准确性问题。语音认证是准确性最低的生物统计安全系统。在现实生活中使用时,用户的行为和环境因素都可能会降低语音认证系统的准确性,例如背景噪声或者用户的声音由于健康、情绪状态、疲劳、年龄或其它原因引起的变化等。这就使得只依赖语音认证作为唯一的安全措施的系统有问题。为了解决这一问题,研究人员采用多种方法以改善语音认证的准确性。但是如果在只有低档麦克风和有限系统资源的家里的环境而不是实验室环境中,很难应用复杂的语音认证系统。

发明内容

本发明正是鉴于上述技术问题而提出的,其目的在于提供一种使用可移动的语音ID卡的语音认证系统及语音认证方法,即使存储有被授权者的声纹的可移动存储介质丢失或被盗,也可以防止其声纹的误用。

根据本发明的一个方面,提供一种使用可移动的语音ID卡的语音认证系统,包括:

服务器侧,

声纹数据库,用于存储所有被授权者的声纹;

声纹更新装置,用于更新所述声纹数据库中的声纹;以及

声纹摘要生成器,用于根据客户端的请求生成声纹摘要;

客户端,

语音ID卡,用于存储某个被授权者的声纹;

验证装置,用于根据来自服务器的声纹摘要执行对语音ID卡中的声纹的验证;

音频装置,用于与用户进行语音交互;

语音认证装置,用于识别来自所述语音ID卡的声纹与来自所述音频装置的声音是否来自同一个说话者。

优选地,所述语音认证系统在客户端还包括:

随机通行码生成器,用于随机生成作为通行码的文本原稿;

文本语音转换装置,用于根据文本原稿生成音频数据,发送到所述音频装置;以及

语音识别装置,用于识别用户通过所述音频装置输入的语音的语义,并判断其是否与所述随机通行码生成器生成的文本原稿相同,由此确定所述用户是否可被授权。

优选地,所述声纹数据库中包括与各声纹对应的声纹摘要,所述声纹摘要生成器,用于根据客户端的请求从所述声纹数据库中检索出相应的声纹摘要。

优选地,所述摘要生成器根据客户端的请求实时产生所请求的声纹摘要。

优选地,所述语音认证系统在客户端还包括:

计时器,用于记录用户从被通知输入声音时到输入声音为止的时间。

优选地,所述语音认证系统在客户端还包括:

计数器,用于记录认证失败的次数。

根据本发明的另一个方面,提供一种使用可移动的语音ID卡的语音认证方法,包括以下步骤:

用户在客户机中插入存储有被授权者的声纹的语音ID卡;

客户机向服务器请求对应于该语音ID卡中的声纹的声纹摘要;

客户机生成该语音ID卡中的声纹的摘要;

比较上述两个声纹的摘要;以及

在两者匹配情况下,执行语音认证过程;否则,拒绝用户的请求。

优选地,所述执行语音认证过程的步骤还包括:

客户机随机生成通行码,转换成语音,向用户播放;

用户重复上述语音;

客户机识别用户通过音频装置输入的语音的语义,并判断其是否与所述通行码所对应的文本原稿相同,由此确定所述用户是否可被授权。

优选地,所述认证方法还包括步骤:更新服务器内存储的被授权者的声纹。

优选地,所述执行语音认证过程的步骤还包括:

通知用户输入声音,同时开始计时;

如果在预定时间内用户还未输入声音,则表示认证失败。

优选地,所述执行语音认证过程的步骤还包括:

当认证失败时,提示用户再次输入语音;

记录执行认证失败的次数;以及

当所述失败次数超过预定次数时,拒绝用户的请求,此次认证结束。

根据本发明的再一个方面,提供一种使用可移动的语音ID卡的语音认证系统,包括:

语音ID卡,用于存储某个被授权者的声纹;

音频装置,用于与用户进行语音交互;

语音认证装置,用于识别来自所述语音ID卡的声纹与来自所述音频装置的声音是否来自同一个说话者;

随机通行码生成器,用于随机生成作为通行码的文本原稿;

文本语音转换装置,用于根据文本原稿生成音频数据,发送到所述音频装置;

语音识别装置,用于识别用户通过所述音频装置输入的话语的语义,判断其是否与所述随机通行码生成器生成的文本原稿相同,由此确定所述用户是否可被授权。

在根据本发明的使用可移动的语音ID卡的语音认证系统和方法中,利用服务器中的声纹摘要来验证语音ID卡中的声纹,可有效地防止在语音ID卡丢失或被盗后的误用,同时也保留了现有基于客户机的语音认证系统的优点。采用本发明,还可以在语音ID卡丢失或被盗时更新服务器中的声纹,以使旧的声纹无效。此外,在本发明中,利用文本语音转换系统生成随机的语音通行码,这可以在声学和语义学两方面验证用户的声音,从而避免利用录音骗取语音认证,同时增强了基于简单声学的语音认证系统的可靠性。

附图说明

图1是根据本发明的一个实施例的语音认证系统的结构框图;

图2是根据本发明的另一个实施例的语音认证系统的结构框图;

图3是根据本发明的再一个实施例的语音认证系统的结构框图;

图4是根据本发明的一个实施例的语音认证方法的流程图;以及

图5是根据本发明另一个实施例的语音认证方法的流程图。

具体实施方式

相信通过以下结合附图对本发明具体实施例的详细描述,本发明的上述和其它目的、特征及优点会变得更明显。

图1是根据本发明的一个实施例的语音认证系统的结构框图。

如图1所示,该语音认证系统,在服务器侧,包括:声纹数据库202,其中存储了所有被授权者的声纹;声纹摘要生成器201,用于根据客户端的请求生成声纹摘要(用于表征声纹特征的信息),以便验证语音ID卡101中的声纹;以及,声纹更新装置203,用于在语音ID卡丢失或被盗时或定期地更新声纹数据库201中的声纹。优选地,声纹数据库202中还包括与各声纹对应的声纹摘要,而声纹摘要生成器201在接收到来自客户端的请求时,从声纹数据库202中检索出相应的声纹摘要发送给客户端。此外,摘要生成器201还可以根据客户端的请求实时产生所请求的声纹摘要,并将实时产生的声纹摘要发送给客户端。

该语音认证系统,在客户端,包括:语音ID卡101,其中存储了某个被授权者的声纹,可使用如基于Smart卡的可移动介质实现;音频装置104,通过它,用户向语音认证系统输入声音作为被认证对象,语音认证系统向用户播放语音提示,如通知用户可以输入声音等;验证装置102,根据来自声纹摘要生成器201的声纹摘要,对语音ID卡101中的声纹进行验证,然后将验证结果发送给音频装置104和语音认证装置103,以控制音频装置102和语音认证装置103的操作;语音认证装置103,其在验证装置102的验证结果是肯定的时候识别来自语音ID卡101的声纹与从音频装置104输入的声音是否来自同一个说话者,即识别向系统输入声音的用户是否是语音ID卡101中的声纹的提供者。

图1所示的语音认证系统的工作过程如下所述。用户首先在客户机中插入带有被授权者声纹的语音ID卡101,卡101中的声纹被传送到验证装置102。验证装置102建立与服务器的连接,向位于服务器侧的声纹摘要生成器201发送声纹验证请求,在该声纹验证请求中包含所请求的声纹的ID信息,声纹摘要生成器201根据该ID信息搜索对应的声纹摘要或根据声纹数据库202中的声纹实时产生声纹摘要,然后将该声纹摘要发回给验证装置102。同时,验证装置203对语音ID卡101中的声纹生成摘要,将其与从服务器返回的声纹摘要进行比较,然后向音频装置104和语音认证装置103发送控制信号。

如果比较的结果是否定的,即两个摘要不一致,则发送“拒绝”控制信号以阻止用户访问任何业务和应用程序,此次认证失败。

如果比较的结果是肯定的,即语音ID卡101中的声纹摘要与从服务器获得的声纹摘要是一致的,则发送“成功”控制信号,音频装置104收到后,向用户播放语音提示,通知用户输入声音。在这种情况下,播放的语音提示是预先录制的。同时,语音认证装置103收到“成功”控制信号后,通知用户通过音频装置104输入声音,其声音被传送到语音认证装置103中。语音认证装置103接收来自音频装置104的声音输入,并识别该声音是否与从语音ID卡101获得的声纹来自同一个说话者,产生识别结果。如果识别结果是肯定的,则表示认证成功,输入声音的用户的身份被核实,用户可以进行后续的访问;如果识别结果是否定的,则表示认证失败,拒绝用户的访问请求。

在语音ID卡101丢失或被盗的情况下,用户可以利用声纹更新装置203从声纹数据库202中调出旧的声纹进行改编再存储到声纹数据库202中或用新的声纹直接覆盖旧的声纹。新的声纹也可以下载到新的语音ID卡101上。

通过以上描述,可以看出,采用本实施例的系统,通过利用服务器内存储的声纹对语音ID卡中的声纹进行验证,可以防止语音ID卡在丢失或被盗后的误用。具体地说,在本实施例的系统中,在语音ID卡丢失或被盗时,可以通过声纹更新装置更新被授权者的声纹,从而防止丢失的语音ID卡被盗用或误用。

图2是根据本发明的另一个实施例的语音认证系统的结构框图,其中与图1所示实施例相同的部分使用相同的标记,并适当省略其说明。

如图2所示,该语音认证系统除了包括位于服务器侧的声纹摘要生成器201、声纹数据库202和声纹更新装置203、位于客户端的语音ID卡101、音频装置104、语音认证装置103和验证装置102之外,在客户端还包括:随机通行码生成器105、文本语音转换装置106、语音识别装置107和控制装置108。其中,随机通行码生成器105,在控制装置108的控制下,随机生成用于对用户的声音进行声学和语义确认的文本原稿,发送到文本语音转换装置106;文本语音转换装置106,根据接收的文本原稿生成音频数据,发送到音频装置104向用户播放;语音识别装置107,识别用户通过音频装置104输入的语音的语义,并判断识别的结果是否与随机通行码生成器105生成的文本原稿相同;控制装置108,用于控制随机通行码生成器105,以及用于接收语音认证装置103的识别结果和语音识别装置107的判断结果,确定所述用户是否可被授权。在本实施例中,验证装置102的输出连接到控制装置108,控制装置108根据验证装置203的验证结果来控制随机通行码生成器105。

下面对图2所示系统的工作过程进行描述,其中对于与图1所示系统的工作过程相同的部分省略其描述。

在验证装置102的验证结果是否定的情况下,即向控制装置108发送“拒绝”控制信号,此次认证失败,拒绝用户的访问请求。

在验证装置102的验证结果是肯定的情况下,即向控制装置108发送“成功”控制信号,控制装置108收到该控制信号后,控制随机通行码生成器105产生随机的文本原稿,输出到文本语音转换装置106。文本语音转换装置106将该文本原稿转换成语音数据,输出到音频装置104,由音频装置104向用户播放该语音,要求用户重复该语音作为输入。用户输入声音后,其声音被分别传送到语音认证装置103和语音识别装置107中。在语音认证装置103中的语音认证与图1所示系统中的相同,此处省略,识别的结果发送到控制装置108中。而在语音识别装置107中,其对用户输入的话语的语义进行识别,为了改善识别的结果,随机通行码生成器105生成的通行码同时也被传送到语音识别装置107中,用于生成对应的识别语法。然后语音识别装置107将识别的通行码与原始的通行码进行比较,判断两者是否相同,并将判断的结果发送到控制装置108中。控制装置108收到语音认证装置的认证结果和语音识别装置的识别结果后,如果两个结果都是肯定的,则认证成功,该用户可以进行后续的访问;如果有任何一个结果是否定的,则认证失败,拒绝用户的访问请求。

通过以上描述可知,采用本实施例的系统,进一步从声学和语义学上同时验证用户的声音,增强了语音认证系统的准确性;并且通过随机生成文本原稿的方式,有效避免了采用录音骗取语音认证。

此外,该语音认证系统还可以包括计时器,用于记录用户从被通知输入声音时到输入声音为止的时间。当音频装置104开始播放语音时,启动该计时器;当音频装置104收到用户输入的声音时,停止该计时器的工作。计时器设置有阈值,当超过该阈值时,表示用户在预定时间内没有输入声音,则向控制装置108发送信号。控制装置108确定此次认证失败,拒绝用户的访问请求;或者控制音频装置104再次向用户播放语音。

如果控制装置108控制音频装置104再次向用户播放语音,则语音认证系统还可以包括计数器,用于根据控制装置108的控制,记录认证失败的次数。计数器也设置有阈值,当超过该阈值时,向控制装置108发送信号,控制装置108确定此次认证失败,拒绝用户的访问请求。

图3是根据本发明的再一个实施例的语音认证系统的结构框图,其中与图1或图2所示实施例相同的部分使用相同的标记,并适当省略其说明。

如图3所示,语音认证系统包括:语音ID卡101、音频装置104、语音认证装置103、随机通行码生成器105、文本语音转换装置106、语音识别装置107、控制装置108。

图3所示的语音认证系统的工作过程如下所述。当用户想要访问某个具有语音认证功能的系统或应用程序时,需要语音认证系统对该用户的身份进行验证。用户首先在客户机中插入带有被授权者声纹的语音ID卡101,卡101中的声纹被传送到语音认证装置103中。同时,控制装置108控制随机通行码生成器105产生随机的文本原稿作为通行码,输出到文本语音转换装置106。文本语音转换装置106将该文本原稿转换成语音数据,输出到音频装置104,由音频装置104向用户播放该语音,要求用户重复该语音作为输入。用户输入声音后,其声音被分别传送到语音认证装置103和语音识别装置107中。语音认证装置103接收来自音频装置104的声音输入,识别该声音是否与收到的来自语音ID卡101的声纹来自同一个说话者,产生识别结果并发送到控制装置108中。与此同时,在语音识别装置107中,对用户输入的语音的语义进行识别,为了改善识别的结果,随机通行码生成器105生成的通行码也被传送到语音识别装置107中,用于生成对应的识别语法。然后语音识别装置107将识别的通行码与原始的通行码进行比较,判断两者是否相同,将判断的结果发送到控制装置108中。控制装置108收到语音认证装置的认证结果和语音识别装置的识别结果后,如果两个结果都是肯定的,则认证成功,该用户可以进行后续的访问;如果有任何一个结果是否定的,则认证失败,拒绝用户的访问请求。

通过以上描述可知,采用本实施例的系统,可以在客户端从声学和语义学上同时验证用户的声音,增强了语音认证系统的准确性;并且通过随机生成文本原稿的方式,有效避免了采用录音骗取语音认证。

图4是根据本发明的一个实施例的语音认证方法的流程图。如图4所示,当用户访问具有语音认证功能的系统时,需要对用户的身份进行认证。首先在步骤401,用户将存储有被授权者的声纹的语音ID卡插入客户机中,然后在步骤405,客户机向服务器发送请求,以获取存储在服务器中的被授权者的声纹的摘要,在该请求中带有语音ID卡中声纹的ID信息。服务器根据ID信息,查找到存储的声纹摘要或实时生成该声纹的摘要,发回给客户机。在步骤410,客户机生成语音ID卡中的声纹的摘要。然后在步骤415中,客户机对从服务器接收的声纹摘要和语音ID卡中的声纹摘要进行比较。在两者相同的情况下,通知用户输入声音(步骤425);否则,认证失败,拒绝用户的访问请求(步骤420)。在步骤430,用户输入声音到客户机中,客户机识别该声音与语音ID卡中的声纹是否属于同一个说话者(步骤435)。如果上述识别的结果是肯定的,则表明认证成功,结束此次认证(步骤445);否则,认证失败,拒绝用户的访问请求(440)。

通过以上描述可以看出,采用本实施例的语音认证方法,通过在进行正式认证之前对语音ID卡中的声纹进行验证,可以防止语音ID卡丢失或被盗后的误用。

图5是根据本发明的另一个实施例的语音认证方法的流程图,其中与图4所示实施例相同的步骤使用相同的标记,并适当省略其说明。

如图5所示,首先执行步骤401至步骤415,这些步骤与图4中的相同,此处省略其说明。在服务器接收的声纹摘要与语音ID卡中的声纹摘要相同的情况下,客户机随机生成用于语义确认的文本原稿作为通行码(步骤421),在步骤422中将该文本原稿转换成语音数据,并向用户播放,然后用户在步骤423中重复上述语音,以向客户机输入声音。当用户输入声音后,在执行步骤435的同时,客户机从该声音中识别其语义(步骤455),并将识别出的语义与随机生成的通行码进行比较(步骤456)。如果比较的结果是两者相同,并且步骤435的识别结果也是肯定的,则表明对该用户的认证成功,允许该用户进行后续访问(步骤460)。如果步骤456的比较结果或者步骤440的识别结果是否定的,则认证失败,拒绝用户的访问请求。

进一步地,本实施例的语音认证方法还包括:在执行步骤422的同时,进行计时,直到用户输入声音。如果在预定时间内用户还未输入声音,则表示认证失败,拒绝用户的访问请求。

进一步地,在本实施例的语音认证方法中,在认证失败的情况下,还可以包括:提示用户再次输入声音,并记录执行认证失败的次数,如果失败次数超过预定次数,则拒绝用户的请求,此次认证结束。

进一步地,还可以包括对存储在服务器中的声纹进行更新的步骤,具体是:在步骤501中,录制被授权者的几段话语,接着在步骤502中,根据被授权者的信息,从服务器中调出该被授权者的旧的声纹,然后,根据新录制的话语对旧的声纹进行改编(步骤503),用改编后的新的声纹替换旧的声纹,存储在服务器中(步骤504)。新的声纹也可以下载到新的语音ID卡上。

通过以上描述可以看出,采用本实施例的方法,从声学和语义学两个方面对用户输入的声音进行认证,提高了语音认证的准确性,并且采用随机生成通行码的方式,有效地避免了采用录音骗取语音认证。此外,本实施例允许对服务器中存储的声纹更新,有效防止了语音ID卡丢失或被盗后的误用。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号