首页> 中国专利> 利用多语言字典执行语音识别的系统和方法

利用多语言字典执行语音识别的系统和方法

摘要

本发明包括一种利用多语言字典进行语音识别的系统和方法,并且可以包括一个识别器,该识别器被配置成将输入的语音数据与多语言字典中的一系列字典条目作比较,以便检测一个识别的短语或命令。所述多语言字典可以用混合语言技术来实现,该技术利用用于合并如广东话和英语之类的多种不同语言的字典条目。因此,所述语音识别器可以有利地以有效且简洁的方式获得更为准确的语音识别准确度。

著录项

  • 公开/公告号CN1598924A

    专利类型发明专利

  • 公开/公告日2005-03-23

    原文格式PDF

  • 申请/专利权人 索尼电子有限公司;

    申请/专利号CN200410056611.4

  • 申请日2004-08-11

  • 分类号G10L15/08;G10L15/14;G10L15/00;G06K9/00;

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人程天正;王勇

  • 地址 美国新泽西州

  • 入库时间 2023-12-17 16:04:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-18

    未缴年费专利权终止 IPC(主分类):G10L15/08 专利号:ZL2004100566114 申请日:20040811 授权公告日:20070418

    专利权的终止

  • 2007-04-18

    授权

    授权

  • 2005-05-25

    实质审查的生效

    实质审查的生效

  • 2005-03-23

    公开

    公开

说明书

技术领域

本发明总体涉及电子语音识别系统,更具体来说,涉及利用多语言字典来执行语音识别的系统和方法。

背景技术

对于系统设计者和制造商来说,实现一种让系统用户与电子设备接口的健壮且有效的方法是十分重要的考虑因素。对于许多系统用户来说,电子设备的语音控制操作是理想的接口。举例来说,语音控制操作允许用户同时执行其它任务。例如,人们可以在操作汽车的同时通过语音控制操作电子组织者(organier)。而对于有身体缺陷或者有其他特殊要求的用户来说,电子系统的无手操作也可能是理想的。

通过各种语音激励的电子系统可以实现电子设备的无手操作。因此,在利用传统输入设备往往会不方便或有潜在危险的情况下,语音激励的电子系统有利地允许用户与电子设备接口。电子娱乐系统也可以利用语音识别技术以允许用户通过对系统说话来与之互动。

然而,有效地实现此类系统对系统设计者来说是相当大的挑战。举例来说,对于增强系统功能和性能的提高的要求可能需要更强的系统处理能力和附加的硬件资源。提高对处理和硬件的要求,可能产生由于增加的生产成本和操作的低效率而导致导致相应的不利的经济影响。

此外,虽然增强系统执行各种高级操作的能力可以为系统用户提供附加的好处,但是也会提高对控制和管理各系统组件的要求。举例来说,由于涉及大量复杂的数字数据,能有效识别广东话和英语这二者中单词及短语的增强的系统可以从有效的实施方案中获益。因此,出于所有上述原因,对于系统设计者和制造商来说,实现一种让系统用户与电子设备接口的健壮且有效的方法仍是十分重要的考虑因素。

发明内容

按照本发明,公开了通过利用多语言字典来执行语音识别的系统和方法。在某些实施例中,语音识别器可以将输入的语音数据与字典中的字典条目作比较,所述字典是通过利用在几个不同字典条目类中合并多种不同语言的混合语言技术来实现的。在一个实施例中,上述各字典条目类可以包括(但不限于)广东话类、英语类、混合的广东话-英语类以及借用(borrowed)英语类。

在某些实施例中,广东话类可以包括从广东话语言中选出的任何适当的单词和短语。同样地,英语类可以包括从英语语言中选出的任何适当的单词和短语。然而,为将英语发音转换成相应的广东话发音,来自英语类的单词和短语一般会需要一个英语-广东话发音转换过程。

混合的广东话-英语类可以包括具有从广东话和英语语言中选出的任何适当的单词和短语的条目。按照本发明,可以组合这些来自两种不同语言的单词,以便在字典中创建单个的条目。然而,正如以上所讨论的,为将英语发音转换成相应的广东话发音,来自英语语言的单词可能需要一个英语-广东话发音转换过程。

在某些实施例中,借用英语类可以包括英语语言中的、已经典型地合并在说广东话的人们的标准日常使用中的任何适当的单词。比起相同单词的标准英语发音,在借用英语类中的单词一般会显示出发音变化。实际上,来自借用英语类的单词也可以和来自广东话语言及/或英语语言的单词相组合,以便为字典创建单个的条目。

本发明通过利用单一优化的音素组提供一种用于表示多语言字典的简洁(compact)方法。因此,本发明利用上述用于实现多语言字典的改进的混合语言语音识别技术,从而提供广东话语言口语的准确表示,该表示典型地合并来自英语语言的各种单词和短语。因此,本发明提供一种通过利用多语言字典来执行语音识别的有效系统和方法。

附图说明

图1是按照本发明的计算机系统的一个实施例的方框图;

图2是按照本发明的图1的存储器的一个实施例的方框图;

图3是按照本发明的图2的语音检测器的一个实施例的方框图;

图4是按照本发明的图2的隐藏式马尔可夫模型的一个实施例的图示;

图5是按照本发明的图2的字典的一个实施例的图示;

图6是按照本发明一个实施例的图5的字典条目的图示;

图7是按照本发明一个实施例的最优化音素组的图示;

图8是按照本发明一个实施例的混合语言语音识别技术的图示;以及

图9是按照本发明一个实施例的英语-广东话发音转换过程的图示。

具体实施方式

本发明涉及在语音识别系统上的改进。下面的说明是在专利申请及其要求的情境下提供的,以使得本领域普通技术人员能够制造及使用本发明。本领域技术人员可以很容易的想到对各优选实施例的各种修改,并且本文中的一般原理也可被应用于其它实施例。因此,本发明不非旨在被限制于所示的各实施例,而是希望被授予与其中所描述的各原理和特征相一致的最广范围。

本发明包括利用多语言字典进行语音识别的系统和方法,并且可以包括一个识别器,该识别器被配置成将输入的语音数据与多语言字典中的一系列字典条目作比较,以便检测到一个识别出的短语或命令。所述多语言字典可以用混合语言技术来实现,该技术利用合并了如广东话和英语之类的多种不同语言的字典条目。因此,所述语音识别器可以有利地以有效且简洁的方式获得更为准确的语音识别准确率。

现参照图1,其中示出了按照本发明的计算机系统110的一个实施例的方框图。图1的实施例包括声音(sound)传感器112、放大器116、模数转换器120、中央处理单元(CPU)128、存储器130以及输入/输出接口132。在各替换实施例中,除了结合图1的实施例讨论的那些单元和功能之外,计算机系统110可以容易地包括各种其它单元和功能,或者用其它单元和功能替换图1中的那些单元和功能。

声音传感器112检测声音能量,并将所检测到的声音能量转换成模拟语音信号,以便将其经线路114提供给放大器116。放大器116放大所接收的模拟语音信号,并将所放大的模拟语音信号经线路118提供给模数转换器120。模数转换器120随后将放大的模拟语音信号转换成相应的数字语音数据。然后,模数转换器120将数字语音数据经线路122提供给系统总线124。

CPU 128随后可以访问系统总线124上的数字语音数据,并响应地分析和处理该数字语音数据,以便按照包含在存储器130中的软件指令执行语音检测。后面会结合图2-3进一步讨论CPU 128的操作和存储器130中的软件指令。在处理完语音数据之后,CPU 128随后可以将语音检测分析的结果经输入/输出接口132提供给其它装置(未示出)。在各替换实施例中,可以很容易地在图1所示的计算机系统110之外的各种装置中实现本发明。

现参照图2,其中示出了按照本发明的图1的存储器130的一个实施例的方框图。存储器可以替换地包括各种存储装置配置,包括随机存取存储器(RAM)和诸如软盘或硬盘驱动器之类的存储装置。在图2的实施例中,存储器130包括(但不限于)语音检测器210、隐藏式马尔可夫模型(HMM)212以及词汇表字典214。在各替换实施例中,除了结合图2的实施例讨论的那些单元和功能之外,存储器130可以容易地包括各种其它单元和功能,或者用其它单元和功能替换图2中的那些单元和功能。

在图2的实施例中,语音检测器210包括一系列由CPU 128执行以便分析和识别语音数据的软件模块,后面会结合图3进一步说明这些模块。在各替换实施例中,可以使用各种其它软件和/或硬件配置来容易地实现语音检测器210。语音检测器210可以利用HMM 212和字典214来实现本发明的语音识别功能。后面会结合图4进一步讨论HMM212的一个实施例,以及结合图5进一步讨论字典214的一个实施例。

现参照图3,其中示出了按照本发明的图2的语音检测器210的一个实施例的方框图。语音检测器210包括(但不限于)特征提取器310、端点检测器312以及识别器314。在各替换实施例中,除了结合图3的实施例讨论的那些单元和功能之外,语音检测器210可以容易地包括各种其它单元和功能,或者用其它单元和功能替换图3中的那些单元和功能。

在图3的实施例中,模数转换器120(图1)将数字语音数据经系统总线124提供给特征提取器310。特征提取器310响应地生成特征矢量,并将其经路径320提供给识别器314。特征提取器310还响应地生成语音能量以将其经路径322提供给端点检测器312。端点检测器312分析语音能量,并响应地确定由语音能量所代表的话语(utterance)的端点。所述端点表示话语在时间上的开始和结束。端点检测器312随后将端点经路径324提供给识别器314。

识别器314优选地被配置成识别预定词汇表中的命令,所述词汇表被表示在字典214中(图2)。字典214中的上述词汇表命令可以对应于所有希望的命令、指令或用于计算机系统110的其它讯息。随后可以将所识别的词汇表命令经路径332输出到系统110。

实际上,字典214中的每一条命令都可以和代表该单词的一个对应音素串(各单个音素的串)相关联。隐藏式马尔可夫模型(HMM)212(图2)可以包括对一个预定音素组中的每个音素的训练的统计表示,可以有效地利用所述音素组来表示字典214中的各命令。识别器314随后可以将来自线路320的输入的特征矢量与适当的HMM 212作比较(该比较是对于字典214中的每一个音素串进行的),以便确定哪一个命令产生最高的识别分数。因此,对应于最高识别分数的命令可以被视为所识别的命令。

现参照图4,其中示出了按照本发明的图2的HMM 212的一个实施例的方框图。在图4的实施例中,HMM 212优选地包括模型1(412(a))到模型N(412(c))。在各替换实施例中,除了结合图4的实施例讨论的那些单元和功能之外,HMM 212可以容易地包括各种其它单元和功能,或者用其它单元和功能替换图4中的那些单元和功能。

在图4的实施例中,HMM 212可以容易地被实现为包括任何希望数目的模型412,所述模型可以包括任何所需要的类型的信息。在图5的实施例中,HMM 212中的每个模型412可以对应于识别器314(图3)所使用的预定音素组中的一个不同的特定音素。

现参照图5,其中示出了按照本发明一个实施例的图2的字典214的方框图。在图5的实施例中,字典214可以优选地包括条目1(512(a))到条目N(512(c))。在各替换实施例中,除了结合图5的实施例讨论的那些单元和功能之外,字典214可以容易地包括各种其它单元和功能,或者用其它单元和功能替换图5中的那些单元和功能。

在图5的实施例中,字典214可以容易地被实现为包括任何希望数目的条目512,所述条目可以包括任何所需要的类型的信息。如前面结合图3所讨论的那样,在图5的实施例中,字典214中的每个条目512也可以包括一个预定的音素组中的各单个音素的对应音素串。上述音素串中的各单个音素优选地构成字典214中对应单词发音的顺序(sequential)表示。后面会结合图6进一步讨论字典条目512的一个实施例。

现参照图6,其中示出了按照本发明一个实施例的图5的字典条目512的示例性方框图。在各替换实施例中,本发明可以容易地使用各字典条目来执行语音识别,除了结合图6的实施例讨论的那些单元和功能之外,所述条目可以容易地包括各种其它单元和功能,或者用其它单元和功能替换图6中的那些单元和功能。

在图6的实施例中,字典条目512可以包括一个词汇表中的一条特定命令610,识别器314(图3)被设计成识别该词汇表。在各种实施例中,命令610可以是任何类型的话语或语音,包括句子、短语、命令、问题或可以按照适当的表示方案来表示的单词。此外,字典条目512可以包括代表命令610的顺序(sequential)声音特性的音素串。与命令610相关联的音素串可以由一个预定音素组中的一系列音素构成,该音素组由识别器314使用。在图6的实施例中,上述音素串可以包括音素1(612(a))到音素N(612(b))。

出于说明的目的,提供下面的表I作为广东话语言的字典214的一个实施例。由于广东话一般用中文字而不是罗马字母书写,下面的表I利用称为“jyutping”的广东话罗马化方案来表示,该方案由香港语言学学会(LSHK)开发。可以在万维网上的cpct91.cityu.edu.hk/lshk处找到关于“jyutping”和香港语言学学会的更多信息。

在各替换实施例中,本发明可以利用由各种其它类型的罗马化方案表示的多语言字典,其中包括任何其它适当的语言的多语言字典。下面提供表I作为字典214的一个实施例,表I包括位于左侧的命令610以及位于右侧的表示对应命令610的发音的音素612的对应音素串。在各替换实施例中,可以以不同于下面表I中所示方式的各种其它方式来组织多语言字典。

表I:

aai1_bou4:                 sil aa b ou sil

aai1_bou4:                 sil aai b ou sil

aai1_bou4:                 sil ng aai b ou sil

baai1_baai3:               sil b aai b aai sil

baai2_go3_pou1_si2:        sil b aai g o p ou s i sil

bei2_jat1_go3_zi6_ngo5:    sil b eij a t g o z i ng o sil

bei2_jat1_go3_zi6_ngo5:    sil b ei j a t g o z i o sil

caa4_ngo5_ge3_seon3:       sil c aa ng o g e i m eu sil

caa4_ngo5_ge3_seon3:       sil c aa ng o g e s eo n sil

caa4_ngo5_ge3_seon3:       sil c aa o g e i m eu sil

caa4_ngo5_ge3_seon3:       sil c aa o g e s eo n sil

caa4_seon3:                sil c aa i m eu sil

caa4_seon3:                sil c aa s eo n sil

caa4_seon3:                sil c e k i m eu sil

co5_dai1:                  sil c o d ai sil

co5_dai1:                  sil c o d ai l aa sil

co5_dai1:                  sil s i cl sil

daa2_kyun4:                sil d aa  k yu n sil

daa2_kyun4:                sil h eoi d aa g aau sil

daa2_kyun4:                sil k yu n g i cl sil

dai6_jat1_jip6:            sil d aij a tj i cl sil

dai6_ji6_jip6:             sil d aij ij i cl sil

dai6_ji6_zek3_sau2:        sil d ai j i z e k s au sil

dai6_ng5_jip6:             sil d ai mj i cl sil

dai6_ng5_jip6:             sil d ai ngj i cl sil

dai6_saam1_jip6:           sil d ai s aa m j i cl sil

dai6_sei3_jip6:            sil d ai s ei j i cl sil

dai6_seng1_di1_laa1:       sil d ai s e ng d i sil

dai6_seng1_di1_laa1:       sil d ai s e ng d i l aa sil

dong2_dak1_hou2:           sil d o ng d a k h ou sil

dong2_dak1_hou2:           sil z i p d a k h ou sil

duk6_dai6_jat1_jip6:       sil d u k d ai j a tj i cl sil

duk6_dai6_ji6_jip6:        sil d u k d aij i j i cl sil

duk6_dai6_ng5_jip6:        sil d u k d ai mj i cl sil

duk6_dai6_ng5_jip6:        sil d u k d ai ngj i cl sil

duk6_dai6_saam1_jip6:      sil d u k d ai s aa m j i cl sil

duk6_dai6_sei3_jip6:       sil d u k d ai s eij i cl sil

duk6_haa6_jat1_fung1_seon3:sil d u k h aaj a t fu ng s eo n sil

duk6_haa6_jat1_fung1 seon3:sil d u k h aaj a t g o i m eu sil

duk6_jyun4_seon3_gin2:     sil d u k j yu n s eo n g i n sil

duk6_jyun4_seon3_gin2:     sil t ai j yu n s eo n g i n sil

duk6_ngo5_ge3_seon3:       sil d u k ng o g e s eo n sil

duk6_ngo5_ge3_seon3:       sil d u k o g e s eo n sil

duk6_seon3:                sil d u k s eo n sil

duk6_seon3_jing4_sik1:     sil d u k s eo nj i ng s i cl sil

duk6_soeng6_jat1_fung1_seon3:

                            sil d u k s oe ngj a t f u ng sil

duk6_soeng6_jat1_fung1_seon3:

                            sil d u k s oe ngj a t f u ng i m eu sil

duk6_soeng6_jat1_fung1_seon3:

                            sil d u k s oe ngj a t f u ng s eo n sil

duk6_soeng6_jat1_fung1_seon3:

                            sil d u k s oe ng j a t g o i m eu sil

faai3_di1_laa1:            sil f aai d i sil

faai3_di1_laa1:           sil f aai d i l aa sil

faai3_di1_laa1:           sil g aa c u cl sil

faan1_heoi3_fan3_laa1:    sil f aa n h eoi f a n l aa sil

faan1_heoi3_soeng5_jat1_fung1_seon3:

                           sil f aa n h eoi s oe ng j a t f u ng sil

faan1_heoi3_soeng5_jat1_fung1_seon3:

                           sil f aa n h eoi s oe ng j a t f u ng i m eu sil

faan1_heoi3_soeng5_jat1_fung1_seon3:

                           sil f aa n h eoi s oe ng j a t f u ng s eo n sil

faan1_heoi3_soeng5_jat1_fung1_seon3:

                           sil f aa n h eoi s oe ng j a t g o i m eu sil

fai6_jaa1:                sil f ail aa sil

fan3_jat1_zan6:           sil f a n j a t z a n sil

gam3_dak1_ji3_ge3:        sil g a m d a k j i g e sil

gam3_dak1_ji3_ge3:        sil h ou d a kj i sil

gam3_ho2_ngoi3_ge3:       sil g a m h o ng oi g e sil

gam3_ho2_ngoi3_ge3:       sil h ou h o ng oi sil

git3_cuk1_duk6_seon3_jing4_sik1:

                           sil g i t c u k d u k s eo n j i ng s i cl sil

git3_cuk1_duk6_seon3_jing4_sik1:

                           silj yu n s i ng d u k s eo n j i ng s i cl sil

giu3_jan4_laa1:           sil g iu j a n l aa sil

giu3_jan4_laa1:           sil s ei h aa l ou sil

giu3_jan4_laa1:           sil t u ng h eoi s ei h aa l ou sil

giu3_jan4_laa1:           sil t u ng k eoi s ei h aa l ou sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h ai b i n aa sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h ai b i n d ou aa sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h ai b i n d ou o sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h ai b i n o sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h eoi z o b i n aa sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h eoi z o b i n d ou aa sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h eoi z o b i n d ou o sil

go3_bo1_hai2_bin1_aa3:    sil g o b o h eoi z o b i n o sil

goi2_meng2:               sil g oi m e ng sil

gui6_m4_gui6_aa3:         sil g ui m g ui aa sil

gui6_m4_gui6_aa3:         sil g ui m g ui o sil

gui6_m4_gui6_aa3:         sil l ei g ui m aa sil

gui6_m4_gui6_aa3:         sil l ei g ui m g ui aa sil

gui6_m4_gui6_aa3:         sil l ei g ui m g ui o sil

gui6_m4_gui6_aa3:         sil n ei g ui m aa sil

gui6_m4_gui6_aa3:         sil n ei g ui m g ui aa sil

gui6_m4_gui6_aa3:         sil n ei g ui m g ui o sil

gwaan1_gin6_ci4:          sil g w aa n g i n c i sil

haa6_jat1_fung1_seon3:    sil h aaj a t f u ng i m eu sil

haa6_jat1_fung1_seon3:    sil h aa j a t f u ng s eo n sil

haa6_jat1_fung1_seon3:    sil h aaj a t g o i m eu sil

haa6_jat1_fung1_seon3:    sil h eoih aaj a t f u ng i m eu sil

haa6_jat1_fung1_seon3:    sil h eoih aaj a t fu ng s eo n sil

haa6_jat1_fung1_seon3:    sil h eoi h aaj a t g o i m eu sil

haail:                    sil h aai sil

haail                      sil l ei h ou sil

haail:                    sil n ei h ou sil

hap6_maai4_zeoi2:         sil h a p m aai g o z eoi sil

hap6_maai4_zeoi2           sil h a p m aai z eoi sil

hei2_san1:                sil h ei s a n sil

hei2_san1:                sil h ei s a n aa sil

hei2_san1:                sil h ei s a n l aa sil

hei2_sanl:                sil h ei s a n o sil

hei2_san1:                sil k ei h ei s a n sil

hei2_san1:                sil k ei h ei s a n aa sil

hei2_san1:                sil k ei h ei s a n l aa sil

hei2_san1:                sil k ei h ei s a n o sil

heoi3_haang4_haa5_laa1:   sil h aa ng h aa sil

heoi3_haang4_haa5_laa1:    sil h aa n h aasil

heoi3_haang4_haa5_laa1:    sil h eoi h aa ng h aa l aa sil

heoi3_haang4_haa5_laa1:    sil h eoi h aa n h aa l aa sil

heoi3_waan2_laa1:          sil h eoi w aa n aa sil

heoi3_waan2_laa1:          sil h eoi w aa n l aa sil

heoi3_waan2_laa1:          sil h eoi w aa n o sil

heoi3_waan2_laa 1:         sil w aa n aa sil

heoi3_waan2_laa1:          sil w aa n l aa sil

heoi3_waan2_laa1:          sil w aa n o sil

heoi3_zap1_bo1_laa1:       sil f aai d i h eoi w a n g o b o l aa sil

heoi3_zap1_bo1_laa1:       sil h eoi d aam b o l aa sil

heoi3_zap1_bol_laa1:       sil h eoi w a n g o b o l aa sil

heoi3_zap1_bo1_laa1:       sil h eoi z a p b o l aa sil

hoeng3_cin4:               sil h aa ng h eoi c i n b i n sil

hoeng3_cin4:               sil h aa ng h eoi c i n m i n sil

hoeng3_cin4:               sil h aa n h eoi c i n b i n sil

hoeng3_cin4:               sil h aa n h eoi c i n m i n sil

hoeng3_cin4:               sil h eoi c i n b i n sil

hoeng3_cin4:               sil h eoi c i n m i n sil

hoeng3_cin4:               sil h oe ng c i n sil

hoeng3_hau6:               sil f aa n h eoi l aa sil

hoeng3_hau6:               sil h eoi h au b i n sil

hoeng3_hau6:               sil h eoi h au m i n sil

hoeng3_hau6:               sil h oe ng h au sil

hoi1_ci2_bei2_coi3:        sil b ei c oi h oi c i sil

hoi1_ci2_bei2_coi3:        sil h oi c i b ei c oi sil

hoi1_ci2:                  sil h oi c i sil

hou2_jai5_aa3:             sil g a m j ai g aa sil

hou2_jai5_a3:              sil h ou j ai aa sil

hou2_jai5_aa3:             sil h ou j ai o sil

hung1_sau2_dou6:           sil h u ng s au d ou sil

jap6_kau4:                 sil j a p k au sil

jat1_ji6_saam1_siu3:       sil j a t j i s aa m s iu sil

jau5_mou5_seon3_aa3:       sil j au m ou s eo n aa sil

jau5_mou5_seon3_aa3:       sil j au m ou s eo n o sil

jau5_mou5_seon3_aa3:       sil ng o j au m ou s eo n aa sil

jau5_mou5_seon3_aa3:       sil ng oj au m ou s eo n o sil

jau5_mou5_seon3_aa3:       sil o j au m ou s eo n aa sil

jau5_mou5_seon3_aa3:       sil o j au m ou s eo n o sil

jau5_mou5_si6_aa3:         sil d i m aa sil

jau5_mou5_si6_aa3:         sil d i m o sil

jau5_mou5_si6_aa3:         sil j au m ou s i aa sil

jau5_mou5_si6_aa3:         sil j au m ou s i o sil

jau5_mou5_si6_aa3:         sil l ei d i m aa sil

jau5_mou5_si6_aa3:         sil l ei d i m o sil

jau5_mou5_si6_aa3:         sil l eij au m ou s i aa sil

jau5_mou5_si6_aa3:         sil l eij au m ou s i o sil

jau5_mou5_si6_aa3:         sil l ei m ou s i a m aa sil

jau5_mou5_si6_aa3:         sil n ei d i m aa sil

jau5_mou5_si6_aa3:         sil n ei d i m o sil

jau5_mou5_si6_aa3:         sil n ei j au m ou s i aa sil

jau5_mou5_si6_aa3:         sil n eij au m ou s i o sil

jau5_mou5_si6_aa3:         sil n ei m ou s i a m aa sil

jau6_min6:                 sil h eoi j au b i n sil

jau6_min6:                 sil h eoi j au m i n sil

jau6_min6:                 sil j au b i n sil

jau6_min6:                 sil j au m i n sil

ji4_gaa1_gei2_dim2_aa3:    sil j i g aa g ei d i m sil

ji4_gaa1_gei2_dim2_aa3:    sil j i g aa g ei d i m aa sil

ji4_gaa1_gei2_dim2_aa3:    sil j i g aa g ei d i m o sil

ji4_gaa1_gei2_dim2_aa3:    sil j i g aa g ei d i m z u ng sil

ji4_gaa1_gei2_dim2_aa3:    sil j i g aa g ei d i m z u ng aa sil

ji4_gaa1_gei2_dim2_aa3:    sil j i g aa g ei d i m z u ng o sil

jing2_soeng2_laa1:         sil j i ng s oe ng sil

jing2_soeng2_laa1:         sil j i ng s oe ng aa sil

jing2_soeng2_laa1:         sil j i ng s oe ng l aa sil

jing2_soeng2_laa1:         sil j i ng s oe ng o sil

jing2_soeng2_laa1:         sil j i ng z oe ng s oe ng sil

jiu3_heoi3_fan3_laa3:      sil j iu f a n g aau l aa sil

jiu3_heoi3_fan3_laa3:      sil j iu h eoi f a n l aa sil

jiu3_m4_jiu3_caa1_din6_aa3:sil j iu c aa d i n m aa sil

jiu3_m4_jiu3_caa1_din6_aa3:sil j iu mj iu c aa d i n aa sil

jiu3_m4_jiu3_caa1_din6_aa3:sil j iu m j iu c aa d i n o sil

laa6_tei1:                 sil l aat ei sil

laang5_zing6_di1_laa1:     sil l aa ng z i ng d i l aa sil

laang5_zing6_di1_laa1:     sil l aa n z i ng d i l aa sil

ling6_zyun3_min6:          sil l i ng z yu n m i n sil

ling6_zyun3_min6:          sil l i ng z yu n s a n sil

ling6_zyun3_min6:          sil z yu n w aa n sil

m4_goi1:                   sil d o z e sil

m4_goi1:                   sil m g oi sil

m4_goi1:                   sil m g oi s aai sil

m4_hou2_cou4_laa1:         sil m h ou c ou l aa sil

m4_hou2_cou4_laa1:         sil s au s e ng l aa sil

m4_hou2_cou4_laa1:         sil z i ng d i l aa sil

m4_hou2_fai6_laa1:         sil m h ou f ail aa sil

m4_zeon2_aa3:              sil m d a cl sil

m4_zeon2_aa3:              sil m h o j i sil

m4_zeon2 aa3:              sil m h ou g a m j ail aa sil

m4_zeon2_aa3:              sil m z eo n aa sil

m4_zeon2_aa3:              sil m z eo n g a m j oe ng sil

m4_zeon2_aa3                sil m z eo n o sil

maa1_kaa6_won4:            sil m aa k aa w o n sil

maak3_daai6_hau2:          sil d aa h oi sil

maak3_daai6_hau2:          sil m aa k d aai h au sil

maak3_daai6_hau2:          sil m aa k d aai h au aa sil

maak3_daai6_hau2:          sil m aa k d aai h au o sil

maan5_ngon1:               sil m aa n ng o n sil

maan5_ngon1:               sil m aa n o n sil

nei5_gei2_seoi3_aa3:       sil l ei g ei d o s eoi aa sil

nei5_gei2_seoi3_aa3:       sil l ei g ei d o s eoi o sil

nei5_gei2_seoi3_aa3:       sil l ei g ei s eoi aa sil

nei5_gei2_seoi3_aa3:       sil l ei g ei s eoi o sil

nei5_gei2_seoi3_aa3:       sil n ei g ei d o s eoi aa sil

nei5_gei2_seoi3_aa3:       sil n ei g ei d o s eoi o sil

nei5_gei2 seoi3_aa3:       sil n ei g ei s eoi aa sil

nei5_gei2_seoi3_aa3:       sil n ei g ei s eoi o sil

nei5_giu3_mat1_je5_meng2_aa3:

                            sil l ei g iu m a t j e m e ng aa sil

nei5_giu3_mat1_je5_meng2_aa3:

                            sil l ei g iu m a tj e m e ng o sil

nei5_giu3_mat1_je5_meng2_aa3:

                            sil n ei g iu m a tj e m e ng aa sil

nei5_giu3_mat1_je5_meng2_aa3:

                            sil n ei g iu m a tj e m e ng o sil

ngaak1_sau2:               sil aa k aa k s au sil

ngaak1_sau2:               sil aa k ng aa k s au sil

ngaak1_sau2:               sil aa k s au sil

ngaak1_sau2:               sil aa k s au l aa sil

ngaak1_sau2:               sil ng aa k aa k s au sil

ngaak1_sau2:               sil ng aa k ng aa k s au sil

ngaak1_sau2:               sil ng aa k s au sil

ngaak1_sau2:               sil ng aa k s au l aa sil

ngaap3:                    sil aa cl sil

ngaap3:                    sil ng aa cl sil

ngo5_dei6_waan3_lo4:       sil ng o d ei w aa n l aa sil

ngo5_dei6_waan3_lo4:       sil ng o d ei w aa n l o sil

ngo5_dei6_waan3_lo4:       sil o d ei w aa n l aa sil

ngo5_dei6_waan3_lo4:         sil o d ei w aa n l o sil

ngo5_hai2_dou6_aa3:          sil l i d ou aa sil

ngo5_hai2_dou6_aa3:          sil l i d ou o sil

ngo5_hai2_dou6_aa3:          sil ng o h ai d ou aa sil

ngo5_hai2_dou6_aa3:          sil ng o h ai d ou o sil

ngo5_hai2_dou6_aa3:          sil ng o h ai l i d ou aa sil

ngo5_hai2_dou6_aa3:          sil ng o h ai l i d ou o sil

ngo5_hai2_dou6_aa3:          sil ng o h ai n i d ou aa sil

ngo5_hai2_dou6_aa3:          sil ng o h ai n i d ou o sil

ngo5_hai2_dou6_aa3:          sil n i d ou aa sil

ngo5_hai2_dou6_aa3:          sil n i d ou o sil

ngo5_hai2_dou6_aa3:          sil o h ai d ou aa sil

ngo5_hai2_dou6_aa3:          sil o h ai d ou o sil

ngo5_hai2_dou6_aa3:          sil o h ai l i d ou aa sil

ngo5_hai2_dou6_aa3:          sil o h ai l i d ou o sil

ngo5_hai2_dou6_aa3:          sil o h ai n i d ou aa sil

ngo5_hai2_dou6_aa3:          sil o h ai n i d ou o sil

ngo5_hou2_zung1_ji3_nei5:    sil ng o h ou z u ng j i l ei sil

ngo5_hou2_zung1_ji3_nei5:    sil ng o h ou z u ng j i n ei sil

ngo5_hou2_zung1_ji3_nei5:    sil ng o z a n h ai z u ngj i l ei sil

ngo5_hou2_zung1_ji3_nei5:    sil ng o z a n h ai z u ngj i n ei sil

ngo5_hou2_zung1_ji3_nei5:    sil ng o z u ng j i l ei sil

ngo5_hou2_zung1_ji3_nei5:    sil ng o z u ngj i n ei sil

ngo5_hou2_zung1_ji3_nei5:    sil o h ou z u ng j i l ei sil

ngo5_hou2_zung1_ji3_nei5:    sil o h ou z u ngj i n ei sil

ngo5_hou2_zung1_ji3_nei5:    sil o z a n h ai z u ngj i l ei sil

ngo5_hou2_zung1_ji3_nei5:    sil o z a n h ai z u ngj i n ei sil

ngo5_hou2_zung1_ji3_nei5:    sil o z u ng j i l ei sil

ngo5_hou2_zung1_ji3_nei5:    sil o z u ng j i n ei sil

paa1_hai2_dou6:              sil f a n d ai sil

paa1_hai2_dou6:              sil f a n d ai l aa sil

paa1_hai2_dou6:              sil p aa h ai d ou sil

paa1_hai2_dou6:           sil t aa n h ai d ou sil

pui4_ngo5_king1_haa5_gaai2_a2:

                           sil k i ng h aa g aai l o sil

pui4_ngo5_king1_haa5_gaai2_a2:

                           sil ng o d ei k i ng h aa g aai l o sil

pui4_ngo5_king1_haa5_gaai2_a2:

                           sil o d ei k i ng h aa g aai l o sil

pui4_ngo5_king1_haa5_gaai2_a2:

                           sil p ui ng o k i ng h aa g aai a sil

pui4_ngo5_king1_haa5_gaai2_a2:

                           sil p ui o k i ng h aa g aai a sil

saan3_maai4:              sil s aa n m aai sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil f a n m f a n h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil f a n m f a n h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu f a n g aau m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu f a n h aa m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu h a p h aa m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu m j iu f a n g aau aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu m j iu f a n g aau o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu m j iu h a p h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil j iu m j iu h a p h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil l ei j iu f a n g aau m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil l ei j iu h a p h aa m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil l ei j iu m j iu f a n g aau aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil l ei j iu m j iu f a n g aau o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil l ei j iu m j iu h a p h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil l ei j iu m j iu h a p h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil n ei j iu f a n g aau m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil n ei j iu h a p h aa m aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil n ei j iu m j iu f a n g aau aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil n ei j iu m j iu f a n g aau o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil n ei j iu m j iu h a p h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil n ei j iu m j iu h a p h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai f a n g aau aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai f a n g aau o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai f a n h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai f a n h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai h a p h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai h a p h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai t au h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil s ai m s ai t au h aa o sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil t au m t au h aa aa sil

sai2_m4_sai2_hap1_haa5_aa3:

                           sil t au m t au h aa o sil

sai2_m4_sai2_jau1_sik1_aa3:

                           sil j iu j au s i k m aa sil

sai2_m4_sai2_jau1_sik1_aa3:

                           sil j iu m j iu j au s i k aa sil

sai2_m4_sai2_jau1_sik1_aa3:

                           sil j iu m j iu j au s i k o sil

sai2_m4_sai2_jau1_sik1_aa3:

                           sil s ai m s ai j au s i k aa sil

sai2_m4_sai2_jau1_sik1_aa3:

                           sil s ai m s ai i au s i k o sil

sai2_m4_sai2_sik6_faan6_aa3:

                           sil j iu m j iu s i k f aa n aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                           sil j iu m j iu s i k f aa n o sil

sai2_m4_sai2_sik6_faan6_aa3:

                           sil j iu m j iu s i k j e aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                           sil j iu m j iu s i k j e o sil

sai2_m4_sai2_sik6_faan6_aa3:

                           sil j iu s i k f aa n m aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil j iu s i k j e m aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s ai m s ai s i k d i j e aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s ai m s ai s i k d i j e o sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s ai m s ai s i k f aa n aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s ai m s ai s i k f aa n o sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s ai m s ai s i kj e aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s ai m s ai s i k j e o sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s i k m s i k d i j e aa sil

sai2_m4_sai2_sik6_faan6_aa3:

                             sil s i k m s i k d i j e o sil

se6_kau4:                   sil s e k au sil

soeng6_jat1_fung1_seon3:    sil s oe ng j a t f u ng s eo n sil

soeng6_jat1_fung1_seon3:    sil s oe ng j a t g o i m eu sil

tek3_bo1_laa1:              sil t e cl sil

tek3_bo1_laa1:              sil t e k b o sil

tek3_bo1_laa1:              sil t e k b o l aa sil

tek3_bo1_laa1:              sil t e k g o b o sil

tek3_bo1_laa1:              sil t e k l aa sil

teng1_ngo5_gong2_laa1:      sil t e ng ng o g o ng sil

teng1_ngo5_gong2_laa1:      sil t e ng ng o g o ng l aa sil

teng1_ngo5_gong2_laa1:      sil t e ng o g o ng sil

teng1_ngo5_gong2_laa1:      sil t e ng o g o ng l aa sil

teng1_ngo5_gong2_laa1:      sil t e ng z yu sil

ting4_dai1:                 sil t i ng d ai sil

ting4_dai1:                 sil t i ng d ai l aa sil

ting4_dai1:                 sil t i ng h ai d ou sil

ting4_dai1:                 sil t i ng h ai d ou l aa sil

tiu3_mou5_laa1:             sil t iu m ou sil

tiu3_mou5_laa1:             sil t iu m ou l aa sil

tou5_m4_tou5_ngo6_aa3:      sil l ei t ou m t ou ng o aa sil

tou5_m4_tou5_ngo6_aa3:      sil l ei t ou m t ou ng o o sil

tou5_m4_tou5_ngo6_aa3:      sil l ei t ou m t ou o aa sil

tou5_m4_tou5_ngo6_aa3:      sil l ei t ou m t ou o o sil

tou5_m4_tou5_ngo6_aa3:      sil l ei t ou ng o m aa sil

tou5_m4_tou5_ngo6_aa3:      sil l ei t ou o m aa sil

tou5_m4_tou5_ngo6 aa3:      sil n ei t ou m t ou ng o aa sil

tou5_m4_tou5_ngo6_aa3:      sil n ei t ou m t ou ng o o sil

tou5_m4_tou5_ngo6_aa3:      sil n ei t ou m t ou o aa sil

tou5_m4_tou5_ngo6_aa3:      sil n ei t ou m t ou o o sil

tou5_m4_tou5_ngo6_aa3:      sil n ei t ou ng o m aa sil

tou5_m4_tou5_ngo6_aa3:      sil n ei t ou o m aa sil

tou5_m4_tou5_ngo6_aa3:      sil t ou m t ou ng o aa sil

tou5_m4_tou5_ngo6_aa3:      sil t ou m t ou ng o o sil

tou5_m4_tou5_ngo6_aa3:      sil t ou m t ou o aa sil

tou5_m4_tou5_ngo6_aa3:      sil t ou m t ou o o sil

waa6_bei2_ngo5_zi1_ji4_gaa1_gei2_dim2:

                             sil w aa b ei ng o z i j i g aa g ei d i m sil

waa6_bei2_ngo5_zi1_ji4_gaa 1_gei2_dim2:

                             sil w aa b ei o z i j i g aa g ei d i m sil

zan1_hai6_dak1_ji3_laa3:    sil l ei g a m d a kj i g e sil

zan1_hai6_dak1_ji3_laa3:    sil n ei g a m d a kj i g e sil

zan1_hai6_dak1_ji3_laa3:    sil z a n h ai d a kj i l aa sil

zan1_hai6_gwaai1_laa3:      sil l ei h ou g w aai aa sil

zan1_hai6_gwaai1_laa3:      sil l ei h ou g w aai o sil

zan1_hai6_gwaai1_laa3:      sil n ei h ou g w aai aa sil

zan1_hai6_gwaai1_laa3:      sil n ei h ou g w aai o sil

zan1_hai6_gwaai1_laa3:      sil z a n h ai g w aai l aa sil

zan1_hai6_zeng3:            sil h ou z e ng sil

zan1_hai6_zeng3:            sil z a n h ai z e ng sil

zau2_laa3:                  sil g o l eil aa sil

zau2_laa3:                  sil g w o l eil aa sil

zau2_laa3:                  sill eil aa sil

zau2_laa3:                  sil ng o d ei z au l aa sil

zau2_laa3:                  sil o d ei z au l aa sil

zau2_laa3:                  sil z au l aa sil

zau6_faai3_mou5_din6_laa3:  sil z au f aai m ou d i n l aa sil

zek3_maau1_lei4_laa3:       sil z e k m aau l ei g a n aa sil

zek3_maau1_lei4_laa3:       sil z e k m aau l ei g a n o sil

zek3_maau1_lei4_laa3:       sil z e k m aau l eil aa sil

zo2_min6:                   sil h eoi z o b i n sil

zo2_min6:                   sil h eoi z o m i n sil

zo2_min6:                   sil z o b i n sil

zo2_min6:                   sil z o m i n sil

zoi3_gong2_do1_ci3:         sil z oi g o ng d o c i sil

zoi3_gong2_do1_ci3:         sil z oi g o ng j a t c i sil

zou2_san4:                  sil z ou s a n sil

zyun3_jau6:                 sil z yu n j au sil

zyun3_zo2:                  sil z yu n z o sil

现参照图7,其中示出了按照本发明一个实施例的最优化的广东话音素组710的方框图。在各替换实施例中,除了结合图7的实施例讨论的那些单元和功能之外,本发明可以容易地使用各种其它单元和功能来执行语音识别,或者用其它单元和功能替换图7中的那些单元和功能。

在图7的实施例中,音素组710包括三十九个单独音素,在这里提出的是十七个辅音音素外加一个闭合(closure)音素“cl”和一个无声(silence)音素“sil”(全部在图7的左侧示出)以及包括一组双元音(diphthong)在内的二十个元音(vocalic)音素(全部在图7的右侧)。在图7的实施例中,音素组710被实现成表示广东话语言中的音素声音(phonetic sound)。

如上所述,由于广东话一般用中文字而不是罗马字母书写,图7的音素组710(除了闭合音素“cl”和无声音素“sil”)利用称为“jyutping”的广东话罗马化方案来表示,该方案由香港语言学学会(LSHK)开发。可以在万维网上的cpct91.cityu.edu.hk/lshk处找到关于“jyutping”和香港语言学学会的更多信息。在各替换实施例中,本发明可以利用由各种其它类型的罗马化方案表示的最优化广东话音素组。

在图7的实施例中,音素组710包括下列辅音音素:b,d,g,p,t,k,m,n,ng,f,l,h,z,c,s,w和j。此外,音素组710还包括下列元音音素:aa,i,u,e,o,yu,oe,eo,a,eu,aai,aau,ai,au,ei,oi,ou,eoi,ui和iu。在图7的实施例中,音素组710还包括闭合音素“cl”和无声音素“sil”。由于所使用的音素数目相对较少,因此音素组710提供有效且简洁的音素表示以用于准确地识别广东话语音。

由于音素组710中的单独因素的数目减少,因此显著节约了电子系统110中的处理资源和存储器。此外,音素总数的减少充分减轻了与训练隐藏式马尔可夫模型(HMM)212相关联的负担。然而,在各种替换实施例中,本发明可以被实现为包括除了图7的实施例中所示的那些音素之外各种附加的音素,或者包括与图7的实施例中所示的那些音素不同的各种音素。

传统的中文语音识别系统一般利用一个用子音节(sub-syllabic)方法实现的音素组,其中的音节被表示为韵或半音节。相反地,本发明的最优化广东话音素组710有利地利用了次音节音素(phonetic)技术,其中音节被进一步分为子单元,所述子单元可以用适当的辅音音素和元音音素的组合来表示,以便为语音表示处理提供较大的粒度。此外,音素组710表示广东话语言的各种声音,而无需利用相应的音调信息作为不同音素的一部分。除了能够提供更好的灵活性,上述音素(phonetic)技术还有附加的好处,即在音素组710中所需要的音素总数较少。按照本发明,可以利用音素组710来表示对应于字典214的各条目512的音素串。

根据对应音素的特性,可以将图6的音素组710编制成各种语言学类别。为了说明的目的,下面用表II表示一个这样的组织,表II包括在左侧的类别,以及在右侧的音素组710中的对应音素。在各替换实施例中,可以以不同于表II中所示方式的各种方式对音素组710进行编制。

表II:

非边界单态(non-boundary single-state)  sil cl

辅音                     b d g p t k m n ng f l h z c s w j

不送气(unaspirated)辅音  b d g m n ng f l h z s w j

送气(aspirated)辅音      p t k c

辅音性音(consonantal)    b d g p t k m n ng f h z c s

不送气辅音性音           b d g m n ng f h z s

唇音                     b p m f w

齿槽音                   d t n l z c s

软颚音                   g k ng

滑音                     w j

阻塞音                   b d g p t k f h z c s

不送气阻塞音             b d g f h z s

响音                     m n ng l w j aa i u e o yu oe eo a eu

                         aa i aau ai au ei oi ou eoi ui iu

连续音                   f l h s w j

粗擦音                   z c s

鼻音                     m n ng

摩擦音                   f h s

无擦通音                 l w j

塞擦音                   z c

爆破音                   b d g p t k

送气爆破音               p t k

不送气爆破音             b d g

舌前音                   b d p t m h f l z c s

舌冠音                   d t n l z c

音节                     aa i e o yu oe eo a aai aau ai

                         au ei oi ou ui iu m ng

音节辅音                m ng

音节元音                aa i e o yu oe eo a aai aau ai au

                        ei o  ou ui iu

浊音                    aa i u e o yu oe eo a eu aai aau ai

                        au ei oi ou eoi ui iu m n ng l w j

清音                    b d g p t k f h z c s

元音                    aa i u e o yu oe eo a eu aai aau ai au

                        e i o i ou eoi u i iu

单元音                  aa i u e o yu oe eo a

双元音                  eu aai aau ai au ei oi ou eoi ui iu

前双元音                aai ai ei oi eoi ui

后双元音                eu aau au ou iu

圆元音                  u o yu oe eo

不圆元音                a i i e a

高元音                  i u yu

中元音                  e o oe eo

低元音                  aa a

前元音                  i e yu oe

中央元音                eo a

后元音                  aa u o

现参照图8,其中示出了按照本发明一个实施例的用于实现字典214(图2)的混合语言语音识别技术的图示810。在各替换实施例中,除了结合图8的实施例讨论的那些单元和技术之外,本发明可以容易地使用各种其它单元和技术来执行语音识别,或者用其它单元和技术替换图8中的那些单元和技术。

按照本发明,图示810示出了可以在设计字典214时被有利地合并的几个不同的字典条目类。在图8的实施例中,字典214可以包括(但不限于)广东话类814、英语类816、混合的广东话-英语类818以及借用英语类820。

在图8的实施例中,广东话类814可以包括从广东话语言中选出的任何适当的单词和短语。在图示810中,广东话类814的一个实例是短语“sik6 m5 sik6 di1 je2 aa3”,其可以翻译成英语问句“Areyou hungry(你饿么)?”同样地,英语类816可以包括从英语语言中选出的任何适当的单词和短语。然而,为将英语发音转换成相应的广东话发音,英语类816中的单词和短语一般会需要一个英语-广东话发音转换过程。该英语-广东话发音转换过程可以基于适当的语音(phonological)转换处理,其中,说母语的人将外语单词的发音映射到他或她的母语。后面会结合图9进一步讨论上述的英语-广东话发音转换过程。在图示810中,英语类816的一个实例是命令“SIT(坐下)”。

在图8的实施例中,广东话-英语类818可以包括从广东话语言和英语语言中选出的任何适当的单词和短语。按照本发明,随后可以组合这些来自两种不同语言的单词以创建字典214中的各单个条目512。然而,如上所述,为将英语发音转换成相应的广东话发音,来自英语语言的单词可能需要一个英语-广东话发音转换过程。在图示810中,广东话-英语类818的一个实例是短语“caa4 ngo5 ge3 EMAIL”,其可以翻译成英语命令“check my email(检查我的电子邮件)”。

在图8的实施例中,借用英语类820可以包括英语语言中的、已经典型地被合并在说广东话的人们日常使用里的任何适当的单词。比起相同单词的标准英语发音,在借用英语类820中的单词一般会显示出发音变化。实际上,来自借用英语类820的单词也可以和来自广东话语言及/或英语语言的单词相组合,以便为字典214创建单个的条目512。在图示810中,借用英语类820的一个实例是短语“haa1 lou2”,其可以翻译成英语单词“hello(你好)”。

本发明通过利用单一最优化的音素组710提供一种用于表示多语言字典214的简洁方法。因此,本发明利用上述用于实现字典214的改进的混合语言语音识别技术,从而提供广东话语言口语的准确表示,该表示一般合并了来自英语语言的各种单词和短语。

现参照图9,其中示出了按照本发明一个实施例的英语-广东话发音转换过程的图示910。在各替换实施例中,除了结合图9的实施例讨论的那些单元和过程之外,本发明可以容易地使用各种其它单元和过程来执行语音识别,或者用其它单元和过程替换图9中的那些单元和过程。

按照本发明,可以用最优化音素组710中的对应音素串来表示字典214中的每一个条目512。然而,由于最优化音素组710的容量较小以及在英语和广东话之间有发音差异,因此在最优化音素组710中可能不存在英语语言中的某些标准声音。因此,为将标准英语音素转换成最优化音素组710中的对应广东话音素,本发明可以对此类英语单词执行上述英语-广东话发音转换过程。

在图示910中,提供一个英语-广东话发音转换过程的实例,其中使用在上面图8的借用英语类820实例中使用的英语单词“EMAIL(电子邮件)”。在图9的实例中,行914示出原始英语单词“EMAIL”。图示910的行916示出“EMAIL”的英语发音的音素(phonetic)表示“i m ei l”。最后,图示910的行918示出英语单词“EMAIL”的广东话发音的音素(phonetic)表示“i m eu”。因此,英语单词“EMAIL”的广东话发音的音素(phonetic)表示“i m eu”可以有利地用最优化音素组710来表示。

上面参照各优选实施例说明了本发明。对于那些阅读本公开内容的本领域技术人员来说,其他的实施例将会是显而易见的。举例来说,使用不同于上面优选实施例中的配置和技术可以容易地实现本发明。此外,可以结合不同于上面作为优选实施例描述的系统来有效地使用本发明。因此,本发明希望涵盖对各优选实施例的这些和其它改变,而这只由所附权利要求书来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号