首页> 中国专利> 汉语语音码语音合成方法

汉语语音码语音合成方法

摘要

本发明是一种汉语语音码转换成语音的方法,属于计算机语音合成技术领域。通过这种方法可以方便地将包含汉语声、韵、调用且仅用26个拉丁字母作码元的汉语语音码转换成汉语、汉语特定人、中国方言、少数民族语言、外语单词词组及其短语的语音,采用这种汉语语音码后,就克服了目前所有汉语语音合成只能用汉字或汉语拼音进行,且汉字和汉语拼音与ASCII码不能100%兼容的弊端,本发明能广泛应用于语音合成技术领域,给计算机语音信息处理提供了极大的便利。

著录项

  • 公开/公告号CN101123089A

    专利类型发明专利

  • 公开/公告日2008-02-13

    原文格式PDF

  • 申请/专利权人 苗玉水;

    申请/专利号CN200610029807.3

  • 发明设计人 苗玉水;

    申请日2006-08-08

  • 分类号G10L13/02(20060101);G10L13/00(20060101);G06F17/28(20060101);

  • 代理机构

  • 代理人

  • 地址 200093 上海市杨浦区控江一村44号甲105室

  • 入库时间 2023-12-17 19:45:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-10-16

    专利权的转移 IPC(主分类):G10L13/02 变更前: 变更后: 登记生效日:20130916 申请日:20060808

    专利申请权、专利权的转移

  • 2011-01-26

    授权

    授权

  • 2008-04-09

    实质审查的生效

    实质审查的生效

  • 2008-02-13

    公开

    公开

说明书

一.所属技术领域

本发明是一种用且仅用26个拉丁字母以词为单位,每一个音节包含汉语声、韵、调的汉语语音码转换成语音的方法,该语音包括外语单词、词组或短语、汉语、汉语特定人、中国方言、少数民族语言的语音,本发明申请中所称的“汉语”是指汉语普通话(以上以下均同),本技术属于计算机语音合成技术领域。

二.背景技术

随着计算机多媒体技术的发展,语音合成技术越来越受到人们广泛的重视,目前许多实用的各种以汉语为代表的语音合成系统已经被开发出来并投入实际应用中,给人们生活带来了极大的便利。比较典型的有安徽科大讯飞、北京清华大学等开发的汉语语音合成系统。

但目前所有的汉语语音合成系统都是通过汉字或汉语拼音查找到与它对应的汉语语音文件来进行语音合成的,而汉字或汉语拼音的计算机机内码都不能与当今世界计算机标准信息交换代码ASCII码100%兼容,这就给计算机汉语信息处理带来了许多不便。

三.发明内容

本发明的目的是提供一种汉语语音码语音合成方法来解决以上存在的弊端。语音合成时,是通过汉语语音码查找到预先存储在计算机中与它对应的能播放成语音声音的文件来进行语音合成的。

具体来说本发明方法所采用的汉语语音码,它用且仅用26个拉丁字母作为码元,以词为单位采用按词连写的方式对组成词的每一音节的声、韵、调先进行编码,再依照“声码+介码+韵码+调码兼隔音节符号”的顺序进行编码的一种汉语语音码,由于26个拉丁字母在128个ASCII码码符集范围内,因此一旦传统用于合成语音的汉字、汉语拼音改用汉语语音码进行以汉语为主的语音合成后,世界上一切用于处理西码的所有软硬件资源都可以不加改造地用于处理汉语语音码表达的汉语信息,处理完后在需要时输出该汉语语音码所表达的语音信息。

四.具体实施方式

下面结合实施例对本发明的具体实施方式作进一步的说明。

(一)所采用的语音码的每一音节声、韵、调的编码方法可以采用类似以下的方法:

(注:括号内的符号均为汉语拼音符号,不带括号的字母为本发明所采用的汉语每一音节声、韵、调的编码,以上以下叙述均同。)

1、声码的编码:

b:(b)  p:(p)  m:(m)  f:(f)  d:(d)  t:(t)

n:(n)  l:(l)  g:(g)  k:(k)  h:(h)  i:(zh)  (j)

q:(ch),(q)    x:(sh),(x)  r:(r)

z:(z)  c:(c)  s:(s)    y:(y)  w:(w)

2、介码的编码:

i:(i)  u:(u)  y:(ü)

3、韵码的编码:

a:(a)  o:(o)  e:(e)  i:(i)  u:(u)  y:(ü)

k:(ao)  c:(ai)  s:(an)  x:(ou)  w:(ei)  n:(en)

z:(ua)  l:(uo)  b:(ang)  d:(ong)  D:(eng)

q:(ing)  g:(ng)(无声母韵母)  er:(er)

r:(i)[只与(zh)、(ch)、(sh)相拼]

4、调码的编码:

a:(-)阴平e:(/)阳平v:(ˇ)上声u:()去声o:(不标)轻声

(二)利用上述编码的汉语语音码表示可以采用如下的方法:

以单词为单位,这里将单个汉字看作单音节词,根据组成该单词的每个音节的《汉语拼音方案》中的拼音,依次按“声码+介码+韵码+调码兼隔音节符号”的顺序编码,同一个单词的多个音节不用空格隔开连写,单词与单词之间的编码用空格隔开。

这里由于将独立运用的汉字看作单音节词,因此,本发明所采用的汉字编码的方法和汉语单词音节编码的方法相同,在本发明中所采用的单词音节编码按词连写后得到单词汉语语音码编码,我们将由若干个单词组成的一组词称为词组,本发明中所采用的词组的编码同汉语句子的编码相同,由于单词可以表示词组和汉语句子,因此词组的编码和汉语句子的编码都可以通过单词的编码实现,而不需要对词组和汉语句子另外制定一套专门的编码,一般在整句整篇以词为单位表示汉语信息时,在理解时一般不需要进行同音字词的选择,原则上听起来不会产生歧义的句子,用编码表达时也不会产生歧义。

当语音码转换成语音时,可以分别采用查汉语语音码与音节、单词、语段语音合成文件对照表输出相应的语音。

下面例举一些用本发明方法将汉语语音码转换成语音的例子:

比如:wovmno huiu xrvydu hsuyyv laadqawnv.

它是汉语语音码所表达的汉语信息,其意义用汉字表达为:

“我们会使用汉语拉丁文。”

1.通过查汉语语音码和音节汉语语音合成文件对照表进行语音合成的方法:

查汉语语音码和音节汉语语音合成文件对照表后得到与语音码对应的汉语语音的声音文件(为表述方便该声音文件用“相对应的音节汉语拼音.wav”表示,实际情况中是没有汉语拼音符号的,它只是预先储存在计算机中,可以通过一定的声音播放软件播放的表示相应音节汉语语音的声音文件)

wov(wǒ.wav)mno(men.wav)huiu(huì.wav)xrv(shǐ.wav)ydu(yòng.way)hsu(hàn.wav)yyv(yǔ.wav)laa(lā.wav)dqa(dīng.wav)wnv(wěn.wav).

对查找到的代表该音节汉语语音的相应的声音文件用声音播放软件依次顺序播出,词与词之间采用比同一单词音节之间更长的时间间隔来依次连续播出,这样会听起来更接近按词朗读的效果,更符合人们听语音的习惯。

2.通过查汉语单词语音码和单词汉语语音合成文件对照表进行语音合成的方法:

查汉语单词语音码和单词语音合成文件对照表后得到预先储存在计算机中的与单词语音码对应的以单词为单位的汉语语音的声音文件(为表述方便该以单词为单位的汉语声音文件用“相对应的以单词为单位的汉语拼音.wav”表示,实际情况是没有汉语拼音符号的,它只是预先储存在计算机中,可以通过一定的声音播放软件播放的表示相应以单词为单位的汉语语音的声音文件)

wovmno(wǒmen.wav)huiu(huì.wav)xrvydu(shǐyòng.wav)hsuyyv(hànyǔ.wav)laadqawnv(lādīngwěn.wav).

对查找到的以单词为单位代表该汉语语音的相应的声音文件用声音播放软件依次顺序播出,词与词之间采用比同一单词音节之间更长的时间间隔来依次连续播出,这样会听起来更接近按词朗读的效果,更符合人们听语音的习惯。

3.通过查汉语语音码串和最大匹配语段汉语语音合成文件对照表进行语音合成的方法:

该方法采用最大匹配法,通过查以最大语段为单位的汉语语音码串和语段汉语语音合成文件对照表输出相应的汉语语音。比如通过查预先储存在计算机中的最大语段为:“wovmnohuiu xrvydu我们会使用”和“hsuyyv laadqawnv汉语拉丁文”那么汉语语音合成按下面的方式进行:

wovmno huiu xrvydu(wǒmen huìshǐyòng.wav)hsuyyv laadqawnv(hànyǔlādīngwěn.wav).

(为表述方便上述该以语段为单位的汉语声音文件用“相对应的以该语段为单位的汉语拼音.wav”表示,实际情况是没有汉语拼音符号的,它只是预先储存在计算机中,可以通过一定的声音播放软件播放的表示相应以该语段为单位的汉语语音的声音文件)

依次类推,上述三种情况中如果语音码对应的音节、单词、语段的汉语语音合成文件分别换成汉语特定人、中国方言、少数民族语言的语音合成文件时,则计算机合成出来的就分别是汉语特定人、中国方言、少数民族语言的语音。

一般来说,由于外语的音节均声音与汉语音节的声音不能建立某种对应关系,外语的句子的语序与汉语句子的语序也不同,只有汉语单词、词组或短语和外语单词、词组或短语之间可以建立某种对应关系,因此汉语语音码与外语语音的合成只能在单词、词组或短语之间进行,而不能在音节和音节或句子和句子之间进行。比如:单词“wovmno我们”可以合成英语单词(we.wav)的声音,词组或短语hsuyyv laadqawnv合成英语词组或短语(ChineseLatin.wav)的声音,(这里we.wav和Chinese  Latin.wav分别代表预先储存在计算机中的英语we和Chinese Latin的声音文件,可以通过声音播放软件播放),如果某种中国方言或少数民族语言出现上述与外语同样的情况,我们也采取与外语同样的方法只进行单词、词组或短语与短语之间的语音合成。

在上述三种语音合成方法中第一种方法所需要的计算机语音文件储存空间最小,第三种所需要的计算机语音文件储存空间最大。

比如就汉语来说第一种音节合成的方法的优点是只要将1282个汉语有调音节预先录好储存在计算机中就可以以不变应万变,这是因为所有的汉字的读音都包括在这1282个汉语有调音节的语音的声音中,所有的包括新发展在内的汉语单词都是由这1282个汉语有调音节以词为单位排列组合的结果。由于只有1282个汉语有调音节,因此系统的储存的空间开销小,而且该系统的稳定性好,该方法的缺点是单词按音节来读不太符合人们的听语音的习惯,这可以随着今后计算机音节语音合成拼接技术的不断发展而得到改善。

今后如果汉语语音有了新的发展,我们只要将新产生出的汉语音节再作相应增加,该方法便可以适应未来形势的发展需要。

第二种以单词为单位的语音合成方法优点是由于预先录入计算机中的语音文件是按词来录入的,因此匹配输出回放后听起来也是按词来朗读,比较符合人们的听语言的习惯,存在的缺点是由于语音文件是按词储存的,系统所占用的存储空间要比按音节合成方式所需要占用的存储空间大,而且汉语单词增加了,与该单词对应的语音文件要同步制作并增加,系统不能做到以不变应万变。

第三种按最大语段匹配的方法需要准备大量的语料预先储存在计算机的语料库中,系统开销就更大,但听起来的效果比前面两种更自然,这种方法也不能做到以不变应万变,一般用在听起来自然度要求较高的应用场合。

对有些需要模仿人类发音时口型变化的机器人等语音合成系统,它在汉语语音合成时往往需要知道汉语每一个音节的声母、介母、韵母、声调信息才能进行汉语语音合成,由于本发明所采用的汉语语音码含有汉语每一个音节的声母、介母、韵母、声调信息,因此可以根据上面的汉语语音码与汉语拼音声母、介母、韵母、声调编码对照表,将汉语语音码转换成汉语拼音声母、介母、韵母、声调的信息后,再输入到机器人汉语语音合成系统中进行汉语语音合成便可。比如对汉语语音码“wovmno”,查上面汉语语音码与汉语拼音声母、介母、韵母、声调编码对照表可以知道:w代表汉语拼音的声母(w),o代表汉语拼音的韵母(o),v代表汉语拼音的第三声声调(ˇ),m代表汉语拼音的声母(m),n代表汉语拼音的韵母(en),o代表汉语拼音的轻声(不标)。

同理,用上述方法,我们可以将所有的任意多音节的汉语语音码转换成汉语拼音的声母、介母、韵母、声调信息,输入到所需要的类似上面机器人的汉语语音合成系统中便可满足系统的要求,达到我们所需要的目的。

有时为了校对文章的方便,我们需要将汉语语音码文章中的标点符号和移行号朗读出来,这就要对汉语语音码文章中的标点符号和移行号进行语音合成,为了使得汉语语音码所表达的汉语信息与ASCII码100%兼容,这里我们特别规定汉语语音码文章中的标点符号和移行号分别与英文的标点符号和移行号相同,在具体语音合成时我们只要将相应的预先储存在计算机中的标点符号和移行号的声音文件提取出来,用声音播放软件进行播放便可,比如:

六种点号:句号“.”(jùhào.wav)、问号“?”(wènhào.wav)、感叹号“!”(gǎntànhào.wav)、逗号“,”(dòuhào.wav)、冒号“:”(màohào.wav)、分号“;”(fēnhào.wav)。

七种标号:引号“”(yǐnhào.wav)、括号( )(kuòhào.wav)、破折号“-”(pòzhéhào.wav)、省略号...(shěngluèhào.wav)、着重号.(zhuózhònghào.wav)、书名号(( ))(shūūmínghào.wav)、间隔号.(jiàngéhào.wav)。

一个移行号:移行号“-”(yíhánghào.wav)。

上面列出了本发明所采用的与英语相同的六种点号、七种标号和一个移行号,括号中的“.wav”文件就是与标点符号或移行号发音相应的语音合成文件,当该语音合成文件是汉语的语音合成文件时,则该标点符号或移行号朗读出来的声音便是汉语相应的标点符号或移行号的声音,当该语音合成文件分别是汉语特定人、中国方言、少数民族语言的语音合成文件时,则该标点符号或移行号朗读出来的声音便分别是汉语特定人、中国方言、少数民族语言的相应的标点符号或移行号的声音。

当输入的是用汉字或汉语拼音表达的汉语信息时,汉字或汉语拼音可以通过标准模块先转换成汉语语音码再进行上述外语单词、词组或短语、汉语、汉语特定人、中国方言、少数民族语言等的语音转换。

该标准模块进行汉字或汉语拼音转换成汉语语音码时,汉字先转换成汉语拼音,遇异音同形字时将可能的汉语拼音全部列出,汉语拼音则无须先转换,然后再根据汉语音节语音码的声码、介码、韵码、调码与汉语拼音编码对照表先转换成相应的汉语音节语音码串,然后再查词库进行按词切分。对包括异音字引起的多种单词切分,可以依据汉语词法句法上下文联系及统计规律等手段先进行判别后再进行单词分割,对已经分过词的汉字和汉语拼音转换成汉语语音码后则不必再进行单词切分,仍以原来的单词为单位进行转换。上述分割出的单间采取同一单词的音节与音节之间连写,词与词之间空格的方式表示,在汉语信息表示处于汉语语音码状态时其标点符号和移行号的用法与英文标点符号和移行号的用法相同。下面例举一些本发明方法中所采用的标准转换模块将汉字汉语拼音转换成汉语语音码的例子:

1.对汉字首先将汉字通过查表的方式转换成对应的汉语拼音:

比如:“我们会使用汉语拉丁文。”转换成拼音后成为:

wǒmen huìshǐyòng hàn yǔlādīng wěn。

2.对由汉字转换过来的或原有的汉语拼音则通过以上汉语拼音和语音码码表对照表将汉语拼音转换成如下汉语语音码串。

wov mno huiu xrv vdu hsu yyv laa dqa wnv.(音节和音节之间用空格隔开)

或wovmnohuiuxrvyduhsuyyvlaadqawnv.(音节和音节之间不用空格隔开)

(熟练后mno中的轻音符o在不引起混音时可以省略,以上以下均同。)

为了让大家看清楚,这里将表示声调的字母加了下划线,语音码中的声调字母同时具隔音节作用,实际语音码中声调无下划线,熟练语音码后,声调兼隔音节符能够方便区分出来。

3.将语音码串进行分词切割,最终完成语音码转换。

通过查找预先分好词的汉语语音码单词词库,将同一个单词的多个音节连写,词与词之间用空格隔开便得到以下我们最终需要的汉语语音码:

wovmno huiu xrvydu hsuyyv laadqawnv.

依次类推,用上述方法,我们可以将所有的任意多的汉字和汉语拼音转换成以词为单位的汉语语音码,以这些汉语语音码组成的单词为基础,汉语信息经过所有与处理西码相同的软硬件系统处理后,并根据需要采用按音节、单词、最大语段匹配的方式将汉语语音码合成为外语单词、词组或短语、汉语、汉语特定人、中国方言、少数民族语言的语音,从而可以方便地进行各种汉语信息和语音合成处理。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号