首页>中文会议>工业技术>自动化技术与计算机技术>第五届全国现代语音学术会议
第五届全国现代语音学术会议

第五届全国现代语音学术会议

  • 召开年:2001
  • 召开地:北京
  • 出版时间: 2001-08-30

主办单位:中国中文信息学会

会议文集:第五届全国现代语音学术会议论文集

会议论文

热门论文

全部论文

全选(0
  • 摘要:本文针对汉语连续语音中声调模式的特点,提出一种随机多项式曲线声调模型.在模型中,我们将基频曲线看成是随机曲线,其均值曲线是归一化时间为参数的多项式曲线,方差随时间变化.为了进一步增强模型的描述能力以适应连续语音中声调模式分布的多变性,我们将单随机曲线声调模型扩展为多混合随机多项式曲线声调模型,并建立了相应的模型训练算法.声调识别实验的结果表明:和传统的HMM声调模型相比,单随机曲线模型的误识率下降了13﹪,多曲线模型的误识率则进一步下降了41.4﹪,同时在识别速度上也大大优于HMM模型.
  • 摘要:在实验室环境下,很多计算机语音识别系统有很好的性能,但是当环境噪音很大,即信噪比很低时,系统的识别性能将急剧变坏,有的甚至会使识别系统的误识率增加好几倍,因此,开展各种环境噪音条件下的语音识别方法研究是很有必要的.本文对噪音环境下的语音识别技术进行了较为详细的讨论.全文分为三个部分,首先,论述了抗噪语音识别研究的必要性,并简单回顾了一些含有去噪处理措施的语音识别系统;其次,详细介绍了一些已经使用的具有代表性的去噪处理方法,例如,语音信号级语音增强/反语音增强方法,语音特征参数变换方法,识别模型补偿方法等,其中还介绍了我们实验室最近一年来在抗噪语音识别方面的研究工作、理论分析,以及我们对这些抗噪处理方法的评价;第三部分则是对今后抗噪语音识别研究工作的展望,给出了本文作者认为很有潜力的一些抗噪语音识别方式.
  • 摘要:本文主要介绍我们在语言分析的研究中,对语音的韵律特征的分析与计算,并给出一些探索性的实验结果.研究中,先给出该语音数据库的统计特性.然后分别选取一个韵律参数,研究它的变化对听感的影响及其影响程度.最后探讨韵律特征的计算方法.
  • 摘要:本文在语音语料库切分和标记的基础上,对语音单元和时长规整化方法进行了初步研究,探讨了语音单元时长的概念、影响时长的主要因素和进行时长规整化的意义,并在分析目前常用时长规整化方法优势和不足的基础上,提出了一种融合传统方法的新的时长规整算法.该算法主要包括3个过程:(1)计算不同发音人在不同状态空间下语料的相对语速;(2)用语音单元的物理时长除以其相对语速,可以得到语料排除语速影响后的规整时长;(3)对语音单元的规整时长进行Z-SCORE规一,可以得到语料的规一化时长.该方法经过实践验证,可更好地提高语音单元时长的规整度,为以后进行更深入的语音研究打下良好基础.
  • 摘要:本文阐述了信息时代对中文语音输入的迫切需求,指出语音识别技术目前应用中的难点,从发展前景看讨论不同层次的研究重点和策略.
  • 摘要:本文根据建立高质量小型汉语语音合成系统的需要,提出了一种基于量化韵律模板的韵律生成方案,提高了合成语音的表现力.我们针对PSOLA算法的韵律高调整能力,设计了一套韵律调整方案,在实现生成韵律的同时保证了音质.建立了高自然度小型化合成系统.
  • 摘要:本文利用《蒙古语韵律特征声学参数数据库》,分析归纳了蒙古语三音节词的重音模式,并与听辨心理测试实验相结合,进一步论证了蒙古语三音节词重音的性质和韵律模式.
  • 摘要:汉语的时长特征在孤立音节或实验室语料的研究结果较多,如冯隆,齐士钤等,基于实际语流的研究,除石基琳外,很少看到研究结果发表.汉语音节作为基本的合成单元在目前的主流型汉语合成系统中形成定势.音节时长又是普通听众语音感知中很敏感的声学参数,研究实际语流中汉语音节时长的变化特点,发掘它变化的原因,是汉语韵律特征研究的主题之一,也是言语工程技术上普遍关注的热点.本文在大规模语料库的基础上对实际语流中汉语音节时长进行了全面的统计分析,微软中国研究院汉语语料库是本研究的基础.通过对19万个音节时长的统计分析,首次得到了实际语流中汉语音节时长的总体分布图,以及汉语音节时长诸多方面的统计特性,包括韵律边界、音节的声、韵、调结构以及音节在词中的位置对音节时长的影响等.其中韵律边界包括韵律词边界、韵律短语边界、语调短语边界.统计结果表明韵律短语边界、语调短语边界和语调短语群边界对音节时长有明显的延长效果,并发现虽然在这三种边界前音节延长的程度略有差别,但从统计上看没有质的区别.同时发现不同声调对边界前音节延长作用也不同,轻声受边界的影响最大,它可以延长到非轻声、非边界前音节几乎同样的长度,其次是阳平,上声受影响最小.本文报告语料库的基本信息,停顿感知的标注、声学参数的提取和数据处理的方法,以及主要的研究结果等.对与已有的研究结果不同的地方,和它在汉语合成技术中的应用做出讨论.研究虽然是对一位广播学院的女生,按新闻朗读风格录制言语材料做出的,但具有一定的普遍意义.由于对语料库进行重音标注的复杂性,本文未能涉及重音对时长影响的研究,这将是我们下一步工作的内容.
  • 摘要:本文主要针对感知实验得到的4种普通话韵律结构单元:音节、语音词、中间短语和韵律短语来研究它们边界处的声学特征,如前后音节长的时长、音高、停顿以及它们相互之间的关联.我们从具有韵律结构标注信息的语音库中挑选出116组语音测试样本,使每一组后音节之间分别出现上述的4种韵律边界,并且前音节和后音节的声韵调都相同.在分别对时长和音高进行了归一化处理后的统计结果表明:中间短语和韵律短语边界处的前音节有音延和静音段;韵律短语边界前的音节的音高动态范围有错位的现象.静音段长度与前音节时长是相互补偿的,而静音段长度与后音节高上、下限线的重置程度是相互增益的.
  • 摘要:汉语语句中的重音研究是韵律特征研究中的重要内容.一般认为汉语语流中重音特征主要是通过音高、音长的变化加以体现的,但是在重音确定时表明仅仅选用这两个属性参数对于其分析并不完善,重音的确定还到其他很多属性参数的影响.本文以男声实际语料库中的完整语句作为研究对象,提出一种采用重读音节的三个属性参数作为其表述重音的描述方法,并基于优化的神经网络模型对该属性集进行训练和分类.
  • 摘要:本文从语音的标注、数据库结构和特征选择、语音采样数据、数据库文本等方面介绍藏语拉萨话、哈萨克语和蒙古语三个语音声学参数数据库的多媒体数据库光盘.
  • 摘要:本文拿日本语这个音长发达的语言作为对比“参数”,力图从汉、日两语的音长对比中发现汉语习焉不察的音长特征.
  • 摘要:本文从音高的调域、高音点、时长和能量等韵律声学参数来考察偏正/动宾句法关系岐义的韵律表现形式,以验证“辅重论”的合理性,结果表明,对比偏正和动宾结构来看,从以上几个方面均能得到两者之间一致性的区别,但仅看一个短语结构,根据我们目前的分析结果,没有充分证据判定是前重还是后重.
  • 摘要:本文研究连续话语中,不送气塞音[p]、[t]、[k]的声学表现并加以分类,同时考察前后语境及停顿和词类与塞音声学变化的关系.
  • 摘要:关于鼻韵尾脱落,前人的研究表明鼻韵尾脱落与两个因素有关:(1)鼻尾的时长越短越容易脱落;(2)去声音节的鼻尾容易脱落.但是,这些研究结果是孤立单词的语境下得出来的,还没有人在连续且自然的语音条件下系统而全面的考察鼻韵尾的脱落情况.显然,后者条件下的研究更有实用价值.本文在前人的基础上,考察在句子和语篇层面上的鼻韵尾脱落情况.实验材料自来10000个句子和数篇新闻.实验结果表明,与鼻韵尾脱落有关的因素有:(1)鼻韵尾之后的音节的声母发音方法;(2)鼻韵尾与之后音节连接的紧密度;(3)鼻韵音节的音高.本研究还通过大范围的实验语料,给出具体的鼻韵尾脱落出现的统计值.
  • 摘要:温州话是南部吴语的代表方言.传统方言学研究认为南部吴语浊塞音是真浊音,而不是如北部吴语般的“清音浊流”.但前人的语音学研究发现:温州话的浊塞音与北部吴语并无不同,在单字音或处于语流中重读位置时,所谓的浊音即不浊、也无浊流,实际上是不送气清音,听觉上的浊感来自于其后接元音(尤其是元音开始部分)的气声化.本文用声学实验的方法分析温州话塞音,探讨:(1)温州话究竟有不同有真浊塞音,(2)浊塞音后的元音是否有气声化,其声学上的谱特征如何?从而决定温州话浊塞音的声学特性.
  • 摘要:本文以114名年龄介于21-60岁的新加坡福建社群人士为调查对象,通过读数字、读词语、读词对等方式,调查不同受访人华语“第五声”在59个词语中的分布情况.根据调查结果,本文将探讨“第五声”的遗失过程在词汇中的实现情况.调查结果显示,在词汇层面,新加坡华语“第五声”的遗失呈现连续渐变的特性,随着受访人读作“第五声”的词汇总数的下降,特定的词不再被读成“第五声”,第五声的遗失呈现“词汇收缩”现象.反观,标准华语的声调则呈现“词汇扩散”现象.王士元(1969,1984)提出的词汇扩散理论认为语音的变化在词汇中的一种实现方式是“扩散”,即开始的时候可能只在某些词中有变化,随着时间推移,在少数词中首先发生的变化扩散到所有有关的词,而不是象青年语法学派所说的那样“所有在相同关系中发生了语音变化的词”都突然地、没有例外地同时受到这种这种变化的影响.新加坡华语“第五声”的遗失是现实语音变化中“照着词汇扩散的方式走的”一个实例.
  • 摘要:为探索客观有效的异常语音评价方法,应用CSL分析各种类型患者的异常声音.方法:8例筛选患者,咽喉摩擦音、先天性腭咽闭合功能不全、腭化构音和正常构音各2例,其中男性4例,女性4例,平均年龄18岁.被检敏感音为/z/、/c/、/s/,直接输入计算机语音工作站,存盘后对音声图像进行定量分析和比较.结果:各种类型语音的音声图像各有其特征,其频谱、辅音起声时间和共振峰各不相同.结论:CSL综合了语图仪和计算机技术,可图像化和定量分析声音,在目前是一种较好的研究手段.
  • 摘要:“含灯大鼓”的表演形式特殊,演唱时表演者口中衔一根竹筷,以竹筷为支架,在嘴前架置一个龙头式灯座,其上点燃蜡烛,演唱时不得张嘴,同时又要求唱词的吐字清晰.本文试图通过声学分析,从声学特征上初步了解“含灯大鼓”演唱发声与正常发声的异同.实验结果显示,虽然口衔竹筷发音会使元音的共振峰发生变化,但其元音共振峰模式没有发生变化,故“含灯大鼓”演唱者仍然能发出清晰的元音.
  • 摘要:本文认为,“节奏”是从属于“韵律”(或“节律”)的一个超音段感知范畴,表现为轻重对立在一定时间间隔上的反复交替,是人对时长、音强、调形、调域等多重声学要素及其他因素加以整合的综合感知经验.节奏通过音步或节奏单元实现对连续话语的切分,同时又通过节奏单元的长度限制对句法产生制约.句子中节奏单元的排列与句子的信息结构形成同构.每个节奏单元必包含一个核心重音,本文据此提出“节奏重音”的概念.节奏重音是句子的基本重音,在此基础上再进一步形成句子的正常重音和特殊重音.
  • 摘要:本文分三部分.第一部分介绍利用孤立语句语料库中语句,得到普通话韵律结构的研究成果.第二部分基于韵律结构提出三个层次的F0高线和低线,据此说明普通话语句F0下倾(declination)问题.第三部分根据语句韵律结构和F0高低线,编辑合成了一些普通话孤立句声音,其音质不仅像那个发音人说的,而且还给人以抑扬顿挫、轻重快慢的感觉.这个试验说明这项研究结果反映了语句韵律的客观性.
  • 摘要:话语的韵律结构在话语理解过程中起着很重要的作用,它会影响听话人对话语结构的感知.话语的韵律特征,包括节律和语调,为连续语流的切分提供了一个自然的手段(Fischer and Tokura,1996).本文考察普通话朗读话语中基频重设与语流间断的关系,分析语流间断处的基频重设表现.数据结果表明,基频重设的幅度与语流间断的程度二者关系密切,基频的重设幅度越大,听感上的间断程度就越高.
  • 摘要:言语交际活动是语言的源泉.人类语言在交际活动中孕育、形成和发展.语音的社会标准靠声音维系.普通话的概念不限口语,却以口语为底层依据.它以全民为范围,兼容方言,却以北方方言和北京语音为操作依据.现代白话文形成过程的方方面面都有全民有声交际中逐一整合的环节.汉语的统一是全体方言有声语言的表现.有了那种一致性,书面语言才能够在各方言区生存.方言知识往往忽略方言混杂、普通话与其共存、使用同一种书面语言以及文化教育遍及全国的事实.在社会生活中,言语实践方式不是单一的,而是错综复杂的.在听说读写的方方面面,个人使用方言或普通话并非简单的是与否问题.现实的语音、词汇、语法是不可分割整体的三部分内容.全国使用汉语的所有人都在实践它们的整体关系,其中北京的群体是比较全面的楷模.普通话语音研究必须以北京群体为基础.本文讨论语言的实体性、可重复性、社会性,以及语言文字各种属性在听说读写实践和人际沟通中的整合,以此说明考察汉语内部一致性的思路,兼论什么是语音.
  • 摘要:本文对两位讲普通话的男发音人的450句即兴话语进行实验分析,考察了话语中声母和韵母的减音状况.实验结果显示:两发音人的声韵减音总数分别占各自声韵总数的2.7﹪和3.1﹪;发音人M01的减音声、韵数与其总声、韵数的百分比分别为2.8﹪和2.7﹪,发音人M05的减音声、韵数与其总声、韵数的百分比分别为5.1﹪和1.5﹪.另外,文中还讨论了声、韵减音的一些特点.
  • 摘要:在北京话中,由于语流音而发生语音脱落的现象是很多见的.脱落的有时是区别特征,有时是部分音段,有时则是整个音节.语音的脱落一般发生于非重读音节,并且绝大部分是离散的现象.但是,这种离散的音变大多又是能产的,相同的语言形式总是发生相同的音变.
  • 摘要:俄语语调的研究从罗蒙诺索夫(M.B.ломоносов)最早提出了语调同句法的关系起,到80年代初勃雷兹古诺娃(Б.А.Брыэгунова)的语调理论体系在俄语标准语中的确立,经历了近百年的历程,终于走出迷茫,形成一套善整的、科学的体系.这套成果已被广泛地用于外语教学、电脑的言语自动识别与合成,及根据言语信号的声学特征来认证说话者本人极其情感状态,甚至用于诊断某些疾病,使前苏联语调理论的研究跃居世界先进地位.在俄语语调理论研究方法的指导下,西班牙语、缅甸语、越南语、阿塞拜疆语、阿拉伯语、及阿尔及利亚语都制定了自己的调型.尽管我们都知道,汉语不同俄语,是声调语言,但是俄语语调研究的方法不能说对我们会没有启发,而且,根据俄语语调理论制定出自己的句调型的越南语、缅甸语也是声调语言.笔者愿向对汉语句调研究感性趣的学者介绍俄语句调研究的成果与经验,共同探讨汉语语调研究的更好途径.
  • 摘要:遵化方言口语中的上声有六种变化.在词汇平面上,绝大多数“上声+上声”的双字组变成了“阴平+上声”;但是,有个别词语以及语句中的一些“上声+上声”变成“阳平+上声”.本文据此认为遵化方言中“上声+上声→阳平+上声”的途径是:上声+上声→阳平+上声→阴平+上声.文章还归纳了汉语北方方言中“上声+上声→阴平+上声”的两条途径.
  • 摘要:本文在“优选论”(Optimality Theory,以下简称OT)的框架内提出普通话舌尖元音实际上是一种插音,这种插音是由制约条件ALIGN-R(σ,V)所驱动的,所插入舌尖元音翘舌性或卷舌性,则是由横向忠实性对应制约条件决定的.文章指出汉语普通话舌尖元音的插音过程类似于其他语言的无标记元音插音,是受一组普遍性制约条件的制约.所不同的是,汉语普通话的插入元音还要受到横向忠实性对应制约条件的制约.最后,文章提出有关驱动普通话舌尖元音插入的制约条件的部分等级排列,即IDENT-IO(F)*[back],*[+low],*[+round],*[-high],S-IDENT(F),ALIGN-R(σ,V)DEP-IO.
  • 摘要:天津方言三字组的连读变调多年来一直是学术界争论的焦点.很多学者对这一问题进行了深入的研究.但迄今为止还没有令人满意的结果.引起争议的三字组可归纳为以下七种结构:阴阴阴,上上上,去去去,去阴阴,去去阴,阴去去和上阴阴.本文认为词的内部结构与变调结果无关.我们把右→左看作天津方言连读变调的一般方向.(unmarked direction)也就是说,当一个三字词同时满足两个连读变调时,要先执行右边的变调规则,再执行左边的变调规则.阴阴阴,去去去,去阴阴,阴去去和上阴阴都符合这条规律,只有上上上和去去阴例外.我们认为这两个例外是由于上上规则和去阴规则的特殊性造成的.首先,本文用大量语料,从多方面论证上上规则是两字组的四条变调中最少标记性的.上上上从左到右的特殊变调方向是由于在第三个上声出现之前,上上已经变成了阳上.然后,本文论证了去阴规则的特殊性.我们发现去阴规则与上上,阴阴和去去这三条规则是不同类的变调规则.上上,阴阴和去去都是异化规则,声调是它们的唯一条件.而去阴的变调条件不仅有声调,而且有重音模式.因此我们把去阴变调称为以节奏为条件的变调规则(metrically conditioned TS rule).本文提供了详实的语料,论证了去阴规则的特殊性.进而得出结论:去阴规则是这四条变调规则中标记性最强的.这样,我们得出了两字组变调规则的层级排列;上上>去去,阴阴>去阴.在去去阴结构中,去去的层级高于去阴,所以去去变调要先于去阴变调.我们认为,当方向性与层级排列出现矛盾时,方向性要服从层级排列.这时还有一个问题没有解决:为什么去去去→去阴去而不是阳阴去.也就是说,为什么去阴在去阴中不变成阳阴,而在两字组和去去阴中,去阴都变为阳阴.本文也从这一规则是以节律为条件的角度,对这一现象做出了解释.天津方言三字组的连读变调,自李行健,刘思训(1985)的文章《天津方言的连读变调》发表以来,引起了国内外语言学界的广泛关注.谭馥(1986),陈渊泉(1986),陈渊泉(即将出版),石峰(1988),(1990)Milliken等(1997)都对这一问题进行了深入的研究.但迄今为止还没有找到天津方言三字组连读变调规则运行的规律.特别是对于李行健,刘思训在他们的文章结尾提出的问题:为什么去去去的变调结果是去阴去而不是阳阴去,还没有做出令人满意的解释.天津方言同普通话一样,单字调有阴平,阳平,上声和去声四个调类.但天津方言四声的调值与普通话不同.天津方言四声的调值分别是:阴平21,阳平45,上声213,去声53(天津方言四声的调值说法不一,我的实验结果与郭承铭(1981)一致.)天津方言三字组的连读变调是以两字组为基础的.天津方言两字组有四条连读变调.1.阴阴→上阴 飞机 fei ji(阴阴)→fei ji(上阴) ‘airplane’2.上上→阳上 洗脸 xi lian(上上)→xi lian(阳上) ‘wash face’ 3.去去→阴去 教授 jiao shou(去去)→jiao shou(阴去) ‘professor’4.去阴→阳阴 教师 jiao shi(去阴)→jiao shi(阳阴) ‘teacher’ 对于这四条变调规则,目前没有什么争议.但三字组的连读变调就复杂多了.天津方言三字组共有64种声调组合,其中37种不会产生任务连读变调如阴去上,阳去上等.17种结构只发生一次连读变调,如阴阴阳,阳去去等.奇怪的是去阴去,去阴阳和去阴上这三种结构.这三种结构本应发生一次连读变调即去阴变成阳阴.但是根据我们的实验,这三种结构没有发生任何变调.这一奇怪的现象以前并没有被注意.为什么去阴在去阴去,去阴阳和去阴上不发生变调?本文将从去阴变调是以节律为条件的连读变调的角度给予解释.剩下的七种结构一直是争论的焦点.它们或者是涉及不止一条变调规则或者是涉及一条规则的两次应用.也就是说,它们或者是同时满足了两条变调规则如去去阴,去阴阴或者是对于同一变调规则的两次应用如上上上,或者是一条变调规则的结果恰好给另一条规则的应用提供了条件如上阴阴,阴去去或者是阻碍了其它规则的应用如阴阴阴.规则应用的先后次序的不同会导致变调结果的不同.连读变调规则在天津方言中的应用模式是什么?连读变调的应用否有方向性?变调规则是否有先后次序?三字组的内部结构对变调结果是否有影响?句法和节律因素是否对变调结果产生影响?这些都是本文要讨论的问题.
  • 摘要:本文结合语音实验,对乌鲁木齐汉民汉语方言中的轻声进行了描写与分析,文章分为四个部分:1,引言.2,轻声的语音描写.3,轻声的音高分析.4,结论.
  • 摘要:赵元任和HOCKETT曾提出phonemic brurden或phonological load这样的概念.中国科学院声学研究所曾对普通话的声母、韵母和声调在书面文本中的出现频度做对一个统计.我们认为,这样一个概念和这样一份统计资料,对于应用语言学,特别是语言获得理论研究是弥足珍贵的.在此基础上,我们又对汉语静态的词汇单位和不同语体的语篇材料进行了统计分析.我们可以发现普通话音系存在着以下一些主要分布特点.(1)音系成分在不同语料中的分布大致相同,可以据此分出高、中、低三小不同频度的声母、韵母.(2)部分音系成分在静态材料和动态材料之间存在着分布差异.(3)音系成分在静态或动态的材料内部虽然分布相关性较强,但也存在着一些值得注意的情况.(4)音系成分的出现频度与结构关系之间的相关性不匀称.最后根据普通话音系成分的分布特点,我们提出相应的语音教学和测试的策略.
  • 摘要:普通话语句中音节间和短语间的韵律特征变化,与合成语音的自然度关系密切,其中尤以声调的变化最为重要.文中叙述普通话韵律在口语中的必然变量和自由变量、变通话的轻声和轻读,字调和语调等在合成中处理问题.文中并讨论如何用移调方法在合成中将普通语的平叙句的语调修改成逻辑重音或感情重音的语调.
  • 摘要:在声纹鉴定的实际案件中,语音材料通过电话录制的案件占很大比例,如:绑架、敲诈勒索、恐吓、滋扰等案件.语音材料的录音设备也是五花八门,种类繁多,有各种录音电话机、语音答录机、电话转接器转接各种录音机等,而嫌疑人的语音多为用录音机直接录音.通过语图仪检测,即使是同一声源,在语音参数上也存在差异.本项研究通过使用同一语音信号源经相同的电话线路传输,由三种不同的电话录音设备录音,与不经过电话线路传输的录音相互比较,研究其对于声纹鉴定的影响.
  • 摘要:在声纹鉴定的司法实践中,经常遇到由于话者情绪波动而引起案件检材和样本中的语音出现较大差异的情况.一般情况下,检材中的语声或者口气凶狠,或者打官腔、态度傲慢,大都底气比较足、言语自然.但嫌疑人在面对办案人员依法对录制语音样本时,恐惧、紧张使之情绪低沉、精神萎靡,说话结结巴巴、底气不足,张不开嘴;还有一部分涉案人员为了逃避打击,回答问题往往避重就轻、竭力回避问题,故意含糊其词.这时,检材和样本的语音图谱中会出现一些差异.本文就情绪波动时检材和样本的语图出现差异的机理及同一人变化范围进行了探讨,取得了比较满意的结果.
  • 摘要:话者的语音变异一直是说话人识别的关键问题.本文以零声母音节和声母为边音的音节作为语音素材,通过对不同发音人的上述音节图谱进行形态及数值分析,对话者自身和话者之间的语音变异进行了定量研究,实验结果表明,在实验室条件下,多数话者自身的语音变异小于话者之间的语音变异.
  • 摘要:本文通过对10名发音人所发的汉语普通话韵母进行观测分析,发现有些人在有动程单韵母、复合韵母和鼻韵母中有标准共振峰之外的附加共振峰存在,有些人则没有.并且这种现象具有较强的个人稳定性.由此确立了一种新的声纹特征.
  • 摘要:现今的社会中语言的使用是相当多元的,因此多语言语音识别(multilingual speech recognition)也就成了语音识别研究中一个重要的课题.目前普遍的做法是将针对各种不同语言所独立发展的完整的语音识别系统做结合,以达到辨识多语言语音的目的.然而在某些需要用到多语言语音识别的实用系统中,大部分的使用者都还是以单一主要语言为主,较少使用到其它的语言.本文即是针对这种特殊需求所设计的多语言自动总机系统,在最主要的中文人名辨识部分,我们建立一个以中文音节模型(sub-syllable model)为基础的关键词萃取(keyword spotting)系统,而在较少使用到的非中文(包含英文与地方方言)人名部分,则依据系统实际需要建立以全词模型(whole word model)为基础的单词语音识别器,最后则是利用一个以信心值(confidence measure)为基础的决策机制来决定系统的结果输出.目前我们的系统规格设定为可辨识6500个中文人名及50个非中文人名(40个英文人名和10个闽南语人名).实验结果在中文人名部分的辨识正确率为91.70﹪,而非中文人名部份则有92.23﹪,显示系统能有效解决特殊应用下的多语言语音识别问题.
  • 摘要:本文从语音学嗓音发声类型研究的角度,介绍了语言发声类型的一些基本概念,并在此基础上讨论了语言发声类型基础研究的各个方面和相关的领域.嗓音研究的信号有语言声学信号、声门阻抗信号和高速数字图像信号.研究的方法包括语音学研究、多维嗓音研究、声门阻抗信号研究、嗓音的小波变换研究、声门高速成像的研究和语音合成研究等.在学科上涉及语音学、言语声学、嗓音生理学和言语工程等.文章包括以下十一个方面:1)嗓音发声类型的语音学研究;2)多维嗓音分析;3)声门阻抗信号与声带振动;4)信号类型与基频提取;5)基于高速数字成像动态声门研究;6)基于高速数字成像的动态声门模型;7)基于高速数字成像的嗓音病理研究;8)基于小波变换的嗓音研究;9)嗓音的变换;10)语音合成研究;11)其它.这些基础研究对语音学、言语声学、嗓音医学、言语工程以及声纹鉴定和声乐等研究都具有十分重要的意义.,
  • 摘要:本文致力于建立一个初步的普通话视位系统.研究基于一个小规模的普通话语音唇型参数数据库.通过一系列统计分析的运用,归纳出一套汉语普通话视位系统.初步的结论有:1、大部分唇型参数之间高度相关,起主导作用的是唇高度、外唇宽度(含上齿露现度)和唇突度;2、普通话共有7个视位,辅音视位有“b”、“d”和“f”,元音视位有“i”、“u”、“o”和“a”.
  • 摘要:本文提出将合成语料库中的语句按韵律词进行划分并按四级进行韵律层级的标注,通过人工听辩的方法对微软中国研究中心的大规模语音合成语料库进行了标注.报告这项技术对提高合成语音自然度的实际作用.
  • 摘要:粤方言研究专家对粤语调值的描写,目前还没有一致的看法.主要分歧出现在:阴平调、阳平调和阳上调,争议最大的是阴平调值.通过实验语音分析,香港粤语的阴平调值为55,阳平调值为31,阳上调值为23.我们预期,广州粤语和香港粤语的阴平调,55和53将会合流,原来老派粤语55调和53调的对立现象将逐渐合而为一,都读作55调.
  • 摘要:优选论的框架中评估装置是其核心之一,寻找具有普遍意义的制约条件便是用优选论方法分析音系现象的前提.高平调在连读变调中具有稳定性,而低平调在许多方言中却会发生变化,高平调和低平调在连读变调中具有不对称性.本文试图指出汉语中,高、低平调的不对称性这一特点应成为优选论分析汉语连读变调现象的一个重要制约条件.
  • 摘要:本文介绍了邯郸话的单字调及二字组连读变调,并在此基础上采用优选论着重分析了二字组连读变调.结果表明,通过制约条件的交互作用,优选论能够比较满意地解释邯郸话二字组的声调现象.
  • 摘要:本文采用实验语音学的方法对乌鲁木齐回民汉语的轻声作一详细的描写与分析.乌鲁木齐的汉语方言是由乌鲁木齐汉民汉语(简称乌汉话)和乌鲁木齐回民汉语(简称乌回话)组成的.这种两种汉语方言同城而处的现象并不多见,主要是由回民的民族、居住、宗教等特点造成的.本文通过南开大学研制开发的桌面语音系统软件(Minispeech Lab)对乌回话的轻声音节在两字组、三字组及四字组中的情况进行考察.从时长、音高及音强三个方面进行分析,实验结果表明:1.乌回话的轻声根据时长可分为两类,一类同语言学界普遍认识的轻声相同,即音长较短,只有重读音节的50﹪左右;而第二类在调长方面同重读音节相似,这两种轻声的调型模式相同.2.乌回话轻声的音高的情况是:起点受到前字调终点协同发音效应的影响,终点为低调(L),同时也受到乌回话连调系统的制约,因此是音系学和语音学综合作用的结果.而轻声音节在三字组及四字组中的情况表明,轻声音节的音高主要受到前面那个重读音的影响,而后字对它没有根本的影响.3.音强也不是构成轻声的决定性因素.因此,在构成轻声的四个语音要素、时长、音高、音强和音色中,音高是乌回话轻声的决定性因素.
  • 摘要:本文采用实验语音学的方法以及现代音系学——优选论(Optimality Theory)的理论对扬州方言二字组的连读变调进行了描述和分析,其中值得关注的是非忠实性制约条件(Anti-faithfulness Constraints)在扬州方言声调分析中起到的作用.
  • 摘要:对传统的字调教学而言,本文提出了以下的新的思路,并针对不同教学要求进行教学.一.建立起声调在口语中有调型的平滑和跳断的新概念.二.将字调教学扩大到韵律短语的调型教学.三.将轻读、轻声结合到调型中,力求切合自然口语.利用词首辅音的持阻段延长所形成的填声停顿和无声停顿,建立韵律短语内部的节奏感.
  • 摘要:本文从语音角度考察韩国学生“儿化韵”的发音错误.一般说来,学习汉语的韩国学生,在所和写的时候,儿化韵母给他们带来的困难不多.但是,当他们说话或阅读时,儿化韵母的发音是比较难掌握的.为了帮助韩国学生正确地掌握儿化韵母的发音,本文首先从语音角度考察韩国学生的儿化韵母发音情况,其次通过发音情况的结果来分析其原因,帮助韩国学生理解现代汉语韵母的儿化规律,指导他们正确发儿化韵.
  • 摘要:本文将分析TTS系统的传统三步韵律实现策略及存在的问题,并通过介绍一个基于大规模语料库的两步韵律实现策略,探讨如何在合成语音中实现更为自然的韵律.主观听辨实验的结果表明,在这个新的两步韵律策略中用来选择合成单元的音节平均拼接损失函数与合成语音的自然度呈现出良好的负相关性.通过降低拼接损失,就能达到提高自然度的目的.
  • 摘要:捷通华声TTS是一个多样本、不定长拼接合成系统,以它的合成语音为例分析当前拼接合成语音的特点.比较合成语音自然语音的异同,指出存在的主要问题.提出为提高合成语音的自然度,加强语言学处理,和加强汉语韵律特征及音联研究的迫切要求.
  • 摘要:随着近几年来,随着计算机技术、声信号处理技术和人工智能技术的飞速发展,语音合成中的韵律建模越来越朝着数字化、智能化和综合化方向发展.韵律建模工作也超出了传统的单存韵律参数处理本身,而与语法分析、重音分析和预测以及其它语音声学参数的处理更多的融合在一起.各种人工智能技术也在其中得到了充分的体现,如自然语言理解中的分词、词性分析、语法和语义分析技术、人工神经网络技术、决策树技术、甚至是隐马尔可夫技术等.现代韵律建模思想,已经使得汉语的语音合成系统的自然度获得了巨大的进步.但是语音学的研究,尤其是传统语音学研究和韵律的研究对汉语韵律建模是否还存在帮助呢?本文力图从作者的韵律数字建模的工作中,包括了:音节重音的自动预测和处理,基频、音长和能量等声学物理参数的自动预测和处理,来阐述现代汉语语音学的研究在汉语韵律数字建模工作中的体现.
  • 摘要:口语对话和朗读语篇的差别表现在句法、副语言学现象、音段和韵律等许多方面,这给口语对话的标注带来新的课题.本文介绍自然口语对话语音语料库CADCC(Chinese Annotated Dialogue and Conversation Corpus)和其文字转写、音段以及韵律标注.CADCC包括两个子库:电话对话库set1和口语对话语篇库set2.其标注内容包括篇章话题、话轮、韵律和音段的标注.音段标注采用SAMPA-C标注系统,韵律标注采用C-ToBI标注系统.本文还报告了标注结果,如篇章话题的长度,口语话轮出现的模式,插入和叠接现象,韵律结构和朗读语篇的差异等等.
  • 摘要:本文针对D.L.Donoho提出小波阈值去噪方法中软阈值函数的缺点,提出一种新的连续可导的阈值函数,并在此基础上基于SURE无偏估计,给出一种自适应算法.由于此算法可基于SURE无偏估计准则对输出结果进行反馈控制,因此对语音信号中的清音和浊音不必分别处理,降低了编程的复杂性.最后本文把经过处理的语音信号进行语音识别,实验结果表明此方法对在噪声环境下的语音识别性能有很大的改进.
  • 摘要:由于普通话的推广,在声纹鉴定的案件中,经常遇到罪犯在作案时使用语言的和提取样本时犯罪嫌疑人的语言分别为普通话和当地方言.因此研究方言和普通话比对时的语音声学特征参量的变化规律和鉴定方法是非常必要和重要的.这种利用方言伪装、掩盖话者身份的语音,我们称为方言性伪装语音.本文对三位男性发音人的普通话和济南话的声学参量进行测量分析,以探讨方言性伪装语音的声纹鉴定方法.
  • 摘要:近年来,随着IT业的飞速发展和计算机的普及,我们的生活发生了翻天覆地的变化,很多过去难以实现的梦想如今已经或正在变成现实.在语音信号处理领域,过去的语图仪我国全部依赖进口,价格昂贵、操作复杂且维修不便,严重制约了声纹鉴定技术在我国的普及和发展.鉴于以上原因,公安部物证鉴定中心与北京阳宸电子技术公司从90年代开始合作开发具有自主知识产权的基于PC产品的全数字化语图仪,经过多年努力已完成第三代产品—VS99的开发定型工作,作为国家九五重点科技攻关成果,现已成为我国声纹鉴定的主流设备.VS99语音工作站是基于PC机的全数字化语图仪,操作简单,使用方便,而且成本较低.它不便具有国外高档语图仪的全部功能,而且在录音、语音分析等功能方面有较大改变,特别是噪音降除处理能力是其最具有特色的功能.VS99语音工作站最大的特点之一是用纯软件实现语图的实时显示.在VS99的语图分析中采用256级黑白灰度,分析数据的采样率从8K-44.1K,语图窗口的大小根据用户的要求可以任意调节,由于采用了多种加速算法,无论是语图的绘制速度,还是语图的层次、清晰度都可以和硬件级的实现方案相媲美,是国内唯一用软件实现实时语图显示的高档产品.在VS99中,可以产生动态效果极佳的实时宽带/窄带语图,并给出众多的语图设置和修改参数,用户可以根据实际需要定制出最清晰的语图.
  • 摘要:为了深入研究普通话语言舌-腭接触特性,本文介绍了研制“普通话动态腭位数据库”的情况.
  • 摘要:本文通过心理实验对一中等规模语料库进行韵律层级标注,较全面地分析了汉语韵律层级边界结构的声学相关物,包括低音点、时长和无声段长度.研究主要得到以下结果:1.低音线较好地反映了韵律层级结构.不出现韵律边界的情况下,低音线渐降;2.韵律词边界的声学线索是低音线的不连续性和边界前音节的延长,没有无声段;3.韵律短语和语调短语的边界处,低音线出现重置.并且,在语调短语边界处的低音线重置程度显著地大于在韵律短语边界处的.语调短语边界处的无声段也显著长于韵律短语边界处的.两种边界前音节的时长没有显著差异.4.无声段随韵律等级的增加呈对数增长,边界等级越高无声段的增长越快.
  • 摘要:本文研究了语句层面双音节韵律词的重音感知特点.实验结果表明,连续话语中双音节词的重音分布与孤立词的重音分布特点有所不同,它受到词所在的韵律边界的显著影响.词内两音节在感知中的轻重对比度与音节的高音点差和时长差表现出正相关,与音高差的相关高于与时长的相关.统计分析的结果还表明,音节间的轻重对比度受到调型组合的显著影响.
  • 摘要:本文通过感知试验、声学语音学实验和文本分析,考察韵律边界前后的语音学和语言学信息特征,为韵律短语切分提供更加科学可靠的、可以自动预测的标志.全文重点讨论以下三个方面的问题:第一,关于韵律词和韵律短语的界定;第二,停顿分布与句法结构和词性特点;第三,实际言语中的韵律词组词规则.
  • 摘要:本文认为词汇词进入话段要经过一个韵律组块的过程,首先单音节词会与相邻音节组成音步,音步与音步会组合成不稳定的附加组,再组合成韵律词.韵律词与韵律词可以组合成韵律短语,再组成话段.韵律组块要受语义、语用、句法、及语音等因素的制约,动词倾向于把后面的成分拉过来,语义关系密切的词会优化组块(意义单元制约条件).“是”倾向于前附,韵律组块有时会跨过大的句法边界,组块还受短单元优化等条件的制约.
  • 摘要:本文是针对汉语普通话状中结构的韵律所做的初步研究.文章从状中结构在更大组合中的可能停延和音域展敛出发,具体考察了“也”和“只”的韵律表现,总结出各自的表达式:“也/X”和“/只X”;了解到状中结构中,“也”是韵律外自由成分,“只”为韵律内成分;这种差异来自两者不同的句法语义内容.作状语的副词句法语义内容的不同,造成了状中结构韵律的复杂表现;同时,在更大组合中状中结构的自由成分韵律归属的多种可能,也是状中结构韵律复杂性的表现.这两种表现可以分别通过对句法语义的关照,以及语音层面上该自由成分前后音节数的多少加以控制.
  • 摘要:北京话口语音在长期使用过程中,为满足表情达意的需要,发生了一些变异,并形成了多种变体.本文选取若干特征明显的变异形式,试作整理、归纳和分析的工作,并试图说明,语音作为最具效能的表意载体,能够采用灵活多样的方式使信息传递获得最佳效能,北京话口语音的变异形式成为口头表达、交流的有力手段即是实证;“音义俱在”应该有更多的指导意义.
  • 摘要:文语转换系统中自动分词的理想结果是和人朗读习惯相符合的韵律词.在利用词库切分文本之后,处理语句中残留的大量单字虚词就成了完善切分结果的重要步骤.本文主要探讨在汉语自动分词中如何对虚词进行处理,尝试利用词性和词长等因素对特定的虚词制定一些规则,从而在实际应用时系统可以根据这些规则来确定虚词与前后字或词组的归属与结构.
  • 摘要:本文考察汉语普通语轻声词中的频谱平衡问题.本文通过对五个元音[a]、[i]、[u]、[r]、[o]在四个声调情况下组成的重轻格轻声词(18个词)中的声学分析和数据处理,得到每个音四个频段的强度值和斜率值,用同一个词内轻音节减重音节得到频段差值和斜率差值.实验依据4名男子18个轻声词每人10遍的样品.实验结果表明,在汉语中,频谱倾斜存在,但有些因素影响到它.1.声调的不同对频段强度值有直接影响,其中最明显的是,在由上声组成的轻声词中,轻音节的强度在四个频段上都大于重音节.从对偶音高的观点看[1],在四声中,上声为低讯,其他声调为高调.在重轻格词中,前后字的声调有对偶关系,即有高与低或低与高的对立关系.从频谱倾斜看,上声的情况与其他声调不同.因此,将上声与其他声调分为两类,无论是否元音不同,都是必要的.2.元音的开口度对频段差值有影响.开口度大的元音差值大于开口度小的元音.其顺序依次为[a]、[r]、[o]、[u]、[i].
  • 摘要:近些年来,汉语的语调、韵律研究正成为学术界的热点,而作为普通话重要特征的轻声,由于牵涉到诸多相关问题,如连续变调、轻重音等,需要我们给予更大的重视.本文对多种声学环境下的普通话轻声进行全面的实验分析,特别考察其基频的声学性质.
  • 摘要:语音合成的研究中,我们处理一个近万句的普通话自然语言数据库时,发现前鼻音韵母产生后鼻音化趋向的现象比较严重.从理论上来说,前鼻音韵母的后鼻音化趋向是连续音变的同化造成的,后续声母影响了鼻竭尾,使之发生了改变,从而使音节发生变化.经过对具体元音声学特征的分析及比较,我们发现在这一音变现象中,韵腹的声学特征的改变更为关键.由于/av/和/aN/在话语中使用频率较高且听觉上的差别较为明显,我们选取/av/进行连续语流中的音变现象的分析.发生了音变的韵母/av/,其韵腹/a/的声学特征有所改变,决定了元音音色的改变,进而使整个音节的音色发生了改变.所以,连续语流中逆向协同发音,发生根本性改变的是其中的元音.最后,文章将提出这一现象及解释对实际语音处理的作用.
  • 摘要:本文对上海方言A、B、C、D、E、F、G、H、I、J十种双音节调调型进行声学实验,给出它们的F0数值表和图.然后用z-score法进行标准化分析,得出十种变调调型五度值.最后将实验得出的五度值同传统方法得出的结果进行对比.
  • 摘要:本文主要通过祈使和陈述语调的对比以及祈使和疑问语调的对比,探讨汉语祈使语调的声学特征.汉语的语调类型是可以用音域的高音线和低音线的调节来说明.祈使句和陈述锯都呈高音线骤落形式.相比之下,祈使句和疑问句的高音线在调核后的落差有细微而重要的不同.疑问句调核具有努力把紧跟其后的第一音节抬高的趋势,也就说明它有高音线渐落的特征,有别于祈使句和骤落特征.随着调核后一音节抬高的幅度加大,疑问信息量增加.三种句型的低音线趋向各自有所不同.陈述句的低音线起伏较大,低音线很低,显示出下延形式.祈使句的低音线起伏较小,低音点比陈述句相应部分要高,呈弱上敛形式.在疑问句中上敛形式使低音点变高,使对偶距离变小的性质比祈使句更为显著,呈强上敛形式.祈使句的弱上敛、疑问句的强上敛和陈述句的下延形式并列,是三种不同的低音线形式.
  • 摘要:本论文为了进一步了解普通话语句重音和语调的关系,通过实验语音学的手段,研究了重音的声学特征、组合特征以及重音对语调的影响.主要结果看到:(1)强重音前后的弱重音在高音线上形成了非对称格局.(2)具有强重音的语调分为两种,即句末强重音和非句末强重音.(3)自然重音和强重音的音高下倾具有一定的规律性.(4)具有阴平、阳平和去声强重音的语调跟上声强重音的语调比较类似,它们的高音线都出现骤落现象.只是在高音线骤落的位置上上声跟其他声调有所不同,上声强重音语调高音线的骤落出现滞后现象.
  • 客服微信

  • 服务号