语音合成属于《中国图书分类法》中的六级类目,该分类相关的期刊文献有386篇,会议文献有186篇,学位文献有302篇等,语音合成的主要作者有蔡莲红、张银华、凌震华,语音合成的主要机构有清华大学计算机科学与技术系、华南理工大学、苏州大学电子信息学院等。
统计的文献类型来源于 期刊论文、 学位论文、 会议论文
1.[期刊]
摘要: HiFi-GAN声码器通过采用缩减网络层的通道数或层数的方式来有效减少模型参数、提高推理速度,但此种方式也严重损害了生成语音的质量。针对此问题,提出了两点改进...
2.[期刊]
摘要: 为了解决语言障碍者与健康人之间的交流障碍问题,提出了一种基于神经网络的手语到情感语音转换方法。首先,建立了手势语料库、人脸表情语料库和情感语音语料库;然后利用...
3.[期刊]
摘要: 语音的声调最能突显个人语气与情感状态,通过加入声调参数这一特征,能够有效提高语音合成的逼真度,使得话语更加具有区分度,并且有效提高了情感识别和语音识别的准确度...
4.[期刊]
摘要: 针对基于注意力机制的序列到序列模型在合成长句子语音时出现的漏读、重读问题,根据前向算法提出了前向注意力机制,其利用前一时刻的注意力得分平滑当前异常得分。在此基...
5.[期刊]
摘要: 在大多数语音合成系统中,预测的Mel谱的质量直接决定了最终合成语音的质量。基于Tacotron 2的框架预测的Mel谱通常缺乏接近真实数据的精细结构,为解决此...
6.[期刊]
摘要: 端到端语音合成(TTS)系统可以直接根据给定的字素或音素序列生成语音。当前主流的端到端语音合成系统可以为英语生成近似于人类声音的语音。然而,中文的文本不同于这...
7.[期刊]
摘要: 针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:1.采用音素嵌入作为输入,...
8.[期刊]
摘要: 美国加州大学旧金山分校科学家爱德华?张(音译)及其同事,利用与人类下颌、喉头、嘴唇和舌头动作相关的脑信号,开发出了一种人类语音合成系统。首先,他们在5 名被试...
9.[期刊]
摘要: 基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究...
10.[期刊]
摘要: 近年来,随着人工智能语音和图像处理等技术逐渐成熟落地,智能人机交互产品种类不断创新,智慧屏作为典型的智能产品形态,受到了广大消费者和产业界的广泛关注,其带动的...
11.[期刊]
摘要: 汉语语音的声调是个人语气与情感状态最直接的表达,是体现汉语语言状态最重要的特征之一.为了使得语音合成的逼真度得到有效的提高,讲话者的话语更加具有区分度,通过加...
12.[期刊]
摘要: 语调是说话的腔调,由不同的声调抑扬顿挫的配制和变化形成,是人类传递情感的特征之一.通过调节语调参数来改变一段话语中某个字音的长短及高低,从而使可控的语调实现语...
13.[期刊]
摘要: 射孔施工作业是油田开采的关键步骤之一.针对油田射孔操作依赖井场人工操控的局限,将语音合成技术应用到油田射孔操作中,实现了射孔设备远程操作.在油田射孔操作指令数...
14.[期刊]
摘要: 近年来,AI技术发展越来越迅速,人机之间的交互也越来越频繁.语音合成技术就是人机交互的重要一环.语音合成技术又被称为文语转换(TTS)技术,就是可以将文字信息...
15.[期刊]
摘要: 藏文分词是实现藏文语音合成和藏文语音识别的关键技术之一.提出一种基于双向长短时记忆网络加条件随机场(bidirectional long-short-term...
16.[期刊]
摘要: 韵律结构预测作为语音合成系统中的一个关键步骤,其结果直接影响合成语音的自然度和可懂度.本文提出了一种基于预训练语言表示模型的韵律结构预测方法,以字为建模单位,...
17.[期刊]
摘要: 针对当前神经网络声学建模中数据混用困难的问题,文中提出了一种基于听感量化编码的神经网络语音合成方法。通过设计听感量化编码模型学习海量语音在音色、语种、情感上的...
18.[期刊]
摘要: 声纹鉴定运用语言学、计算机科学等知识,对涉案语音和样本语音进行听觉辨识,同时运用频谱图进行综合分析,判断二者是否由同一音源发出,或者判断声音性质.声纹鉴定结果...
19.[期刊]
摘要: 针对端到端语音合成系统中Griffin-Lim算法恢复相位信息合成语音保真度较低、人工处理痕迹明显的问题,提出了一种基于WaveNet网络架构的端到端语音合成...
20.[期刊]
摘要: 为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法.该方法应用文本分析获得语音对应的文本...
1.[会议]
摘要: 人机交互中最自然、最理想的交流方式为语音,其中主要涉及到了语音合成,即文本转换为语音的技术.随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人...
2.[会议]
摘要: 本文首先介绍了语音合成技术(TTS)的原理,然后探讨了基于自建语音库的基础如何开发光缆包装语音辅助检验系统.
3.[会议]
摘要: 本文分别以自然的和时长规整的汉语陈述句和语调疑问句为语料,通过听辨实验,对比考察了4-5岁的单模和双模状态下的人工耳蜗植入儿童(CI)、以及健听儿童(NH)的...
4.[会议]
摘要: 本文提出了一种基于深度神经网络(Deep Neural Network,DNN)的汉藏语双语语音合成方法.该方法以普通话和藏语的声韵母作为语音合成基元,利用普...
5.[会议]
摘要: 本文提出了一种基于注意力的端到端韵律结构和重音联合预测方法,首次将韵律结构预测和重音预测统一到同一框架中.该方法是基于端到端的,无需任何人为的特征处理工作.其...
6.[会议]
摘要: 发音器官运动可视化对人类发音机理研究、语言教学和病理语音分析等具有重要意义.本文提出一种文本无关的语音驱动舌位运动合成方法,基于医学影像和舌位轮廓自动提取方法...
7.[会议]
摘要: 本文提出了一种基于深度卷积神经网络的语音参数合成器,用以实现从倒谱、基频等语音声学特征中重构语音波形信号.该合成器基于WaveNet模型进行构建,使用深度扩张...
8.[会议]
摘要: 韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中的不一致、耗时的缺点.仿照人工标注流程,本文运用循环神经网络分别对文本...
9.[会议]
以前后鼻音连续统为例的基于Praat软件和STRAIGHT系统的共振峰合成实验
摘要: 语音合成是现代语音学的研究中常见的需求,语音合成的工具有很多.Praat软件是一款功能强大的语音处理软件,业内应用广泛,可以进行语音合成.由日本和歌山大学的K...
10.[会议]
摘要: 传统语音合成系统只能合成单一风格的语音,不能满足当前对多表现力合成语音的需求.本文提出面向有声小说的语音合成框架.有声小说语音具有韵律特征丰富、发音风格多样的...
11.[会议]
摘要: 针对健全人与聋哑人之间的交流障碍问题,实现了一个手语到汉藏双语语音转换的方法.通过使用基于RBM调节和深度反馈微调的深度学习方法,结合支持向量机对30种静态手...
12.[会议]
摘要: 针对情感语音合成系统中情感的细腻刻画与自动预测问题,提出多视角情感描述模型,从认知评价、心理感受、生理反应和发音方式四个方面刻画言语情感的产生过程和衍化机制;...
13.[会议]
摘要: 普遍认为,焦点在语流中承担交际功能,每一种语言或方言都有其实现焦点的方式.本文着重对比了济南方言和太原方言中焦点语音实现的手段.通过考察这两个方言平均基频F0...
14.[会议]
摘要: 韵律预测是提高语音合成自然度的重要因素.蒙古语语音合成技术的研究仍处于起步阶段,合成语音的自然度较低,韵律预测成为了蒙古语语音合成亟待解决的关键问题.本文结合...
15.[会议]
摘要: 韵律层级的预测是影响合成语音自然度的关键因素之一.本文提出了一种基于递归神经网络(Recurrent neural Network,RNN)的韵律层级预测模型...
16.[会议]
摘要: 前人研究多关注疑问句韵律的局部特征,而语音工程中疑问句基频的生成,则有赖于对疑问句语调走势的全局把握与量化建模.文章以疑问句与陈述句的音高曲线的回归线代表语调...
17.[会议]
摘要: 本文首次运用实验语音学的基本理论和方法,在“维吾尔语语音声学参数数据库”中的语料条件下,对维吾尔语中的双音节和谐词、三音节和谐词以及四音节和谐词的时长(VD)...
18.[会议]
摘要: 为了得到更加精确的声道共鸣特性,人们越来越关心说话时声道的结构及其形状变化.本文从MRI3D图像数据中提取了汉语普通话7个单元音[a],[o],[(r)],[...
19.[会议]
摘要: 针对目前合成语音缺乏表现力的现状,本文提出了一种基于自适应训练的疑问句语音合成方法.采用基于统计参数语音合成技术,用大规模的陈述句语料训练初始声学模型,在此基...
20.[会议]
摘要: 本文提出了一种用于情感语音合成的基频转换方法.该方法使用定量目标逼近(qTA)特征作为语音音节层的基频描述,使用高斯双向联想贮存器(GBAM)实现中性合成语音...
1.[学位]
语音合成中韵律结构预测改进——深度学习在韵律预测模块中的应用研究
摘要: 韵律结构是影响语音合成中语音自然度的关键因素之一,对韵律结构预测的研究具有重要意义。传统的基于规则和基于统计的韵律预测模型建模方法在应用中取得了许多成功,但其...
2.[学位]
摘要: 语音合成技术旨在实现文本等输入信息到语音波形的转换。统计参数语音合成方法以及单元挑选与波形拼接方法是现阶段实现语音合成的两类主流方法。前者具有系统自动构建、合...
3.[学位]
摘要: 语音合成旨在将输入文本转换成自然流畅的语音。统计参数语音合成(Statistical Parametric Speech Synthesis,SPSS)具有系...
4.[学位]
摘要: 发音特征指的是人类语音产生过程中舌头、牙齿、嘴唇等发音器官的位置和运动特征。发音特征描述层次化语音产生过程中的生理层信息,与声学特征紧密相关,同时又具有物理意...
5.[学位]
摘要: 语音驱动虚拟说话人技术指的是通过输入语音信息生成虚拟人面部动画。不仅提高用户对语音的理解度,而且提供一种真实、友好的人机交互方式。随着该技术的发展进步,势必为...
6.[学位]
摘要: 语音合成即文语转换(TTS)技术,是智能语音交互方式的重要分支。在当今这个快速发展的信息化社会中,人们普遍追求智能化的交互方式,其中语音合成技术己经在一些应用...
7.[学位]
摘要: 目前,语音合成技术在公共信息咨询与发布、语音应答、手机语音服务、主持文稿校对、残疾人辅助等许多方面得到广泛应用。可懂度和自然度是衡量语音合成质量的主要指标,合...
8.[学位]
摘要: 随着互联网的普及,信息系统与它们所支持的运作流程越来越紧密的结合在一起,越来越多的公司和组织使用流程模型进行流程的结构化和文档化。因为流程模型拥有复杂的语义、...
9.[学位]
摘要: 语音作为人类交流的重要方式之一,越来越多地被深入探究和扩展,而对人类发声原理的研究是促使语音技术进一步发展的基础,此研究广泛应用于语音识别、语音合成和相关医学...
10.[学位]
摘要: 正弦模型广泛应用于语音信号等的分析与合成中,本文对基于正弦模型的音乐合成进行了深入的研究。谱峰值法作为正弦模型参数提取的传统方法,虽然有一定的理论基础,但是传...
11.[学位]
摘要: 随着智能设备的普及,人们对语音合成系统提出了更高的要求,方言使人感到亲切,有助于拉近人机关系,同时国家也在大力提倡保护方言这一非物质文化遗产,因此研究闽南方言...
12.[学位]
摘要: 基于计算机视觉的手语识别技术和语音合成技术是人机交互领域中的重要研究内容,有着广泛的应用,已成为目前的两大研究热点。但是,现有的研究大都只是分别独立地针对手语...
13.[学位]
摘要: 语音合成技术应用于嵌入式设备更方便于人在日常生活中的做事效率,如基于语音处理的智能家电等。由于嵌入式设备内存空间和处理器速度的限制,较复杂的语音合成算法应用到...
14.[学位]
摘要: 在语音合成的研究中,基于HMM的统计参数语音合成近些年在汉语等成熟语种中的广泛应用的同时,也逐渐开始应用在藏语等少数民族语言在内的语言学的研究中,文本分析对合...