语音信号处理属于《中国图书分类法》中的五级类目,该分类相关的期刊文献有8577篇,会议文献有2354篇,学位文献有7042篇等,语音信号处理的主要作者有赵力、鲍长春、张雪英,语音信号处理的主要机构有上海交通大学电子工程系、东南大学信息科学与工程学院、太原理工大学等。
统计的文献类型来源于 期刊论文、 学位论文、 会议论文
1.[期刊]
摘要: 级联卷积神经网络(CNN)结构和循环神经网络(RNN)结构的卷积循环神经网络(CRNN)及其改进是当前主流的声音事件检测模型。然而,以端到端方式训练的CRNN...
2.[期刊]
摘要: 文章以藏语安多方言中的元音为研究对象,采用实验语音学研究方法,从言语空气动力学的角度研究了藏语元音的发音机制,其中主要对藏语元音生理信号与其发音特征的关系、声...
3.[期刊]
摘要: 针对现有的语音合成系统Tacotron 2中存在的注意力模型学习慢、合成语音不够鲁棒以及合成语音速度较慢等问题,提出了三点改进措施:1.采用音素嵌入作为输入,...
4.[期刊]
摘要: 从语音识别系统前端信号处理出发研究了语音信号特征的提取方法。对4种语音识别主流算法模型进行部署,构建了不同车载应用场景,并选择字错误率和实时率两种主流评价指标...
5.[期刊]
摘要: 该文设计了基于高斯混合模型的说话人识别系统实验,通过录制小型语音库、提取表征说话人个性的特征参数、训练说话人模型和似然度判决,实现文本无关的说话人识别。实验以...
6.[期刊]
摘要: 文章重点研究覆盖全业务流程的自动拨测方法,替代人工拨测,实现对智能客服系统进行主动监控。传统手段以人工拨测的方式,存在费时费力,无法及时发现流程故障,业务流程...
7.[期刊]
摘要: 针对贵阳工厂环境下口头任务对接缺乏依据性、出现事故难于追责的问题,引入深度学习模型改善贵阳方言工厂指令识别效果。自制贵阳方言工厂指令数据集,搭建指令识别系统,...
8.[期刊]
摘要: 近年来,浙江卫视制作了多部环绕声大型音乐综艺节目,如《中国好声音》《天赐的声音》等。在终混时,如何与音乐混音师合作以制作高品质的环绕声音乐,是一个很大的难题。...
9.[期刊]
摘要: 医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值。汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步。神经机器翻译通常依赖...
10.[期刊]
摘要: 目前的语言在线测试系统大多采用B/C架构来进行构建,但当并发人数过多时,该系统的服务器端压力过大,导致负载能力较差。因此,文中提出一种基于在线交互学习的语言在...
11.[期刊]
摘要: 室内混响会严重降低语声质量,因此在室内语声通信中对混响的抑制显得尤为重要。针对无线声传感网,该文提出一种基于加权预测误差的分布式自适应去混响算法。通过调整传统...
12.[期刊]
摘要: 民族乐器是中国优秀传统音乐文化的瑰宝,人工智能与音乐乐器的结合是传承和弘扬传统文化的大势所趋。目前乐器检测研究大部分集中在西方乐器领域,而中国民族乐器的检测却...
13.[期刊]
摘要: 针对实时声源定位、超声无损检测等需求,设计了基于Zynq的高速声场信号采集与处理系统。该系统以Zynq-7000系列SoC为主控芯片,首先以其PL(可编程逻辑...
14.[期刊]
摘要: 为了准确地掌握管道线路的运行状态,保障油气管道的安全运行,在基于相位敏感光时域反射(Φ-OTDR)原理的光纤分布式振动系统的基础上,提出了一种泄漏声波信号监测...
15.[期刊]
摘要: 心音是诊断身体健康的重要生理信号,为有效降低心音信号的噪声,提出一种联合互补总体经验模态分解(CEEMD)及AFSA优化小波阈值去噪相结合的方法。即先将不同频...
16.[期刊]
摘要: 针对当前主流的中文拼写纠错模型对文本局部上下文特征学习不足的问题,该文提出基于局部语义特征增强的改进思路:在自注意力计算单元中添加高斯分布的偏置矩阵,改变注意...
17.[期刊]
摘要: 语音情感识别任务的训练数据和测试数据往往来源于不同的数据库,二者特征空间存在明显差异,导致识别率很低。针对该问题,本文提出新的构图方法表示源和目标数据库之间的...
18.[期刊]
摘要: 基于无监督预训练技术的wav2vec 2.0在许多低资源语种上获得了良好的性能,成为研究的热点。本文在预训练模型的基础上进行越南语连续语音识别。将语音学信息引...
19.[期刊]
摘要: 现今关于驾驶员路怒情绪识别方法中语音特性分析相对较少,该研究以路怒情绪为研究对象,利用模拟驾驶系统建立数据集,通过分析驾驶员语音的频谱特征,将时域中短时能量及...
20.[期刊]
摘要: 语音识别是实现人机交互的一种重要途径,是自然语言处理的基础环节,随着人工智能技术的发展,人机交互等大量应用场景存在着流式语音识别的需求。流式语音识别的定义是一...
1.[会议]
摘要: 随着科学技术的不断发展,物联网、大数据、云计算已成为目前电子科技发展的主流,智慧管家——物联网语音智能对话及语音操控系统选取机智云,实现语音识别和语音合成百度...
2.[会议]
摘要: 近些年,在物联网领域,伴随看多元化智能硬件的出现,触控式人机交互逐渐被语音人机交互取代已成为趋势.通过声纹生物信息ID解决人作为自然个体而非数字ID的唯一登录...
3.[会议]
摘要: 随着4G网络不断成熟,语音业务(VoLTE)的承载也已经成为主流趋势.结合上海实际无线环境,4G覆盖暂未形成连续覆盖,为保证VoLTE通话时在LTE覆盖不全区...
4.[会议]
摘要: 人机交互中最自然、最理想的交流方式为语音,其中主要涉及到了语音合成,即文本转换为语音的技术.随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人...
5.[会议]
摘要: 随着自动大规模语音识别的不断发展,以自动语音识别为基础的计算机辅助发音教学也随之进步,作为传统教学方法的补充,它极大地弥补了传统教育资源不足以及传统教育方法无...
6.[会议]
摘要: 本文针对非任务导向型对话的回复质量构建了一个大规模的人工标注中文数据集,该数据集包含了从社交媒体收集到的超过2万7千个对话问题以及超过8万2千个对话问题的回复...
7.[会议]
摘要: 端到端(end-to-end)模型因其能有效避免传统的管道式设计存在的错误传递和累积问题,成为了近年来口语对话系统(spoken dialogue syste...
8.[会议]
摘要: 基于互联网络和移动信息技术发展起来的人工智能语音技术不仅是传统计算机信息技术的重要延伸和拓展,更是世界各国未来科技领域具有重要战略价值的拓展领域.当前语音的采...
9.[会议]
摘要: 本文首先介绍了语音合成技术(TTS)的原理,然后探讨了基于自建语音库的基础如何开发光缆包装语音辅助检验系统.
10.[会议]
摘要: 语音识别已经在服务、医疗、家电等行业中得到广泛的应用.智能设备中,语音交互系统的能耗较高,往往处于关闭状态.而唤醒词识别功能能耗相对较低,可以在后台保持开启状...
11.[会议]
摘要: 次声事件检测应用领域广泛,在MUSIC算法的基础上,提出利用分段递进方法和MDL准则来确定事件发生的时间及数量;同时,为了提升MUSIC算法的检测效率,提出了...
12.[会议]
摘要: 次声监测技术是监测大气层和浅地表核试验的有效手段,根据不同次声源的声源特性寻找有效的特征提取方法以实现可靠的分类判别,成为禁核试次声监测中的关键问题.基于次声...
13.[会议]
摘要: 环境声音分类(ESC)是音频处理领域中的重要分支之一,在未来多媒体应用中有重要的作用。音频识别是提取音频中特定的声学特性,将音频分类至样本对应的正确场景,有助...
14.[会议]
摘要: 为了提高嵌入式英语语音识别系统发音误差自动检测能力,提出基于时频分析和关联信息熵特征提取的嵌入式英语语音识别系统发音误差自动检测方法.采用时频特征分解方法进行...
15.[会议]
摘要: 传统英语语音合理性自动化识别模型无法准确有效反映英语语音合理性,结果准确性较低.为此有必要对英语语音合理性自动化识别模型进行研究.规划英语语音合理性自动化识别...
16.[会议]
摘要: 利用传统方法对多媒体网络语音音调数据特征进行识别,存在识别准确性低,识别速度慢的问题.针对上述问题,提出一种新的多媒体网络语音音调数据特征智能识别方法.该方法...
17.[会议]
摘要: 在现在发达的数字语音通信业务中,语音信号处理技术发挥着越来越重要的作用.自适应噪声抑制是指从带噪音信号中提取尽可能纯净的原始语音.本文在经典的谱减法的基础上做...
18.[会议]
摘要: 针对目前声纹识别中常用的模式识别算法(LPCC、MFCC等)的不足,为了提高声纹识别系统性能,本研究提出将小波分析和BP神经网络—小生境遗传优化算法(BP-G...
19.[会议]
摘要: 本系统的硬件部分采用STM32F407作为主控芯片,以MAX9817为核心构建信号调理电路,系统软件部分的核心采用了GCC-PHAT算法进行声源入射角的估计....
20.[会议]
摘要: 运营商的语音呼叫中心作为客户服务的语音门户,承载着巨大的压力,呼叫中心工作人员服务过程中需要通过烦琐的操作来满足客户的咨询和记录客户来访目的,如何简化服务操作...
1.[学位]
摘要: 随着时代的发展,对人类情绪的识别已成为一个非常热门的研究领域。常见的有基于面部表情、文本内容、生理信号以及人类语音等方面的情绪识别方式。其中,作为日常生活中最...
2.[学位]
摘要: 随着时代的发展,对人类情绪的识别已成为一个非常热门的研究领域。常见的有基于面部表情、文本内容、生理信号以及人类语音等方面的情绪识别方式。其中,作为日常生活中最...
3.[学位]
摘要: 随着时代的发展,对人类情绪的识别已成为一个非常热门的研究领域。常见的有基于面部表情、文本内容、生理信号以及人类语音等方面的情绪识别方式。其中,作为日常生活中最...
4.[学位]
摘要: 随着数字多媒体技术的快速发展,语音信号凭借自身占用空间小、易于编辑和传输等优点成为人们日常生活沟通的一种重要方式。由于语音具有易编辑特性,这导致语音很容易被篡...
5.[学位]
摘要: 语音合成技术的迅猛发展对自动说话人验证系统构成了威胁。为了提高自动说话人验证系统的安全性,我们需要研究如何鉴别自然语音和合成语音。本文在分析现有合成语音检测技...
6.[学位]
摘要: 随着生物识别技术的发展和人们对生活品质追求的提高,声纹识别技术逐渐应用在生活的方方面面,例如人工智能中声纹识别的应用,另外,在新冠疫情全球蔓延的今天,声纹识别...
7.[学位]
摘要: 经历了多年的发展,深度神经网络针对不同的任务需求演化出多种独特的结构。卷积神经网络(CNN)由于在计算机视觉、语音识别和自然语言处理等领域的出色表现引起了研究...
8.[学位]
摘要: 语音增强技术在传统通信领域中,可用于增强语音信息的正确性,在新型智能电子设备中,可作为语音识别的前端处理技术,用于增强噪声环境中的语音识别功能。现有的语音增强...
9.[学位]
摘要: 方言是一种特殊的语言变体,具有珍贵的史学及语言学研究价值。汉语方言作为中华民族优秀的非物质文化遗产,不应该随着普通话的日益普及而消失。汉语方言种类识别是推进汉...
10.[学位]
摘要: 自动说话人确认技术(Automatic speaker verification,ASV)是生物识别技术的一种,通过说话人的语音信号自动确定该说话人的身份。在...
11.[学位]
摘要: 基于传声器阵列的波束形成声源识别技术以其便捷高效、识别范围广、对中高频定位精准、可进行中远距离测量等优点而广泛应用于汽车、航空航天、高速列车等领域。随着实际应...
12.[学位]
摘要: 近场声全息是一种十分有效的噪声源定位及声场可视化技术。等效源近场声全息因不受限于声源形状且数学模型的建立及其传递矩阵的构造简单,近年来得到了广泛的应用。由于倏...
13.[学位]
摘要: 基于麦克风阵列的波束成形是一种通过声学图像以进行声源定位可视化的流行技术。该技术可在频域和时域执行,但对于宽带声源,时域技术较频域技术具有计算效率优势。其中,...
14.[学位]
摘要: 城市声音监控作为视频监控的补充,可以弥补视频监控受天气、遮挡物等影响的不足。对城市声音的有效监控可提高人们的声学舒适度,对城市中各类场所进行安全预警,同时可为...
15.[学位]
摘要: 声音污染不仅让人心烦、睡眠不好,甚至还会引发心脏疾病。基于声学参量阵的声频定向系统能够像激光一样让声波具有方向性,将需要传播的声音信号与超声载波信号进行调制,...
16.[学位]
摘要: 基于逆Patch传递函数(Inverse Patch Transfer Function,iPTF)的声源识别法是近年来提出的一种近场声全息技术,可在嘈杂环境...