面向语料采集系统的非并发说话人分离技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

人工智能技术发展到今天，数据资源成为了各大研究机构在人工智能领域能否取得领先地位的关键。研究如何从互联网上海量数据资源中获取感兴趣的音频数据，已成为很多大学和研究机构的研究热点之一。现有的一些开源语料采集系统大多基于分布式爬虫结构，在爬取网页中非并发的说话人音频资源时，缺乏一个有效的按性别区分的说话人分离方案，而不经分离处理的语料资源实际应用价值损失很大。针对上述问题，本学位论文依托实习单位“语音叫车”项目，利用互联网中非并发的说话人音频资源，研究了一种基于性别的说话人分离方法。在基于Hadoop的语料采集系统中，上述方法是说话人分离子系统的核心。采集系统中由爬虫网络爬取的非并发说话人音频数据，经过说话人分离子系统处理，输出两类带性别标记的语料。本文所研说话人分离方法包含了两个关键步骤:基于贝叶斯信息准则与通用背景模型(BIC-UBM)混合方法的说话人分割以及基于深度神经网络（DNN）的说话人性别识别。基于BIC-UBM的说话人分割以找出音频中说话人性别发生转换的位置为目的，并按照这种说话人转折点对音频进行分割，是一种先进行说话人转折点检测再进行转折点真伪鉴别的二步判决方法;基于DNN的性别识别网络对分割得到的语音片段进行性别识别，根据识别结果输出两类语音信号。本文以实习单位提供的客服通话语音作为实验语料库，实验结果表明，本文所研说话人分割方法对包含多个说话人转折点的语音分割准确度达到了94.2％，转折点检测的漏警率为5.8％、虚警率为15.5％。基于DNN的说话人性别识别方法对语音片段的性别识别准确度最高可达96％，其中男性样本识别查全率为94％，女性样本识别查全率为98％。本文所研基于性别的说话人分离方法满足了相关语料采集系统的要求，为“语音叫车”项目后续的模型训练工作提供了良好的语料基础。

著录项

作者
何云亚;
展开▼
作者单位

南京理工大学;

展开▼
授予单位南京理工大学;
学科电子与通信工程
授予学位硕士
导师姓名赵兆,苏丹;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类
关键词
语料; 采集系统; 说话人;

相似文献

中文文献
外文文献
专利

1. 基于 BIC 和 G＿PLDA 的说话人分离技术研究 [J] . 李锐 ,卓著 ,李辉 . 中国科学技术大学学报 . 2015,第004期
2. 智能麦克风阵列语音分离和说话人跟踪技术研究 [J] . 杜江 ,朱柯 . 电子学报 . 2005,第002期
3. 面向航天器多学科参数采集处理的IDS系统插件技术研究 [J] . 魏平 ,王璐 ,赵寒 . 航天制造技术 . 2016,第002期
4. 面向数字化制造系统信息采集的刀具标识技术研究 [J] . 殷锐 ,何卫平 ,侯伟 . 机床与液压 . 2007,第002期
5. 通过分离语音空间和说话人空间的说话人识别 [J] . 邱政权 ,尹俊勋 . 计算机工程与应用 . 2008,第012期
6. 非限定语音说话人识别的方法及其实时系统的实现 [C] . 俞振利 . 1989年中国电子学会第六届学术年会 . 1989
7. 面向嵌入式系统的文本无关说话人识别技术研究 [A] . 魏琴 . 2012

面向语料采集系统的非并发说话人分离技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅