对话语音中的目标说话人检测和定位

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文主要研究在对话语音中检测目标说话人，并定位目标说话人语音的问题。目标说话人检测，是指在一段多个人连续说话的对话语音中判断目标说话人是否出现；目标说话人定位，是指在目标说话人检测的基础上，当检测到目标说话人在对话语音中出现时，对目标说话人在对话语音中出现的具体的时间段进行估计。本文的研究基于事先已经知道目标说话人这样一个前提。　　目前，对话语音中的目标说话人检测和定位问题，主要是采用以下方法来解决。首先，检测出对话语音中的说话人跳变点，将不同说话人的语音分割开来；然后，对分割后的语音段进行说话人聚类处理；最后，使用单个说话人识别技术在对话语音中识别出目标说话人的语音，从而达到在对话语音中检测和定位目标说话人的目的。我们将这种基于说话人的语音分割、聚类以及说话人识别的方法称为硬分割。本文在研究和总结前人成果的基础上，针对硬分割的缺陷，结合实际情况，提出了单帧对数似然比算法。相对于硬分割，本文将这种基于单帧对数似然比算法进行对话语音中的目标说话人检测和定位的方法称为软分割。　　与硬分割相比，软分割主要有以下几个优点：第一，充分利用了已知目标说话人这个先验知识，将目标说话人检测问题作为解决目标说话人定位问题的前提和基础，只有在对话语音中检测到目标说话人的情况下才进行目标说话人定位。因此，软分割方法更为简洁、高效。第二，在参与对话的说话人个数未知的情况下，由于不需要对对话语音进行基于说话人跳变点的细致分割，因此在这种情况下软分割仍然适用；而硬分割在这种情况下因无法进行准确的说话人聚类而不再适用。　　实验表明，从总体上来说，软分割的性能要好于硬分割。而且，软分割的实用性、实时性以及鲁棒性均要好于硬分割。

著录项

作者
吕兰兰;
展开▼
作者单位

中山大学;

展开▼
授予单位中山大学;
学科计算机软件与理论
授予学位硕士
导师姓名欧贵文;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
说话人检测; 说话人定位; 多个说话人; 高斯混合模型;

相似文献

中文文献
外文文献
专利

1. 对话语音中实时说话人检测的研究 [J] . 刘大鹏 ,朱庆生 . 小型微型计算机系统 . 2008,第002期
2. 多说话人环境下目标说话人语音提取方案 [J] . 叶于林 ,莫建华 ,刘夏 . 计算机系统应用 . 2016,第004期
3. 基于对话语音的与文本无关的说话人确认系统的研究 [J] . 陈雁翔 ,戴蓓倩 ,周曦 . 中文信息学报 . 2004,第002期
4. 说话人日志中可靠静音模型语音活动检测方法 [J] . 杨登舟 ,徐嘉明 ,刘加 . 浙江大学学报（工学版） . 2016,第001期
5. 基于小波包变换的说话人语音特征参数及其在说话识别中的应用 [J] . 屈百达 ,蒋纯纲 ,王月 . 中国新通信 . 2008,第001期
6. 基于说话人的对话语音分割 [C] . 邓英 . 中国声学学会2005年青年学术会议CYCA'05 . 2005
7. 数字串语音和对话电话语音的说话人确认的研究 [A] . 陈雁翔 . 2004

对话语音中的目标说话人检测和定位

目录

摘要

著录项

相似文献

相关主题

期刊订阅