発話内分散に基づき動的に生成された話者空間による話者クラスタリング

石川　勇樹; 西田　昌史; 山本　誠一

首页> 外文期刊>電子情報通信学会技術研究報告 >発話内分散に基づき動的に生成された話者空間による話者クラスタリング

【24h】

発話内分散に基づき動的に生成された話者空間による話者クラスタリング

机译：基于话语内方差动态生成的基于说话人空间的说话人聚类

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Speech has two types of information, such as phoneme and speaker. If these information are separated, robust speaker clustering can be achieved. It is necessary to suppress the phonetic information for each utterance because variance of utterance duration is large in multi-party conversation. We propose a speaker clustering method using Gaussian mixture model in flexibly selected speaker subspace based on variance of intra-utterance. We carried out speaker clustering experiments compared with conventional methods based on Bayesian information criterion and Gaussian mixture model in an observation space. The experimental results showed that the proposed method can achieve higher clustering accuracy than conventional methods.%音声データには音韻性と話者性が含まれており，音韻性を抑制することでより頑健な話者クラスタリングが可能になると考えられる．また，多人数会話では発話の時間長のばらつきが大きいため，発話毎に音韻性を抑制する必要があると考えられる．そこで，本研究では主成分分析による空間分離手法を用いて発話ごとに音韻性と話者性の分離を行い，さらに，発話内分散に応じて最適な話者空間の次元数を設定することで，音韻性を抑制した話者空間を構築する手法を提案する．従来のBIC を用いた手法とGMM を用いたCLR による話者クラスタリング手法との比較実験を行った結果，提案手法が最も高いクラスタリング精度を実現した．

机译：语音具有音素和说话人这两种信息，如果将这些信息分开，则可以实现鲁棒的说话人聚类。由于多方通话中说话持续时间的差异较大，因此有必要抑制每种说话的语音信息。基于说话人内在差异，提出了一种基于高斯混合模型在说话人子空间中灵活选择的说话人聚类方法，并在观察空间中与基于贝叶斯信息准则和高斯混合模型的传统方法进行了说话人聚类实验。语音数据包含语音和说话者特征，并且抑制语音特征可以使说话者聚类更加可靠。。此外，在多人交谈中，由于发声时间变化很大，因此认为有必要抑制每种发声的语音特性。因此，在这项研究中，通过使用基于主成分分析的空间分离方法，针对每种话语分离了语音和说话者特征。我们提出了一种构建具有抑制音素的扬声器空间的方法。通过使用BIC的常规方法与使用GMM的CLR的说话人聚类方法进行比较实验的结果，提出的方法实现了最高的聚类精度。

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第365期|p.67-71|共5页
作者
石川　勇樹; 西田　昌史; 山本　誠一;
展开▼
作者单位

同志社大学大学院工学研究科　〒610-0321　京都府京田辺市多々羅都谷1-3;

同志社大学大学院工学研究科　〒610-0321　京都府京田辺市多々羅都谷1-3;

同志社大学大学院工学研究科　〒610-0321　京都府京田辺市多々羅都谷1-3;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
話者クラスタリング; 発話内分散; 話者空間; 混合ガウス分布; 主成分分析;

机译：说话人聚类;说话方差;说话人空间;高斯混合分布;主成分分析;

相似文献

外文文献
中文文献
专利

1. 発話内分散に基づき動的に生成された話者空間による話者クラスタリング [J] . 石川勇樹, 西田昌史, 山本誠一電子情報通信学会技術研究報告. 音声. Speech . 2011,第365期

机译：基于语音内分布通过动态生成的说话人空间进行说话人聚类
2. 発話内分散に基づき動的に生成された話者空間による話者クラスタリング [J] . 石川勇樹, 西田昌史, 山本誠一電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2011,第364期

机译：基于语音内分布通过动态生成的说话人空间进行说话人聚类
3. 発話内分散に基づき動的に生成された話者空間による話者クラスタリング [J] . 石川　勇樹, 西田　昌史, 山本　誠一電子情報通信学会技術研究報告 . 2011,第364期

机译：基于话语内方差动态生成的基于说话人空间的说话人聚类
4. ロジスティック回帰分析に基づく発話内容と発話場所との関係性の分析:建築・都市空間における人間行動の記号過程の解読とそのシミュレーション（その２） [C] . 鶴田爽, 木曽久美子, 門内輝行日本建築学会大会;日本建築学会 . 2013

机译：基于逻辑回归分析的话语内容与话语位置之间的关系分析：解码建筑和城市空间中人类行为的符号过程及其模拟（第二部分）
5. 表面分析における選択スパッタリングに関する基礎的研究-スパッタされた銅ニッケル合金表面のオージェ電子分光法による解析- [D] . 佐伯, 登 1980

机译：表面分析中选择性溅射的基础研究-溅射铜镍合金表面的俄歇电子能谱分析-
6. 外国の捜査官憲が裁判所発付の令状に基づいて実施した電話の傍受により得られた被告人と共犯者との通話の録音テープ等につき、我が国の憲法及び刑訴法の精神に照らして、事実認定の証拠として許容できない事情は窺われないとされた事例 [O] . 小川佳樹 2000

机译：根据日本宪法和刑法，发现了有关事实的证据，涉及被告和同伙之间的电话录音带，这些录音带是由外国调查员肯根据法院签发的手令截取电话而获得的。没有发现不可接受的情况作为证据的情况

発話内分散に基づき動的に生成された話者空間による話者クラスタリング

摘要

著录项

相似文献

相关主题

期刊订阅