マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション

奥貴裕; 佐藤庄衛; 小林彰夫; 本間真一; 今井亨

首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション

【24h】

マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション

机译：基于多音类贝叶斯信息量标准的在线说话者拨号

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本論文では,対談音声認識のための,音素情報を利用したベイズ情報量基準に基づくオンライン話者ダイアライゼーション手法について述べる.従来のオンライン話者ダイアライゼーションは,対談音声から切り出される一つの音声区間内に多く発生する話者交替点を想定していないものや,話者判定結果をリアルタイム音声認識の話者適応に利用するには,話者判定の遅れ時間が大きく不向きなものが多い.提案手法では,ベイズ情報量基準により,複数話者が連続して発話する音声区間内の話者交替点を逐次検出しながら,オンライン性を考慮した判定手法で話者ダイアライゼーションを行う.また,音素認識から得られる音素情報に基づいて特徴量を分類した,「マルチ音素クラス」モデルを用いることで,特に短い遅れ時間での話者ダイアライゼーション精度の向上を図る.報道系情報番組の対談部分を対象とした話者ダイアライゼーション実験を行った結果,遅れ時間2秒の話者判定において,提案手法により,従来の単一音素クラスの全音素モデルに比べて話者ダイアライゼーション誤りが20.0%削減することを確認した.話者判定結果を利用した音声認識のオンライン話者適応実験では,話者交替点前後の発話に関して7.8%の単語誤り削減率を得た.

机译：在本文中，我们描述了一种基于贝叶斯信息量标准的，使用语音信息进行对话语音识别的在线说话者拨号方法，传统的在线说话者拨号方法是在从对话语音中切出的一个语音区域内。在许多情况下，没有假定频繁发生的说话者改变点，并且为了将说话者判断结果用于实时语音识别的说话者自适应，说话者判断的延迟时间大并且不合适。然后，基于贝叶斯信息量标准，通过考虑在线性的判断方法，在依次检测多个讲话者连续讲话的语音区间中的讲话者交替点的同时，进行讲话者辩识，并进行语音识别。通过使用“多音素类别”模型，根据从中获得的语音信息对功能进行分类，我们旨在提高说话者透析的准确性，尤其是在较短的延迟时间内。说话者拨号实验的结果是，与传统的单电话类全音模型相比，通过本发明的方法在说话者判断中将说话者拨号错误减少了20.0％，延迟时间为2秒。在使用说话者判断结果进行语音识别的在线说话者适应实验中，在说话者交替点之前和之后，语音的单词错误减少率达到7.8％。

著录项

来源
《電子情報通信学会論文誌, D. 情報·システム》 |2012年第9期|共10页
作者
奥貴裕; 佐藤庄衛; 小林彰夫; 本間真一; 今井亨;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类通信;
关键词
話者ダイアライゼーション; 話者適応; 対談番組; オンライン; ベイズ情報量基準;

机译：说话人拨号;说话人适应;对话程序;在线;贝叶斯信息量标准;

相似文献

外文文献
中文文献
专利

1. マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション [J] . 奥　貴裕, 佐藤　庄衛, 小林　彰夫, 電子情報通信学会論文誌 . 2012,第9期

机译：基于贝叶斯信息准则的多音素在线说话人二分法
2. マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション [J] . 奥貴裕, 佐藤庄衛, 小林彰夫, 電子情報通信学会論文誌, D. 情報·システム . 2012,第9期

机译：基于多音类贝叶斯信息量标准的在线说话者拨号
3. マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション [J] . 奥貴裕, 佐藤庄衛, 小林彰夫, 電子情報通信学会論文誌, D. 情報·システム . 2012,第9期

机译：基于多音素级贝叶斯信息标准的在线扬声器用语
4. FTMP場の理論に基づくラスマルテンサイト組織のモデル化とクリープ損傷過程のマルチスケールシミュレーション: 第2報：シミュレーション結果と評価について [C] . 松原康高, 長谷部忠司第56回高温強度シンポジウム前刷集 . 2018

机译：基于FTMP场论和蠕变损伤过程多尺度模拟的板条马氏体结构建模：第二份报告：模拟结果与评估
5. エナンチオメリゼーションコンセプトに基づく高機能性シクロペンタノイドキラル素子の開発と活用(生理活性天然物の効率的エナンチオ制御合成への適用) [D] . 猪股浩平 1991

机译：开发和利用基于对映异构概念的高效功能环戊烷手性装置（应用于生物活性天然产物的有效对映体控制合成）
6. チイキデクラスセイシンショウガイシャニトッテデイケアワキュウケイキチノヨウナバショヒトトヒトガササエアウグループオトオシテノカンゴシノヤクワリダイ11カイオオサカシリツダイガクダイガクインカンゴガクケンキュウカコウエンシンポジウムココロノイリョウサイゼンセンコレカラノセイシンイリョウトカンゴショクノヤクワリ [O] . 桑田淳一 2016

机译：Chiiki Declass seisin shogaishani Totte日间护理Wa Kyu Kei Kita Yona Nasho sho Hito saga air Group Group角色

マルチ音素クラスのベイズ情報量基準に基づくオンライン話者ダイアライゼーション

摘要

著录项

相似文献

相关主题

期刊订阅