マルチカーネル学習を用いた話者認識における最適化の検討

小川　哲司; 日野　英逸; レイハニ　ニマ; 村田　昇; 小林　哲則

首页> 外文期刊>電子情報通信学会技術研究報告 >マルチカーネル学習を用いた話者認識における最適化の検討

【24h】

マルチカーネル学習を用いた話者認識における最適化の検討

机译：基于多核学习的说话人识别优化研究

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では，マルチカーネル学習を話者認識システムに適用した場合における，最適化アルゴリズムと認識性能の関係について調査を行った．話者認識システムにカーネル法を適用する場合，与えられたデータに対して適切なカーネル関数やパラメータを決定する必要がある．マルチカーネル学習は，複数のカーネル関数を凸結合することで，カーネル関数やパラメータを厳密に決定する必要性を減じることができる．本稿では，このマルチカーネル学習で用いる最適化基準および最適化アルゴリズムに焦点を当て，条件付きエントロピー最小化に基づくアルゴリズムと従来多く用いられているマージン最大化に基づくアルゴリズムを話者認識において比較した．その結果，条件付きエントロピー最小化に基づくシステムは，マージン最大化に基づくシステムの誤りを削減することがわかった．%We investigated the relation between the optimization algorithm for multiple kernel learning (MKL) and the speaker recognition performance. Most of the kernel methods applied to speaker recognition systems require a suitable kernel function and its parameters to be determined for a given data set. In contrast, MKL eliminates the need for strict determination of the kernel function and parameters by using a convex combination of element kernels. In the present paper, we focused on the optimization criterion and algorithm applied to MKL. We compared an MKL algorithm based on conditional entoropy minimization (MCEM) with a conventional maximum-margin-based MKL algorithm in terms of speaker recognition accuracy; the MCEM-based system reduced the speaker error rate as compared to the maximum-margin-based system.

机译：在本文中，我们研究了将多核学习应用于说话人识别系统时，优化算法与识别性能之间的关系。将核方法应用于说话人识别系统时，有必要确定给定数据的适当核函数和参数。多内核学习可以通过凸连接多个内核函数来减少严格确定内核函数和参数的需求。在本文中，我们重点研究了用于多核学习的优化准则和优化算法，并将基于条件熵最小化的算法与基于边缘最大化的传统算法在说话人识别中进行了比较。结果，发现基于条件熵最小化的系统减小了基于裕度最大化的系统的误差。我们研究了多核学习优化算法（MKL）与说话人识别性能之间的关系。应用于说话人识别系统的大多数核方法都需要合适的核函数及其参数才能确定给定的数据集。本文将重点放在应用于MKL的优化准则和算法上，比较了基于条件包体的MKL算法。使用传统的基于最大边距的MKL算法在说话人识别准确性方面实现最小化（MCEM）；与基于最大边距的系统相比，基于MCEM的系统降低了说话人错误率。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第357期|p.153-158|共6页
作者
小川　哲司; 日野　英逸; レイハニ　ニマ; 村田　昇; 小林　哲則;
展开▼
作者单位

早稲田大学高等研究所;

早稲田大学先進理工学部　電気・情報生命工学科;

Information and Computer Science Lab．;

Aalto University;

早稲田大学先進理工学部　電気・情報生命工学科;

早稲田大学基幹理工学部情報理工学科;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
入库时间 2022-08-18 00:34:33

相似文献

外文文献
中文文献
专利

1. マルチカーネル学習を用いた話者認識における最適化の検討 [J] . 小川哲司, 日野英逸, レイハニニマ, 電子情報通信学会技術研究報告. 音声. Speech . 2010,第357期

机译：使用多核学习对说话人识别进行优化检查
2. マルチカーネル学習を用いた話者認識における最適化の検討 [J] . 小川哲司, 日野英逸, レイハニニマ, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2010,第356期

机译：使用多核学习对说话人识别进行优化检查
3. マルチカーネル学習を用いた話者認識における最適化の検討 [J] . 小川　哲司, 日野　英逸, レイハニ　ニマ, 電子情報通信学会技術研究報告 . 2010,第356期

机译：基于多核学习的说话人识别优化研究
4. データセンタにおける最適マネジメントに関する研究その５空調停止後のサーバルームにおける温度変化に関するDCIM と機械学習を用いた予測モデルの検証 [C] . 笹倉康佑, 青木健, 渡邊剛, 日本建築学会;日本建築学会大会 . 2019

机译：数据中心优化管理研究第5部分：使用DCIM和机器学习对停止空调后服务器机房中温度变化的预测模型进行验证
5. モデルベース深層強化学習におけるタスク依存の中間表現を用いた環境遷移モデルの学習利用統計を見る [D] . 水谷陽太 2019

机译：在基于模型的深度强化学习中查看使用任务相关中间表示的环境过渡模型的学习使用情况统计信息
6. 複数チャネルを用いた無線マルチホップネットワークにおけるTCP通信高速化のためのチャネル割当方式の研究 [O] . 横濱智史 2016

机译：多信道无线多跳网络中加速TCP通信的信道分配方法研究

マルチカーネル学習を用いた話者認識における最適化の検討

摘要

著录项

相似文献

相关主题

期刊订阅