首页> 外文会议>日本音響学会;日本音響学会秋季研究発表会 >音声における快-不快の程度推定のための学習データの検討
【24h】

音声における快-不快の程度推定のための学習データの検討

机译:语音愉悦度估计的学习数据研究

获取原文

摘要

音声情報処理の分野において,音声の感情認識は音声データベースを用いて行なわれる場合がほとんどである。一般的に,感情音声データベースには2 種類ある。1つは,発話に対する感情を「怒り」「喜び」といったカテゴリとしてラベル付けをするデータベースである。もう1 つは,発話に対して感情の強度がラベル付けされているデータベースである。自然発話に対して感情の強度がラベル付けされているデータベースでは,感情ラベルの数の分布は,感情の強度が中程度の発話が多くなる傾向がある。そのようなデータベースを用いて,データ数の偏りを考慮せずに感情推定の精度を評価した場合,一見すると良い結果が得られることがある。しかし実際は,発話数の多い,感情強度が中程度の発話のみを正しく推定し,それ以外の発話を正しく推定できていない可能性がある。つまり,全感情強度の平均的な推定精度だけでなく,感情強度ごとの推定精度の評価を行なう必要があると考える。
机译:在语音信息处理领域,语音情感识别主要使用语音数据库来执行。通常,有两种类型的情感语音数据库。第一个是将发话的情绪标记为“愤怒”和“欢乐”等类别的数据库。另一个是数据库,其中为说话强度标注了情绪强度。在其中将情绪强度标记为自然话语的数据库中,在具有中等情绪强度的话语中,情绪标签的数量分布趋于增加。当使用这样的数据库来评估情绪估计的准确性而不考虑数据数量的偏差时,乍看之下可以获得良好的结果。然而,实际上,有可能仅正确地估计具有大量话语和中等情绪强度的话语,而没有正确地估计其他话语。换句话说,不仅需要评估所有情绪强度的平均估计精度,而且需要评估每种情绪强度的估计精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号