首页> 外文会议>情報処理学会;情報処理学会全国大会 >野鳥の鳴き声識別における特徴量類似性と認識精度に関する検討
【24h】

野鳥の鳴き声識別における特徴量類似性と認識精度に関する検討

机译:检查野鸟吠叫中的特征相似性和识别准确性

获取原文

摘要

機械学習における教師あり学習では人手によるラベル付きデータを多数学習に用いるほど識別率が高くなることが知られている。しかし、ラベル付きデータは専門家の知識や人の手間などがかかり、高コストである。このコストを削減し、識別器の性能を向上させることは機械学習において重大な課題の一つである。ラベル付きデータが高コストである一方で、ラベルなしデータの場合は低コストで大量に獲得できる場合が多い。たとえば鳥の鳴き声の音声データであれば、森の中に録音機を設置するだけで容易に獲得できる。そこで本研究では特徴ベクトル間の類似性に着目し、少数のラベル付きデータから多数のラベルなしデータのクラスを特徴ベクトル間距離によって決定して訓練データとして用いる手法を検討する。特徴量間の距離尺度についてバタチャリヤ距離の平方根など多くの距離が提案されているが、本研究では最も広く使われており、直感的に理解がしやすいユークリッド距離を距離尺度として用いる。ニュージランドに生息する野鳥の鳴き声のデータを例に、SVM において訓練データの数と識別率の推移の関係を検討するための実験を行った。
机译:机器学习中的监督学习是手动的 带标签的数据用于多次学习的次数越多,被识别的内容就越多 众所周知,该比率将会很高。但是啦 带有铃铛的数据包括专家知识和人为的努力 它花费很多并且昂贵。降低成本 而提高分类器的性能是机器学习 这是其中的重要问题之一。贴有标签 数据很昂贵,但没有标签 在数据的情况下,是否可以低成本大量获取 有许多。例如,鸟皮的语音数据 如果是这样,您可以轻松地在森林中安装记录器。 可以收购。因此,在这项研究中,特征向量之间 着眼于相似性,是少量标记数据吗? 具有大量未标记的数据类 由托之间的距离确定作为训练数据 考虑要使用的方法。用于要素之间的距离比例 许多距离,例如Batacharya距离的平方根 已经提出了分离方法,但是在这项研究中使用最广泛。 Yukuri易于直观理解 使用距离作为距离度量。新吉拉 以栖息在该土地上的野鸟吠叫的数据为例 支持向量机中训练数据数量与识别率过渡的关系 进行了实验以检查负责人。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号