首页> 外文会议>情報処理学会;情報処理学会全国大会 >二値判別器の性能に着目したECOC法による多値文書分類における符号語構成に関する一考察
【24h】

二値判別器の性能に着目したECOC法による多値文書分類における符号語構成に関する一考察

机译:基于二元鉴别器性能的ECOC多值文档分类中的码字组合研究

获取原文

摘要

近年,World Wide Web,電子メール,電子図書館など,膨大なオンラインテキストが扱われるようになった.このような電子媒体のテキストデータを自動処理する技術の重要性は高まり,中でも高精度な文書自動分類技術が必要とされている.文書の自動分類技術には様々な手法が提案されているが,特にカーネル法を用いた手法が高性能であると報告されている[1].その代表的な手法として,Support VectorMachine (SVM)[2] があげられ,優れた二値判別器として知られている.しかし,文書分類などは複数のカテゴリを持つことも多く,一般には多値分類問題として定式化される.多値分類問題を多値分類器を用いて直接解決する方法もあるが,学習計算量はカテゴリ数M に対して,O(M2) と膨大になる[3].一方で,二値判別器を複数組み合わせて多値分類を実現可能であることが知られており,従来から多値分類問題を二値判別器の集合の構成に落とし込むアプローチが研究されている.その中の方法のひとつとして,符号理論の枠組みを導入したECOC(Error Correcting Output Codes)復号法に基づく多値分類法がある[4],[5].この方法は二値判別器によって学習計算量を調整可能であり,最大の計算量はO(2M) であるが,最小ではO(M) となる.このことから,ECOC 法を用いてなるべく分類精度を高めつつ,計算量を抑えるような二値判別器の構成法が多値分類問題を解決する上で注目されている.
机译:近年来,万维网,电子邮件,电子图书馆等。 一个巨大的在线文本得到了处理。这条路 自动处理电子媒体文本数据的重要技术 性行为高,需要高精度的文件自动分类技术。 ing。已提出各种方法,用于文档自动分类技术 但是,据报道,使用内核方法的方法高度高 [1]。作为代表方法,支持向量 给出了机器(SVM)[2]并知道作为优秀的二进制鉴别器 它是。但是,文件分类等有多个类别 许多事情通常被制定为多级分类问题。许多 还可以使用多级分类器直接解决值分类问题的方法 但是,学习的数量是类别的数量,O(M2)和巨大 成为。[3]。另一方面,组合了二元鉴别器的多种组合 众所周知,可以实现这种种类,以及传统上的多价分类 问题堆叠成一组二进制鉴别器的配置的方法 它已经研究过。作为其中的方法之一,代码理论框架 ECOC(纠错输出代码) 基于解码方法[4],[5]存在多级分类方法。该方法是二进制确定 可以通过单独的设备调整学习计算量,并且最大的计算量是 o(2米),但在最小O(m)中。由此, 计算量,同时使用ECOC方法尽可能多地分类精度 抑制二元鉴别器的方法解决了多级分类问题 它正在引起关注。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号