...
【24h】

半構造化テキストの分類のためのブースティングアルゴリズム

机译:用于半结构化文本分类的Boosting算法

获取原文
获取原文并翻译 | 示例
           

摘要

近年,テキスト分類は,単純なトピック分類から,文のモダリテイ,意見性,主観性といった書き手の意図に基づく分類へと,その夕スクの多様化が進んでいる。 それに伴い,単語の集合(bag-of-words) を素性とする古典的手法では十分な精度を得にくくなっている。 精度向上には,テキストの構造(構文/レイアウト)を考慮する必要があるが,恣意的に選択された部分構造のみを用いた手法が多い。 本稿では,構造を考慮したテキスト分類(半構造化テキスト分類)に向け,部分木を素性とするdecision stumpsと,それを弱学習器とするBoostingアルゴリズムを提案する。 また,Tree Kernelを用いたSVMとの関連性,及び本手法の利点について言及する。 実デー夕を用いた実験により,提案手法の有効性を検証する。
机译:近年来,文本分类已经从简单的主题分类扩展到基于作者意图的分类,例如句子模态,观点和主观性。结果,使用以词袋为基础的经典方法难以获得足够的精度。为了提高准确性,有必要考虑文本的结构(语法/布局),但是有许多方法仅使用任意选择的子结构。在本文中,我们提出了一个决策树,该决策树使用子树作为基础,并提出了一种Boosting算法,该算法将树用作考虑结构的文本分类(半结构文本分类)的弱学习者。它还提到了使用树内核与SVM的关系以及该方法的优点。该方法的有效性将通过使用实际白天和晚上的实验来验证。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号