首页> 外文期刊>電子情報通信学会技術研究報告. オフィスインフォメ-ションシステム >文書分頬における決定木アルゴリズム適用法の検討
【24h】

文書分頬における決定木アルゴリズム適用法の検討

机译:决策树算法在文件分割脸颊中的应用方法研究

获取原文
获取原文并翻译 | 示例
       

摘要

本稿では,決定木を用いた文書分類方法を提案し,その評価を行う.決定木の作成にはC4.5アルゴリズムを用いたが,語彙不足,構造の問題があり,分類性能はベクトル空間法を用いた辞書分類に劣る結果となった.集合分割に用いる閥値の変更,複数の決定木の組合せ,2つの名詞をテストに用いた決定木の作成など,C4.5の改良を行った。 評価結果は辞書分類に及ばないものの,1つの名詞で高確率で分野を特定できるリーフや,テスト名詞が存在しないことで分野を絞り込むフィルターの役割を果たすテスト名詞の存在が明らかとなってきた.部分的に高い分類性能を示すリーフのみを用いることで,情報の抽出など有効な利用方法が期待される.
机译:在本文中,我们提出了一种使用决策树的文档分类方法并对其进行评估。 C4.5算法用于创建决策树,但是由于缺乏词汇和结构问题,因此分类性能不如使用向量空间法的字典分类。对C4.5进行了改进,例如更改用于集划分的条值,组合多个决策树以及使用两个命名法创建测试树以进行测试。尽管评估结果不如字典分类那么好,但很明显,有一片叶子可以在一个正午时以高概率识别该字段,并且由于缺少测试鼻子,测试术语可以充当筛选条件以缩小字段范围。通过仅使用部分表现出较高分类性能的叶子,可以期待有效的使用方法,例如信息提取。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号