首页> 外文期刊>電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems >文脈木重み付け法を用いた半教師付き学習による文書分類
【24h】

文脈木重み付け法を用いた半教師付き学習による文書分類

机译:使用上下文树加权方法的半监督学习进行文档分类

获取原文
获取原文并翻译 | 示例
           

摘要

文書分類問題は,ベクトル空間モデルやサポートベクターマシンなど様々な手法により研究されてきた.一方,F.M.J.Willemsらにより提案された文脈木重み付け法(以下CTW法と略す)は非常に優れた圧縮性能を示す.このCTW法を自動分類へ応用する手法が提案されており,DNA解析などで大変良い性能を示すことが知られている.本研究では学習データ数が十分でない場合を想定し,CTW法を用いた文書分類に対して,カテゴリが未知のデータを用いた半教師付き学習を行う手法を提案する.また新聞データを用いた計算機実験を行い,正分類率によりその有効性を示す.
机译:已经通过各种方法研究了文档分类问题,例如向量空间模型和支持向量机。另一方面,F.M.J.Willems等人提出的上下文树加权方法(以下简称为CTW方法)显示出极好的压缩性能。已经提出了将该CTW方法应用于自动分类的方法,并且已知其在DNA分析等中表现出非常好的性能。在这项研究中,假设训练数据的数量不足,我们提出了一种使用未知类别的数据进行半监督学习的方法,用于使用CTW方法进行文档分类。我们还使用报纸数据进行了计算机实验,并以积极的分类率证明了其有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号