首页> 外文会议>International Conference on Universal Digital Library >Text Categorization with a Robust Minimax Approach
【24h】

Text Categorization with a Robust Minimax Approach

机译:具有强大的Minimax方法的文本分类

获取原文

摘要

This paper explores the use of a new Robust Minimax machine for automated categorization of texts. This Minimax machine minimizes the worst-case (maximum) probability of misclassification of future data points. An important feature of this method considers data in a global fashion, while SVM ignores this kind of global information. We use feature selection based on information gain and other methods to reduce the feature space and improve performance. In this paper, a heuristic one-against-rest strategies for multiclass categorization problem has been proposed by using probability output of the machine and we analyze the particular properties of learning with text data and identify why this approach that use global information is appropriate for this task. Empirical results show that our approach is competitive with the other methods: generally yield high prediction accuracy.
机译:本文探讨了使用新的强大Minimax机器进行自动分类文本。此最低机器最小化未来数据点错误分类的最坏情况(最大)的概率。此方法的一个重要特征以全局方式考虑数据,而SVM则忽略这种全局信息。我们根据信息增益和其他方法使用特征选择来减少特征空间并提高性能。在本文中,已经通过使用机器的概率输出来提出了一种对多种多组分类问题的启发式一反对休息策略,并通过文本数据分析了学习的特定属性,并确定了使用全局信息的原因适用于此方法任务。经验结果表明,我们的方法与其他方法具有竞争力:通常会产生高预测精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号