首页> 外文期刊>Neurocomputing >Boosting Naive Bayes text classification using uncertainty-based selective sampling
【24h】

Boosting Naive Bayes text classification using uncertainty-based selective sampling

机译:使用基于不确定性的选择性采样提高朴素贝叶斯文本分类

获取原文
获取原文并翻译 | 示例
       

摘要

This paper presents adaptive boosting with uncertainty-based selective sampling (AdaBUS), a variant of the AdaBoost algorithm for boosting the Naive Bayes (NB) text classification. Although the boosting technique has been shown to effectively improve the accuracy of machine-learning-based classifiers, boosting does not work well with NB text classification owing to the low variance in the accuracy of its base classifier. In this study, we propose boosting the NB text classifier by combining the AdaBoost boosting algorithm with uncertainty-based selective sampling. Experiments using the popular Reuters-21578 document collection showed that the proposed algorithm effectively improves classification accuracy.
机译:本文介绍了基于不确定性的选择性采样(AdaBUS)的自适应增强,这是AdaBoost算法的一种变体,用于增强朴素贝叶斯(NB)文本分类。尽管已经证明了Boosting技术可以有效地提高基于机器学习的分类器的准确性,但是由于NB文本分类器的基本分类器准确性低,Boosting不能很好地与NB文本分类一起使用。在这项研究中,我们建议通过将AdaBoost增强算法与基于不确定性的选择性采样相结合来增强NB文本分类器。使用流行的Reuters-21578文档集进行的实验表明,该算法有效地提高了分类准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号