首页> 中国专利> 基于特征二维信息增益加权的朴素贝叶斯文本分类方法

基于特征二维信息增益加权的朴素贝叶斯文本分类方法

摘要

本发明提供基于特征二维信息增益加权的朴素贝叶斯文本分类方法。所述方法获取文档的特征词,根据不同的特征词出现的类别数和文档数,得到相应的特征类别概率和特征文档概率,进而得到特征的二维信息增益;由于信息增益具有反应特征对分类效果提升大小的作用,信息增益越大说明该特征越能表达该类的信息,把特征的二维信息相结合,提高了朴素贝叶斯文本分类器的性能;并且与TFIDF加权朴素贝叶斯文本分类算法、TFIDF*IGC文本分类算法相比,基于特征二维信息增益加权的朴素贝叶斯文本分类方法具有更好的鲁棒性,使其对所有类别的分类效果都能保持很好;在同等条件下,本发明的分类性能要优于传统改进的朴素贝叶斯文本分类方法。

著录项

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号