首页> 中国专利> 基于终生学习的增量式朴素贝叶斯文本分类方法

基于终生学习的增量式朴素贝叶斯文本分类方法

摘要

本发明涉及一种基于终生学习的增量式朴素贝叶斯文本分类方法,该方法包括:获取初始文本;提取文本的特征词,保存文本集的特征词表以及文本数量;计算文本中各特征词的词频,将文本集分为训练集和验证集两个部分;通过朴素贝叶斯分类器训练上一步生成的训练集向量模型,得出朴素贝叶斯模型的先验概率和特征类条件概率并保存;如果有新文本,增量式训练新文本并更新朴素贝叶斯模型的先验概率和特征类条件概率,若没有,从验证集中选取测试语料,并根据朴素贝叶斯模型得到测试语料的预测文本类别,计算预测的准确率。本发明不仅能够增量式地利用过去任务中学习到的知识指导新任务的学习,而且具有新特征处理和领域自适应能力。

著录项

  • 公开/公告号CN108062331B

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 南京理工大学;

    申请/专利号CN201610983203.6

  • 发明设计人 夏睿;潘振春;

    申请日2016-11-08

  • 分类号G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人陈鹏;朱显国

  • 地址 210094 江苏省南京市孝陵卫200号

  • 入库时间 2022-08-23 11:31:45

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号