首页> 中文学位 >增量学习朴素贝叶斯中文分类系统的研究
【6h】

增量学习朴素贝叶斯中文分类系统的研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景及意义

1.2研究现状

1.3本文工作

1.4本文的组织结构

第二章文本自动分类技术概述

2.1文本自动分类技术

2.1.1文本自动分类的定义

2.1.2文本预处理

2.1.3文本表示

2.1.4特征加权算法

2.1.5部分文本分类方法

2.2贝叶斯分类方法

2.2.1贝叶斯理论

2.2.2贝叶斯分类方法

2.2.3朴素贝叶斯分类的缺陷

2.3增量学习朴素贝叶斯分类

2.3.1增量学习机制

2.3.2增量学习在分类中的应用

2.3.3增量学习贝叶斯分类分析

2.4本章小结

第三章改进的特征选择算法

3.1基本概念

3.2几种常用的特征选择算法

3.3算法类比实验

3.4改进的特征选择算法

3.4.1已有算法的不足

3.4.2一种改进的TFIDF特征选择算法

3.5实验结果及分析

3.6本章小结

第四章改进的增量学习朴素贝叶斯分类方法

4.1改进的增量朴素贝叶斯分类模型

4.2增量学习加权朴素贝叶斯分类算法

4.3增量学习公式的证明

4.4算法分析

4.5本章小结

第五章增量学习朴素贝叶斯中文分类实验系统

5.1系统框架设计与模块说明

5.2系统中的关键算法

5.3实验系统开发环境及分类语料

5.3.1实验系统开发环境

5.3.2实验语料库

5.4测试方法及评价标准

5.4.1测试方法

5.4.2实验评价标准

5.5测试结果分析

5.6本章小结

第六章总结与展望

6.1工作总结

6.2下一步展望

参考文献

致谢

攻读硕士学位期间的主要研究成果

展开▼

摘要

随着Internet的飞速发展,文本信息成几何级增长。为了能在海量的文本中及时准确地获得有效的知识和信息,文本分类技术受到了广泛的关注。朴素贝叶斯分类是目前公认的一种简单有效的概率分类方法,但是它不具备增量学习的功能。针对这种情况,本文提出改进的增量学习朴素贝叶斯算法。本文详细介绍了增量学习思路与增量学习朴素贝叶斯算法,并设计了一个增量朴素贝叶斯中文分类实验系统。 论文的主要内容包括如下几个方面: 1.描述了文本分类的一般过程,介绍了多种贝叶斯分类方法,对比研究分析其联系与差别。 2.对特征选择算法进行深入分析,提出一种结合特征项在各类别中的分布信息的改进的TFIDF特征选择方法。实验证明改进的方法选择出的特征有更强的类别表达能力。 3.针对朴素贝叶斯分类不具备增量学习的缺陷,提出增量学习朴素贝叶斯算法。详细介绍了增量学习思路,提出带选择性对文本进行增量学习的思想。在此基础上提出加权朴素贝叶斯方法增量学习算法,并对算法给出了详细证明与分析。 4.设计了一个增量朴素贝叶斯中文分类实验系统,使用两个中文数据集进行实验。实验结果表面,带增量学习的朴素贝叶斯分类方法在两个数据集上都比单纯的朴素贝叶斯分类效果要好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号