增量式中文文本分类算法研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

文本自动分类是指根据文本内容自动确定文本类别的过程.其目的是为信息检索提供更高效的搜索策略和更准确的查询结果.随着网络信息的快速增长,文本自动分类技术的研究对于网上信息搜索具有重要的意义.该论文对中文文本自动分类技术作了系统论述,介绍了用于文本表示的向量空间模型、文本特征获取方法,较深入地讨论了基于支持向量机(SVM)的文本分类算法和Bayes文本分类算法.从提高训练速度,减少存储空间,充分利用历史信息的角度提出了增量式SVM文本分类算法.针对难以获得大量有类标签的训练集问题,提出了增量式Bayes文本分类算法.设计并实现了中文文本自动分类原型系统,对有关中文文本分类算法的有效性进行了验证分析.文章详细分析了文档频率DF、信息增益IG、CHI统计和互信息MI的优缺点,提出了将文档频率DF和其它三种特征选择相结合的组合特征选择方法,实验结果表明组合的特征选择方法显著地提高了分类的精度.

著录项

作者
高洁;
展开▼
作者单位

南京师范大学;

展开▼
授予单位南京师范大学;
学科计算数学(计算机应用)
授予学位硕士
导师姓名吉根林;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;自动推理、机器学习;
关键词
文本分类; 中文分类; Bayes; 支持向量机; 增量学习;

相似文献

中文文献
外文文献
专利

1. 改进词向量和kNN的中文文本分类算法 [J] . 丁正生 ,马春洁 . 现代电子技术 . 2022,第1期
2. 基于深度学习的中文文本分类算法 [J] . 薛兴荣 ,靳其兵 . 计算机与数字工程 . 2022,第1期
3. 中文文本层次多标签分类算法研究 [J] . 罗玉杰 ,晏忠泰 ,杨科 . 现代计算机（专业版） . 2021,第009期
4. 基于三支决策的中文文本分类算法研究 [J] . 靳义林 ,胡峰 . 南京大学学报：自然科学版 . 2018,第4期
5. 基于多种特征池化的中文文本分类算法 [J] . 阳馨 ,蒋伟 ,刘晓玲 . 四川大学学报（自然科学版） . 2017,第002期
6. 一种基于EP的中文文本自动分类算法 [C] . 许红涛 ,范明 ,昝红英 . 2005第一届中国分类技术与应用研讨会（CSCA） . 2005
7. 基于SVM的中文文本分类算法研究与实现 [A] . 熊浩勇 . 2008

增量式中文文本分类算法研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅