朴素Bayes分类器文本特征向量的参数优化

方秋莲; 王培锦; 隋阳; 郑涵颖; 吕春玥; 王艳彤

首页> 中文期刊> 《吉林大学学报（理学版）》 >朴素Bayes分类器文本特征向量的参数优化

朴素Bayes分类器文本特征向量的参数优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:采用朴素Bayes算法建立中文文本自动分类器,并研究相关参数的选择问题,以实现中文文本的高效分类.首先在模型训练阶段,采用N-gram模型处理训练数据集提取特征向量;然后使用朴素Bayes算法建立文本分类器;最后在模型测试阶段,为提高分类准确率,使用词频-反文档频率算法对测试样本进行特征向量提取.实例分析结果表明,在提取训练集特征向量时,2-gram模型和4-gram模型的特征提取效果最佳;在选取特征向量长度时,长度为25000的特征向量可使分类准确率出现最大增幅并保证较高准确率;在确定特征项词性方面,同时选取动词和名词可使分类器准确率达到最高,仅选取动词时准确率最低.

著录项

来源
《吉林大学学报（理学版）》 |2019年第6期|1479-1484|共6页
作者
方秋莲; 王培锦; 隋阳; 郑涵颖; 吕春玥; 王艳彤;
展开▼
作者单位

中南大学数学与统计学院长沙410083;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
朴素Bayes分类器; 特征选择; TFIDF算法; N-gram模型;

相似文献

中文文献
外文文献
专利

1. 基于朴素Bayes组合的简易集成分类器 [J] . 宋丛威 . 计算机系统应用 . 2021,第002期
2. 基于朴素贝叶斯分类器的朝鲜语文本分类的研究 [J] . 周国强 ,崔荣一 . 中文信息学报 . 2011,第004期
3. 一种改进的朴素贝叶斯分类器在文本分类中的应用研究 [J] . 张璇 ,左敏 . 北京工商大学学报（自然科学版） . 2009,第004期
4. 基于n-gram语言模型和链状朴素贝叶斯分类器的中文文本分类系统 [J] . 毛伟 ,徐蔚然 ,郭军 . 中文信息学报 . 2006,第003期
5. 朴素贝叶斯中文文本分类器的设计与实现 [J] . 潘忠英 . 电脑编程技巧与维护 . 2021,第002期
6. 通过弱化朴素贝叶斯假设提高朴素贝叶斯文本分类器的性能 [C] . 张阳 ,李战怀 ,卢维扬 . 第十九届全国数据库学术会议 . 2002
7. 改进朴素贝叶斯文本分类器的特征选择方法探讨 [A] . 罗志峰 . 2009

朴素Bayes分类器文本特征向量的参数优化

摘要

著录项

相似文献

相关主题

期刊订阅