首页> 中国专利> 一种基于朴素贝叶斯的文本分类方法

一种基于朴素贝叶斯的文本分类方法

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于朴素贝叶斯的文本分类方法，包括：步骤1：将待分类文本利用分词工具形成特征向量，将特征向量与常用词进行比较，去掉待分类文本中无意义的词语；对待分类文本中出现的每一个单词s_i进行权重w_i设置；得到P(w₁,...,w_n)在训练文本集D_i中出现的概率集Q(w₁,...,w_n)；将Q(w₁,...,w_n)中属性相乘得到P(w₁,...,w_n)在训练文本集D_i中出现的先验概率P(w|D_i)；步骤3：训练文本集D_i中的文件数量除以整个训练文本集的总数得到先验概率P(D_i)，P(D_i)*P(x|D_i)得到P(w₁,...,w_n)在训练文本集D_i中的后验概率P(D_i|w)，步骤4：重复步骤2、3，计算出所有后验概率；步骤5：在步骤4的结果中比较出最大的后验概率P(D_i)，D_i类为P(w₁,...,w_n)所属类别，本方法的性能更好，在电力用户诉求文本分类问题中具备很好的实践应用价值。

著录项

公开/公告号CN107391772B

专利类型发明专利
公开/公告日2020-12-01

原文格式PDF
申请/专利权人国网四川省电力公司眉山供电公司;
展开▼

申请/专利号CN201710832802.2
发明设计人简海英;吕磊;邓丕;杨谦;王海;袁志刚;陈焕章;吴红;张庆;高峰;刘悠;张威;
展开▼

申请日2017-09-15
分类号G06F16/35(20190101);G06F40/279(20200101);G06K9/62(20060101);G06Q50/06(20120101);
代理机构51220 成都行之专利代理事务所(普通合伙);
代理人梁田
地址 620000 四川省眉山市东坡区二环东路150号
入库时间 2022-08-23 11:23:33

相似文献

专利
中文文献
外文文献

1. 一种基于集群环境的朴素贝叶斯文本分类方法 [P] . 中国专利： CN113157915A . 2021-07-23
2. 一种基于改进朴素贝叶斯的电力系统文本数据分类方法 [P] . 中国专利： CN112215002A . 2021-01-12
3. An olap-based naive bayes classification method [P] . AU2002342149A8 . 2004-05-04

机译：基于Olap的朴素贝叶斯分类方法
4. AN OLAP-BASED NAIVE BAYES CLASSIFICATION METHOD [P] . AU2002342149A1 . 2004-05-04

机译：基于OLAP的朴素贝叶斯分类方法
5. AN OLAP-BASED NAÏVE BAYES CLASSIFICATION METHOD [P] . 世界知识产权组织专利： WO2004034287A2 . 2004-04-22

机译：基于OLAP的朴素贝叶斯分类方法