大数据环境下基于Spark的Bayes分类算法研究

张睿敏; 张琪淼; 杜叔强; 贾桂霞

首页> 中文期刊> 《工业仪表与自动化装置》 >大数据环境下基于Spark的Bayes分类算法研究

大数据环境下基于Spark的Bayes分类算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

With the big data burst, how to improve the execution efficiency of the algorithm is the re-search focus of big data classification, Spark is the distributed parallel computing framework, support the iterative data flow. In this paper, the naive Bayes text classification algorithm is used in parallel flow pro-cessing. Experiments show that the parallel flow type Bayes classification algorithm can effectively to im-prove the efficiency of data classification.%随着大数据的爆发,如何提高算法的执行效率是大数据分类的研究热点,Spark是分布式并行计算框架,支持迭代数据流,该文对朴素贝叶斯文本分类算法作并行流式化处理,实验证明,并行流式化Bayes分类算法能有效提高大数据分类效率.

著录项

来源
《工业仪表与自动化装置》 |2018年第3期|116-118,123|共4页
作者
张睿敏; 张琪淼; 杜叔强; 贾桂霞;
展开▼
作者单位

兰州工业学院软件工程学院,兰州730050;

兰州市公安局,兰州730030;

兰州工业学院软件工程学院,兰州730050;

兰州工业学院软件工程学院,兰州730050;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机软件;
关键词
大数据; Spark; 并行流式化; 贝叶斯分类;

相似文献

中文文献
外文文献
专利

1. Spark平台环境下基于Aco-kmeans算法的滚轴故障检测算法研究 [J] . 刘兴建 ,原振文 . 计算机应用与软件 . 2021,第001期
2. 基于加权Bayes分类器的流数据在线分类算法研究 [J] . 卢惠林 . 计算机科学 . 2014,第005期
3. 基于Spark的分布式大数据分析算法研究 [J] . 宋泊东 ,张立臣 ,江其洲 . 计算机应用与软件 . 2019,第001期
4. 基于Spark框架的网络大数据分类处理方法研究 [J] . 王志 . 信息与电脑 . 2021,第010期
5. 基于Spark和SimHash的大数据K-近邻分类算法 [J] . 翟俊海 ,沈矗 ,张素芳 . 河北大学学报（自然科学版） . 2019,第002期
6. 基于Spark和SimHash的大数据K-近邻分类算法 [C] . ZHANG Su-fang ,张素芳 ,WANG Ting-ting . 第六届中国计算机学会大数据学术会议 . -1
7. 基于Spark计算环境的改进Bayes文本分类并行算法的研究与实现 [A] . 肖伟 . 2019

大数据环境下基于Spark的Bayes分类算法研究

摘要

著录项

相似文献

相关主题

期刊订阅