基于大数据分析的文本智能识别系统的研究

杨明芬; 吴旭; 阚瑷珂; 常康

首页> 中文期刊> 《西藏科技》 >基于大数据分析的文本智能识别系统的研究

基于大数据分析的文本智能识别系统的研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

根据软件工程的基本原理在Ubuntu操作系统环境下使用Eclipse开发工具,设计并实现了基于Hadoop系统架构的NaiveBayes算法文本分类系统。系统将大量中文文本数据集存储在分布式文件系统HDFS上,通过MapReduce并行计算模型和Ansj中文分词库对中文数据集进行分词,采用TF-IDF算法进行文本特征抽取,最后基于Spark并行计算框架和NaiveBayes算法对特征数据集进行模型训练,得到文本分类模型,将文本分类服务集成到Web页面。系统基本实现了文本的正确分类。

著录项

来源
《西藏科技》 |2018年第9期|74-80|共7页
作者
杨明芬; 吴旭; 阚瑷珂; 常康;
展开▼
作者单位

西藏自治区科技信息研究所;

成都理工大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类检索机;
关键词
大数据; Hadoop; Spark; NaiveBayes; MapReduce;

相似文献

中文文献
外文文献
专利

1. 基于大数据分析的智能采购系统设计研究——以评标专家抽取方案智能生成研究项目为例 [J] . 张准 ,张晨 ,胡雨鹏 . 通讯世界 . 2021,第009期
2. 基于人工智能和大数据分析的传送网智能运维模式研究与应用 [J] . 王元杰 ,张贺 ,杨宏博 . 通信世界 . 2020,第031期
3. 基于文本大数据分析的会计和金融研究综述 [J] . 马长峰 ,陈志娟 ,张顺明 . 管理科学学报 . 2020,第009期
4. 基于微博短文本的大数据分析方法探索与研究 [J] . 宋啸天 ,姚家伟 . 江苏通信 . 2018,第001期
5. 基于微博短文本的大数据分析方法探索与研究 [J] . 宋啸天 ,姚家伟 . 江苏通信 . 2018,第001期
6. 基于NB-IoT和大数据分析的智能路灯控制云端系统的研究 [C] . 董铮 ,陈思 ,叶韬 . 2018中国信息通信大会 . 2018
7. 基于贝叶斯分类的文本信息智能检测与识别系统研究 [A] . 常金凤 . 2020

基于大数据分析的文本智能识别系统的研究

摘要

著录项

相似文献

相关主题

期刊订阅