朴素贝叶斯
朴素贝叶斯的相关文献在2002年到2022年内共计994篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文829篇、会议论文33篇、专利文献70133篇;相关期刊389种,包括智能计算机与应用、电脑知识与技术、计算机工程等;
相关会议32种,包括2015年全国工业控制计算机技术年会、第十三届全国遥感遥测遥控学术研讨会、第十八届全国网络与数据通信学术会议等;朴素贝叶斯的相关文献由2318位作者贡献,包括王峻、石洪波、王志海等。
朴素贝叶斯—发文量
专利文献>
论文:70133篇
占比:98.79%
总计:70995篇
朴素贝叶斯
-研究学者
- 王峻
- 石洪波
- 王志海
- 王利民
- 苑森淼
- 李海军
- 王敏
- 王斌
- 王钲旋
- 王雷
- 翟军昌
- 邓维斌
- 黄厚宽
- 徐光美
- 朱永利
- 杨武
- 王涛
- 王磊
- 裘国永
- 陈治平
- 刘培玉
- 刘大有
- 周东华
- 张伟
- 李华
- 李大庆
- 李昕洁
- 李欣
- 熊志斌
- 王辉
- 王鹏
- 秦玉平
- 纪洪泉
- 陈茂银
- 高明
- 鲁明羽
- 丛林
- 何小海
- 何聚厚
- 关菁华
- 冯鸿怀
- 刘涛
- 刘琼荪
- 刘锋
- 华玲
- 卿粼波
- 周浩
- 唐焕玲
- 唐继强
- 张勇
-
-
蒋锋;
张文雅
-
-
摘要:
机器学习方法在处理复杂数据、构建高精度模型方面具有显著优势,在不同领域的研究中都得到了广泛应用。数字经济时代为经济领域带来海量数据的同时,也对经济研究提出诸多挑战。机器学习方法能充分挖掘数据中的非线性、非平稳信息,有效提高经济分析结果的精度。机器学习与经济问题的融合改变了传统经济学的研究范式。文章对近年来机器学习方法在经济研究中的应用进行回顾,从通货膨胀、汇率与货币、GDP、劳动力市场、社会稳定、政策评价等角度进行总结,比较了常用机器学习方法的优缺点,并展示了模型的评价准则,如均方根误差、F1-得分、AUC值等。
-
-
王磊;
张际萍;
杨洋
-
-
摘要:
随着大数据时代的到来,要求将数据资源确认为资产并在企业资产负债表列示的呼声越来越高,然而,学界对数据资源是否应确认为资产的观点并不统一,并且主张将数据资源确认为资产的研究方法只是基于会计准则逻辑基础之上的规范性研究,缺少可用于指导实务的实证方法和应用探讨。文章聚焦于数据资产的会计确认,结合大数据的本质特征,构建基于朴素贝叶斯方法的模型,可辅助企业开展数据资产的会计确认。
-
-
陆浩轩;
徐瑾妍;
程可爱;
谢燕青;
王丽;
计礼丽;
周忠;
杨卓;
景胜;
何文明
-
-
摘要:
本文旨在构建基于临床电子病历数据的冠心病预测模型.回顾性收集了2015年至2020年在宁波大学医学院附属医院住院期间,接受选择性冠状动脉造影的患者的临床数据,分别应用决策树、朴素贝叶斯和逻辑回归算法构建冠心病预测模型,比较3种模型的预测性能.共收集354例患者数据,其中冠心病患者140例,非冠心病患者214例,根据逻辑回归、朴素贝叶斯、决策树算法构建的3种预测模型的准确性分别为70.6%、89.5%、90.7%;曲线下面积分别为0.676、0.869、0.921.所构建的3种预测模型均具备较好的冠心病预测能力,具有用于冠心病筛查的潜在价值.
-
-
孙金晓
-
-
摘要:
本文在“互联网+大数据”的背景下,以Edx开放数据为研究基础,从中选取用户基本信息、学习者行为信息、学习态度信息三个维度,构建特征指标,通过遗传k-means聚类算法建立学习者行为模型,构建学习者画像,从而判断其行为模式、学习动机,进一步通过朴素贝叶斯算法预测其学业通过率,为教育工作者提供教育决策依据。
-
-
方志豪;
李正权;
张铭玮
-
-
摘要:
为更好地实施水环境管理政策,水质评价是基础环节,即根据某一水域多个水质参数,如何将其合理地划分到特定水质类别。针对该问题,提出了一种改进的朴素贝叶斯分类方法,该方法赋予不同属性以不同的权值,削弱了朴素贝叶斯条件独立性的假设,使分类结果更接近实际类别。首先,参考国家地表水水质自动监测站(以下简称国控水站)发布的数据,选取其中500条水质数据作为样本,基于溶解氧、高锰酸盐指数、氨氮和总磷4个指标建立评价体系;然后,利用改进朴素贝叶斯分类方法对样本进行学习与评价,并采用五折交叉验证法验证其分类性能。结果表明,改进朴素贝叶斯分类方法的准确率、精确率、召回率和F1值分别达到96.0%、95.9%、93.8%和94.8%,水质数据分类的性能指标相较于其他朴素贝叶斯分类方法更高,可对实际工程中遇到水质数据分类的问题提供一定的参考。
-
-
王哲;
杜凤娇
-
-
摘要:
随着2020年疫情爆发对经济的影响,常规的商业营销模式受到了冲击。以网红营销为代表的电子商务迅速崛起。电商平台作为网红营销的主要渠道,成为了消费者挑选、评价电商产品的媒介。因此,在电商平台的消费者评论具有文本挖掘的价值和潜力。本文使用网络爬虫技术,爬取到49,700条天猫商城评论数据其中有效数据为40,138条,采用TF-IDF算法提取评论中的关键词,通过Basic LDA模型对商品评论进行属性抽取,并运用变分贝叶斯推断对模型进行求解,最后通过朴素贝叶斯对评论进行情感极性分析,最终得到结论:消费者对电商产品的评论从功能性、消费理性两个角度出发,主题1、3、4表现出消费者重视电商产品使用的直观感受的倾向,主题2表现出消费者重视电商产品实际解决需求的功能性的倾向,消费者对电商产品的情感得分里积极、中性、消极分别为36%、63%、1%,总体上对电商产品持认可态度。
-
-
周家恺;
綦方中
-
-
摘要:
当前的网络流量时延特征识别方法未能在特征识别过程提升流量梯度,导致识别出现较大偏差,且方法的响应时间较长。为此提出基于朴素贝叶斯的网络流量时延特征识别方法。利用移动蜂窝网络通信链路技术和无线资源控制机制造成的网络流量时延波动完成建模分析,同时结合往返时延计算结果,获取与数据时延相关的网络流量特征。通过特征描述得到不同网络节点接入互联网技术差异导致的时序分布。将极端梯度提升树模型和朴素贝叶斯相结合,构建分类器,完成网络流量时延特征的识别。仿真结果表明,所提方法能够获取高精度的网络流量时延特征识别结果,同时还能够有效缩短响应时间。
-
-
夏传林;
郑巍;
谭莉娟;
王小良
-
-
摘要:
为提高测试用例复用的准确率及软件缺陷的发现率,提出一种基于知识图谱的测试用例复用方法,根据已有的项目测试数据,构建测试用例复用模型。对测试用例领域进行研究,分析测试用例的特征,利用本体设计构建测试用例知识图谱,通过问题模板与知识图谱匹配,改进朴素贝叶斯分类模型,利用多属性、多条件检索相似度最高的测试用例。基于模型匹配精度和知识图谱检索效率对复用方法进行验证,实践对照表明该方法能够提升测试用例复用率以及缺陷发现率。
-
-
李欣倩;
杨哲;
任佳
-
-
摘要:
根据朴素贝叶斯算法的特征条件独立假设,提出一种基于互信息和层次聚类双重特征选择的改进朴素贝叶斯算法。通过互信息方法剔除不相关的特征,然后依据欧氏距离将删减后的特征进行分层聚类,通过粒子群算法得到聚类簇的数量,最后将每个聚类簇中与类别互信息最高的特征合并为特征子集,并由朴素贝叶斯算法得到分类准确率。根据实验结果可知,该算法可以有效减少特征之间的相关性,提升算法的分类性能。
-
-
杨小艳
-
-
摘要:
以提升网络热门舆情分类准确率,降低分类时间为目标,提出了基于数据挖掘技术的网络热门舆情分类方法。将小波核函数和支持向量机结合构成小波模糊支持向量机,采用增量学习机制和贝叶斯分类算法建立增量贝叶斯分类算法,组成小波模糊支持向量机-增量贝叶斯分类算法解决测试样本易分类失误以及类条件独立假定性很难获取问题,通过计算待测样本和小波支持向量机之间的距离,实现网络热门舆情分类。经实验验证:类置信度较高时,文中方法分类准确率高,运行时间少,可快速分类网络热门舆情,且网络热门舆情分类结果的查全率以及查准率都在94%以上,分类精度较好。
-
-
瞿俊;
顾刘军
- 《2020互联网安全与治理论坛》
| 2020年
-
摘要:
文章通过静态分析提取良性与恶意程序调用的权限,比较良性和恶意程序调用权限组合的区别,以安卓应用的权限信息为特征值,使用朴素贝叶斯算法对安卓恶意软件进行检测分类.实验结果表明,文中设计的安卓软件恶意行为智能识别技术易于实现,可有效预防安卓恶意软件.
-
-
柏东明;
曾丽花;
冯梅;
郭晓东
- 《2019年中国石油石化企业信息技术交流大会》
| 2019年
-
摘要:
渗透是黑客入侵web站点的实质阶段,也是黑客入侵远端服务的主要手段.建立针对渗透行为的检测算法,能够快速发现此隐匿的攻击行为,能够有效发现web站点的安全漏洞并建立准确的防护策略.本文在使用朴素贝叶斯分类算法,对站点日志进行标记、训练和分类后,发现分类结果并不理想.通过改进朴素贝叶斯算法和分析渗透过程中URL参数的特征,提出了一种适用于渗透行为分类的分词算法,并通过实际应用和对比,证明了分词改进的有效性,为提升应用系统的安全防护、修复由系统自身的逻辑错误和功能缺欠而导致的安全漏洞提供有力依据.
-
-
-
许召召;
李京华;
陈同林;
李昕洁
- 《第十六届全国软件与应用学术会议》
| 2017年
-
摘要:
如何对以"工业4.0"为背景的物联网智慧医疗系统所产生的医疗数据进行高效而又准确地挖掘仍然是一个十分严峻的问题.而医疗数据往往是高维的、不平衡和有噪声的,基于此,本文提出一种新的数据处理方法——将SMOTE方法与Filter-Wrapper特征选择算法融合——用于支持临床医疗决策.将本文的算法应用于ECG临床医疗决策中,并取得了很好的效果.将本文所提算法用于心电图数据集中,可以得到高效而又准确的病人病症分类结果,在心电图治疗之中起到了辅助作用。本文提出的方法不仅克服了朴素贝叶斯在属性实际应用中因属性独立假设而造成预测不佳的情况,而且避免了C4.5决策树在构建模型时的过拟合问题.
-
-
-
-
Jia Shanshan;
贾杉杉;
Liu Chang;
刘畅;
Sun Lianying;
孙连英;
Liu Xiaoan;
刘小安;
Peng Tao;
彭涛
- 《首届数据分析与知识发现学术研讨会》
| 2017年
-
摘要:
目的:为了准确地给专利申请书分配IPC分类号,本文提出一种基于多特征多分类器集成的专利自动分类方法. 方法:使用从专利申请书中提取的全词典TFIDF特征、信息增益词典TFIDF特征、段落向量特征、主题模型向量特征,分别训练朴素贝叶斯、支持向量机、AdaBoost分类器,以此构建特征–类别矩阵,并结合F1权重矩阵集成,获得最终IPC预测分类号. 结果:对2014年–2016年“发动机或泵”领域的10个小类进行分类,使用Top Prediction、All Categories和Two Guesses三种评估方法得到准确率分别为:78.9%、80.1%、91.2%. 局限:训练仅仅使用了2014年–2016年共三年的专利数据,数据规模有限. 结论:在“发动机或泵”领域,本文方法能够有效地提高专利文本分类的准确率.
-
-
陈翠云;
刘志宇;
宫月
- 《第六届全国网络安全等级保护技术大会》
| 2017年
-
摘要:
基于统计机器学习方法的优势提出一种网络入侵检测系统模型.该模型是一种通用的模型,其中每个模块功能可以采用不同的方法进行实现,模型的各个部分也可以根据实际应用情况进行添加或删减.同时,为验证所提出模型的可行性,在实验部分采用Fisher实现模型中的特征选择部分,采用典型的机器学习方法SVM和朴素贝叶斯分别实现模型中统计机器学习部分.实验结果表明,所提出的基于机器学习的网络入侵检测系统模型,具有一定的可行性.在采用Fisher实现特征选择,SVM算法实现统计机器学习部分时,统计机器学习分类的准确率更高.
-
-
贺宝记;
张阳;
王延颋
- 《“可控自组装体系及其功能化”重大研究计划2015-2016年度学术交流会》
| 2016年
-
摘要:
蛋白质链接(Cα-Cα<8(A))预测是根据蛋白质序列的比对得到的一个概率图表,常用的方法可以分为三种:机器学习,共同进化和meta方法.用朴素贝叶斯和机器学习方法设计了新的蛋白质链接预测软件NN-BAYES,并且将NN-BAYES整合到蛋白质三维结构预测软件QUARK中.结果显示:NN-BAYES可以将蛋白质链接预测精度提高15%-24%,在将NN-BAYES整合入QUARK之后,QUARK可以将简单蛋白质三维结构预测精度提高47.6%,复杂蛋白质结构预测精度提高7%.
-
-
-
-
-
-
-
-
-
- 浪潮云信息技术股份公司
- 公开公告日期:2022-08-02
-
摘要:
本发明公开了一种基于朴素贝叶斯的网络钓鱼邮件检测方法及系统,属于机器学习人工智能领域;所述的方法的具体步骤如下:S1基于Python在Jupyter的环境中搭建运行;S2利用朴素贝叶斯支持向量机查找目标函数的全局最小值;S3通过支持向量机建立超平面对样本进行划分;S4从数据集文件中逐行读取训练数据并进行分析;S5将数据集划分为训练集和测试集进行模型训练;本发明基于正文特征(特定单词和标点符号)的对决策树,逻辑回归,随机森林,朴素贝叶斯和支持向量机模型进行了测试,结果基于真阳性,假阳性,真阴性,假阴性,准确率,精确率,召回率,f1分数进行评估比较;数据集来自IWSPA竞赛(包括训练集和测试集),其中正常邮件来自Wikileaks和SpamAssassin,钓鱼邮件来自Nazario phishing corpus。
-
-
-