数据采掘
数据采掘的相关文献在1996年到2008年内共计150篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究
等领域,其中期刊论文132篇、会议论文18篇、专利文献545864篇;相关期刊76种,包括中国金融电脑、情报学报、计算机工程等;
相关会议14种,包括2005第一届中国分类技术与应用研讨会(CSCA)、第18届全国数据库学术会议、全国第十四届计算机科学及其在仪器仪表中的应用学术交流会等;数据采掘的相关文献由231位作者贡献,包括唐常杰、罗可、孟志青等。
数据采掘—发文量
专利文献>
论文:545864篇
占比:99.97%
总计:546014篇
数据采掘
-研究学者
- 唐常杰
- 罗可
- 孟志青
- 谢印宝
- 吴杰
- 于中华
- 俞瑞钊
- 林士敏
- 陆玉昌
- 陈宁
- 史忠植
- 周欣
- 夏红霞
- 张邦礼
- 施伯乐
- 朱扬勇
- 杨斌
- 相利民
- 董淳
- 薛锦
- 陈奇
- 陈安
- 黄湘林
- 刘玉葆
- 刘鲁
- 印勇
- 叶施仁
- 夏绍玮
- 姚卿达
- 张全伙
- 张剑达
- 张天庆
- 张继福
- 张钹
- 曹献媛
- 曹长修
- 朱红
- 朱绍文
- 李晓黎
- 李鸣晓
- 杨富华
- 杨璐
- 殷华蓓
- 游湘涛
- 王利强
- 王宁
- 程岩
- 程泽凯
- 胡振宇
- 铁治欣
-
-
-
李晓毅;
徐兆棣;
孙笑微
-
-
摘要:
贝叶斯网络是数据采掘的一个非常有效的工具,它能够定性和定量地分析属性之间的依赖关系,进行概率推理.在给出贝叶斯网络相关概念后,讨论了贝叶斯网络在离散型、连续型和混合型3种情况下的参数学习计算公式;利用给定样本数据,对具有完整数据和不具有完整数据的贝叶斯网络,学习网络参数,更新网络变量原有的先验分布;从理论上给出两种不同类型下的参数学习公式.
-
-
-
陶再平;
俞瑞钊
-
-
摘要:
在原有序列模式挖掘算法基础上,提出了序列模式增量式更新的快速算法SPIU.算法充分利用原有的挖掘结果,并对候选序列集合进行有效地剪枝.测试结果表明,算法是正确和高效的,具有良好的扩放性.
-
-
程泽凯;
秦锋;
徐浩
-
-
摘要:
基于概率的贝叶斯分类器以其简单的结构和良好的性能受到重视,树扩展朴素贝叶斯分类器TANC应用较广.用TANC-BIC结构学习算法构建的分类器取得了成功,但TANC-BIC结构学习算法未考虑类节点的情况.文中提出了一种新的结构学习TANC-CBIC算法.并在贝叶斯分类器实验平台MBNC上编程实现.实验结果表明,改进算法分类准确率要高于由TANC-BIC和TANC-CMI结构学习算法构建的分类器,TANC-CBIC结构学习算法是有效的.
-
-
XIONG Jiajun;
LI Qinghua;
TU Jing
-
-
摘要:
This paper studied on the clustering problem for intrusion detection with the theory of information entropy, it was put forward that the clustering problem for exact intrusion detection based on information entropy is NP-complete, therefore, the heuristic algorithm to solve the clustering problem for intrusion detection was designed, this algorithm has the characteristic of incremental development, it can deal with the database with large connection records from the internet.
-
-
员巧云;
程刚
-
-
摘要:
数据挖掘是人工智能、机器学习与数据库技术等多学科相结合的产物.作为当前重要的前沿课题之一,研究人员提出了许多数据挖掘理论和方法,并取得了许多重要的研究成果.本文运用统计、比较方法对相关著作和论文进行了统计研究,并对研究中的重点问题及相关成果作了分析总结.
-
-
梁开健
-
-
摘要:
设计了一种快速采掘意外关联模式的新算法.利用采掘常规模式时产生的统计数据,对常规关联模式进行适当的筛选,然后产生相应的采掘数据库De,所有大项集在De中产生,最后再对整个数据库D扫描从而采掘出意外关联模式.
-
-
-
程泽凯;
林士敏
-
-
摘要:
分类技术是数据采掘的基础与核心,建构分类器是分类技术的关键,利用贝叶斯网络可以构造出分类性能较好的分类器.基于BN Toolkit(BNT)软件包利用Matlab语言实现了两种贝叶斯网络分类器(BNC).分别基于GS算法和K2算法学习分类器结构.用UCI(University ofcaliforniainIrvine)上下载的标准数据集验证所建构的BNC,实验结果表明所建构BNC的分类准确率高于文献中所列的NBC和TANC结果,从而表明所建立分类器的有效性和正确性.最后列出了进一步要做的工作.
-
-
孟志青;
万天明;
杨斌
- 《第18届全国数据库学术会议》
| 2001年
-
摘要:
数据仓库的数据采掘问题本质上是时态数据采掘问题,本文首先简述了一种基于数据中央采掘器为核心的数据仓库的建造方法,给出了划分时间段的时态型理论,由此定义了时态数据----事件空间,最后我们讨论了时态关联规则、时态周期规则、时间序列事件和其它时态数据采掘的有关问题.
-
-
-
-
-
陆声链;
林士敏;
鲁明羽
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
为解决分类数据、高维数据中的异常检测问题,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显著性的异常存在判别准则,实验结果表明该判别准则可有效去除大量异常程度并不显著的异常对象.从检测结果的有趣性、与同类算法的比较、对提高分类准确率的贡献和检测小类的能力4个方面对算法的有效性进行了评价。
-
-
陆声链;
林士敏;
鲁明羽
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
为解决分类数据、高维数据中的异常检测问题,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显著性的异常存在判别准则,实验结果表明该判别准则可有效去除大量异常程度并不显著的异常对象.从检测结果的有趣性、与同类算法的比较、对提高分类准确率的贡献和检测小类的能力4个方面对算法的有效性进行了评价。
-
-
陆声链;
林士敏;
鲁明羽
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
为解决分类数据、高维数据中的异常检测问题,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显著性的异常存在判别准则,实验结果表明该判别准则可有效去除大量异常程度并不显著的异常对象.从检测结果的有趣性、与同类算法的比较、对提高分类准确率的贡献和检测小类的能力4个方面对算法的有效性进行了评价。
-
-
陆声链;
林士敏;
鲁明羽
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
为解决分类数据、高维数据中的异常检测问题,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显著性的异常存在判别准则,实验结果表明该判别准则可有效去除大量异常程度并不显著的异常对象.从检测结果的有趣性、与同类算法的比较、对提高分类准确率的贡献和检测小类的能力4个方面对算法的有效性进行了评价。
-
-
陆声链;
林士敏;
鲁明羽
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
为解决分类数据、高维数据中的异常检测问题,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显著性的异常存在判别准则,实验结果表明该判别准则可有效去除大量异常程度并不显著的异常对象.从检测结果的有趣性、与同类算法的比较、对提高分类准确率的贡献和检测小类的能力4个方面对算法的有效性进行了评价。
-