数据开采
数据开采的相关文献在1996年到2010年内共计110篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、经济计划与管理
等领域,其中期刊论文89篇、会议论文19篇、专利文献561488篇;相关期刊59种,包括管理科学、情报学报、计算机工程等;
相关会议12种,包括2007年北京地区高校研究生学术交流会、电站自动化信息化学术技术交流会议、第八届全国遥感遥测遥控学术研讨会等;数据开采的相关文献由158位作者贡献,包括路松峰、陈文伟、胡和平等。
数据开采—发文量
专利文献>
论文:561488篇
占比:99.98%
总计:561596篇
数据开采
-研究学者
- 路松峰
- 陈文伟
- 胡和平
- 何炎祥
- 卢正鼎
- 黄金才
- 张戈
- 徐治皋
- 李超
- 江浩
- 石莉
- 陈元
- 方正江
- 王春花
- 谢坤武
- 赵卫东
- 陈世强
- 黄厚宽
- 黄浩
- 余达征
- 冯剑琳
- 冯玉才
- 刘宏彬
- 刘芳
- 吴宇红
- 尹春华
- 斯第芬·荷曼·梅斯
- 李德毅
- 李新远
- 李旗号
- 杰弗里·斯考特·琐伦森
- 狄文远
- 王元珍
- 第米垂·卡那威斯基
- 赵新昱
- 邓洪志
- 钱进
- 顾培亮
- 马光志
- 黄宏斌
- 丁永波
- 从柏林
- 何国金
- 何宏
- 何志国
- 余腊生
- 兰壮丽
- 刘兵
- 刘大敏
- 刘清
-
-
薛松
-
-
摘要:
智能化搜索引擎的出现,使数据开采技术的应用进入了一个全新的阶段.文章探讨了数据开采技术的概念、方法及其过程,分析了数据开采技术的发展趋势,提出了数据开采技术在学生成绩分析系统和图书馆中应用的有效方法.
-
-
谢坤武;
陈世强;
毕晓玲
-
-
摘要:
算法MARC(Mining Association Rules using Clustering)将聚类技术应用到关联规则的发现上,MARC利用聚类技术压缩交易数据库,从而减少开采算法需要处理的数据量以提高开采效率,同时算法提出了聚类汇总转换的概念用以减轻压缩数据带来的信息丢失.在几个实际数据集上的实验表明该算法可以达到高精度和高性能.
-
-
滕利辉;
黄仙
-
-
摘要:
决策支持系统是一个人机交互的计算机应用系统.数据库是DSS的一个最基本的部件.本文通过对DSS及其数据库的研究,完成了通用DSS数据库的设计步骤,同时根据设计方法完成了学生信息数据库的概念设计和逻辑设计.在文章最后总结出了决策支持及数据库相关新技术,为以后DSS数据库的研究和发展提供了新的技术支持.同时强调DSS的继续发展必须面向实际,更多地解决实际问题.指出DSS融合到火电厂厂级监控信息系统(SIS)中将带来巨大的经济效益.
-
-
谢坤武;
陈世强
-
-
摘要:
现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categoricaldata)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.
-
-
员巧云;
程刚
-
-
摘要:
数据挖掘是人工智能、机器学习与数据库技术等多学科相结合的产物.作为当前重要的前沿课题之一,研究人员提出了许多数据挖掘理论和方法,并取得了许多重要的研究成果.本文运用统计、比较方法对相关著作和论文进行了统计研究,并对研究中的重点问题及相关成果作了分析总结.
-
-
杨君锐
-
-
摘要:
关联规则是当前数据挖掘研究的主要领域之一.发现频繁项目集是关联规则数据开采中的关键问题.该文提出了一种基于最大频繁项目集的逆向开采算法IDMF1(inverse discovery maximum frequent itemsets),该算法利用频繁项目集的有关特性作为启发信息,采用逆向(即自顶向下)的搜索策略,能够大大减少候选项目集的生成,从而显著地提高了开采效率.
-
-
-
徐新;
鲁汉榕;
谢磊
-
-
摘要:
基于粗糙集的属性约简过程中,属性集对论域的划分存在大量繁杂且冗余的集合求交运算,提出 一种将求交集的划分过程变换为对一组一维整数集合进行分类的替换算法.通过一个典型的算例说明该算法的合理性和有效性.与传统的算法比较,该算法具有简明、易实现的特点.
-
-
陈敏;
蔡筱英
-
-
摘要:
随着我国加入WTO,企业所面临的外部环境正在发生迅速变化,这对企业的决策提出了更高的要求.文章通过分析企业现有决策方式和OLTP系统存在的问题,介绍了决策支持系统技术的研究现状和发展趋势,阐述了基于数据仓库的决策支持系统的关键技术和设计与实现方法,提出了企业在DSS建设中需注意的一些问题.
-
-
江浩;
徐治皋
-
-
摘要:
在电站运行优化的目标分析的基础上,依照决策支持系统(DSS)的结构及其设计思想,对电站运行优化决策支持系统(OODSS)的结构进行探讨,重点对运行优化的关键性难题--优化目标值的确定问题进行深入研究,在传统方法的基础上提出基于数据开采技术的新方法,并利用决策支持系统解决半结构化问题的优势提出进一步的综合性解决方案.图2表2参5
-
-
-
-
谢坤武;
陈世强
- 《第二十三届中国数据库学术会议(NDBC2006)》
| 2006年
-
摘要:
现有的针对分类数据的算法需要多次扫描数据库,对于数据开采经常处理的大容量数据,多遍I/O操作是一项沉重的系统开销.CACD(clustering algorithm for categorical data)是针对分类属性数据的聚类算法,该算法采用压缩技术缩小需要处理的数据量以提高效率,同时算法提出了一种新的基于压缩数据结构的标准用于衡量分类数据的相似度.CACD只需扫描数据库一遍,算法理论分析和实验分析都表明该算法比同类针对分类数据的聚类算法效率要高,并且压缩技术对聚类结果的质量影响不大.
-
-
江浩;
徐治皋
- 《电站自动化信息化学术技术交流会议》
| 2002年
-
摘要:
本文基于电站运行优化的目标分析,依照决策支持系统(DSS)的结构及其设计思想,在对电站运行优化决策支持系统的总体设计和对运行优化的关键性问题如优化目标值的确定、偏差分析、操作指导等方面进行深入研究的基础上,对人机交互系统、问题处理系统、数据库及其管理系统、模型库及其管理系统、专家系统(ES)与数据开采等主干子系统的设计提出合理的方案.
-
-
-
-
-
-
王春花;
寇育敬;
黄厚宽
- 《第六届中国人工智能职合学术会议》
| 2001年
-
摘要:
在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,将需要不断调整两个描述用户兴趣程度的阈值;最小支持度和最小可信度.本文主要研究分布式环境下多层关联规则的增量更新问题,提出了一种快速有效的I_MLFDM算法,论述了它的原理、具体实现方法,性能分析说明它是有效.
-
-
王春花;
寇育敬;
黄厚宽
- 《第六届中国人工智能职合学术会议》
| 2001年
-
摘要:
在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,将需要不断调整两个描述用户兴趣程度的阈值;最小支持度和最小可信度.本文主要研究分布式环境下多层关联规则的增量更新问题,提出了一种快速有效的I_MLFDM算法,论述了它的原理、具体实现方法,性能分析说明它是有效.