数据集合
数据集合的相关文献在1983年到2022年内共计260篇,主要集中在自动化技术、计算机技术、法律、经济计划与管理
等领域,其中期刊论文126篇、会议论文10篇、专利文献549347篇;相关期刊110种,包括甘肃社会科学、中国金融电脑、黑龙江科技信息等;
相关会议10种,包括NDBC2009第26届中国数据库学术会议、第六届全国信息获取与处理学术会议、第二十五届中国数据库学术会议(NDBC2008)等;数据集合的相关文献由461位作者贡献,包括杰克·李、周嘉源、塔特姆·M·谢菲尔德等。
数据集合—发文量
专利文献>
论文:549347篇
占比:99.98%
总计:549483篇
数据集合
-研究学者
- 杰克·李
- 周嘉源
- 塔特姆·M·谢菲尔德
- 特里·雷蒙德
- 阿尔伯特·B·巴拉巴斯
- 马克·D·A·万古利克
- 兰迪·R·雷贝尔
- 布兰特·凯勒
- 斯蒂芬·C·克劳奇
- A·A·吉里纽
- A·V·舒杰葛洛夫
- A·维斯
- B·M·兰伯特
- B·W·尼尔勒
- B·万达埃勒
- C·利曼
- D.摩斯
- E·阿里
- F·阿尔韦萨
- I·奥斯特罗夫斯基
- J·E·施莱费尔
- J·T·惠特克
- J·博克哈德特
- J·古尔德
- J·达菲
- K.梅拉
- M·S·奥古斯汀
- P·S·苏塞
- R.纳加
- R·E·奥齐
- R·Z·斯派尔
- S.拉帕尔
- S.费尔马
- S·埃尔巴加迪
- S·托布
- T·珀金斯
- W·万巴埃伦
- 亚历克斯·D·利特尔
- 何彬彬
- 何恺铎
- 刘志勇
- 刘泽胤
- 刘莉
- 叶青
- 吕卓纹
- 吴扬扬
- 吴易杰
- 吴晓飞
- 吴裕宪
- 吴跨宇
-
-
翟思贝;
范海玲;
杨波
-
-
摘要:
洪涝灾害是我国影响范围较广、持续性较强,且具有较高危害性的自然灾害。一般情况下,强降雨是洪涝灾害的主要成因之一,而地方水文环境也与之息息相关,为了有效预警洪涝灾害,设计基于水文数据的分析整理和计算,以多类统计模型为基础,建立洪涝灾害预警系统。通过超限水量的评估以及后续流域水文淹没分析及数据分析,建立矢量数据集合,再通过网络数据传输分析,构建完整的洪涝灾害预警分析系统。实验表明,该系统可以有效分析目标区域的水文数据类型,生成风险区域规划图,实现洪涝预警。
-
-
张冬
-
-
摘要:
近年来,探索“另类数据”应用的研究日渐兴起,通过分析财务数据的局限以及“另类数据”的特点,研究重点探讨了其在企业业绩预测、财务困境识别与预警、财务舞弊甄别方面的应用价值,并结合应用中面临的挑战给出了建议。数据作为数字经济时代的基本元素,已被国家明确列为与土地、劳动力、资本、技术并列的第五大生产要素并受到各方关注。数字经济环境下的数据通过计算机和互联网等工具捕捉、管理和处理形成数据集合和信息资产[1]。
-
-
黄卫东;
梁齐;
谢凤;
滕露
-
-
摘要:
随着物联网、互联网、人工智能等计算机技术的迅速发展,大数据成为国内外的研究热点。麦肯锡在2011年的全球研究院《大数据:创新、竞争和生产力的下一个新领域》报告中将“大数据”定义为:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合[1]。大数据的发展不仅推动了电商、金融和教育等领域的进步,在医疗信息领域也展现出独特的魅力和较高的医疗价值[2],在医疗与医药、医生等场景中已探索出各种应用[3]。对于大数据来说,数据仓库承载着整个企业的全业务数据,数据仓库的建设是一个综合性的技术[4],具备包含数据的抽取、转换和清洗的完整体系结构[5]。通过大数据的分析,能降低病人二次住院时病情的不确定性,使医护工作的效率提高,也能降低医疗风险[6],基于网络平台的医学检验以及数据分析对于医疗平台运营具有重要实践意义[7],医院信息化建设在保障医疗健康事业中的作用也日益显著。
-
-
-
王贺敏;
刘明玮
-
-
摘要:
一、引言2015年8月31日国务院印发《促进大数据发展行动纲要》明确指出,大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。同年10月召开的中国共产党第十八届中央委员会第五次全体会议提出实施“国家大数据战略”,将大数据战略上升至国家战略层次,开启了我国大数据建设的新篇章。
-
-
张智行
-
-
摘要:
有关大数据分析的说法很多,目前比较一致的说法是:大数据分析是指对规模巨大的数据进行分析。那什么是大数据呢?麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。具体来说,大数据分析就是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。伴随着经济的快速发展,尤其是IT行业的风起云涌,数据仓库、数据安全、数据分析、数据挖掘等围绕大数据的社会价值的利用逐渐成为行业热点,大数据分析的战略价值和意义与日俱增。多年来,马昊始终致力于大数据分析行业的发展与建设,为培养数据分析人才、传播数据分析的意义和作用作出了积极贡献。
-
-
徐东;
许永正;
侍守创
-
-
摘要:
针对因网络设备损坏行为而造成的电量过度利用问题,设计基于动态链接库的工业网络设备损坏率预测系统。以工业电网平台为支撑,按需连接实体预测电路与网络设备损坏率统计模块;对网络设备损坏率的数据集合进行标定处理,通过计算聚类参数的方式,建立主机设备与动态存储数据库间的实用连接关系;联合相关硬件设备结构体,完成基于动态链接库的工业网络设备损坏率预测系统设计。实验结果表明,动态链接库预测系统能够较好地解决因网络设备损坏行为而造成的电量过度利用问题,从而建立更加稳定的工业智能应用平台。
-
-
-
-
摘要:
根据住房和城乡建设部关于加快推进新型城市基础设施建设的工作部署,济南市将以“智慧住建”为基础,按照“数据集合、系统整合、功能融合”的原则,围绕打造“五个济南”、建成“五个中心”,实现“七个新跨越”、完成“十个新突破”等战略目标,打造“新城建”济南模式。
-
-
吴亚光
-
-
摘要:
数据控制者在形成数据集合时实现信息熵减的劳动带来了大数据经济利益.数据集合上负载信息主体人格利益和多重社会利益,并不影响数据集合的相对独立性,数据集合可以成为数据财产权的客体基础.实现数据财产权各项权能需要平衡数据集合的利益结构.基于数据集合的负外部性,需要在数据收集、处理、存储和披露环节对数据控制者设定行为边界.此外,需要建立数据的强制公开、移送、许可和合理使用制度,并且基于利益分配公正性适当征收"数字税".
-
-
杨亮;
王谊
-
-
摘要:
室内环境舒适度评价研究具有重要意义,当前室内环境舒适度评价方法不能准确描述室内环境舒适度的变化规律,导致室内环境舒适度评价精度低,为了更加准确对室内环境舒适度进行评价,提出了改进RBF神经网络的室内环境舒适度评价模型.首先对室内环境舒适度评价研究进展进行分析,并设计了环境舒适度评价指标体系,然后采集环境舒适度评价指标的数据,并确定环境舒适度等级,得到环境舒适度评价数据集,最后采用改进RBF对环境舒适度评价数据集进行学习,建立环境舒适度评价模型,与其它环境舒适度评价模型的对比结果表明,改进RBF神经网络的环境舒适度评价精度要高于对比模型,能够更好描述环境舒适度变化规律,具有十分广泛的应用前景.
-
-
- 《第六届全国信息获取与处理学术会议》
| 2008年
-
摘要:
高效和精确的数据清理是能够让射频识别技术(RFID)系统成功运行的一个关键所在,尽管最近几年在标签识别率上取得了重要的进展,但是在射频界面和标签读写器之间仍然存在大量丢失数据的情况.现有的清理技术主要集中在各种各样的条件下如何获得高精度的清理效果,而这些方法运用到实际中则可能导致非常高的数据清理开销,以至于无法运用到实际中来.本文提出了一种清理框架,用一个RFID数据集合,一些数据清理方法和相关的开销要求,然后推导出一个清理方案,在不同的需要下采用不同的清理方法,使清理开销和最后的精度能够得到统一.
-
-
-
- 《第二十五届中国数据库学术会议(NDBC2008)》
| 2008年
-
摘要:
提出了一种基于人工鱼群优化算法的支持向量机集成模型(AFSASVM).在独立训练出一批个体支持向量机后,利用人工鱼群优化算法对集成中个体支持向量机的权值进行优化,选择权值大于某一阈值的部分个体支持向量机参与集成,实现一种基于选择性集成思想的支持向量机集成模型.在标准UCI数据集合和StatLog项目集合上的仿真对比实验表明,该方法可以得到更好的集成性能,显示了AFSA在多分类器集成权值优化方面的有效性,同时在运行效率上AFSA也具有明显的优势。
-
-
陆筱霞;
李思昆;
曾亮;
郑笈
- 《第七届全国虚拟现实与可视化学术会议》
| 2007年
-
摘要:
数据组织是大规模场景绘制和处理中影响性能的一个关键问题。提出了一种基于本体的场景数据组织方式:设计了区域本体对场景进行区域划分和管理;利用任务本体,明确了任务关注的数据集合以及任务间的信息交互。大规模场景绘制实验结果表明,该数据组织方式能够降低组织信息对内存的需求,并有效提高了绘制效率。
-
-
郭金喜;
朱文兴
- 《第六届中国Rough集与软计算学术研讨会(CRSSC'2006)》
| 2006年
-
摘要:
特征子集选择问题是指从一个给定的候选特征集合中,根据一定的评价标准,选出一个特征子集,使其能够一致地描述给定的例子集合.很明显通过特征子集选择,可以减少描述原数据集合的特征(属性)的数目,进而可以减少原数据集合的例子数.而在实际应用中,数据挖掘或模式识别所处理的对象是大型的数据库.其中每个记录都包含了许多特征(属性),由于在数据的采集过程中,可能会因为某些特征提取费用或设备和人为等原因,造成了属性集合中包含了一些未知的、无关的或冗余的特征(属性).这些特征(属性)的存在会给数据挖掘或模式识别算法带来很多麻烦.近年来,随着机器学习和数据挖掘在实际领域中的不断应用,特征子集选择算法研究逐渐成为人工智能领域的一个研究热点,因为通过特征子集选择。本文简介NFS算法和基于半贪心策略的特征子集选择算法。
-
-
-
冯红伟;
李战怀
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本文对时间序列的聚类方法进行了研究,提出了基于序列模糊相似性距离的聚类方法.在决定簇的融合时,使用簇之间的相对距离以消除序列的分布特征对聚类结果的影响,在聚类的开始阶段,使用随机选取的点形成初始化簇,减少了层次聚类初始簇的数目,提高了聚类效率.
-
-
冯红伟;
李战怀
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本文对时间序列的聚类方法进行了研究,提出了基于序列模糊相似性距离的聚类方法.在决定簇的融合时,使用簇之间的相对距离以消除序列的分布特征对聚类结果的影响,在聚类的开始阶段,使用随机选取的点形成初始化簇,减少了层次聚类初始簇的数目,提高了聚类效率.
-
-
冯红伟;
李战怀
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本文对时间序列的聚类方法进行了研究,提出了基于序列模糊相似性距离的聚类方法.在决定簇的融合时,使用簇之间的相对距离以消除序列的分布特征对聚类结果的影响,在聚类的开始阶段,使用随机选取的点形成初始化簇,减少了层次聚类初始簇的数目,提高了聚类效率.
-
-
冯红伟;
李战怀
- 《第二十届全国数据库学术会议》
| 2003年
-
摘要:
本文对时间序列的聚类方法进行了研究,提出了基于序列模糊相似性距离的聚类方法.在决定簇的融合时,使用簇之间的相对距离以消除序列的分布特征对聚类结果的影响,在聚类的开始阶段,使用随机选取的点形成初始化簇,减少了层次聚类初始簇的数目,提高了聚类效率.