大样本
大样本的相关文献在1982年到2022年内共计284篇,主要集中在预防医学、卫生学、内科学、自动化技术、计算机技术
等领域,其中期刊论文237篇、会议论文1篇、专利文献23883篇;相关期刊186种,包括数量经济技术经济研究、同济大学学报(自然科学版)、科技成果纵横等;
相关会议1种,包括中国数学会均匀设计分会第十届学术研讨会暨2009西安应用统计学术研讨会等;大样本的相关文献由683位作者贡献,包括袁志敏、骆清铭、龚辉等。
大样本—发文量
专利文献>
论文:23883篇
占比:99.01%
总计:24121篇
大样本
-研究学者
- 袁志敏
- 骆清铭
- 龚辉
- M.
- 刘丹
- 刘力生
- 奉国和
- 王文
- 王超
- 范贞
- 陈宇
- A.
- R.
- 付川
- 任晓峰
- 伍朝华
- 何坤金
- 兰国新
- 冯远静
- 刘基伟
- 刘运德
- 刘运德(校)
- 刘鹏
- 吴旷怀
- 周高盛
- 孔庆鹏
- 左子瑾
- 常小宇
- 弗罗里安·法尔巴赫
- 张宏
- 张帅
- 张揽月
- 张昊阳
- 张贵富
- 张静
- 张香燕
- 徐玮
- 方尔正
- 时洁
- 时胜国
- 曾庆润
- 朱中锐
- 朱思铭
- 朱新成
- 李其刚
- 李安安
- 李建南
- 李思琦
- 李思纯
- 李方洁
-
-
尚建敏;
张齐
-
-
摘要:
随着计算机行业的迅猛发展,人类社会逐渐迈入大数据时代。面对大规模右偏性和厚尾分布的数据,Gamma回归模型发挥着非常重要的作用。然而如何快速并准确估计出Gamma回归中感兴趣参数成为值得思考的热点问题。在本文中,我们提出两种两步算法分别有效地逼近Φ已知Gamma回归和Φ未知Gamma回归在全数据下的最大似然估计,从而解决了单参数与双参数大样本Gamma回归估计问题。首先在Φ已知情况下,可证明出在给定全数据下一般子抽样估计量渐近服从正态分布,推导出使估计量渐近均方误差最小的最优子抽样概率。为了进一步降低计算量,我们还提出了另一种最优子抽样概率。由于最优子抽样概率取决于未知参数,我们还提出了单参数两步算法。其次在Φ未知情况下,我们基于单参数两步算法提出了双参数两步算法。最后使用数值模拟表明两种算法的计算效率高,也证实了通过单参数两步算法得到的估计量与双参数两步算法得到的估计量差距不明显。
-
-
王蓉华;
顾蓓青;
刘金梅;
徐晓岭
-
-
摘要:
变异系数是衡量产品质量稳定性的一个重要指标,在实际应用中经常需要研究两种不同环境下变异系数的差异问题。文章在大样本场合给出了两个正态分布变异系数的差与商的近似置信区间、单侧近似置信下限与单侧近似置信上限的计算公式,这些公式计算简单,仅依赖于两个样本变异系数及样本容量,且Monte-Carlo模拟结果表明可以达到给出的置信水平。同时,通过几个算例可以为方法的应用提供参考。
-
-
徐礼文;
廖丹
-
-
摘要:
文章考虑了大样本下线性回归中同时进行快速估计和变量选择的问题,即针对一个存在稀疏解的大样本线性模型,根据重要性抽样分布从全数据集抽取少量子样本,对该子样本进行自适应Lasso估计。通过随机模拟研究,将该算法分别应用在几种不同的数据集中,并从模型预测精度和可解释性两个方面比较了四种子抽样方法在该算法下的表现。模拟结果表明,所提出的算法具有良好表现,在计算开销上也具有一定优势。
-
-
丁玮明
-
-
摘要:
基于大规模语音样本的声调分析软件在基础语音分析功能的同时,创造性地设计并实现了批量处理通过大容量词表调查获取的大量单音节词语音样本数据的程序,分析流程包括:音频载入、提取基频、确定声调段、筛选F0数据、数据预处理、数据归一化、调值估计、数据聚类,整个过程全自动运行。该方法的应用价值在于能够与广泛使用的小样本分析方法形成参照、有效地挖掘出声调系统细微的变异与演变信息、为音系整理工作提供些许便利。
-
-
温录亮;
陈平炎
-
-
摘要:
针对广义对数正态分布的参数估计问题,首次提出了广义对数正态分布形状参数一种新的强相合的点估计量,并给出推导证明过程。利用逆变换抽样方法对点估计量进行数值模拟,将点估计和极大似然估计、贝叶斯估计结果进行对比,结果表明这种点估计方法在进行相关大数据分布模型参数估计时,具有较好的应用价值。
-
-
陈宝;
黄春;
谢光毅;
付江华;
黄泽好
-
-
摘要:
就目前缺乏针对电动汽车性能进行评估的行驶工况,对电动汽车行驶工况构建方法展开研究。收集了成都市30辆电动汽车3个月的道路行驶数据,提取了8 599条运动学片段,采用主成分分析对特征参数降维处理,通过轮廓系数和肘部法确定聚类数目,并结合粒子群算法的全局搜索能力优化K均值聚类算法的聚类中心,构建了基于大样本、时长为1 502 s的电动汽车行驶工况。结果表明,构建的工况与样本数据库特征参数的相对误差不超过5%,平均相对误差为2.28%;与国内外城市行驶工况对比,存在较大差异,有必要对电动汽车行驶工况展开研究。
-
-
申罕骥;
付翔;
李俊
-
-
摘要:
传统基于日志的异常检测方法依赖于人工分析,适用于数据量小的系统,而对于复杂且庞大的日志系统,其检测效率往往很低,无法满足要求。随着机器学习的发展,检测手段发生了根本的转变,检测效率及性能也大幅提高。对于同一个日志系统,针对不同的日志预处理方法及机器学习算法,尤其对日志模板及特征的提取目前还没有统一的成熟模型,导致最后得到较大差异的检测准确率、性能等指标。本文基于监督学习方法提出大样本日志异常检测优化方法,将数据集进行日志解析得到精确的日志模板,再进行日志序列的向量化处理,使用逻辑回归监督学习算法进行分类训练与测试,结合不同的测试指标来选取最佳的参数,最终得到最优模型。实验结果证明,经此方法获取的模型能够达到较优的检测结果。
-
-
陈建生(文/图)
-
-
摘要:
天文学也要进行“人口”普查?天文史上最重要的照相巡天是哪两个?中国有哪些大视场、大样本数字化巡天计划?未来的天文巡天将如何发展?且听陈建生院士--讲述。天文学是一门观测科学,和其他科学一样,它有普查(巡天)观测和精细观测两种研究模式。普查(巡天)观测的任务是了解系统的整体性质,如整体的状态、分布、结构等性质及发现特殊天体;精测则是对典型成员或普查中发现的有趣天体进行深入的了解。
-
-
毕春宝;
张亚竹;
石少元;
郭亚祥;
黄军
-
-
摘要:
铁钢界面铁水温度对炼钢生产的控制与优化具有重要意义.因此,为了更加准确地获取铁钢界面铁水温度,本文采用较大样本构建了基于遗传算法(GA)优化的BP神经网络铁水温度预测模型.对影响铁钢界面铁水温度的因素分析,选取了出铁时间、预处理时间、重罐时间、空罐时间、出铁铁水温度、预处理后铁水温度、铁水质量7个关键因素作为模型的输入,铁钢界面铁水温度作为输出.结果表明:GA-BP神经网络预测模型具有较好的性能表现,绝对误差10°C范围内的预测命中率达到了89%,平均绝对百分比误差(MAPE)为0.39%,均方根误差(RMSE)为6.41°C.相比于BP神经网络预测铁钢界面铁水温度,GA-BP模型具有更高的精确度和稳定性.
-