过采样
过采样的相关文献在1986年到2023年内共计48309篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、电工技术
等领域,其中期刊论文535篇、会议论文17篇、专利文献47757篇;相关期刊282种,包括电声技术、电讯技术、电子学报等;
相关会议16种,包括2011年全国嵌入式仪表及系统技术会议、中国仪器仪表学会医疗仪器分会2010两岸四地生物医学工程学术年会、中国电子学会电路与系统学会第二十二届年会等;过采样的相关文献由50000位作者贡献,包括韩涛、韩德礼、不公告发明人等。
过采样—发文量
专利文献>
论文:47757篇
占比:98.86%
总计:48309篇
过采样
-研究学者
- 韩涛
- 韩德礼
- 不公告发明人
- 王鹏
- 张伟
- 李鹏
- 王磊
- 张涛
- 李强
- 张磊
- 刘洋
- 刘伟
- 李伟
- 王伟
- 刘强
- 李军
- 王强
- 陈涛
- 张强
- 李刚
- 王旭
- 张静
- 张鹏
- 王凯
- 刘涛
- 张凯
- 王军
- 李超
- 李明
- 其他发明人请求不公开姓名
- 陈益思
- 张辉
- 李勇
- 刘刚
- 张勇
- 张波
- 李娜
- 王宇
- 张超
- 陈刚
- 温吉利
- 刘杰
- 张斌
- 朱平
- 王超
- 陈杰
- 杨勇
- 王健
- 王浩
- 杨凯
-
-
-
邱灿华;
吴杰
-
-
摘要:
针对传统的合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)中存在的忽略类间不平衡、类内不平衡、无法控制合成样本的噪声等问题,结合DBSCAN聚类算法,提出了一种基于DBSCAN改进的SMOTE算法:使用DBSCAN算法对少数类样本进行聚类,计算少数类密度系数和采用权重为每个簇分配采样数量,将每个簇中样本点按照到簇质心的距离分为2类,对每类中的样本点分配不同的随机系数进行过采样,得到新的较为平衡的数据集。根据获取的数据集进行实验表明,改进的算法可以很好地改善分类器的分类性能。
-
-
李倩玉;
王蓓;
金晶;
张涛;
王行愚
-
-
摘要:
针对现阶段深度睡眠分期模型存在的梯度消失、对时序信息学习能力较弱等问题,提出一种基于双向长短时记忆卷积网络与注意力机制的自动睡眠分期模型。将少样本类别的睡眠脑电数据通过过采样方式进行数据增强后,利用带残差块的卷积神经网络学习数据特征表示,再通过带注意力层的双向长短时记忆网络挖掘深层时序信息,使用Softmax层实现睡眠分期的自动判别。实验使用Sleep-EDF数据集中19晚单通道脑电信号对模型进行交叉验证,取得了较高的分类准确率和宏平均F_(1)值,优于对比方法。该方法能够有效缓解睡眠分期判别中少数类分类性能较低的问题,并提高了深度睡眠分期模型的整体分类性能。
-
-
马汉达;
朱敏
-
-
摘要:
为了改善传统支持向量机SVM对不平衡数据集中少数类的分类效果,提出一种基于改进灰狼算法(IGWO)的过采样方法——IGWOSMOTE。首先,改进初始灰狼种群的生成形式,由SVM的惩罚因子、核参数、特征向量和少数类的采样率组成灰狼个体;然后,经由灰狼优化过程智能搜索获得最优相关参数和最优采样率组合,进行重新采样供分类器学习及预测。通过对6个UCI数据集的分类实验得出:IGWOSMOTE+SVM较传统SMOTE+SVM方法在少数类分类精度上提高了6.3个百分点,在整体数据集分类精度上提高了2.1个百分点,IGWOSMOTE可作为一种新的过采样分类方法。
-
-
黄学颖;
刘永阔;
单龙飞
-
-
摘要:
由于小样本不平衡数据的存在,对核电厂故障诊断准确率造成极大的影响,针对核电厂小样本不平衡的问题,文中提出一种合成少数类过采样技术(SMOTE)与长短期记忆(LSTM)深度神经网络相结合的算法进行核电厂小样本不平衡故障诊断,实验结果表明采用该方法进行故障诊断具有很高的诊断准确率。
-
-
周晶雨;
王士同
-
-
摘要:
多源在线迁移学习已经广泛地应用于相关源域中含有大量的标记数据且目标域中数据以数据流的形式达到的应用中。然而,目标域的类别分布有时是不平衡的,针对目标域每次以在线方式到达多个数据的不平衡二分类问题,本文提出了一种可以对目标域样本过采样的多源在线迁移学习算法。该算法从前面批次的样本中寻找当前批次的样本的k近邻,先少量生成多数类样本,再生成少数类使得当前批次样本的类别分布平衡。每个批次合成样本和真实样本一同训练目标域函数,从而提升目标域函数的分类性能。同时,分别设计了在目标域的输入空间和特征空间过采样的方法,并且在多个真实世界数据集上进行了综合实验,证明了所提出算法的有效性。
-
-
贾建波;
孙师贤;
尚捷;
丁旭东;
吉玲
-
-
摘要:
传统永磁同步电机相电流重构技术在每个PWM周期内由于不同相电流采样的不同步性,会产生采样相位误差,进而对电机整体控制性能产生不利影响。在分析上述相位误差的基础上,基于传统直流母线采样方法提出了一种电流过采样策略。通过在每个PWM周期的对称采样点分别进行一次采样并取均值的方式得到该控制周期内的相电流信息,同时利用一阶保持器估计电流控制点处的电流以消除采样相位误差。实验结果证明所提出的方法能够提高相电流重构精度,具有较好的降低相电流重构技术采样相位误差效果。
-
-
江昊琛;
魏子麒;
刘璘;
陈俊
-
-
摘要:
近年来,人工智能技术被广泛地应用于多个领域。其中,智慧医疗场景得到了普遍关注,并产生了大量临床辅助诊断和医疗方案推荐的实际应用。然而,由于人工智能技术的本质在于通过从大量真实数据中进行模式抽取,从而预测未知情况,因此真实数据的数据特征和数据质量将直接影响人工智能应用的效果。相比其他智能应用领域,由于罕见病患者在人群中总是占极少数,医疗数据具有天然的非均衡的特点,而高度非均衡的数据在机器学习领域被认为是难于学习的。针对这一应用现状,文中首先围绕"数据非均衡"问题开展了文献调研,尝试通过寻找该问题的通用解决办法来指导在智慧医疗环境下的应用。之后,以数据挖掘领域的会议SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)近年来涉及非均衡数据集的工作为分析样本,统计针对特定领域的"数据非均衡"问题人们倾向选择的处理方法。最后,通过医学数据分析中的两个典型应用场景,对调研获得的知识和方法进行实验应用,从而验证了调研和统计分析中所得出方法的可用性。
-
-
崔鑫;
徐华;
朱亮
-
-
摘要:
为解决不均衡多分类问题,提出了一种基于采样和特征选择的不均衡数据集成分类算法(IDESF)。基分类器的多样性会影响集成算法的分类性能,所以IDESF算法对数据集进行有放回采样+SMOTE的两阶段采样。两阶段采样在保证所得数据集中样本合理性的基础上,增加数据集间的差异性以此隐式地提高基分类器的多样性。两阶段采样同样可以平衡数据分布,防止分类器偏向多数类。在两阶段采样的基础上,IDESF算法引入了数据清洗和特征选择方法,试图进一步提高算法的分类性能。与其他不均衡分类算法在5组不均衡数据集上进行了对比实验,结果表明该算法可以获得较高的AUCarea和G-Mean值,具有较为优异的分类效果。
-
-
丁胜夺;
赵刚;
阎红巧;
刘洪太
-
-
摘要:
针对数据分类预测模型的生成中,高度不平衡的训练数据会大幅降低模型的性能,本文提出了一种改进的基于遗传思想的不平衡数据集过采样方法,该方法从生物染色体遗传理论中得到启发,利用近亲生成相似而又不完全相同的新实例来平衡多数类,在保证样本分布不变的前提下,减弱甚至消除不平衡数据对训练结果的偏差影响.最后,通过在公共数据集上的对比实验表明,该方法取得了更高的召回率及G-mean值,证明此改进方法行之有效,所生成模型的综合性能有所提高.
-
-
林凌;
刘近贞;
张昊;
周梅;
李刚
- 《2011年全国嵌入式仪表及系统技术会议》
| 2011年
-
摘要:
提出一种新型的生物电放大器,巧妙地利用成形信号,不仅提高了过采样性能,还实现了多种生物医学信息的检测;文章以心电信号为例,同步检测了呼吸和导联脱落信号.实验表明该电路不仅能够满足人体生物医学信号动态监测的要求,还具有工艺性好、免调试、时器件性能要求低等一系列优点.该电路不仅可以用于生物电信号的检测,也可用于各种微弱信号的检测.
-
-
-
-
-
-
-
-
-
张小莉
- 《第三届全国虚拟仪器学术交流大会》
| 2009年
-
摘要:
本文在介绍∑-△ADC技术的基础上,论述了微波功率计中对噪声和干扰进行抑制的必要性,探索了一种小信号处理技术,着重描述了过采样技术、∑-△调制技术以及数字滤波和抽取技术,SD1877就是采用了∑-△技术的系列ADC之一,本文中介绍的微波功率计采用了AD1877进行模数转换,配合其它的一系列小信号处理技术,成功获得了87dB的动态范围,能够很好的满足微波功率测鼍的需求。
-