您现在的位置: 首页> 研究主题> 特征权重

特征权重

特征权重的相关文献在2004年到2022年内共计206篇,主要集中在自动化技术、计算机技术、中国少数民族语言、无线电电子学、电信技术 等领域,其中期刊论文138篇、会议论文11篇、专利文献62536篇;相关期刊83种,包括人天科学研究、现代图书情报技术、电子学报等; 相关会议11种,包括第六届全国青年计算语言学会议、中国科学院声学研究所第四届青年学术交流会、第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会等;特征权重的相关文献由552位作者贡献,包括彭勇、焦李成、陈黎飞等。

特征权重—发文量

期刊论文>

论文:138 占比:0.22%

会议论文>

论文:11 占比:0.02%

专利文献>

论文:62536 占比:99.76%

总计:62685篇

特征权重—发文趋势图

特征权重

-研究学者

  • 彭勇
  • 焦李成
  • 陈黎飞
  • 万曙静
  • 严爱军
  • 于渤
  • 付海涛
  • 任海涛
  • 何利力
  • 何清林
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 严爱军; 丁凯
    • 摘要: 针对案例推理(case-based reasoning, CBR)检索过程中特征权重的分配结果直接影响CBR预测模型性能的问题,提出了一种基于自私牧群优化-模拟退火(selfish herd optimizer-simulated annealing, SHO-SA)算法的特征权重优化分配方法.首先,将CBR预测模型的均方根误差定义为SHO算法和SA算法中权重寻优的适应度;然后,通过SHO算法的牧群运动、捕食及恢复等步骤得到种群内最小均方根误差所对应的权重;最后,采用SA算法对上述权重进行随机搜索,从而获得特征权重的近似最优解.采用加州大学欧文分校(University of California Irvine, UCI)数据集中的5个标准回归数据集进行实验,结果表明该方法与一些典型的优化方法相比可以显著提高CBR预测模型的精度,说明SA算法能够改善SHO算法陷入局部最优的问题.
    • 李大伟; 范荣双; 王崇兵; 贺亚杰; 任伟
    • 摘要: 针对多特征参数分析地磁适配性时,易存在重复表征现象的问题,提出利用因子分析法提取主要特征参数;对于因子分析法单一采用累积方差贡献率作为权重在评价过程中不充分不全面的问题,提出熵值法结合因子分析法的方差贡献率对所提取的公共因子进行赋权,最后将权重与因子得分进行线性组合求得综合评价值。综合评价值越大,候选匹配区的适配性越好,以此分析出适配性较好的候选匹配区,为后期地磁匹配做准备。为验证所提方法的有效性,利用地磁匹配算法对各个候选匹配区进行匹配验证,其结果表明:利用因子分析法得出的结果与利用地磁匹配算法得出的结果一致,表明利用因子分析法对地磁基准图候选区域适配性进行分析是可行的。
    • 江雨燕; 邵金; 李平
    • 摘要: 子空间聚类算法是一种面向高维数据的聚类方法,具有独特的数据自表示方式和较高的聚类精度。传统子空间聚类算法聚焦于对输入数据构建最优相似图再进行分割,导致聚类效果高度依赖于相似图学习。自适应近邻聚类(CAN)算法改进了相似图学习过程,根据数据间的距离自适应地分配最优邻居以构建相似图和聚类结构。然而,现有CAN算法在进行高维数据非线性聚类时,难以很好地捕获局部数据结构,从而导致聚类准确性及算法泛化能力有限。提出一种融合自动权重学习与结构化信息的深度子空间聚类算法。通过自编码器将数据映射到非线性潜在空间并降维,自适应地赋予潜在特征不同的权重从而处理噪声特征,最小化自编码器的重构误差以保留数据的局部结构信息。通过CAN方法学习相似图,在潜在表示下迭代地增强各特征间的相关性,从而保留数据的全局结构信息。实验结果表明,在ORL、COIL-20、UMIST数据集上该算法的准确率分别达到0.7801、0.8743、0.7421,聚类性能优于LRR、LRSC、SSC、KSSC等算法。
    • 戴兴; 刘永坚; 解庆; 刘平峰
    • 摘要: 针对协同过滤算法在为用户商品相关性建模时未考虑用户/商品对特征属性的不同关注度及不可解释性问题,提出基于特征权重与情感偏好的可解释推荐算法。利用评论中抽取的特征及对应情感设计用户商品的表征,根据TF-IDF算法确定其重要性,将其加入相关性建模中;在评分预测时引入贝叶斯个性化排序减小评分误差;在生成推荐的同时,提供特征短语级别的解释。实验结果表明,对比现有模型,该模型均方根误差平均降低了3.62%,最大降低了4.93%。
    • 王浩伟; 王照利; 杨佳乐; 段梦琦
    • 摘要: 机载激光雷达技术为获取高时空分辨率的空间信息提供了新的解决方法,近年来被应用于森林资源规划设计与调查,通过空间点云数据提取林木特征,并在此基础上推演出相关林分因子。以陕西省安康市岚皋县国营林场中部分天然林为研究对象,在利用机载激光雷达点云数据进行森林资源调查时,通过对不同特征变量在不同林分因子模型反演中重要程度的分析,利用特征权重评估特征变量的贡献值,并以此为依据筛选出优秀的核心特征子集,采用随机森林算法对研究区蓄积量、林分平均高以及株数进行回归预测。实验结果表明该方法具有较优的拟合精度及较小的相对均方误差,且对不同密度下的点云数据均具有较高的稳定性。
    • 张翼英; 王鹏凯; 柳依阳; 武延年; 郭晓艳
    • 摘要: 针对光通信设备在多工况条件下由于健康状态的不确定性导致难以及时发现运行异常的问题,对基于监控日志数据量化分析的设备异常检测方法进行研究,提出了基于加权线性修正函数(W-ReLU)的设备多工况状态异常检测方法.首先采用滑动时间窗口机制对告警日志进行划分,并根据每条日志的类型,将日志子集表征为日志特征向量;然后对健康状态下的样本点进行密度峰值聚类分析,以构建设备的基准健康状态矩阵;最后采用W-ReLU非线性映射模型量化评估设备的异常度,并据此进行异常检测.结果表明,与现有的相似性度量方法相比,该方法具有更高的准确率和稳定性.
    • 叶彪; 李琳; 丁应; 宋荆汉; 万振华
    • 摘要: 近年来由于计算机和人们的工作生活结合得更加紧密,为保障信息安全,恶意软件分类的重要性与日俱增,但是现有的恶意软件分类方法大多都存在模型复杂、耗费时间长以及效果不突出等困境。为提高恶意软件分类效率,提出一个结合特征提取和卷积神经网络的恶意软件分类框架。针对目前恶意软件分类算法准确率低、处理时间慢等问题,引入并改进了NLP领域中的一种特征权重算法。通过计算操作码的特征权重,选取具有较大信息增益的操作码作为特征词,然后提取恶意样本的特征图,最后传入卷积神经网络进行训练和分类。实验结果表明,该方法在big2015数据集上的准确率为99.26%,比基于TFIDF特征提取的方法略好,接近该数据集上的冠军方法,在不均衡类别上的分类表现优于基于频率的特征词选择的提取算法,并且在预处理时间上短于其他方法。
    • 姜雪
    • 摘要: 为了降低高维特征空间的维度,从高维特征空间中选择最优特征子集作为检索特征,并合理设置检索特征的权重,使得最优检索特征能够有效融合,运用遗传算法进行自适应特征选择和权重设置.实验数据表明,运用遗传算法进行特征选择和权重设置,提高了图像检索的精度.
    • 高庆芳; 蒲宝卿; 包蕾
    • 摘要: 为了解决传统的基于上下文图形爬行模型爬取效率低、特征词提取不精确的问题,本文采用了在现有的技术支持上,融入机器学习算法的思想,设计并实现了一种改进的基于主题的爬虫算法,结果表明该算法是有效的.
    • 蔡瑞光; 张德生; 肖燕婷
    • 摘要: 针对局部均值伪近邻(LMPNN)算法对k值敏感且忽略了每个属性对分类结果的不同影响等问题,提出了一种参数独立的加权局部均值伪近邻分类(PIW-LMPNN)算法.首先,利用差分进化算法的最新变体——基于成功历史记录的自适应参数差分进化(SHADE)算法对训练集样本进行优化,从而得到最佳k值和一组与类别相关的最佳权重;其次,计算样本间的距离时赋予每类的每个属性不同的权重,并对测试集样本进行分类.在15个实际数据集上进行了仿真实验,并把所提算法与其他8种分类算法进行了比较,实验结果表明,所提算法的分类准确率和F1值分别最大提高了约28个百分点和23.1个百分点;同时Wilcoxon符号秩检验、Friedman秩方差检验以及Hollander-Wolfe两处理的比较结果表明,所提出的改进算法在分类精度以及k值选择方面相较其他8种分类算法具有明显优势.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号