特征权重
特征权重的相关文献在2004年到2022年内共计206篇,主要集中在自动化技术、计算机技术、中国少数民族语言、无线电电子学、电信技术
等领域,其中期刊论文138篇、会议论文11篇、专利文献62536篇;相关期刊83种,包括人天科学研究、现代图书情报技术、电子学报等;
相关会议11种,包括第六届全国青年计算语言学会议、中国科学院声学研究所第四届青年学术交流会、第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会等;特征权重的相关文献由552位作者贡献,包括彭勇、焦李成、陈黎飞等。
特征权重—发文量
专利文献>
论文:62536篇
占比:99.76%
总计:62685篇
特征权重
-研究学者
- 彭勇
- 焦李成
- 陈黎飞
- 万曙静
- 严爱军
- 于渤
- 付海涛
- 任海涛
- 何利力
- 何清林
- 何跃鹰
- 冯成刚
- 冯洋
- 刘中金
- 刘丹
- 刘兵
- 刘娟
- 刘宇
- 刘洋
- 刘海峰
- 刘群
- 台德艺
- 叶章明
- 吴凡
- 吴涛
- 吴燕玲
- 吴陈
- 周宇
- 姬波
- 孔凡淇
- 宋亮
- 左万利
- 张怿恺
- 张永霞
- 张淑婷
- 张红涛
- 张静川
- 徐俊
- 支晓斌
- 朱琦
- 李大威
- 李峰
- 李晴熙
- 李淑英2
- 李璐
- 李茹
- 杨宇航
- 杨路
- 杨风暴
- 林俊光
-
-
严爱军;
丁凯
-
-
摘要:
针对案例推理(case-based reasoning, CBR)检索过程中特征权重的分配结果直接影响CBR预测模型性能的问题,提出了一种基于自私牧群优化-模拟退火(selfish herd optimizer-simulated annealing, SHO-SA)算法的特征权重优化分配方法.首先,将CBR预测模型的均方根误差定义为SHO算法和SA算法中权重寻优的适应度;然后,通过SHO算法的牧群运动、捕食及恢复等步骤得到种群内最小均方根误差所对应的权重;最后,采用SA算法对上述权重进行随机搜索,从而获得特征权重的近似最优解.采用加州大学欧文分校(University of California Irvine, UCI)数据集中的5个标准回归数据集进行实验,结果表明该方法与一些典型的优化方法相比可以显著提高CBR预测模型的精度,说明SA算法能够改善SHO算法陷入局部最优的问题.
-
-
李大伟;
范荣双;
王崇兵;
贺亚杰;
任伟
-
-
摘要:
针对多特征参数分析地磁适配性时,易存在重复表征现象的问题,提出利用因子分析法提取主要特征参数;对于因子分析法单一采用累积方差贡献率作为权重在评价过程中不充分不全面的问题,提出熵值法结合因子分析法的方差贡献率对所提取的公共因子进行赋权,最后将权重与因子得分进行线性组合求得综合评价值。综合评价值越大,候选匹配区的适配性越好,以此分析出适配性较好的候选匹配区,为后期地磁匹配做准备。为验证所提方法的有效性,利用地磁匹配算法对各个候选匹配区进行匹配验证,其结果表明:利用因子分析法得出的结果与利用地磁匹配算法得出的结果一致,表明利用因子分析法对地磁基准图候选区域适配性进行分析是可行的。
-
-
江雨燕;
邵金;
李平
-
-
摘要:
子空间聚类算法是一种面向高维数据的聚类方法,具有独特的数据自表示方式和较高的聚类精度。传统子空间聚类算法聚焦于对输入数据构建最优相似图再进行分割,导致聚类效果高度依赖于相似图学习。自适应近邻聚类(CAN)算法改进了相似图学习过程,根据数据间的距离自适应地分配最优邻居以构建相似图和聚类结构。然而,现有CAN算法在进行高维数据非线性聚类时,难以很好地捕获局部数据结构,从而导致聚类准确性及算法泛化能力有限。提出一种融合自动权重学习与结构化信息的深度子空间聚类算法。通过自编码器将数据映射到非线性潜在空间并降维,自适应地赋予潜在特征不同的权重从而处理噪声特征,最小化自编码器的重构误差以保留数据的局部结构信息。通过CAN方法学习相似图,在潜在表示下迭代地增强各特征间的相关性,从而保留数据的全局结构信息。实验结果表明,在ORL、COIL-20、UMIST数据集上该算法的准确率分别达到0.7801、0.8743、0.7421,聚类性能优于LRR、LRSC、SSC、KSSC等算法。
-
-
戴兴;
刘永坚;
解庆;
刘平峰
-
-
摘要:
针对协同过滤算法在为用户商品相关性建模时未考虑用户/商品对特征属性的不同关注度及不可解释性问题,提出基于特征权重与情感偏好的可解释推荐算法。利用评论中抽取的特征及对应情感设计用户商品的表征,根据TF-IDF算法确定其重要性,将其加入相关性建模中;在评分预测时引入贝叶斯个性化排序减小评分误差;在生成推荐的同时,提供特征短语级别的解释。实验结果表明,对比现有模型,该模型均方根误差平均降低了3.62%,最大降低了4.93%。
-
-
王浩伟;
王照利;
杨佳乐;
段梦琦
-
-
摘要:
机载激光雷达技术为获取高时空分辨率的空间信息提供了新的解决方法,近年来被应用于森林资源规划设计与调查,通过空间点云数据提取林木特征,并在此基础上推演出相关林分因子。以陕西省安康市岚皋县国营林场中部分天然林为研究对象,在利用机载激光雷达点云数据进行森林资源调查时,通过对不同特征变量在不同林分因子模型反演中重要程度的分析,利用特征权重评估特征变量的贡献值,并以此为依据筛选出优秀的核心特征子集,采用随机森林算法对研究区蓄积量、林分平均高以及株数进行回归预测。实验结果表明该方法具有较优的拟合精度及较小的相对均方误差,且对不同密度下的点云数据均具有较高的稳定性。
-
-
张翼英;
王鹏凯;
柳依阳;
武延年;
郭晓艳
-
-
摘要:
针对光通信设备在多工况条件下由于健康状态的不确定性导致难以及时发现运行异常的问题,对基于监控日志数据量化分析的设备异常检测方法进行研究,提出了基于加权线性修正函数(W-ReLU)的设备多工况状态异常检测方法.首先采用滑动时间窗口机制对告警日志进行划分,并根据每条日志的类型,将日志子集表征为日志特征向量;然后对健康状态下的样本点进行密度峰值聚类分析,以构建设备的基准健康状态矩阵;最后采用W-ReLU非线性映射模型量化评估设备的异常度,并据此进行异常检测.结果表明,与现有的相似性度量方法相比,该方法具有更高的准确率和稳定性.
-
-
叶彪;
李琳;
丁应;
宋荆汉;
万振华
-
-
摘要:
近年来由于计算机和人们的工作生活结合得更加紧密,为保障信息安全,恶意软件分类的重要性与日俱增,但是现有的恶意软件分类方法大多都存在模型复杂、耗费时间长以及效果不突出等困境。为提高恶意软件分类效率,提出一个结合特征提取和卷积神经网络的恶意软件分类框架。针对目前恶意软件分类算法准确率低、处理时间慢等问题,引入并改进了NLP领域中的一种特征权重算法。通过计算操作码的特征权重,选取具有较大信息增益的操作码作为特征词,然后提取恶意样本的特征图,最后传入卷积神经网络进行训练和分类。实验结果表明,该方法在big2015数据集上的准确率为99.26%,比基于TFIDF特征提取的方法略好,接近该数据集上的冠军方法,在不均衡类别上的分类表现优于基于频率的特征词选择的提取算法,并且在预处理时间上短于其他方法。
-
-
姜雪
-
-
摘要:
为了降低高维特征空间的维度,从高维特征空间中选择最优特征子集作为检索特征,并合理设置检索特征的权重,使得最优检索特征能够有效融合,运用遗传算法进行自适应特征选择和权重设置.实验数据表明,运用遗传算法进行特征选择和权重设置,提高了图像检索的精度.
-
-
高庆芳;
蒲宝卿;
包蕾
-
-
摘要:
为了解决传统的基于上下文图形爬行模型爬取效率低、特征词提取不精确的问题,本文采用了在现有的技术支持上,融入机器学习算法的思想,设计并实现了一种改进的基于主题的爬虫算法,结果表明该算法是有效的.
-
-
蔡瑞光;
张德生;
肖燕婷
-
-
摘要:
针对局部均值伪近邻(LMPNN)算法对k值敏感且忽略了每个属性对分类结果的不同影响等问题,提出了一种参数独立的加权局部均值伪近邻分类(PIW-LMPNN)算法.首先,利用差分进化算法的最新变体——基于成功历史记录的自适应参数差分进化(SHADE)算法对训练集样本进行优化,从而得到最佳k值和一组与类别相关的最佳权重;其次,计算样本间的距离时赋予每类的每个属性不同的权重,并对测试集样本进行分类.在15个实际数据集上进行了仿真实验,并把所提算法与其他8种分类算法进行了比较,实验结果表明,所提算法的分类准确率和F1值分别最大提高了约28个百分点和23.1个百分点;同时Wilcoxon符号秩检验、Friedman秩方差检验以及Hollander-Wolfe两处理的比较结果表明,所提出的改进算法在分类精度以及k值选择方面相较其他8种分类算法具有明显优势.
-
-
缪建明;
张全
- 《中国科学院声学研究所第四届青年学术交流会》
| 2012年
-
摘要:
特征权重是文本分类中分类计算的核心,对文本分类的效果有着重要的影响。现阶段特征权重计算中广泛采用TF*IDF方法,但这种方法忽略了特征项语义之间的关联性对权重的影响。针对该问题,提出了一种新的特征向量权重计算方法(TF*IDF*CIV),引入语义概念信息量CIV作为一个变量考虑在权重的计算过程中。实验结果表明,该算法是有效可行的,且在一定程度上提高了文本分类的正确率、召回率。
-
-
陈新泉
- 《2009年全国理论计算机科学学术年会》
| 2009年
-
摘要:
应用决策树方法采获取混合属性数据点集的"规则聚类区域",利用"异类子聚类相离,同类子聚类相近"的原则来交替优化有序属性和无序属性的权重,提出了基于决策树划分的特征权重优化方法.该方法在一定程度上解决了有效获取数据子集的子聚类问题和混合属性数据点集的特征权重优化难题.仿真实验表明,该方法在优化混合属性数据点集的特征权重时是有效的.
-
-
-
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
本文在SVM和多特征融合的基础上提出了一种自适应特征权重调节的图像分类算法,该方法首先在单个特征上分别构建分类器,然后根据训练样本集自动学习各个特征的权重系数,最后利用特征权重系数将单个特征上的分类器组合成一个复杂的分类器.实验结果表明.与一般方法相比,该方法对图像分类的性能有一定的改善,且具有一定的自适应和调节能力.此外,该算法避免了各个特征量纲不同所带来的负面影响,有一定的鲁棒性.
-
-
王辉;
左万利;
袁华
- 《第二届中国分类技术及应用学术会议》
| 2007年
-
摘要:
针对传统的TFIDF模型计算根集(root set)文档特征权重的不适应性,提出了计算文档特征权重的新方法--TFIDF-2模型.另外,给出3种启发式规则用于获取根集文档的质心向量.通过计算文档与质心之间的相似度进行文本分类只是质心的一个初步应用.在这个过程中,提出了一种计算文档与质心之间相似度的新方法.通过一系列的对比实验,分析验证了此种分类方法比传统的分类算法更准确、更高效.最后,验证了将本体与质心相结合提取未标识数据集中相关文档的有效性。
-
-
-
任函;
何婷婷
- 《全国第八届计算语言学联合学术会议》
| 2005年
-
摘要:
文本分类是自然语言处理的应用领域中比较重要的一个部分.为了适应因特网上大规模在线文本的分类要求,提出一种过滤网页噪音数据的方法,并使用基于词的类权重模式,将词放在类别中进行考虑,加强类别中文本之间的相互联系,扩大不同类别的文档的区别特征,提高分类的精确度.经实验证明,该方法与传统的词特征权重计算方法相比,具有较高的分类精确度,同时保持了较低的计算成本,符合大规模在线文本自动分类的需要.
-
-
李文;
李淼;
张建;
陈雷;
雪艳
- 《第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会》
| 2010年
-
摘要:
本文以两种黏着语维吾尔语和蒙古语为研究对象,介绍了基于最大后验概率模型非监督式形态切分方法。该模型是以最小描述长度原理为基础,视形态丰富的语言为词素编码的文本序列。形态切分实质则是由蒙古语的文本序列找到一个词素集合,且要求该集合能够高效的对形态丰富文本语料进行编码。然而最大后验概率模型无法根据特定的语言进行调整,鉴于此本文提出在最大后验概率的基础上加入权值参数,并采用少量人工切分的语料进行参数调整的方法。实验显示,最大后验概率模型可以较好的对维吾尔语和蒙古语进行形态切分,加入权重参数后,模型能更好够适特定的语言,使切分准确率、召回率和F值均有了进一步的提高。