K近邻
K近邻的相关文献在1992年到2023年内共计847篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、公路运输
等领域,其中期刊论文586篇、会议论文11篇、专利文献1043篇;相关期刊276种,包括科学技术与工程、电子学报、电脑知识与技术等;
相关会议11种,包括第十届全国科技评价学术研讨会、2010年中国通信国际会议、第27届中国数据库学术会议等;K近邻的相关文献由2308位作者贡献,包括李元、张成、冯立伟等。
K近邻
-研究学者
- 李元
- 张成
- 冯立伟
- 周哲
- 文成林
- 董天阳
- 于自强
- 刘洋
- 张化祥
- 杨春节
- 王爽
- 翟俊海
- 苑露露
- 郭青秀
- 陈红
- 吴飞
- 周牧
- 孙丽萍
- 尚志刚
- 张向荣
- 曾菊儒
- 李翠平
- 李锋
- 欧阳元新
- 江俊君
- 焦李成
- 熊璋
- 王婷婷
- 王晓明
- 王栋
- 王波涛
- 胡瑞敏
- 范明
- 谢彦红
- 郭小芳
- 郭小萍
- 郭良敏
- 陈亮
- 韩士元
- 马坤
- 马文萍
- 马晶晶
- 马盈仓
- 于戈
- 侯谨毅
- 倪巍伟
- 凌能祥
- 刘丽
- 吴会会
- 吴双
-
-
李强;
赵尚上;
李胜广
-
-
摘要:
风险评估是当今社会各个行业都会涉及到的一个基础课题。在传统的风险评估算法研究中,大多关注风险点的前期事件和相关风险的前瞻,大部分认知风险是由日积月累的多种行为、特征组成。在公安监所人员风险评估工作中,人员风险也在日益的变化,通过暴力、健康、脱逃、自杀、心理、闹监六个维度对在押人员进行风险评估计算,并通过机器学习相关技术,进行特征提取和风险值计算,利用基于半监督机器学习框架支持向量机、K近邻、随机森林三种机器学习模型框架,训练六种机器学习数据模型,并随着监管数据的不断更新,模型也随之迭代,使预测的风险值更加准确。
-
-
郭小萍;
俞巷天;
李元
-
-
摘要:
针对现代工业过程的非线性和多分布问题,提出一种基于Jarque-Bera test的故障检测方法。首先,对标准化后的原始数据进行Jarque-Bera test,将变量划分为两个部分;其次,对所有的JB统计量做-ln处理,并采用正态置信概率权值进一步划分,从而使原始变量空间划分为正态和非正态分布的两个子空间;再次,在两个子空间分别基于KPCA和kNN算法提取过程的非线性特征,建立故障检测模型;最后,通过数值案例和TE过程仿真实验验证了所提方法的有效性。
-
-
钱龙;
赵静;
韩京宇;
毛毅
-
-
摘要:
多标签学习是机器学习领域的一个研究热点,其能够有效解决真实世界中的多语义问题。在多标签学习任务中,样本的多个标签之间存在一定的关联关系,忽略标签间的相关性会导致模型的泛化性能降低。提出一种基于标签间相关性的多标签学习K近邻算法。充分挖掘样本多标签间的相关性,通过Fp_growth算法得到标签的频繁项集。针对频繁项和标签分别构建评分模型和阈值模型,评分模型用于衡量样本与频繁项或标签之间的关联程度,阈值模型用于求解频繁项或标签对应的判别阈值,结合评分模型和阈值模型对样本所属频繁项进行预测,进而确定样本标签集。在经典数据集Emotions和Scene上的实验结果表明,该算法的F1-Measure指标分别达到66.6%和73.3%,相比CC、LP、RAKEL、MLDF等基准方法,其F1-Measure分别平均提高3.8和2.1个百分点,该算法通过合理利用标签间的相关性使得分类性能得到有效提升。
-
-
苗登逢;
肖跃雷
-
-
摘要:
为了从移动终端位置数据中精准识别居民职住地,提出了一种基于时空约束密度聚类的职住地识别方法。首先,利用基于K-means的DBSCAN(density-based spatial clustering of applications with noise)时空驻点聚类过程将居民多天的原始轨迹点分成不同的时空驻点簇;然后,利用基于速度阈值的停留点簇和移动点簇识别过程将居民的每一个时空驻点簇区分为停留点簇或移动点簇;接着,利用基于K近距离的DBSCAN重要停留点聚类过程将居民的停留点分成不同的重要停留点簇;最后,利用基于KD-tree优化的KNN(K-nearest neighbor)职住地识别过程将居民的每个重要停留点识别为工作地、居住地、职住同一区域或兴趣地点区域。实验结果表明,该方法的每个过程都是合理有效的,并且最终的职住地识别效果要优于时间阈值法、累加时间法和信息熵法。
-
-
周欢欢;
郑伯川;
张征;
张琦
-
-
摘要:
针对基于共享最近邻的密度峰聚类算法中的近邻参数需要人为设定的问题,提出了一种基于自适应近邻参数的密度峰聚类算法。首先,利用所提出的近邻参数搜索算法自动获得近邻参数;然后,通过决策图选取聚类中心;最后,根据所提出的代表点分配策略,先分配代表点,后分配非代表点,从而实现所有样本点的聚类。将所提出的算法与基于共享最近邻的快速密度峰搜索聚类(SNN-DPC)、基于密度峰值的聚类(DPC)、近邻传播聚类(AP)、对点排序来确定聚类结构(OPTICS)、基于密度的噪声应用空间聚类(DBSCAN)和K-means这6种算法在合成数据集以及UCI数据集上进行聚类结果对比。实验结果表明,所提出的算法在调整互信息(AMI)、调整兰德系数(ARI)和FM指数(FMI)等评价指标上整体优于其他6种算法。所提算法能自动获得有效的近邻参数,且能较好地分配簇边缘区域的样本点。
-
-
莫少慧;
古兰拜尔·吐尔洪;
买日旦·吾守尔
-
-
摘要:
针对传统的方法未能有效地处理具有高维、混合以及不平衡的特性的入侵检测数据,结合单类分类概念和均值计算方法,提出一种单类分类K近邻(KNN)均值算法。其使用主成分分析混合(PCA mix)方法对高维混合数据进行降维预处理,并运用Bootstrap方法计算决策边界,提高准确性。通过使用三个不同的公开数据集进行实验,并与单类分类支持向量机(OCSVM)算法作对比,其分辨精度提高至94%以上,充分验证了提出算法的优越性。
-
-
周晶雨;
王士同
-
-
摘要:
多源在线迁移学习已经广泛地应用于相关源域中含有大量的标记数据且目标域中数据以数据流的形式达到的应用中。然而,目标域的类别分布有时是不平衡的,针对目标域每次以在线方式到达多个数据的不平衡二分类问题,本文提出了一种可以对目标域样本过采样的多源在线迁移学习算法。该算法从前面批次的样本中寻找当前批次的样本的k近邻,先少量生成多数类样本,再生成少数类使得当前批次样本的类别分布平衡。每个批次合成样本和真实样本一同训练目标域函数,从而提升目标域函数的分类性能。同时,分别设计了在目标域的输入空间和特征空间过采样的方法,并且在多个真实世界数据集上进行了综合实验,证明了所提出算法的有效性。
-
-
孙林;
秦小营;
徐久成;
薛占熬
-
-
摘要:
密度峰值聚类(density peak clustering,DPC)是一种简单有效的聚类分析方法.但在实际应用中,对于簇间密度差别大或者簇中存在多密度峰的数据集,DPC很难选择正确的簇中心;同时,DPC中点的分配方法存在多米诺骨牌效应.针对这些问题,提出一种基于K近邻(K-nearest neighbors,KNN)和优化分配策略的密度峰值聚类算法.首先,基于KNN、点的局部密度和边界点确定候选簇中心;定义路径距离以反映候选簇中心之间的相似度,基于路径距离提出密度因子和距离因子来量化候选簇中心作为簇中心的可能性,确定簇中心.然后,为了提升点的分配的准确性,依据共享近邻、高密度最近邻、密度差值和KNN之间距离构建相似度,并给出邻域、相似集和相似域等概念,以协助点的分配;根据相似域和边界点确定初始聚类结果,并基于簇中心获得中间聚类结果.最后,依据中间聚类结果和相似集,从簇中心到簇边界将簇划分为多层,分别设计点的分配策略;对于具体层次中的点,基于相似域和积极域提出积极值以确定点的分配顺序,将点分配给其积极域中占主导地位的簇,获得最终聚类结果.在11个合成数据集和27个真实数据集上进行仿真实验,与最新的基于密度峰值的聚类算法作对比,结果表明:所提算法在纯度、F度量、准确度、兰德系数、调整兰德系数和标准互信息上均表现出良好的聚类性能.
-
-
李元;
耿焱;
冯立伟
-
-
摘要:
针对复杂工业过程数据的动态性、非线性和多阶段性等特征,提出基于时空近邻标准化和KNN规则(Time-Space Nearest Neighborhood Standardization and K Nearest Neighbor Rule,TSNS-KNN)的复杂多阶段过程故障检测方法。首先使用训练样本在时间和空间域上的两层嵌套近邻集的统计信息对样本预处理,然后将标准样本的累积近邻距离作为检测统计量进行故障检测。TSNS-KNN在排除非线性干扰的同时,消除了前后时刻样本间的动态相关性,将多阶段数据转换为单阶段数据,从而实现对复杂多阶段过程的检测。将该方法运用于数值实验和青霉素发酵过程,并与其他方法进行比较,对比结果进一步验证了TSNS-KNN方法的优越性。
-
-
魏思佳;
李涛;
姜禹
-
-
摘要:
随着通信技术的发展,大量无线通信设备接入网络,然而,由于无线网络的开放性,使得恶意用户可能通过伪装身份冒充合法用户接入网络,严重威胁了无线通信网络的安全.由于发射机物理层具有稳定性和唯一性等特性,提取发射机物理层特征作为终端的身份标识对设备进行身份识别成为近几年研究的热点.分析了近年来基于设备物理层特征实现设备身份识别的研究进展,针对现有LoRa设备指纹身份识别方法存在的风险,提出了一种基于设备指纹的LoRa设备识别模型,采用OneClassSVM单分类算法,将非法设备识别转化为异常检测问题,实现了对待测设备合法性的鉴权,获得了较高的识别率,设计了一种误报消除算法实现了误警率的降低,并验证了随机森林、支持向量机(SVM)、KNN作为分类器在设备身份识别中的性能.
-
-
刘胥影;
周志华
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
在机器学习和数据挖掘领域中,分类器通常设计为最小化测试样本的错误率,然而这只有在所有错误具有相同的错误分类代价时才有意义.在现实问题中,不同情况下的错误往往具有不同的代价,分类器应该设计为最小化总体错误分类代价.实现了一种基于示例加权的代价敏感k近邻方法,通过对不同类别的样本赋予不同的权值来获得代价敏感学习能力,其中样本的权值和其所在类别的错误分类代价成正比.实验结果表明,该方法在两类问题上能显著降低总体代价。
-
-
罗辛;
欧阳元新;
熊璋;
袁满
- 《第27届中国数据库学术会议》
| 2010年
-
摘要:
个性化推荐系统能基于用户个人兴趣为用户提供定制信息。此类系统通常使用协同过滤技术实现,其中一种广泛使用的经典模型是基于用户评分相似度的k近邻模型。使用k近邻模型需要预先计算出用户或者项目的k个最近邻居,k值过大时会导致计算量过大而影响推荐产生的实时性,而k值过小则会导致推荐精度下降。为解决此问题,该文中提出了一种新的最近邻度量--相似度支持度。基于相似度支持度,该文提出了数种能够在保持推荐精度和密度的前提下维持合理规模的k近邻的策略。在真实大规模数据集上的实验结果表明,相比传统算法,该文提出的策略能够在保证推荐精度的前提下大幅降低计算复杂度。
-
-
-
-
-
-
-
-