您现在的位置: 首页> 研究主题> 信息增益

信息增益

信息增益的相关文献在1996年到2022年内共计708篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、经济计划与管理 等领域,其中期刊论文575篇、会议论文71篇、专利文献322972篇;相关期刊304种,包括计算机工程、计算机工程与科学、计算机工程与设计等; 相关会议40种,包括第32次全国计算机安全学术交流会 、四川省电子学会曙光分会第十七届学术年会暨中物院第十届电子技术青年学术交流会、第十届中国通信学会学术年会等;信息增益的相关文献由1787位作者贡献,包括王勇、翟军昌、蒋良孝等。

信息增益—发文量

期刊论文>

论文:575 占比:0.18%

会议论文>

论文:71 占比:0.02%

专利文献>

论文:322972 占比:99.80%

总计:323618篇

信息增益—发文趋势图

信息增益

-研究学者

  • 王勇
  • 翟军昌
  • 蒋良孝
  • 于舒娟
  • 何伟
  • 朱文峰
  • 郭茂祖
  • 刘钊
  • 张昀
  • 林伟
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 邱云志; 汪廷华; 戴小路
    • 摘要: 针对当前基于特征加权的模糊支持向量机(FSVM)只考虑特征权重对隶属度函数的影响,而没有考虑在样本训练过程中将特征权重应用到核函数计算中的缺陷,提出了同时考虑特征加权对隶属度函数和核函数计算的影响的模糊支持向量机算法——双重特征加权模糊支持向量机(DFW-FSVM)。首先,利用信息增益(IG)计算出每个特征的权重;然后,在原始空间中基于特征权重计算出样本到类中心的加权欧氏距离,进而应用该加权欧氏距离构造隶属度函数,并在样本训练过程中将特征权重应用到核函数的计算中;最后,根据加权的隶属度函数和核函数构造出DFW-FSVM算法。该方法避免了在计算过程中被弱相关或不相关的特征所支配。在8个UCI数据集上进行对比实验,结果显示DFW-FSVM算法的准确率和F1值较5个对比算法(SVM、FSVM、特征加权SVM(FWSVM)、特征加权FSVM(FWFSVM)、基于中心核对齐的FSVM(CKA-FSVM))中的最好结果分别提升了2.33和5.07个百分点,具有较好的分类性能。
    • 纪淑娟; 申彦博; 王振
    • 摘要: 为了验证用户对项目评分时所处的上下文环境是否会对用户的偏好产生影响,基于矩阵过程的马尔科夫分解方法,提出了一种基于上下文的流式推荐算法(streaming recommendation algorithm based on context,C-SRA),该方法可以从嘈杂的上下文中有效选取与评分相关的上下文信息,并将选取的上下文信息分为主观上下文和客观上下文两类。基于LDOS-CoMoDa数据集的两组对比实验显示,C-SRA算法无论是评分预测性能还是推荐性能均优于其他对比算法。
    • 谢鑫; 张贤勇; 杨霁琳
    • 摘要: 机器学习中的决策树算法具有重要的数据分类功能,但基于信息增益的ID3算法与基于基尼指数的CART算法的分类功效还值得提高。构造信息增益与基尼指数的自适应集成度量,设计有效的决策树算法,以提升ID3与CART两类基本算法的性能。分析信息增益信息表示与基尼指数代数表示的异质无关性,采用基于知识的加权线性组合来建立信息增益与基尼指数的融合度量,开发决策树启发构造算法IGGI。关于决策树,IGGI算法有效改进了ID3算法与CART算法,相关数据实验表明IGGI算法通常具有更优的分类准确度。
    • 张培超; 张孝民; 陈丙见; 李凡
    • 摘要: 根据2019年7—12月我国大陆秋刀鱼(Cololabis saira)渔船生产数据,对秋刀鱼渔场与水温垂直结构的关系进行了分析。首先,运用信息增益技术(IGT)分析了影响CPUE的6个水温因子,各因子按影响大小排序依次是12.5 m水层温度(T_(12.5))、0~12.5 m水温的垂直梯度(△_(T0-12.5))、12.5~37.5 m水温的垂直梯度(△_(T12.5-37.5))、海表面温度(T_(0))、37.5~62.5 m水温的垂直梯度(△_(T37.5-62.5))和37.5 m水层温度(T_(37.5))。然后,用频度分析的方法确定了影响秋刀鱼渔场分布的六个水温因子的适宜范围,分别是:T_(12.5)为7~12°C,△T_(0-12.5)为(1~3)×10^(-2)°C/m,△T_(12.5-37.5)为(3~4)×10^(-2)°C/m,T_(0)为10~16°C,△T_(37.5-62.5)为(2~3)×10^(-2)°C/m,T_(37.5)为6~10°C。研究结果显示12.5 m水层温度(T_(12.5))比海表面温度(T_(0))对秋刀鱼渔场的分布有更大的影响,以后应加强研究12.5 m水层及其附近水层温度与秋刀鱼渔场的关系。
    • 单超; 邹云峰
    • 摘要: 用电数据涉及客户隐私,在分发共享过程中存在泄露风险,数字水印是实现泄露溯源追责的有效手段。而水印植入将导致数据偏移,影响数据分析可用性,且部分数据泄漏时溯源效果不够理想。本文提出一种基于子水印和属性筛选的用电数据泄露溯源算法WRTA,该方法通过利用信息增益率和基尼系数计算数据属性的重要程度,通过密钥和主键随机选择非重要属性来构建子水印,并且兼顾数据分析可用性和安全性,实现部分数据泄露的溯源。
    • 李玎; 林伟; 芦斌; 祝跃飞
    • 摘要: 搜索引擎中的增量式搜索服务通过发送实时请求为用户更新建议列表。针对搜索加密流量存在的信息泄露,该文提出一种面向中文搜索的侧信道分析方法,利用搜索请求数据包长度增量和时间间隔的可区分性,构建了3阶段的分析模型以实现对用户输入查询的识别。实验结果表明,该方法在4个常用中文搜索引擎中的识别性能均达到理论量化值,对包含1.4×10^(5)查询监控集的综合识别准确率达到76%。最后通过评估4种针对性的缓解机制,证明了通过阻断信息泄露来源可有效防御侧信道分析。
    • 谢娟英; 吴肇中
    • 摘要: 针对基于信息增益与皮尔森相关系数的特征选择算法FSIP(feature selection based on information gain and Pearson correlation coefficient)存在的特征子集选取需要人工参与的问题,提出基于可辨识矩阵的完全自适应2D特征选择算法DFSIP(discernibility based FSIP).DFSIP算法完全自适应地发现特征子集,每次选择当前特征中最重要的一个特征,并以此特征约简可辨识矩阵,剔除冗余特征,最终自适应地获得最优特征子集.依据最优特征子集构建K-ELM分类器来评价最优特征子集的类别辨识能力.在基因数据集的实验测试以及与FSIP,mRMR,LLE Score,DRJMIM,AVC,AMID算法的实验比较和统计重要性检测表明:DFSIP算法能够自动选择出辨识能力更强的特征子集,基于此特征子集的分类器具有很好的分类性能.
    • 赵静; 韩京宇; 钱龙; 毛毅
    • 摘要: 心电图(ECG)数据通常包含多种病症,而ECG诊断是一个典型的多标签分类问题。在多标签分类方法中,RAKEL算法将标签集随机分解为若干个大小为k的子集,并建立LP分类器进行训练;然而由于没有充分考虑标签间的相关性,LP分类器中容易产生一些标签组合所对应样本稀少的情况,从而影响预测性能。为了充分考虑标签间的相关性,提出一种基于贝叶斯网络的RAKEL算法BN-RAKEL。首先利用贝叶斯网络找到标签间的相关性,确定候选标签子集;然后对每个标签采用基于信息增益的特征选择算法确定其最优特征空间,并针对每个候选标签子集利用最优特征空间相似性来检测其相关程度,以确定最终的具有强相关性的标签子集;最后在标签子集的最优特征空间上训练LP分类器。在实际的ECG数据集上,与多标签K近邻(ML-KNN)、RAKEL、CC和基于FP-Growth的RAKEL算法FI-RAKEL进行对比,结果显示所提算法在召回率和F-score上最少提高了3.6个百分点和2.3个百分点。实验结果表明,BN-RAKEL算法有较好的预测性能,能有效提升ECG诊断的准确性。
    • 孟雅蕾; 周千明; 师红宇; 马楠
    • 摘要: 为解决ID3算法在构建决策树时偏向于选择取值较多的属性为分支节点的问题,提出一种控制属性偏向程度的数据分类方法。该分类方法通过修正的信息增益和属性偏向阙确定均衡系数,利用均衡系数对ID3算法得到的信息增益进行优化,根据优化信息增益得到决策树的根节点、分支节点,对属性进行分类,构建决策树。通过实例证明该分类方法可以实现对多值偏向的控制,避免选择取值较多的属性为分支节点,提高预测的准确率和算法的效率。
    • 肖香梅; 余建; 林志兴
    • 摘要: 为了有效地检测网络攻击行为,提高网络安全水平,提出一种基于随机森林的网络异常流量检测方法。该方法能够从海量的数据流量中高效、准确地检测出异常流量,及时发现并阻断网络攻击行为。将随机森林算法与决策树、支持向量机等经典分类器从正确率、精确率、召回率、F1度量以及训练预测耗时等指标进行对比,随机森林算法都优于其他分类器,具有出极好的检测效果。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号