首页> 中文会议>2010年全国模式识别学术会议(CCPR2010) >基于实例距离分布的过采样方法的定义抽取研究

基于实例距离分布的过采样方法的定义抽取研究

摘要

为了从航空民航领域的专业语料中获取所有的专业术语定义,本文提出了一种经过改进的不平衡数据分类方法来进行术语定义抽取。本文利用实例距离分布信息改进了过采样方法,将其与随机欠采样方法结合用以建立平衡训练语料,并使用BRF方法来获得C4.5决策树的聚合分类结果。该方法获得了最好65%的Fl-measure成绩和78%的F2-measure成绩。同时本文也分析了特征选择方法对单颗决策树分类结果以及聚合结果的影响。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号