首页> 中文期刊>中文信息学报 >面向文本分类的特征词选取方法研究与改进

面向文本分类的特征词选取方法研究与改进

     

摘要

中文特征词的选取是中文信息预处理内容之一,对文档分类有重要影响.中文分词处理后,采用特征词构建的向量模型表示文档时,导致特征词的稀疏性和高维性,从而影响文档分类的性能和精度.在分析、总结多种经典文本特征选取方法基础上,以文档频为主,实现文档集中的特征词频及其分布为修正的特征词选取方法(DC).采用宏F值和微F值为评价指标,通过实验对比证明,该方法的特征选取效果好于经典文本特征选取方法.

著录项

  • 来源
    《中文信息学报》|2015年第4期|120-125|共6页
  • 作者单位

    中国石油大学(北京)地球物理与信息工程学院,北京102249;

    中国石油大学(北京)油气数据挖掘北京市重点实验室,北京102249;

    石大兆信数字身份管理与物联网技术研究院,北京100029;

    中国石油大学(北京)地球物理与信息工程学院,北京102249;

    中国石油大学(北京)油气数据挖掘北京市重点实验室,北京102249;

    中国石油大学(北京)地球物理与信息工程学院,北京102249;

    中国石油大学(北京)油气数据挖掘北京市重点实验室,北京102249;

    石大兆信数字身份管理与物联网技术研究院,北京100029;

    石大兆信数字身份管理与物联网技术研究院,北京100029;

    石大兆信数字身份管理与物联网技术研究院,北京100029;

    石大兆信数字身份管理与物联网技术研究院,北京100029;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    文本文档; 特征词; 特征选取; 文本分类;

  • 入库时间 2022-09-01 14:35:57

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号