首页> 中国专利> 一种面向类间交叠的两类文本分类方法

一种面向类间交叠的两类文本分类方法

摘要

本发明公开了一种面向类间交叠的两类文本分类方法,该方法首先形成训练样本向量,对类间交叠区域内的训练样本进行识别,判断其是否处于类间交叠区域内;然后,重新划分训练样本向量集合,在新划分的训练样本向量集合上构建第一层分类器;在各类处于类间交叠区域的训练样本集合上,提取相邻两个词性为动词或名词构成的二元词串作为特征,构建第二层分类器;最后对测试样本进行第一层分类,如果满足条件则进入第二层分类器进行识别,最终合并两层分类器结果为最终分类结果;本发明适用于类间交叠程度较高的文本分类、信息过滤和信息监管等领域,能够保证类间交叠程度较高的文本分类准确性。

著录项

  • 公开/公告号CN101876987A

    专利类型发明专利

  • 公开/公告日2010-11-03

    原文格式PDF

  • 申请/专利权人 中国人民解放军信息工程大学;

    申请/专利号CN200910227303.6

  • 申请日2009-12-04

  • 分类号G06F17/30(20060101);

  • 代理机构

  • 代理人

  • 地址 450002 河南省郑州市信息学院路1号

  • 入库时间 2023-12-18 00:56:43

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2012-06-20

    发明专利申请公布后的视为撤回 IPC(主分类):G06F17/30 公开日:20101103 申请日:20091204

    发明专利申请公布后的视为撤回

  • 2010-12-15

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20091204

    实质审查的生效

  • 2010-11-03

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号