首页> 外国专利> Method and apparatus for text classification using minimum classification error to train generalized linear classifier

Method and apparatus for text classification using minimum classification error to train generalized linear classifier

机译:利用最小分类误差训练广义线性分类器的文本分类方法和装置

摘要

Methods and apparatus are disclosed for generating a classifier for classifying text. Minimum classification error (MCE) techniques are employed to train generalized linear classifiers for text classification. In particular, minimum classification error training is performed on an initial generalized linear classifier to generate a trained initial classifier. A boosting algorithm, such as the AdaBoost algorithm, is then applied to the trained initial classifier to generate m alternative classifiers, which are then trained using minimum classification error training to generate m trained alternative classifiers. A final classifier is selected from the trained initial classifier and m trained alternative classifiers based on a classification error rate.
机译:公开了用于生成用于对文本进行分类的分类器的方法和装置。最小分类误差(MCE)技术用于训练用于文本分类的广义线性分类器。特别地,对初始广义线性分类器执行最小分类误差训练以生成训练后的初始分类器。然后将诸如AdaBoost算法之类的增强算法应用于经过训练的初始分类器以生成m个替代分类器,然后使用最小分类误差训练对它们进行训练以生成m个经过训练的替代分类器。根据分类错误率从训练有素的初始分类器和m个训练有素的替代分类器中选择最终分类器。

著录项

  • 公开/公告号US2006069678A1

    专利类型

  • 公开/公告日2006-03-30

    原文格式PDF

  • 申请/专利权人 WU CHOU;LI LI;

    申请/专利号US20040955914

  • 发明设计人 LI LI;WU CHOU;

    申请日2004-09-30

  • 分类号G06F17/00;

  • 国家 US

  • 入库时间 2022-08-21 21:44:34

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号