【24h】

Parametric Mixture Models for Multi-Labeled Text

机译:多标签文本的参数混合模型

获取原文
获取原文并翻译 | 示例

摘要

We propose probabilistic generative models, called parametric mixture models (PMMs), for multiclass, multi-labeled text categorization problem. Conventionally, the binary classification approach has been employed, in which whether or not text belongs to a category is judged by the binary classifier for every category. In contrast, our approach can simultaneously detect multiple categories of text using PMMs. We derive efficient learning and prediction algorithms for PMMs. We also empirically show that our method could significantly outperform the conventional binary methods when applied to multi-labeled text categorization using real World Wide Web pages.
机译:对于多类,多标签的文本分类问题,我们提出了概率生成模型,称为参数混合模型(PMM)。常规地,已经采用了二进制分类方法,其中,由文本分类器针对每个类别来判断文本是否属于类别。相反,我们的方法可以使用PMM同时检测多种类别的文本。我们推导出有效的PMM学习和预测算法。我们还凭经验表明,当将这种方法应用于使用真实的万维网页面的多标签文本分类时,其性能可以大大优于传统的二进制方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号