【24h】

A Text Classifier Based on Sentence Category VSM

机译:基于句子类别VSM的文本分类器

获取原文
获取原文并翻译 | 示例

摘要

VSM is a mature model of text representation for categorization. Words are commonly used as dimensions of feature space of VSM, but words only provide little semantic information. Sentence category theory is an important component of HNC theory and can provide abundant information about meaning, structure and style of a sentence. We use sentence categories as dimensions of feature space, reduce the dimensionality by dividing mixed sentence categories and reform the weights by tfc-weighting algorithm. By simple vector distance calculation, we can get the parameters of the classifier and execute the categorization. The average precision and recall of our classifier are acceptable and can be improved by other HNC techniques.
机译:VSM是用于分类的文本表示的成熟模型。单词通常用作VSM的特征空间的维,但是单词仅提供很少的语义信息。句子类别理论是HNC理论的重要组成部分,可以提供有关句子的含义,结构和样式的大量信息。我们使用句子类别作为特征空间的维数,通过划分混合的句子类别来降低维数,并通过tfc加权算法来调整权重。通过简单的矢量距离计算,我们可以得到分类器的参数并执行分类。我们分类器的平均精度和召回率是可以接受的,并且可以通过其他HNC技术进行改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号