【24h】

Enhancement of DTP Feature Selection Method for Text Categorization

机译:DTP特征选择方法在文本分类中的改进

获取原文
获取原文并翻译 | 示例

摘要

This paper studies the structure of vectors obtained by using term selection methods in high-dimensional text collection, We found that the distance to transition point (DTP) method omits commonly occurring terms, which are poor discriminators between documents, but which convey important information about a collection. Experimental results obtained on the Reuters-21578 collection with the k-NN classifier show that feature selection by DTP combined with common terms outperforms slightly simple document frequency.
机译:本文研究了在高维文本集合中使用术语选择方法获得的向量的结构,我们发现到转换点的距离(DTP)方法省略了常见的术语,这些术语在文档之间的识别能力较差,但传达了有关以下内容的重要信息集合。在使用k-NN分类器的Reuters-21578集合上获得的实验结果表明,结合常用术语通过DTP进行特征选择的性能优于简单的文档频率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号