首页> 外文期刊>Automatic Documentation and Mathematical Linguistics >Classification by Compression: Application of Information-Theory Methods for the Identification of Themes of Scientific Texts
【24h】

Classification by Compression: Application of Information-Theory Methods for the Identification of Themes of Scientific Texts

机译:压缩分类:信息理论方法在科学文本主题识别中的应用

获取原文
获取原文并翻译 | 示例
       

摘要

A method for automatic classification of scientific texts based on data compression is proposed. The method is implemented and investigated based on the data from an archive of scientific texts (arXiv.org) and in the CyberLeninka scientific electronic library (CyberLeninka.ru). Experiments showed that the method correctly identified the themes of scientific texts with a probability of 75-95%; its accuracy depends on the quality of the original data.
机译:提出了一种基于数据压缩的科学文本自动分类方法。该方法是根据科学文献档案(arXiv.org)和Cyber​​Leninka科学电子图书馆(Cyber​​Leninka.ru)中的数据实施和研究的。实验表明,该方法正确识别了科学文本的主题,概率为75-95%。其准确性取决于原始数据的质量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号