【24h】

Fast File-type Identification

机译:快速文件类型识别

获取原文

摘要

This paper proposes two techniques to reduce the classification time of content-based file type identification. The first is a feature selection technique, which uses a subset of highly-occurring byte patterns in building the representative model of a file type and classifying files. The second is a content sampling technique, which uses a subset of file content in obtaining its byte-frequency distribution. Our initial experiments show that the proposed approaches are promising even the simple 1-gram features are used for the classification.
机译:本文提出了两种减少基于内容的文件类型识别的分类时间的技术。第一种是功能选择技术,它使用高出现率字节模式的子集来建立文件类型的代表性模型并分类文件。第二种是内容采样技术,它使用文件内容的子集来获取其字节频率分布。我们的初步实验表明,即使将简单的1克特征用于分类,所提出的方法也很有希望。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号