【24h】

Edge-Guided Natural Language Text Compression

机译:边缘引导自然语言文本压缩

获取原文
获取原文并翻译 | 示例

摘要

We describe a novel compression technique for natural language text collections which takes advantage of the information provided by edges when a graph is used to model the text. This technique is called edge-guided compression. We propose an algorithm that allows the text to be transformed in agreement with the edge-guided technique in conjunction with the spaceless words transformation. The result of these transformations is a PPM-friendly byte-stream that has to be codified with a PPM family encoder. The comparison with state-of-art compressors shows that our proposal is a competitive choice for medium and large natural language text collections.
机译:我们描述了一种用于自然语言文本集合的新颖压缩技术,该技术在使用图形对文本进行建模时利用了边缘提供的信息。这种技术称为边缘引导压缩。我们提出了一种算法,该算法允许与无边单词转换结合的边缘引导技术来转换文本。这些转换的结果是必须与PPM系列编码器一起编码的PPM友好字节流。与最新压缩器的比较表明,我们的建议是中型和大型自然语言文本集合的竞争选择。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号