首页> 外文期刊>電子情報通信学会技術研究報告. マルチメディア情報ハイディング·エンリッチメント >文脈自由文法のチョムスキー標準形を用いた文法圧縮アルゴリズム
【24h】

文脈自由文法のチョムスキー標準形を用いた文法圧縮アルゴリズム

机译:使用Chomsky标准形式的无上下文语法的语法压缩算法

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では新しい,文法に基いた無歪み情報源符号のクラスを提案する.簡潔さのために,文脈自由文法の準チョムスキー標準形(Semi-Chomsky Normal Form,Semi-CNF)を導入する.semi-CNFはCNFを変形したものであり,本稿の中で提案する.文法圧縮符号は文脈自由文法を用いたユニバーサルデータ圧縮アルゴリズムのクラスである.提案するアルゴリズムは,与えられた系列を,その系列のみを生成する既的な文法に二段階で変換する.第一段階では,シンボルもしくは変数のペアから新しい変数への置き換えを繰り返すことで,生成規則の集合のsemi-CNFを構成する.第二段階では,他の生成規則の中で一度しか用いられていない生成規則を削除することで,Semi-CNFを既約もしくはより小さな文法に変換する.LZ78,Multilevel Pattern Matching(MPM)法,Byte Pair Encoding (BPE)法が,このクラスの符号として扱うことができるが,これらのアルゴリズムは,この二段階の手続きのうち最初のものしか用いていない.よって,提案する方法によって,統一した手続きでこれらのアルゴリズムの圧縮性能を向上させることができる.この手法には,Semi-CNFを経由する二段階アルゴリズムを用いることで,与えられた系列から文法への変換が極めて簡潔で効率的であるという利点がある.
机译:本文提出了一种新的,基于语法的,无失真的源代码类。为简洁起见,我们介绍了上下文无关文法的半乔姆斯基范式(Semi-CNF)。 semi-CNF是CNF的一种改进,在本文中提出。语法压缩代码是一类使用上下文无关语法的通用数据压缩算法。所提出的算法将给定序列转换为现有语法,该语法仅分两个步骤生成该序列。在第一阶段,通过用新变量重复替换符号或变量对来构造一组生产规则的准CNF。在第二阶段,通过删除仅在其他生产规则中仅使用一次的生产规则,将Semi-CNF转换为收缩或较小的语法。 LZ78,多级模式匹配(MPM)方法和字节对编码(BPE)方法可以视为此类代码,但是这些算法仅使用这两个步骤中的第一个。因此,通过提出的方法,可以通过统一的程序来提高这些算法的压缩性能。该方法的优点是,通过Semi-CNF使用两步算法,可以非常简洁高效地将给定序列转换为语法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号