首页> 外文期刊>電子情報通信学会技術研究報告. 情報理論. Information Theory >最頻N-gramを考慮した文法生成法に基づくデータ圧縮法
【24h】

最頻N-gramを考慮した文法生成法に基づくデータ圧縮法

机译:基于语法生成方法的数据压缩方法,考虑最频繁的n-gram

获取原文
获取原文并翻译 | 示例
           

摘要

近年,Sequiturアルゴリズムや最頻digram統合法等のデータ系列の文法を用いたデータ圧縮法の研究が盛hに行われている。 文法を用いた圧縮法では,データ系列を直接符号化するのではなく,データ系列を生成するような文法を構成し,それを符号化する。 中村らによる最頻digram統合法では,データ系列を全て読み込み,連続する2記号であるdigramの出現頻度を求め,最頻digramをルールとする文法生成を行っている。 これに対して,神田らは,この文法の符号化に算術符号を適用することを前提とし,算術符号の理想符号長を計算しながら符号長の観点から最適な文法を生成する手法を提案している。 本研究では,神田らの手法と同様に算術符号の理想符号長を計算しながら文法生成を行うが,digramだけでなくより長く連続するN記号であるN-gramを考慮して文法生成を行う手法を提案する。 またカルガリーデータに対して本手法を適用し,シミュレーションに。 よる評価によって,その有効性を示す。更に系列長nのデータに対し提案手法の計算量及びメモリ量が神田らの手法と同様O(n)であることを示す。
机译:近年来,使用序号算法的数据压缩方法和数据序列的语法进行研究,例如最常见的DigRAM集成方法的序列进行到草案中。在使用语法的压缩方法中,而不是直接编码数据序列,它构成了语法以生成数据序列,并进行编码。在Nakamura等人的最常用DigRAM集成方法中,读取所有数据序列的方法和DigRAM的发生频率,这是一个连续的两个符号,并执行规则最常见的Digram的语法生成。另一方面,kanda是在应用算术代码来编码这个语法的前提,并提出一种从代码长度的角度来生成最佳语法的方法,同时计算算术代码的理想代码长度。ING。在这项研究中,在计算算术码的理想代码以及Kanda等人的同时执行语法生成。提出一种方法。此外,该方法应用于卡尔加里数据和仿真。评估表明了有效性。此外,它表明所提出的方法和存储量的量是o(n)作为Kanda等人的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号