【24h】

Arithmetic coding based string approximation

机译:基于算术编码的字符串逼近

获取原文

摘要

Arithmetic coding gives lowest range of entropy for any string computed form joint probability value of sub-strings of keyword. It is very much permissible to use this technique for mapping a large set of keywords to real values with in the range of [0; 1]. This will create a space of search containing tag value range for keywords and mapped all the keywords to this space. In this paper a new string approximation technique is proposed, which is based on the arithmetic coding used for mapping the misspelled keyword to the tag value interval in a limited search space containing the nearest possible keywords against the misspelled keyword. Using such technique time for searching all the nearest keywords is dramatically reduced due to reduction of search space.
机译:对于从关键字子字符串的联合概率值计算出的任何字符串,算术编码都会使熵的范围最小。使用此技术将大量关键字映射到[0;范围内的实数值]是非常允许的。 1]。这将创建一个搜索空间,其中包含关键字的标签值范围,并将所有关键字映射到该空间。本文提出了一种新的字符串近似技术,该技术基于一种算术编码,该算法用于在有限的搜索空间中将拼写错误的关键字映射到标签值区间,该搜索空间包含与拼写错误的关键字最接近的可能关键字。由于减少了搜索空间,因此使用这种技术来搜索所有最近的关键字所需的时间大大减少了。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号