首页> 外国专利> Hybrid approach to collating unicode text strings consisting primarily of ASCII characters

Hybrid approach to collating unicode text strings consisting primarily of ASCII characters

机译:整理主要由ASCII字符组成的unicode文本字符串的混合方法

摘要

Collating text strings having Unicode encoding includes receiving two text strings S=s1s2 . . . s and T=t1t2 . . . tm. When the two text strings are not identical, there is a smallest positive integer p for which the two text strings differ. The process looks up the characters sp and tp in a predefined lookup table. If either of these characters is missing from the lookup table, the collation of the text strings is determined using the standard Unicode comparison of the text strings spsp+1 . . . sn and tptp+1 . . . tm. Otherwise, the lookup table assigns weights vp and wp for the characters sp and tp. When vp≠wp, these weights define the collation order of the strings S and T. When vp=wp, the collation of S and T is determined recursively using the suffix strings sp+1 . . . sn and tp+1 . . . tm.
机译:整理具有Unicode编码的文本字符串包括接收两个文本字符串S = s 1 s 2 。 。 。 s和T = t 1 t 2 。 。 。 t m 。当两个文本字符串不相同时,存在两个文本字符串不同的最小正整数p。该过程在预定义的查找表中查找字符s p 和t p 。如果查找表中缺少这些字符中的任何一个,则使用文本字符串s p s p + 1 的标准Unicode比较确定文本字符串的排序规则。 。 。 s n 和t p t p + 1 。 。 。 t m 。否则,查找表将为字符s p 和t p 分配权重v p 和w p 。当v p ≠w p 时,这些权重定义字符串S和T的排序顺序。当v p = w p时,使用后缀字符串s p + 1 递归确定S和T的排序规则。 。 。 s n 和t p + 1 。 。 。 t m

著录项

  • 公开/公告号US10325010B1

    专利类型

  • 公开/公告日2019-06-18

    原文格式PDF

  • 申请/专利权人 TABLEAU SOFTWARE INC.;

    申请/专利号US201816134919

  • 发明设计人 THOMAS NEUMANN;VIKTOR LEIS;ALFONS KEMPER;

    申请日2018-09-18

  • 分类号H03M7/02;H03M7/30;G06F17/22;G06F17/27;

  • 国家 US

  • 入库时间 2022-08-21 12:16:20

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号