首页> 外国专利> Hybrid Comparison for Unicode Text Strings Consisting Primarily of ASCII Characters

Hybrid Comparison for Unicode Text Strings Consisting Primarily of ASCII Characters

机译:主要由ASCII字符组成的Unicode文本字符串的混合比较

摘要

A method compares text strings having Unicode encoding. The method receives a first string S=s1s2 . . . sn and a second string T=t1t2 . . . tm, where s1, s2, . . . , sn and t1, t2, . . . , tm are Unicode characters. The method computes a first string weight for the first string S according to a weight function ƒ. When S consists of ASCII characters, ƒ(S)=S. When S consists of ASCII characters and some accented ASCII characters that are replaceable by ASCII characters, ƒ(S)=g(s1)g(s2) . . . g(sn), where g(si)=si when si is an ASCII character and g(si)=s′i when si is an accented ASCII character that is replaceable by the corresponding ASCII character s′i. The method also computes a second string weight for the second text string T. Equality of the strings is tested using the string weights.
机译:一种方法比较具有Unicode编码的文本字符串。该方法接收第一个字符串S = s 1 s 2 。 。 。 s n 和第二个字符串T = t 1 t 2 。 。 。 t m ,其中s 1 ,s 2 ,。 。 。 ,s n 和t 1 ,t 2 ,。 。 。 ,t m 是Unicode字符。该方法根据权重函数ƒ计算第一弦S的第一弦权重。当S由ASCII字符组成时,ƒ(S)= S。当S由ASCII字符和一些可以用ASCII字符替换的带重音的ASCII字符组成时,ƒ(S)= g(s 1 )g(s 2 )。 。 。 g(s n ),其中,当s i 是ASCII字符时,g(s i )= s i 和g(s i )= s' i ,当s i 是带重音的ASCII字符时,可以用相应的ASCII字符s'< Sub> i 。该方法还计算第二文本字符串T的第二字符串权重。使用字符串权重来测试字符串的相等性。

著录项

  • 公开/公告号US2020134254A1

    专利类型

  • 公开/公告日2020-04-30

    原文格式PDF

  • 申请/专利权人 TABLEAU SOFTWARE INC.;

    申请/专利号US201916726737

  • 发明设计人 THOMAS NEUMANN;VIKTOR LEIS;ALFONS KEMPER;

    申请日2019-12-24

  • 分类号G06F40/126;H03M7/02;H03M7/30;H03M7/14;G06F40/20;

  • 国家 US

  • 入库时间 2022-08-21 11:21:30

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号