首页>
外国专利>
Hybrid approach to collating unicode text strings consisting primarily of ASCII characters
Hybrid approach to collating unicode text strings consisting primarily of ASCII characters
展开▼
机译:整理主要由ASCII字符组成的unicode文本字符串的混合方法
展开▼
页面导航
摘要
著录项
相似文献
摘要
Collating text strings having Unicode encoding includes receiving two text strings S=s1s2 . . . s and T=t1t2 . . . tm. When the two text strings are not identical, there is a smallest positive integer p for which the two text strings differ. The process looks up the characters sp and tp in a predefined lookup table. If either of these characters is missing from the lookup table, the collation of the text strings is determined using the standard Unicode comparison of the text strings spsp+1 . . . sn and tptp+1 . . . tm. Otherwise, the lookup table assigns weights vp and wp for the characters sp and tp. When vp≠wp, these weights define the collation order of the strings S and T. When vp=wp, the collation of S and T is determined recursively using the suffix strings sp+1 . . . sn and tp+1 . . . tm.
展开▼
机译:整理具有Unicode编码的文本字符串包括接收两个文本字符串S = s 1 Sub> s 2 Sub>。 。 。 s和T = t 1 Sub> t 2 Sub>。 。 。 t m Sub>。当两个文本字符串不相同时,存在两个文本字符串不同的最小正整数p。该过程在预定义的查找表中查找字符s p Sub>和t p Sub>。如果查找表中缺少这些字符中的任何一个,则使用文本字符串s p Sub> s p + 1 Sub>的标准Unicode比较确定文本字符串的排序规则。 。 。 s n Sub>和t p Sub> t p + 1 Sub>。 。 。 t m Sub>。否则,查找表将为字符s p Sub>和t p Sub>分配权重v p Sub>和w p Sub>。当v p Sub>≠w p Sub>时,这些权重定义字符串S和T的排序顺序。当v p Sub> = w p时 Sub>,使用后缀字符串s p + 1 Sub>递归确定S和T的排序规则。 。 。 s n Sub>和t p + 1 Sub>。 。 。 t m Sub>。
展开▼