法律状态公告日
法律状态信息
法律状态
2013-03-27
未缴年费专利权终止 IPC(主分类):G06F3/023 授权公告日:20080319 终止日期:20120117 申请日:20010117
专利权的终止
2008-07-30
专利申请权、专利权的转移(专利权的转移) 变更前: 变更后: 登记生效日:20080620 申请日:20010117
专利申请权、专利权的转移(专利权的转移)
2008-03-19
授权
授权
2001-08-29
公开
公开
2001-08-01
实质审查请求的生效
实质审查请求的生效
本发明涉及一种汉字编码方案。
1995年,全国中小学教学用汉字编码规范与计算机汉字输入系统研制组编著了《认知码培训教程》,介绍了认知码汉字输入方法,认知码汉字输入方法是国家教委“八五”重点攻关项目成果,集中了专家的智慧,吸取了许多编码方案的优秀设计思想,如按三条相似性原则,对部件进行合理归并,建立了以“音联想为主,形联想为辅”的部件分类系统。交叉结构不拆,用汉字的首末笔画来分离重码等。在各种编码方案中,如何分离重码,是该种编码方案的核心技术之一。认知码采用汉字的首末笔画分两级来分离重码,确实是一项比较先进的技术。认知码具有规范性、易学性、快速性、完备性四个主要特点。不足之处是认知码用了四排33键,手指活动扩大到四排,会影响击键速度,增加选键的心理负担。在认知码中,有部分键位负荷不均衡,有的过重,如“C”、“T”、“R”、“5”等键。有的过轻,如“A”、“I”、“P”等键。键位负荷过重或过轻都对分离重码不利。在五笔字型中,最常用的多根字可用二级简码。而在认知码中,除去24个高频字外,等于或多于4根的字必须编四码,尽管它可能是最常用的字。另外在认知码中,字的编码为数字与字母相混杂,不便于作为一种检字方法按字母顺序检字。拆字要区分独体字、准独体字、合体字,增加了学习的记忆量。
本发明的目的在于改进现有认知码方案中的不足之处而提供一种将键位压缩到三排30个键,键位负荷均衡,在国标6763个汉字范围内无重码,常用字具有二级简码,字母之间不混杂其它符号,拆字不要区分独体字、准独体字、合体字的汉字输入方法。
本发明的目的可以通过以下措施来达到:键元集使用26个字母键和4个标点符号键,除按认知码三条相似性原则及笔画特征对字根进行归并,对少数字根还考虑以义归并的原则,定义了30键认知码的基本字根、归并字根、高频字根、第一主根、第二主根、键名、高频字、一般字根的概念,除按认知码采用“音联想为主,形联想为辅”的字根与键位的对应原则,对高频字根中的部分成字字根也采取“以形联想”的原则,第二主根中的数字采取在高频字根键位图中按顺序左右对称排列的对应原则,30键认知码的基本笔画也分为横、竖、撇、点、折,但对应两套代码,在拆字过程中碰到的单笔画横、竖、撇、点、折分别对应G、H、J、K、L,为分离重码而加取字的首末笔画补充码,其横、竖、撇、点、折分别对应[A][;]、[/]、[,]、[.],将认知码中七条汉字拆分规则合并为五条,即相离可分,相接可分,交重不分,从少优先,成字优先,按单根字、二根字、三根字及多根字制定编码规则,字的最大码长为5,规定了单根字的简化编码和常用字的二级简码,编制了二级简码表,对所有二级简码都有其三码兼容码,词语的输入除有形码输入和联想输入外,增加了声码输入方式。
下面对30键认知码汉字输入方法作详细说明:
1.键元集
30键认知码采用26个字母键,4个标点符号键“;”、“/”、“,”、“.”共30个键。
2.基本字根和归并字根
为便于记忆和对应键位,30键认知码对字根进行合理归并,采用了认知码归并部件(字根)的三条相似性原则:
(1)轮廓框架相同,只是位置旋转90°或180°的字根,可归为同一类字根。例如:
山(彐,),巾(屮,),片(爿,丬)
(2)轮廓框架相同,只是主要笔画的比例关系不同的字根,可归为同一类字根。例如:
几丁(),十(),文(攵,,夂)(3)主要轮廓框架相同,只是次要笔画有差异的字根,可归为同一类字根。例如:
卜(),匕(),曲水
另外,与认知码一样,对某些字根也采取按笔画特征来归并,其中:
“二”归并不含折笔的两笔部件,如:
亠,冫,
“三”归并不含折笔的三笔部件,如:
彡,
“四”归并不含折笔的四笔和四笔以上的部件,如:
“五”归并形似“5”的部件,如:
“九”归并含折笔的复笔部件,如:
匕(),厶,幺,乡,,巛
30键认知码与原认知码不同的是,对某些部首及其变形还考虑以义归类的原则,如“灬”归入”火”,“氵”归入水,“爫”归入爪,“扌”归入手。在30键认知码中,有不少字根的归类与原认知码不同。
经过归并分类,从每一类中选出一个有代表性的字根称为基本字根,其余的称为归并字根。基本字根共有327个,见30键认知码基本字根表。
3.字根总数、高频字根、高频字、一般字根
(1)字根总数
30键认知码基本上采用了原认知码的字根集合,只作了个别的调整,将原认知码中的改为“骨”,另外取消了5个字根禸、冂、这5个字根参加组成的字在30键认知码中不用分拆,故取消。同时增加了7个字根“走,糸,歹,为,这,孓,戢”,因此,字根总数为532个。
(2)高频字根
基本字根的组字能力有很大的差异,30键认知码从中选出52个组字能力较强,使用频率较高的字根作为高频字根,均匀分配在26个字母键上,每个字母键两个高频字根,分别排在基本字根表每个键位的第一位和第二位,排在第一位的称为第一主根,排在第二位的称为第二主根。第一主根也称为键名。高频字根对均衡键位负荷起主要作用,具体分布见30键认知码高频字根键位图。
(3)高频字
基本字根中,作为单字使用频率很高,而组字能力不强的称为高频字。30键认知码共选择了26个高频字,分布在26个字母键上,具体分布见30键认知码高频字键位图。
(4)一般字根
在基本字根中,除去高频字根和高频字以外的字根都称为一般字根。
4、字根与键位的对应原则
字根与键位的对应是形码编码中的一项关键技术,要便于记忆,便于联想,减少重码。与认知码一样,30键认知码也采取以音联想为主,形联想为辅的原则。大多数有读音的字根按发音来对应键位,不成字字根又无传统名称的按形联想原则归并于基本字根后再以声、形或次序对应键位。
基本字根主要以其读音的声母(或声母的首字母)与键位对应。以韵母开头的字,则用韵母的首字母。为减轻字母键Y的负担,当字根的拼音为“YI,YIN,YU,YUE,YUAN”时,这时的“Y”对读音不起作用,应以其实际读音的首字母,即Y后的“I”或“U”作为对应键位。
为使键位负荷均衡,对高频字根中少数第一主根、第二主根也采用“以形对应”的原则,“以形对应”主要以表形码为参考依据。第二主根中,数字一、二、三、……十采取按次序与键位对应。30键认知码的基本笔画横(一,)、竖(丨,亅)、撇(丿)、点(、,)、折(所有的单折笔),对应两套代码,在拆字过程中碰到的单笔画横、竖、撇、点、折,归并在第二主根一、六、七、八、九中,考虑形状与次序分别对应G、H、J、K、L,为分离重码而加取字的首末笔画补充码,其横、竖、撇、点、折,考虑形状与次序分别对应[A]、[;]、[/]、[,]、[.]。基本笔画横包括“提”,竖包括“竖钩”,撇包括“横撇”和“竖撇”,点包括“捺”,折包括“所有的单折笔”。
5.基本字根表、高频字根键位图、高频字键位图、字根总表
(1)基本字根表
由音联想或形联想,并考虑负荷均衡等因素,将327个基本字根对应到26个字母键上,就编成了30键认知码基本字根表(第6页)。基本字根表不带归并字根,形式简洁,相当于助记词,便于记忆。记住了基本字根表,字根总表也就容易记住了。基本字根表每个键位第一行的第一位是键名,第二位是第二主根,第三位是高频字,从第四位开始都是按实际读音的首字母对应的一般字根。基本字根表的最下面一排是5种基本笔画补充码的对应键位:A键和标点符号键[;]、[/]、[,]、[.],“[”用作模糊键。
(2)高频字根键位图
高频字根在30键认知码中具有举足轻重的地位,它们在均衡键位负荷、分离重码、记忆键位中有重要作用。30键认知码共选择了52个高频字根。这52个高频字根连同其归并字根,组字频率累计超过55%。30键认知码设计了高频字根键位图,见附图1。在键位图中,每个键位的右上角是键名,左下角是第二主根(第一主根和第二主根可用不同的颜色如红、蓝两色标识)。26个字母键按键名字义分为4个区,A作为字根代码时编在第四区,另外A又作为笔画补充码和4个标点符号键组成第5区。每区首尾相接,用虚线隔开。
第一区金木水火土日月(对应J、M、Y、H、T、R、U)
第二区言口阝竹立女(对应I、O、P、K、L、N)
第三区宀人艹心足广手(对应B、V、C、X、Z、G、F)
第四区刀纟虫山王犬(对应D、S、A、E、W、Q)
第五区[A][;][/][,][.](对应笔画补充码横、竖、撇、点、折)
第一区金木水火土日月好记。第二区只要联想“口言耳听,竹旁立女”,也就好记了。第三区含人心手足。第四区含刀纟山王(玉)虫犬。在第二主根中,数字一、二、三、四、五在左手区大体顺次排列。六、七、八、九、十在右手区大体顺次排列。二、三、四各含不带折的两笔字根、三笔字根、四笔及四笔以上的字根。一、六、七、八、九,各含基本笔画横、竖、撇、点、折,分别对应字母键G、H、J、K、L,笔画形状与字母形状易于联想。26个键名中有9个以形与字母对应,17个以声与字母对应,以形对应的键名有7个与表形码对应规则相一致。第二主根中,除数字以外,或以声或以形与字母对应,且有的字义与键名有联系。30键认知码高频字根键位图最为巧妙之处是:虽然各键名分别以声或形与字母对应,但在各分区中按义又是连续有序的,便于从整体上记忆。但在单独联想时,又不用依赖在分区中的位置。
第五区为笔画补充码,在分离重码时用,分别表示横、竖、撇、点、折五种笔画。笔画的形状与键位之间有联系,如横对应[A](一对A),竖对应[;](两点竖排),撇对应[/](斜杠),点对应[,](逗点),折对应[.](对应句号“。”圆圈为折笔)。[;]、[/]、[,]、[.]与H、J、K、L在键盘上的排列次序也基本相近。为了简明,笔画补充码常简称为补充码或笔画码。
高频字根键位图简洁对称,具有美感。细看一下就知道,26个键名含有天地人,动物植物……,也就是包含人类社会和自然界,这是西文26个字母所办不到的。向世人展示了古老汉字的魅力。我们应为我们祖先的聪明才智而自豪。
30键认知码基本字根表
(3)高频字键位图
30键认知码选择了26个高频字分布在26个字母键上。除去“为”与“这”分别与“O”、“V”对应外,其余24个高频字都是以其读音的首字母与字母键对应,因此便于记忆。但如果再从在键盘上的总体分布记一下效果会更好,总体分布见附图2,附图2为高频字键位图。(4)字根总表
在30键认知码基本字根表的基础上,将其归并字根用括号附于其后,就编成了30键认知码字根总表。基本字根加上归并字根得字根总数532个。基本字根在字根总表中的次序与在基本字根表中的次序一致。用户最终要将字根总表记住。学习时可以先记高频字根键位图,再记高频字键位图,然后记基本字根表,最后记字根总表。循序渐近,水到渠成。
30键认知码字根总表
基本笔画补充码(分离重码用)
6.汉字的拆分规则
在30键认知码中,除去成字字根以外,其余汉字要拆分编码。汉字的拆分规则和认知码的拆分规则基本一致,共有五条拆分规则。
(1)相离可分
字根之间有相离关系的字可以拆分。
拆分举例:
“码”字可拆分为:石,马;
“修”字可拆分为:亻,丨,夊,彡,其中丨是独立笔画。
(2)相接可分
字根之间有相接关系的字可以拆分。
拆分举例:
“兄”字可拆分为:口,儿;
“失”字可拆分为:丿,夫,其中丿是单笔画。
(3)交重不分
交重不分就是“交叉结构不拆,共用笔画不断”的原则。
例如:
“夷”不可拆分成“一”、“弓”、“人”,应整体作为一个字根;
“载”不可拆分成“土”、“车”、“戈”,应拆为“十”、“戈”、“车”,
“里”不可拆分成“日”、“土”(相交不拆),也不可拆分成“田”、“土”(笔画不断),应整体作为一个字根。
(4)从少优先
当一个汉字有几种可能的拆分方式时,优先选取拆出字根最少的那种方式。
拆分举例:
第一种方式拆出的字根少,应取第一种拆分方式。
(5)成字优先
当一个汉字有两种拆出字根数最少的方式时,则在这两种方式中优先选用拆出成字字根或结构部首较多的那种方式。
拆分举例:
第一种方式比第二种方式拆出的成字字根多,因此,应当取第一种拆分方式。
7.汉字编码规则
与认知码不同,30键认知码按单根字、二根字、三根字及多根字制定编码规则,成字字根中不区分独体字、准独体字与合体字,都按单根字规则编码。
字的编码,先取字根(“字根”以下简称“根”),单根字取一根,二根字取二根,三根及三根以上的字取三根,再补充首末笔画码分离重码。拆字过程中碰到的单笔画横、竖、撇、点、折对应代码G、H、J、K、L,补充码中的横、竖、撇、点、折对应代码[A]、[;]、[/]、[,]、[.]。以补充码结尾的编码不用再打空格键。因A既用作字根,又用作补充码,因此凡以A开头的编码,要先打空格键与前面的编码隔开。
7.1单根字的编码规则
单根字主要指基本字根表中的成字字根,以及字根总表归并字根中的少量成字字根。另有39个不成字部首也按单根字方式编码。
单根字的编码规则:
所在字母键+字根首笔补充码+字根末笔补充码。
有重码时再取次笔画补充码为第四码,基本笔画字根将基本笔画补充码重复取。如:
卑---B/;匕---L/.丑---C.A 丞---C.A;乙---I..尔---E/,乡---L./
冖---B,.宀---B,.,纟---S.A 丿---J// 冂---K;.阝---P.;卩---P.;;
7.2二根字的编码规则
二根字的编码分为两种情况:
(1)首根不是键名的二根字
编码为:首根码+次根码+首笔补充码+(末笔补充码)。
常用字大都只取前三码,有重码时才取第四码。如:
帕---JB;贪---JB/ 帐---JC;校---MJ,闸---MJ,;
奇---DKA 夸---DKA。
(2)首根是键名(包括其归并字根)的二根字
编码为:首根码+次根码+末笔补充码+(次根首笔补充码)。
常用字大都只取前三码,有重码时才取第四码。如:
铃---JL,句---DOA 榆---MU;杨---MY/律---VU;偷---VU;/
因键名组字能力强,以同一键名为首根的字往往多达上百个,在此情况下若取键名首笔,则不易起到分离重码的作用,因此规定三码取末笔,四码取次根首笔。在30键认知码中,分离重码的一个主要原则就是避开键名。
7.3三根及多根字的编码规则
多于三根的字称为多根字,多根字与三根字的编码规则一致。
编码为:首根码+次根码+末根码。
常用字大都取三码,有重码时加取第四码,若该字首根不是键名,则加取整字首笔画补充码;若首根为键名(包括其归并字根),则加取整字末笔画补充码。如:
点---BOH 富---BGT 抱---FDS 捺---FDS,操---FOM
捆---FOMA 稀---HNJ 烯-一HNJ;毁---JGU/
注:当字的编码仅为三个字母,如后面接词语编码或是非高频字编码,也不用打空格键,软件会自动切分。
8.关于第五码
当几个汉字的编码在第四码仍相重时,可再取次根首笔画补充码为第五码。30键认知码设定字的最大码长为5,可保证国标6763个汉字无一重码。实际真正需要编到第五码的汉字只有81个,也主要是二级字库中的非常用字。如:
董---CZA/ 萑---CZA// 滥---YRMA 尴---YRMA;醯---YRMA,
初学时所有的字都可先按前三码打出,有重码时,可按数字键选择,也可按该字后面的提示键打出。
9.简码
30键认知码的简码包括单根字的简化编码和常用字的二级简码。用简码输入,速度快且无重码,应首先记住26个高频字。
(1)单根字的简化编码
对基本字根表每个键位第一排上的成字字根另规定了简化编码:
①键名(排在第一位):所在字母键+II。如:金---JII 木---MII
②第二主根(第二位):所在字母键+;;。如:八---K;;又---U;;
③高频字(第三位):所在字母键+空格键。如:个---G 可---K
④第四、五、六、七位:所在字母键+字根首笔画补充码。如:
卜---B;白---B/ 必---B,巴---B。(首笔画分别为竖、撇、点、折)
齿---C;长---C/ 产---C,尺---C。(首笔画分别为竖、撇、点、折)
“尔”“亏”两字在第一排,但没有简化编码。对非成字字根键名(艹,纟,宀),其简化编码归其名称来源字。如:草---CII 丝---SII 宝---BII
特别规定了三个简化编码:片---PII 国---O;;○---O.。
因“一”的使用频率很高,故另用二级简码“AA”作“一”的第二个简化编码。
(2)常用字的二级简码
二级简码的编码为:2字母组合+空格键。30键认知码二级简码表(第14页)中的字就按这种格式编码,二级简码表中的字如为二根字,就取其两根代码;如为三根字或多根字,就取其前二根代码。有部分首笔画为横笔的单根字(首笔画补充码为A),也取二级简码。如:
比---LL 定---BG 进---JZ 林---Mm 强---GO 本---BA
工---GA
10.兼容码与模糊输入
(1)兼容码
在30键认知码中,按规则编的码称为标准码。第9节中规定的简码也是标准码。凡有简码的汉字,其按7.1-7.3节规则编的码(只取前三码)就作为兼容码。另外由于用户在书写习惯,拆分字根以及取码数目上的差异,有时会产生偏离规则取码的现象。考虑到这种情况,30键认知码另编排了大量的兼容码。兼容码在字码表中不列出,可分为下列三种情况:
①笔顺不规范
如“万”字的末笔应为“丿”,因此其编码应为:“WA/”如有的用户将折笔写作末笔,其编码为“WA.”,就作为兼容码。
②拆分字根未做到“从少优先,成字优先”
如“际”字应拆为“阝,示”,其编码为“PS”,如拆为“阝、“二”、“小”,其编码“PRX”就作为兼容码。
③未取简码
如“技”字有二级简码“FN”,如取三码“FNU”,就作为兼容码。
如“草”有简化编码为“CII”,若按“艹,日,十”编码成“CRN”,就作为兼容码。
当一个汉字的兼容码与另一个汉字的标准码相重时,兼容码排在其后,按数字键选择。
(2)模糊输入
用户在输入汉字时,有时对汉字编码的某键不能确定,这时可用“[”模糊键代替,进行模糊输入,按数字键选择,同时可查看该字后面给出的编码。在一个字码中模糊键的使用不超过两次。
30键认知码二级简码表 A B C D E F G H I J K L M N O P Q R S T U V W X Y ZA 一 蛇 蟆 鲍 螳 蚌 虹 蝎 蚁 蜒 蛀 蛹 案 蝴 蝇 鲆 蛆 鲁 蝶 螺 蠕 蛤 蚊 鳔 鲜 蛛B 本 密 军 则 宵 害 定 灾 赐 赚 赠 疗 宋 宏 点 疲 宜 完 家 实 寓 写 客 餐 宙 字C 厂 营 辱 厅 颜 辅 藏 秦 艺 较 芬 历 茅 苦 辑 节 软 春 药 苗 输 花 厉 芯 顺 过D 东 负 夺 列 急 匍 匐 訇 残 太 套 免 奔 召 那 歼 匀 包 奋 争 殇 顶 达E 耳 学 寻 崎 当 峡 光 灵 岂 岗 聊 彝 炭 后 印 聒 岿 岩 尚 肖 屹 敢 岁 取 存F 按 把 拆 打 扫 扶 找 护 拟 折 夹 拉 看 技 扣 报 捡 搞 提 持 援 旅 放 悲 扬 推G 工 下 张 划 应 废 弧 灭 引 廉 共 到 某 度 强 即 再 底 庄 序 巧 既 恳 项 正H 互 秘 烬 利 称 房 煤 秋 所 税 私 秣 委 积 称 租 香 毅 商 燃 黍 遍 虑 烦 种I 夷 补 讨 订 衫 访 式 该 议 记 说 诸 袜 计 识 评 话 谅 让 诗 变 认 许 恋 袖 谁J 铵 铂 升 钉 销 失 银 锈 锡 钱 钢 么 悉 风 铝 郊 丢 帽 系 向 键 锉 改 念 镁 进K 开 管 匿 分 形 卷 道 篇 笋 匠 并 公 笔 区 总 邢 签 篮 医 关 遵 答 主 筷 笑 匮L 两 站 弁 参 允 司 竭 袭 耕 办 幼 亲 辨 加 邻 麒 音 矣 垄 能 考 收 翎 领 边M 面 杯 村 类 闻 摩 根 核 机 术 粒 林 数 问 瞩 检 间 标 睦 权 闪 格 闷 样 李N 廿 嫁 卉 物 先 妨 左 妒 姨 布 娘 始 妈 姑 如 婿 姐 朝 姓 特 嫂 肉 妹 您 她 好 O 虽 员 团 因 兄 哺 吓 喝 唁 听 只 另 困 固 回 啊 吹 唱 呻 吐 叹 吃 味 嚷 呀 唯P 蛋 院 阵 陈 屑 防 卫 陔 刷 阿 陪 尾 居 壁 陂 险 阳 际 陵 除 队 降 将 届 陡Q 求 狈 猫 狗 岳 氟 狠 狄 狱 狡 其 助 盍 妻 适 却 狙 猖 獭 猿 狳 猴 狂 氧 猛R 晏 晕 时 晚 最 晡 量 炅 市 览 动 冒 早 高 昵 次 景 星 亩 明 夜 旺 晒 决 准S 示 馆 导 刺 绿 纺 红 编 级 研 经 声 纳 知 破 组 统 纸 社 缓 给 络 志 题 速T 天 坏 寺 切 垢 坊 域 墟 埸 圾 界 男 坶 填 吞 坡 坎 赤 累 墙 胃 畛 城 思 地 址U 雨 胖 胀 胸 需 肤 脏 炙 胰 配 叉 劝 霜 肢 胭 服 脸 脑 胜 肚 朋 霉 胳 腰 预 建V 傲 体 付 例 微 仿 很 伙 代 佼 何 化 每 件 保 仓 伏 会 伸 街 仅 从 全 假 优 作W 未 责 弄 刘 瑞 罪 感 琥 表 现 来 成 条 置 赢 玻 球 冬 素 备 青 珍 玫 忘 顼 违X 西 外 懂 尖 悄 窥 空 熏 忆 少 悦 究 粟 要 名 怨 突 惊 性 尘 愉 容 忙 多 快 惟Y 页 测 满 美 洲 泼 江 渴 湾 配 河 治 着 洗 澡 波 法 晋 沈 洞 津 海 汪 洒 油 雅Z 专 受 豺 制 步 跋 跟 孩 踢 起 趴 此 集 赵 售 踞 臭 航 跖 鼻 越 趁 路 息 跃 逃
11.特殊字符的输入方法
(1)中文标点符号的输入
在30键认知码状态下,按相应的西文标点符号键,即得到中文标点符号,它们之间的对应关系如下:
西文,. / ;:?! ″ ′ () ^ - & <> @ $
中文,。、;:?!“”‘’()……—— —《<>》·¥
注:双引号、单引号连按两次自动配对。连按两次<、>,单、双书名号自动嵌套配对。因[;][,][.][/]此四键接在字母后面就参与编码,因此要打出这四键所表示的中文标点符号,应先按一下空格键或切换到大写字母状态。“[”在编码时作模糊键用,要用括号“[”,可切换到大写字母状态(按Caps Lock键)。
(2)中文数量词的简化输入
30键认知码规定,按“O”键后接着按数字键,就进入中文数字、度量单位、年月日及元角分的简化输入方式,小写“o”为输入小写中文数字标记,大写“O”为输入大写中文数字标记,每个数字后面所接字母所表示的量的含义,见下面的对应表:
大写中文数字度量单位年月日元角分对应表
另外,如用“$”代“y”则表示美元。
输入完成最后按空格键,如:
输入 输出
O3w2q5b3sly($) 叁万贰仟伍佰叁拾壹元(美元)
O6b8sgl 陆佰捌拾公里
o5q9b4s2t 五千九百四十二吨
o1998n6u15r 一九九八年六月十五日
(3)图形字符的输入
汉字区位码1-9区的图形字符可用两种方法来输入:
①Q+数字(01-09),这时在屏幕的下端出现该区的字符,可用“+”、“-”键翻页查找,按数字键选择。
②Q+区位编码。对经常用到的几个字符,如果能记住这些字符的区位编码,用这种方法就能很快打出你所要的字符。
12.词的编码
在30键认知码中,词语的输入有形码输入、声码输入和联想输入三种输入方式。用户也可自定义词组,方法与认知码一致(从略)。在对词编码时,无论是形码或声码,当对某键不能确定时,可使用“[”模糊键代替,进行模糊输入。与字码一样,因“A”键具有两重性,凡词码以“A”键开头的要先打空格键。
12.1词的形码输入方法
(1)二字词的编码
分别取第一字、第二字的首末字根代码,再加空格键。如为单根字,则重复取。例如:
学校---EZMJ 教师---LWRJ 国家--OKBS 学生---EZSS 工人---GGVV
(2)三字词的编码
分别取第一字、第二字、第三字的首字根再加第三字的末字根代码,最后加空格键。如第三字为单根字,则重复取。例如:
计算机---IKMJ 摩托车---MFCC 电视机---DSMJ 江苏省---YCXM
(3)四字及四字以上词的编码
分别取第一、二、三、末字的首字根代码,最后加空格键。例如:
汉字编码---YBSS 经济效益---SYJK 社会主义---SVKI
人民日报---VMRF
中华人民共和国---ZVVO 电子计算机---DZIM
12.2词的声码输入方法
在词的声码输入中,声母“zh,ch,sh”分别对应首字母“Z,C,S”键。如字的读音不用声母(零声母),则取该字韵母的首字母。
(1)二字词的编码
分别取第一字第二字的声母,再加第一字的首根形码及第二字的末根形码,最后再加空格键。如:
国家---GJOS 学校---XXEJ 教师---JSLJ 工人---GRGV 人民---RMVM
(2)三字词的编码
分别取第一、二、三字的声母,再加第三字的末根形码,最后再加空格键。例如:
电视机---DSJJ 现代化---XDHL 江苏省---JSSM 北京市---BJSJ
(3)四字及四字以上词的编码
分别取第一、二、三、末字的声母,最后再加空格键。例如:
社会主义---SHZY 经济效益---JJXY 汉字编码---HZBM
人民日报---RMRB 中华人民共和国---ZHRG 电子计算机---DZJJ
(4)高频词的简码输入
最常用的二字词和三字词可用简码输入。
①高频二字词的简码
分别取第一字第二字的声母,再按数字键2。例如:
国家---GJ2 我们---WM2 人民---RM2
②高频三字词的简码
分别取第一、二、三字的声母,再按数字键2。例如:
计算机---JSJ2 大学生---DXS2 江苏省---JSS2
(5)声母分流
为减轻字母键Y的负担,对Y的某些音节(用实际读音的首字母)进行适当分流:
①当词语中汉字的拼音为“YI,YIN,YING”,这时的“Y”对读音不起作用,以Y后的“I”作为对应键位。如:“衣”、“乙”、“尹”、“英”对应键位“I”。
②当词语中汉字的拼音为“YU,YUE,YUAN,YUN”,这时的“Y”对读音不起作用,以Y后的“U”作为对应键位。如:“雨”、“月”、“冤”、“晕”对应键位“U”。
(6)形码打法
以形对应和以次序对应的高频字根,以及“为”和“这”两个高频字,在词语声码输入中皆对应其读音的声母。如:“虫”、“鱼”、“山”、“八”、“为”在词语声码中的代码分别为“C”、“U”、“S”、“B”、“W”。这些字根如以其对应的形码输入也是可以的,但只作为该词的兼容码,而不是标准码。
当词的声码与某一词的形码相重时,则排于其后,按数字键2选择。
12.3词的联想输入
在30键认知码中,词可用形码输入或声码输入,也可以联想输入。每打出一个字,屏幕上显示出与该字相联系的词条,即可按数字键选择所要的词语。词语多于10条时,可按“=”、“-”键翻页选择。
本发明与现有认知码相比具有以下优点:
1.输入速度更快
这是通过以下措施来达到的:
(1)将键位分布从四排压缩到三排,将键位数从33个压缩到30个,减少了手指行程,避免越排击键。
(2)由于采用30个键位,虽比认知码少了3个,但比五笔字型及其它采用25或26个字母的输入方法多了4到5个键位,再加上键位负荷均衡,因此规定拆字最多取三个字根,使大部分字自然限制在三码以内,三码以内的字达到5300个,且一级字库中的字绝大多数在三码以内,减少了平均码长。
(3)规定了单根字的简化编码和常用字的二级简码,二码以内的字共有764个。
(4)规定字的编码如以笔画补充码结尾,不用打空格键。
(5)加大中排键位的负荷,因为各种研究表明了中排键位的反应时间最短。
(6)通过对高频字根采取以音、形、次序三种方式对应键位,做到总体键位负荷均衡,同时因左右手各负责15个键位,使左右手负荷均衡,指法协调,便于盲打。
(7)采用“分离重码,避开键名”的原则,有效降低了三码范围内的重码。
(8)规定字的编码最多用三个字母(A作补充码时例外),词的编码用四个字母,字词编码空间分开,词库的容量相对来说可以扩大,而不用担心与字的编码发生重码。
(9)词的编码有“形码”和“声码”两种输入方式,词的这两种编码方式之间,以及“字”与“词”之间的编码,中间无需任何换挡操作。一般而言,“形码”更适合“看打”,“声码”更适合“想打”。在声码输入中,高频二字词和高频三字词可用简码输入。
2.更便于记忆
这是通过以下措施来达到的:
(1)设计了基本字根表,它的作用相当于助记词,便于记忆字根总表。
(2)设计了高频字根键位图,便于初学者根据键名记忆西文字母键的分布,以及高频字根的分布。
(3)有些字根也采用以“义”归类,如“氵”归入“水”,便于联想。
(4)5种基本笔画对应的两套代码以形状与次序分别与相应字母键和标点符号键相对应。
(5)字的编码不需使用独体字与准独体字的概念,减少记忆量。
(6)因规定拆字最多取三个字根(有重码时再补充笔画码),凡有简码的汉字都有其三码兼容码,以及有逐键提示功能,因此初学时无需记忆二码字、四码字、五码字,所有字都可先按前三码打出,有重码时按数字键选择,或按该字后面的提示键打出。
3.无重码
由于采用30个键位,键位负荷均衡,字词编码空间分开,最大码长可为5等技术,实现了国标6763个汉字无重码,字词之间无重码。其中需编到5码的汉字只有81个。
4.便于检索
根据编码规则,首末笔画补充码只用来分离重码,作为后续码元只能接于拆字取码之后,因此表示首末笔画补充码的标点符号键不夹于字母之间(有极少数在A作为补充码时例外),即补充码不与字母相混杂,便于按字母顺序检索,而成为一种检字方法。
国标汉字30键认知码编码表为具体实施例,根据30键认知码字根总表、汉字拆分规则、汉字编码规则、单根字的简化编码和常用字的二级简码规定,对GB2312-80中国家标准字符集16区-87区中的6763个汉字,编制了国标汉字30键认知码编码表。考虑到国家标准字符集第一区中的“○”可用于表示中文数字“零”,故也将其收入,故编码表共有6764个汉字。表中汉字按30键认知码字母顺序编排,但每个键位的第一主根(键名)、第二主根、高频字仍按基本字根表次序排在最前面第一、二、三位。汉字前面的4位数字为该字的区位编码,后面的为30键认知码编码。区位码在5589以下的汉字(16区-55区),是国标一级字库的常用字,编码时尽量保证常用字的码长在3码以内。区位码在5601以上的汉字(56区-87区),是国标二级字库中的字,二级字库中的字的编码大部分也是3码,有小部分为4码。在30键认知码中4码字有1381个。有81个字编到5码(绝大部分为非常用字)。表中列出的皆是按规则编的标准码,无一重码。30键认知码的兼容码不在表中列出。“一”的第二个简化编码“AA”在表中列出。
在编码时,为分离重码要加取字的首末笔画补充码。其横、竖、撇、点、折对应的键位应为[A][;][/][,][.]。但几个标点排在一起,使人眼花,不便于查阅。为使码表清晰直观,也为便于排序,在码表中,加取的补充码的竖、撇、点、折不对应[;][/][,][.],而用“6、7、8、9”表示。这样做是合理的,因在拆字过程中碰到的单笔画竖、撇、点、折就归并在第二主根“六、七、八、九”中,这里用6、7、8、9以示区别,表示笔画补充码。为与数字键相区别,在高频字根键位图上,在相应的键位上是用红色的6、7、8、9标记的。编码表是为了由字查码,或由编码而查字、打字。实际打字时,补充码的竖、撇、点、折仍按[;][/][,][.]键。
国标汉字30键认知码编码表
限于篇幅,在本说明书中,国标汉字30键认知码编码表只列到首字母为“F”的字的编码(20-27页)。
机译: 使用英文字母编码汉字的方向码及其输入方法
机译: 汉字输入设备,汉字输入方法和使用其的汉字搜索方法
机译: 使用点模式的个人识别码输入方法,个人识别码输入方法以及网上购物结算系统