首页> 中国专利> 五三码及其键盘

五三码及其键盘

摘要

本发明属于电脑汉字编码输入方法,还涉及了为实现这一方法的键盘。因根据横、竖、撇、捺、折五种基本笔画,特别是主要根据横、竖、斜三类根本笔画编码。所以称之为五三码,它包括五三笔码和五三音码两种编码。

著录项

  • 公开/公告号CN1330306A

    专利类型发明专利

  • 公开/公告日2002-01-09

    原文格式PDF

  • 申请/专利权人 王治阳;

    申请/专利号CN00138082.6

  • 发明设计人 王治阳;

    申请日2000-12-26

  • 分类号G06F3/023;

  • 代理机构

  • 代理人

  • 地址 312500 浙江省新昌县城南开发区振兴北路16号

  • 入库时间 2023-12-17 14:06:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2009-02-25

    专利权的终止(未缴年费专利权终止)

    专利权的终止(未缴年费专利权终止)

  • 2005-06-22

    授权

    授权

  • 2003-04-02

    实质审查的生效

    实质审查的生效

  • 2002-01-09

    公开

    公开

说明书

本发明属于电脑汉字编码输入方法,还涉及了为实现这一方法的键盘。因根据横、竖、撇、捺、折五种基本笔画,特别是主要根据横、竖、斜三类根本笔画编码。所以称之为五三码,它包括五三笔码和五三音码两种编码。顺便指出,称“五三”而不称“三五”是为了避免专利申请中的商业性宣传之嫌,软件上市时是称三五码的。

在键盘上用音码输入汉字时只要掌握汉字拼音便可输入,人们大都能使用,但由于汉字同音字众多,造成重码多,有时甚至不得不从数十个乃至上百个同音字中挑选一个,故输速较低。

为免去同音字选择烦恼,目前所有问世的优秀汉字输入法都主要向三个方向发展。一是智能语句语音输入法,可仍然免不了同音字选择,并且当拼不出读音时无法用它输入;二是各种组字单元码,特点是将众多的组字单元按笔画或拼音或象形(表形)等方式归类,重码低、输速高。由于笔画是一项足以与字母相提并论的有史以来最伟大发明之一,笔画的发明使汉字由象形文字飞跃成为笔画文字,所以按笔画归类的组字单元码相对略胜一筹,较为流行。可各种组字单元码往往不是基于对古汉字特别是对甲骨文的研究基础上,具有一定的主观随意性,并且有个通病,那就是组字单元数大大多于西文字母数,记不胜记,让一般人望而生畏,无法全民普及;三是各种组字单元与拼音结合的编码,特点是要记忆的组字单元较少,有一定的区分同音字能力,输速较快,但因为组字单元数较少,丢失的信息过多,重码率相对较高,并不能真正有效地免去同音字选择。

这样,目前所有问世的编码都未能同时克服两种主要缺陷:或重码率过高,人工干预过多,无法提高输速;或规则繁杂,难学难记,不易推广。仅仅依据汉字的音、形特征编码似乎已山穷水尽,不可能发明出能同时克服两种主要缺陷的理想的完善的编码了,事实并不如此,五三笔码的问世为汉字输入法最终解决打下了基础。

本发明的目的是提供一种不用拼音,不用组字单元,不考虑结构,又基本不按单个笔画编码的电脑汉字编码方法五三笔码,它具有几分种学会、重码率低于拼音、比全拼音码适应面更广的优点。本发明的另一目的是提供一种组合五三笔码和音码的汉字编码五三音码,它是五三笔码的延伸和重大改进。它具有几分种学会、大部分汉字不必选择同音字、输速快的优点。采用调整方案的,也就是采用以码长最多为2码的五三笔码为基础,组字单元为配合,汉字结构为补充并结合拼音的编码,甚至可以几乎不选同音字,从而实现高速脱稿输入,而学成时间仅需10分钟,同时克服了上述两种主要缺陷。

为达到五三笔码的目的,本发明将汉字各种笔画归类为横竖撇捺折五种基本笔画后,进一步归类为横竖斜三类根本笔画。横竖斜的排列组合不外乎27种,可一一对应或大致一一对应地排列在27个或不足27个互不相同的键上,接着不顾会拆散汉字组字单元和拼形结构断然对N笔及以上的汉字按书写顺序以每M笔为一个字母或符号进行编码,N为正整数,M>2,在M笔中不变位置地抽出三笔,归类为横竖斜三类笔画,根据这三笔的排列组合情况输入对应的字母或符号。当取至最后不足M笔时将剩下的笔画归类为几种笔画,对剩下的第一笔或最末笔用若干键表示,为直观起见一般用不属于27个字母或符号的键,比如用数字键,也可用标点符号键。

为达到五三音码的目的,规定五三笔码的最多码长为L,当超过规定时改取最后一码,也就是改取位于字尾的笔画的编码。当规定L较短比如为2码或3码时,补上该汉字的拼音,这一技术虽然简单,以至一般人几分种可学会,却取得大部分汉字不必选择同音字的意想不到的良效。当规定五三笔码的码长最多为2码时,以每三笔编码,为大大降低重码,对某些组字单元作了调整。组字单元由笔画结合产生,组合形成汉字。调整时要避免容易出现在形部编码同一位置的组字频率高的组字单元和横竖斜某种排列组合排在同一键上,还要根据同音字的实际构成反复优选。排列时还可酌情参考组字单元的笔画数,组字单元及横竖斜的27种排列组合的实用频率、键位压缩、指法规则等因素。笔画过多或过少的组字单元往往因不能有效区分同音字而被舍弃,所选用的基本组字单元最好与某种西文字母数大体接近,在实施例中与俄文字母数相当。有的基本组字单元还可以包含互为繁简,互相同源,音或形或义基本接近的组织单元,主要为形体直观相似,还可以规定必须位于特定形体的汉字中才作调整。因基本组字单元数与西文字母数接近,且基本按笔画或拼音或表形等方式排列,所以极为简单;其余用横竖斜的27种排列组合离散,信息含量足,因此重码率很低。这就克服了其它任何编码都未能同时克服的2种主要缺陷。当然,组字单元数可以为任意个。

由于汉字形体复杂,再加上键位压缩,单纯对首尾编码,仍有点重码。为此规定对少量组字单元取其后三笔,其后不足三笔时编码不调整,遇有需要调整的组字单元,要优先按最大的组字单元编码。

个别汉字取首尾首次都不能区分同音字,这时可针对汉字的结构作调整。对重心字,某一码要按重心所在编码;对夹字架去掉某一头后编码;对叠字架可优选几个字母或符号作识别码;对组合组字单元优选取几个字母或符号作识别码。

下面结合实施例作详细说明。

本发明在编码时对汉字笔画的认识完全科学。根据公认的观点,楷书汉字由笔画构成,笔画为书写汉字时不间断地一次连续写成的一个线条。汉字的笔画有多种,在只考虑笔画的运笔方向而不计其轻重长短时,可以将汉字的笔画归类为五种基本笔画:横、竖、撇、捺、折。其中点作捺,提作横,但点提相连时提作点。本人通过潜心研究发现:撇捺都由上向下倾斜,故可称为斜笔画,而折根据其没折弯钩前的运笔方向,可分别并入上述三类笔画中,这三类笔画本发明人称之为根本笔画。它与汉字各种笔画的对应关系,见图一所示,顺便指出所有图中1、2、3均分别为横、竖、斜的代号。

一、为减少重码规定对1至4笔的汉字按书写顺序根据基本笔画的相交情况编码,横、竖、撇、捺、折当没与上一笔相交时编码分别为1、2、3、4、5;当只与上一笔相交时分别是6、7、8、9、0;当不止与上一笔相交时分别取键盘左右上角的五个字母Q、W、E、R、T。

二、对5笔及以上的汉字按书写顺序根据根本笔画横竖斜的排列组合次序对每三笔进行编码。在三个依次出现的笔画中,横竖斜的排列组合不外乎27种,可一一对应地排列在27个互不相同的字母或符号键上,一般一一对应地排列在26个英文字母及某个特定标点符号键上。如果系统允许的话也可以排列在空格键、回车键上,甚至可以在标准键盘上新增一个键,但这会增加系统成本,为便于输入汉字,本发明人利用26个字母的键位及“;”键进行编码,见图二所示,当取至最后不足三笔时,若剩下一笔,最末笔为横或竖或撇或捺或折其编码分别为1或2或3或4或5;若还剩二笔,最末笔为横或竖或撇或捺或折其编码分别为6或7或8或9或0。当然也可以将最末笔改为剩下的第一笔。

由于简化汉字很少超过18笔,因此可规定码长最多6码,超过6码时,最后一码改取末3笔。不过本发明人并不怎么赞成这种人为压缩,因为随着汉字的科学简化,码长会自然而然缩短,码长还可压缩得更短,当规定码长最多为4码或3码时可补上该汉字拼音首字母或声母作为识别码。

为提高汉字输入速度还设置了词组输入法

词组中每字最多取首尾两码,对6笔以下的汉字按单字编码规则取其首尾两码,6笔及以上的汉字取其首三笔和末三笔,不足两码的可补上一个不属于10个数字及27个字母或符号的特定符号,比如可选用“,”。二字词每字各取其首尾两码,三字词前两字各取第一码,后一字取其首尾两码,四字及以上的词取前3个字和最后一个字的第一码。

实施例:一种电脑汉字编码方法五三笔码

        1 JLA R0UO;9KE KSDW 45;C 11MD

“?”键为万能查询键,当某一码难以确定时,可用“?”键代替,再利用提示行选择,不足规定码长的以空格键结尾,当然也可规定以回车键结尾。

应当指出:对五笔及以上的汉字也可按书写顺序根据横竖斜的排列组合情况以每四笔为一个字母或符号进行编码。在依次出现的四个笔画中不变位置地选出其中三笔,比如选首三笔或末三笔,根据这三笔的排列组合情况输入对应的字母或符号,当取至最后不足四笔时,若只剩一笔,最末笔为横或竖或斜,其编码分别为1或2或3;若还剩二笔,最末笔为横或竖或斜,其编码分别为4或5或6;若还剩三笔,最末笔为横或竖或斜,其编码分别为7或8或9,为折时定为0。当然也可以将最末笔改为剩下的第一笔。

五三笔码将二维方块的汉字按书写顺序一维线性化,使得任何人只要懂得最基本的汉字书写顺序即可在短短几分钟掌握它,快捷地输入一个根本不认识的汉字,真正做到了无须练习,立即使用,而且学会后就能牢志不忘。随着汉字的简化,这种电脑汉字编码方法必将显示出更大的优越性。

应当指出:某几种横竖斜排列组合方式组字频率很低,可将之合并排列在若干键上,这样27种横竖斜排列组合可排列在不足27个字母或符号键上,但这记忆不甚方便,所以一般还是以一一对应地排列好。上述规则是以4笔为界编码的,其实也可以以N笔为界,还可以规定码长最多为L,超过规定时改取最后一码,N,L均为正整数,当码长较短时,补上该汉字的拼音,构成五三音码,音码可前可后,一经选定不得改变,下面是规定码长最多为2码或3码时的五三音码的形部编码具体规则:

(1)对只有1笔的汉字,横、竖、撇、捺、折的编码分别为1、2、3、4、5:

(2)对2至5笔的汉字取其首一笔和末一笔,横、竖、撇、捺、折当没与上一笔相交时,其编码分别为1、2、3、4、5;当只与上一笔相交时其编码分别为6、7、8、9、0;当不止与上一笔相交时,其编码分别为位于键盘左上角的5个字母Q、W、E、R、T;

(3)对6笔及以上的汉字取其首三笔和末三笔,对首三笔和末三笔只须根据其横、竖、斜的排列组合情况输入对应的字母或符号键即可;

(4)对1至5笔的汉字或者按书写顺序对每三笔进行编码,对每三笔只需根据其横竖斜的排列组合情况输入对应的字母或符号键即可。若还剩一笔,最末笔为横或竖或撇或捺或折,其编码分别为1或2或3或4或5;若还剩二笔,最末笔为横或竖或撇或捺或折,其编码分别为6或7或8或9或0;当然也可将最末笔改为剩下的第一笔,也可不考虑剩下的笔画数。

(5)对6笔及以上的汉字或者按书写顺序先对头三笔和次三笔编码,若还剩一笔,最末笔为横或竖或撇或捺或折,编码分别为1或2或3或4或5;若还剩二笔,最末笔为横或竖或撇或捺或折,编码分别为6或7或8或9或0;若还剩三笔及以上,改取末三笔。对头三笔、次三笔、末三笔只需根据其横竖斜的排列组合情况输入一一对应的字母或符号即可。

规则(1)~(4)都以6笔为界,其实也可以以3笔及以上的任意笔画数为界。比如规定对4笔及以上的汉字取其首三笔和末三笔,对1至2笔的汉字可直接输入其双拼码,这样完全舍弃了数字键,但会增加点重码。

音码可以为全拼或简拼或混拼或双拼或不完整拼音。采用不完整拼音,因与全拼不一致,会增加重码,一般不采用。为缩短码长提高输速,一般用双拼法,在实施例中选用微软双拼,还约定音码在后,因规则(4)包含规则(1),规(2)要区分笔画数,规则(5)码长稍长,所以在实施例中按规则(3)、(4)编码。

为提高汉字输入速度还设置了简码、词组、语句输入法。

一、简码

数字一至九只需击一次相应的数字健,字母简码见图三,该图的特点是除A、O、E、I、U按拼音末字母,V按象形,“;”按笔画定位外,其余都按拼音首字母定位。冒号前为一级简码,冒号后为与它在句子中用法类似的同类高频字。对同类高频字只需按该图的左右顺序在一级简码后击相应的数字键1、2、3、4、5即可。

按规则(4)编码时,由于全码输入时击数字键不甚方便,一般大部分1至5笔的汉字都可舍去数字键,击其简码。具体讲对1至2笔的汉字可直接输入其双拼码,对4至5笔的汉字可在输入首三笔所对应的字母或符号后再接着输入其双拼音码。用简码输入时利用数字键会大大增加简码数量,二级简码按五三音码形部编码从理论上讲有700多个,若利用数字键可扩充至1000个左右,这会明显提高输速。三级简码从理论上讲可舍弃五三音码4位编码中的任意1位,考虑思维习惯一般舍弃形部编码第二位码或韵母。

二、词组

词组输入法有两种:一是声韵双拼法;二是按五三音码形部编码。双字词只需直接输入每个汉字的形部编码;三字词输入第一第二个汉字的形部第一位码,再输入第三个汉字的形部编码;四字及以上的多字词只需输入第一、二、三和最后一个汉字形部第一位码。形部编码不足二码,补上“,”键。

三、语句

语句输入时只需接连输入句子中每个汉字的声、韵母即可。

实施例    一种电脑汉字编码方法五三音码

          1 JAVS DMNK HJZI BMMA FHFA WSYM

        若按规则(2)编码,五的编码为11WU,三的编码为11SJ,

        若按规则(5)编码,种的编码为几AVS,

该实施例在词组输入时采用微软双拼输入法。为尽可能消除重码和避免编码的二义性,单字输入时不支持多音字输入,词组输入时仍支持多音字输入。

有些经常出现在字首或字尾的汉字组字单元组字频率高,若完全按规则(3)、(4)编码,容易集中排列在某一字母或符号键上,这会造成一定数量的重码,因此有必要作适当调整。调整的方法是将这些组字单元从组字频率高的某几种横竖斜排列组合键上抽出,排列到组字频率低的横竖斜排列组合键上,避免容易出现在编码同一位置的组字频率高的组字单元及横竖斜某种排列组合排在同一键上,排列时还考虑了同音字因素,还可酌情参考组字单元和横竖斜27种排列组合的实用频率、键位压缩、指法规则。本发明人综合比较,反复优选后调整方案见图四,图四还调整了横、竖、斜三类笔画的排列次序,该图也即优化五三音码形部编码键盘排列图。下面作具体解说:

(1)目含且、、皿、臼,钅含金,日含,足含走,贝含见,扌含,讠含言,含、已、巳、己、巴、尸、,土含士、、牛,氵含水,含,含心,阝含耳,饣含食字头,亻含,メ含,特别指出广不含疒,麻部,木不合未、口不得与其它笔画相交,贝在字首时,按其末三笔编码,也就是为C,这些被含的组字单元与基本组字单元或互为繁简,或互相同源,或音、形、义基本相同,可视为同种组字单元,就象字母有大小手写体一样。

(2)以上组字单元严格按书写顺序出现在字首或字尾,才排列在相应的字母上,心的前三笔为竖斜斜时,编码为声母X。艹下面为氵时惯常与去氵后的字发生重码,编码非改不可,编码为改的声母G,艹下面为扌,犭前为氵、讠,日、口上面与十相连时编码改为G,口上面为八、冂,编码也为G,一横与二竖相交或相连,一般为H,但艹下面连一到二横时以廿代表,编码为声母N。连三横时编码作为组合组字单元,编码也为G,例如萍的编码为“GJP;”,“故”的编码为GKGU,车、禾应位于字首,亻应在字的左部,メ应该在字尾。不在规定位置时,编码不作调整。女的书写顺序为横折撇,忄的书写顺序点竖点,力刀的书写顺序因人而异,约定在下部时为撇折,其余都为折撇。离散的笔画“乙”形似竖的代号2,约定作竖,己上面为山时不作调整。

(3)木根据其首三笔编码;目、禾分别根据末三笔编码;饣为食的简体,其末三笔为N,日的左部,足的中部象E,亻变形后似W,贝象R,メ形似X,讠象I、口象O,象P,扌形似F,艹象H,犭的形似反K,反文低象K,象2个L连成;王形似手写体Z,大有撇有捺象倒立V,钅字头形似V,所以将它们排列在相应的字母键上;的前三笔出现在字首时,形如U,出现在字尾时,为倒立的,编码为U,土、月、氵、广按声母编码,竹按韵母编码。车的第二笔视为撇折的话,将它横倒看,其首三笔就为竖斜竖,所以编码为B,巾将其横倒看,其笔画为横竖横,所以排列在A上,起笔形似L,且其三笔从右向左看为斜斜竖,所以将其排列在L上,的第一三笔为竖斜,兼容在Y键上,小的第一三笔为竖斜,兼容在H键上,的第一二笔为斜横,下面又有二点,所以排列在J上,米的上半部从左至右点竖点、所以排列在P键上,是一线连三横,所以排在Q上,特别规定:马、彳、忄、田、耳、鱼、雨出现在字首时,第二码取依书写顺序出现在其后的次三笔。门、囗部取其内次三笔。如其后不足三笔时,仍按原来规则编码。在对首三笔、其后次三笔、末三笔编码时,遇到调整后的组字单元,则要优先按最大的组字单元编码,木、马、虫在字下部时移至字首后编码。另外,阝象B。例如骥的编码为ARJI,固的编码为RGGU,日的编码为E1RI。

(4)由于每个键上最多只有2个基本组字单元,总共才30余个基本组字单元,与俄文字母相当,且主要按笔画或拼音或象形(与西文字母或号相似)等方式排列在键上,极便于记忆,当然个别似乎有点联想、无理。

(5)有的组字单元组字频率高,但因不足3笔,信息含量低,被舍弃,有的组字单元在6笔以上,但组字频率低,实际信息含量不足,也被舍弃。

(6)可以将某几种横竖斜排列组合方式排在同一键上,按规则(4)编码时也可将剩下的笔画归类为另外几种笔画,比如将折分为顺折、逆折等等,这些都属于该领域普通专业技术人员的变形,不影响本发明实质。

有的汉字为左中右结构或上中下结构,两头组字单元又完全相同,形似夹着一个组字单元,本发明人称之为夹字架。对夹字架可去掉其字首或字尾的组字单元,然后编码,在实施例中去掉字尾的组字单元后编码。

左中右结构,中间在三笔及以上,右边为刂,上中下结构,上面为立,下面为儿也属于广义上的夹字架,对这些夹字架可同样去掉字尾的组字单元后编码。

赤部不属于土部,齿、步部不属于止部,所以应按下半部的首三笔编码。与载类似结构重心在车处,与赢类似结构重心在贝处,所以应按重心所在编码。另外约定组字单元玉、甫、戋右角的点忽略不计。

有的汉字为上下结构,并且至少有2个相同的组字单元依次出现在字尾,本发明人称之为叠字架,对叠字架若有2个相同的组字单元,则形部第2码取英文第一个字母A,若有3相同的组字单元,则取英文第二个字母B。左右结构,右面又为上下结构,并且至少有2个相同的组字单元依次出现在字尾,也属于广义上的叠字架,编码为B。

实施例:弼:WEBI  赢:JRY; 辅:BFFU  荔:HBLI

        一种电脑汉字编码方法五三音码

        1 NWVS E0DM YONK S9HJ KZZI LHBM

        XAMA M5FH SCFA 5 3 JEYN XAMA

其中电的简码:EDM汉的简码:SHJ方的简码:MFH

作为五三音码的一种变形,对6笔及以上的汉字形部编码或者按笔画或拼音或象形等方式先对义部编码,一般当义部在字首时,第二码取字尾三笔,在字尾对取字首三笔,在字中对约定取字首或字尾三笔。由于部首数量划分不一,位置不易确定,相比之下以前一个方案为优选。

本编码字词兼容,不必进行换档等附相操作,重码字极少,重码选择方法和其它输入法相同,另外还设置了去重键“。”也就是将形部编码第二位码改为“。”,这样不影响指法,又可消除重码,利于专职追求高速,“?”键为万能查询键,当某一位码难以确定时,可用“?”代替,再利用提示行选择,不足规定码长的均以空格键结尾。

本编码还提供了一种新的汉字修改方法,它使得汉字修改与西文差不多容易,方法是将光标移至所需要修改的字下,若该字与改后的字同音,双击改后的字的五三音码形部编码,改后的字即上屏,当然这需要强大的软件支持。本方法显然适用于语音语句输入后的修改,软件允许的话,只需念形部编码的读音。

本发明适用于一切大、中、小、微型计算机中文信息处理系统和通讯系统,可广泛应用于中文终端、中文电传、电脑打字和计算机排版印刷等各个方面,可在互联网环境下运行。

本发明可以适用于繁体字的港、澳、台地区,也可以用于日文、韩文,只是日文、韩文汉字与普通话读音不同,组字单元的排列不完全相向,排列方法仍然相同。

五三音码编码规则极为简单、客观,音码部份以双拼法为最快,对于已经掌握双拼法的人来说,不出短短十分钟就能学会,而且学会后就能牢记不忘,没掌握双拼法的人可在练习双拼法时同步学会。单字码长最长不过四码,重码率几乎为0,免去了同音字选择烦恼,音码部分选用南方模糊音几乎不会增加重码,南方模糊音的特点是c、s、z与ch、sh、zh,及in与ing不分,en、eng与清辅音b、p、m、f相拼时区分。支持语句输入,不易疲劳。容量大,从理论上讲可以容纳全部6万多个汉字,做到高速脱稿输入,也就是说不仅适合于盲打,还适合于听打、想打,使得汉字无论是输入速度还是调出速度都要快于西文。

                     附图说明图1、横竖斜三类根本笔画与汉字各种笔画对应关系表。图2、三个笔画中横竖斜的27种排列组合形式在键盘上的一种优选排列图。图3、一级简码和同类高频字。图4、优化五三音码形部编码键盘排列图。图2、图4中1、2、3分别为横、竖、斜的代号。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号