首页> 中国专利> 缅文字型四码智能编码方法及键盘

缅文字型四码智能编码方法及键盘

摘要

缅文字编码方法及键盘。缅文是一种字符集庞大的文字,为数不多的缅文编码和键盘由于用键多,更换键盘挡位频繁而难以普及使用。本发明的目的是采用标准英文键盘,提出按照自然书写顺序四码输入一个缅文整字,并囊括所有缅文字的编码方法。其特征包括对子、母音,重叠字,特殊字进行有机有序的键位定义;在编码上以整字编码为主,子母音编码为辅,当几个字符同处一个键位时按逻辑推理自动选定该键字符含意。该发明重码率低,容错性好,字、词兼容,可方便地嫁接在汉英字处理系统上。

著录项

  • 公开/公告号CN1088321A

    专利类型发明专利

  • 公开/公告日1994-06-22

    原文格式PDF

  • 申请/专利权人 赵英林;陈刚华;黄文明;

    申请/专利号CN92114870.4

  • 发明设计人 赵英林;陈刚华;黄文明;

    申请日1992-12-17

  • 分类号G06F3/023;

  • 代理机构云南省专利事务所;

  • 代理人孙山明

  • 地址 650500 云南省呈贡县35006部队30分队

  • 入库时间 2023-12-17 12:31:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 1999-02-10

    专利权的终止未缴年费专利权终止

    专利权的终止未缴年费专利权终止

  • 1997-03-12

    授权

    授权

  • 1994-11-30

    实质审查请求的生效

    实质审查请求的生效

  • 1994-11-16

    实质审查请求的生效

    实质审查请求的生效

  • 1994-06-22

    公开

    公开

  • 1993-11-03

    实质审查请求的生效

    实质审查请求的生效

查看全部

说明书

本发明属于文字编码方法及键盘。

缅甸文字是一种拼音文字,较之其它拼音文种,它具有字符集庞大,书写顺序线性差、规则复杂,非拼音字占有较大的使用频度,且大量使用巴利语等特点。它包括:

1.由33个子音和30个基本母音符号构成的拼音字结构。如:…等。

2.与子音和母音毫无关联的特殊字结构。如:…等。

3.子音重叠后构成的重叠字结构。如:…等。

本发明之前,我国内尚未研制出任何缅文编码方案,缅甸本土科技落后,也未见有高质量的缅文编码方法,国际上为数不多的缅文编码也因键盘用键太多,频繁更换键盘档位,部分文字编码失败等原因,难于普及和推广,实用性差。例如德制缅文专用打字机,沿袭拼音文字以往的编码方案,每个键位至多能安排两个字符,通过更换键盘档位来确定键位内容,用键46X2个,几乎每打一字都要变换档位,且大量的重叠字无法打出。字处理速度慢,质量差。还必需配专用键,几乎没有与其它字处理系统兼容的可能。

本发明的目的是发明具有文字编码完整、科学;用键少(只用标准键盘上的A-Y25个键位);重码率低;字、词兼容;易学、易记;击键少、输入速度快的缅文字四码编码方法及键盘。

本发明有以下内容:

(一)键盘键位定义

1.子音键位定义

将缅文33个子音使用频率在千分之一以上(百万字统计)的25个子音迭出,分别定义在标准键盘A-Y的25个键位上,剩余8个罕用子音按同音同位原则,分别与上述25个子音对应定位;

2.母音键位定义:

a.凡由子音字母加构成的母音均与对应子音同键位;

b.与低频子音定义在同一键位;

c.基本母音符号(…),与子音同位且相互排斥的字符设计在同一键位上;

3.特殊字符定义;

按读音中子音发音归类,定义在同音的子音键位上;

4.重叠字(巴利文)标志定义:

在键位上设立重叠字标志*。

5.在编码不矛盾条件下将若干组合母音(…)插入适当键位。

(二)编码主要方法

主要策略是同一键位上字符的确认由该键当前所处位置和前后字符含意自动选定,包括:

(1)单子音编码

33个子音单独成字时的编码为该子音所在键位标志码加短音结束码。

即(键位标志码)+(短音结束码)

(2)普通字编码

a.含字的编码

两码字,(如…)

编码为:(所在键)+(子音)+(结束码)

三码字:(如…)

编码为:(所在键)+(子音)+(母音)+(结束码)

且只能下述母音之一:…。

四码字的编码(:…)

(所在键)+(子音)+(母音)+(母音)

超过四码字的编码(…)

(所在键)+(子音)+(母音)+(最末一字符编码)

b.子音开头字编码

(子音)+(母音)+…+(母音)

除第一码必定是子音外,在第二码以后(包括第二码)根据同一键位上不同母音互相排斥性,缅文组合规律和前后码含义唯一确定当前键代表的母音符号。

(3)特殊字编码

为该特殊字所在键位的重复四码组成,

(4)重叠字编码

在相重叠的两个字音中间加一个重叠识别码“*”,“*”前的子音在上,“*”后的子音在下。

(三)其次,对缅文可以组合成任意缅文整字的单个字符进行编码,处理原则是上下结构整体编,左右结构分开编,先左后右,先上后下。

(四)再次,缅文词汇的编码仍由四码组成,即:

a.2个缅文字组成的词汇,按书写顺序取每个字的前两码;

b.3个缅文字组成的词汇,按书写顺序取每个字的子音加结束码;

c.4个缅文字组成的词汇,按书写顺序取其前3个子音加未一个字的子音。

缅文编码众口称难。这不仅给缅甸本国的信息处理系统造成极大困难,而且给与之交往的国际关系造成信息交流障碍,更使计算机技术在涉及缅文领域时步履艰难。

本发明深入分析研究了缅甸文字的结构,突破拼音文种的传统编码思路,以整字编码为主,字符拼字为辅,四码内完成所有缅文字及常用词汇的编码,使缅文输入达到一个空前的高速度。特别对于词汇编码,是以往拼音文字编码方案中所没有的。本发明键盘设计采用一键盘多码结构,编码技术充分发挥计算机智能优势,根据每键所处位置及前后码意义的不同,通过推理判断选定该键当前应表示的确切内容,从而较好的解决了标准键盘难容庞大的缅文字符集;以往的编码方法不适应缅文特点等难题。

首次做到:用键少,记忆量小,键入顺序与书写顺序吻合,重码率低,字词兼容,键入过程中不换键盘档位等。凡会缅文者,只需花极短的时间便可掌握输入方法,并很快达到熟练程度。

本发明还具有与汉字处理系统兼容性好的特点,可方便地稼接在当前最流行的汉、英字处理系统上,形成缅、英、汉混合字处理能力。

四码缅文字型智能编码方法及键盘可广泛用于各类缅文或缅、英、汉文字处理系统中。

附图一是缅文键盘的两种排列方式。

以下结合附图一中缅文键盘表(一)说明实施例:

一、键盘设计:

从实用、兼容、高效之目的出发,选择标准通用英文键盘,通过键位内容的重定义使之成为一个缅文键盘。

1.键位定义:

本发明采用了一键多码结构,既根据字符的相容和互斥性在一固定键位上安排1-2个子音和1-2个母音,每个键位容纳下多达五个字符。同一键位字符的确认不用换键档,不用加任何识别标志,全由该键当前所处位置和前后字符含意自动选定。

1)子音键位定义:

经过百万字统计,将缅文33个子音字母中使用频率较高的25个选出(),分别定义在标准键盘a-y的25个键位上,剩余八个罕用子音按同音同位原则,分别与上述25个子音对应定位,得子音键位定义表:

2)母音键位定义:

先将缅文母音拆成如下基本母音符号:

根据缅文组字结构分析,以下字符两两同位互斥且形状相似:

因此把上述字符对定义在同一键位上即利于编码,又利于记忆。

所有基本母音符号中只有-在且必在字头,其它字均以子音开头。所以把-与低频子音定义在同一键位。

同理类推,根据从缅文组字结构分析中所得到的规律,凡同位互斥的字符可设计在同一键位上,以此原则将所有基本母音字符,基本母音符号定位。为了进一步提高输入速度,又将若干常用组合母音(…等)设计在适当的键位上,这一部分在使用过程中是任选的。

3)特殊字符定义:

缅文中特殊字符是非拼音的,有:…这些字使用频率较高,由于它们独成一体,不与任何字符结合,所以将其按读音中子音发音归类,定义在同音的子音键位上,通过智能编码加以辨认。

4)重叠字标志定义:(重叠字即两个子音下下重叠构成的缅文字)

缅文中,特别是引用的巴利语中有大量的重叠字,这种字组合特殊,必需专门处理,为此在-键位上设立了重叠字标志*,在编码时使用此标志完成重叠字的识别。

5)标准英文键盘的Z键为未定义键,它为本发明在不同的字处理系统上实现时提供了机动。

2.键位排列:

本发明根据缅文子、母音使用频度提供了基本键位布局(如缅文键盘表)。若用户有特殊的技术需要,可任意调整键位排列,不影响缅文字型编码及输入(本发明同时提供了键位调整软件)。

二、智能编码。

原则:按书写笔顺编码,先左后右先上后下,最多四码一字,前三+末一,不足四码者加短字结束码。

1.单子音编码:

缅文子音共33个:,可以单独成字(类似英文中的A,I)。常用子音有约20个,这33个子音单独成字时的编码为该子音所在键位标志码加短字结束码(短字结束码是为编码不足四码的简单字设定的,可以是空格键或其它合适的字符键)。

单子音编码表:

因为任何母音字符不可能单独成字,所以当单独一键后面跟短字结束码时,该键必定是子音,同键位的其它内容被排除。

2.普通字编码:

普通字指即有子音部分也有母音部分的拼音字,这种字在缅文中占绝大多数。

1)含-字的编码:

是唯一个可在字头出现的母音,它后面必定接子音。(注:在键盘设计中与同键位有子音是缅文中的罕用字,使用频率很低,加上其它组字条件的制约,含-字与字编码相重的机会很少。)

两码字,如…等

编码第一码为A(-所在键)时,第二码必定是子音,同键位的其它内容被排除。第三码为结束码(定为F)。

编码为AFF

编码为ATF

三码字,如等

编码第一码为A时第二码必为子音,第三码必为母音,且只能是下述母音之一:

这些母音分布在不同键位上,键位内容唯一确定,,其它内容被排除,第四码为结束码F。

例:.编码为AEHF

:编码为AVGF

四码和超过四码的字,如等

前三码的分析依然如上,最后一码,必为母音即字尾,能够在字尾出现的母音均分布在不同键位上,因此编码中第四码键的内容也是唯一确定的。

超过四码的字,接前三+末一的原则,取该字前三个字符+最后一个字符编码。

例::编码为AQOG

:编码为AUJG 即:

(注:字也可用组合母音编码为UHCG)

2)子音开头字的编码:

(注:除了含-字外,绝大部分字都是子音开头的,含-字的编码已经讨论过)

此时,编码之第一码必定是子音,第二码以后必定全是母音。

由于每个键位上根据缅文字符的互斥性设计了两个以上的母音,故第二码后的键位有个内容选取问题。

关于同键位母音字符选取的智能分析思路:

本发明在键盘设计中已经充分考虑了安排在同一键位上的不同母音符号的互斥性,此时根据缅文组字规律和前后码和含义就可唯一确定当前键所代表的母音符号。

例:编码OXHF

第一码必定是子音,O键的子音是。

第二码必定母音,X键位上母音有,因子音不与结合,所以此时X应代表母音。

第三码也必定是母音,H键位上有,因第二码母音不与,结合,以此时H应代表-.。

第四码F是结束码。

综上:编码OXHF唯一对应缅文字。

编码FFBH

第一码必定是子音。

第二码F的可选内容有,因为F后还有BH,B的可选内容有三:而无论选哪一个,前面都不可能接,所以第二码F唯一确定代表。

第三码B的可选内容有三:,因前两码是,所以第三码应是。

第四码H的可选内容有三:,因和都不能与前面的结合,所以第四码H唯一确定代表。

综上:编码FFBH唯一对应缅文字。

依此类推,通过这种智能分析完成的编码,重码率很低,即使有重码,其使用频率也有很大的悬殊,优先考虑高频字就不会影响输入速度。

3.特殊字编码:

特殊字与缅文子、母音符号全然无关,为独体字,所以将其全部整体安排在各键位上,其编码为所在键位码重复四次组成。

如:PPPP为

TTTT为

因为任一键位连击四次都不可能拼出其它字,所以特殊字编码绝无重码。

4.重叠字(巴利文)的编码:

编码原则及思路不变,只是在相重叠的两个子音中间加一个重叠字识别码“*”(A键位),“*”前的子音在上,“*”后的子音在下。

例如:重叠字编码为EAWF

5.缅文字符编码:

为适应部分用户的特殊需要及罕用字和新造字的处理,本发明对缅文单个母音字符进行了编码,用这种编码可以组合任意缅文整字,(见母音字符编码表)。

编码原则:上下结合整体编,左右结合分开编,先左后右,先上后下。

例:假如有字(实际没有)

则编码为:整体编为WDKF

分开编为DFFF

组合起来就是字。

6.缅文词汇编码:

为提高缅文字的输入速度,本系统提供了一定量的常用缅文词汇,词汇中收集有国际组织名称,国家机构名称,世界各大通讯社和报社名称,涉及范围有政治、军事、地名等,词汇内容还可根据用户需要无限添加,使用词汇输入方法可大大提高缅文输入速度。

编码原则:

词汇编码仍由四码组成。

1)两个缅文字组成的词汇:按书写顺序取每个字前的两码。

例:编码为:YDAQ

2)三个缅文字组成的词汇,取每个字的子音加结束码。

例:编码为:EIWF

3)四个以上缅文字组成的词汇,取其前三个字子音加末一个字的子音。

例:。

编码为:IDYF。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号