首页> 中国专利> 英语二级盲文转换方法及转换装置

英语二级盲文转换方法及转换装置

摘要

本发明涉及一种英语二级盲文转换方法及装置,属于基于计算机科学的盲文处理与分析技术领域。包括逐字符扫描模块、基本规则转换模块、字母匹配模块、数字转换模块、标点转换模块、简写规则转换模块;逐字符扫描模块用于逐字符读入英文并判断转换,如读取的是字母使用字母匹配模块转换,是数字使用数字转换模块进行转换,是标点使用标点转换模块进行转换,是空格转为空方;基本规则转换模块用于将单字符转为盲文;字母匹配模块用于逐字母与简写规则匹配,如匹配成功使用简写规则转换模块转换,否则使用基本规则转换模块转换;数字转换模块用于根据规则进行数字转换;标点转换模块用于根据规则进行标点转换;简写规则转换模块用于按简写规则转换。

著录项

  • 公开/公告号CN105718450A

    专利类型发明专利

  • 公开/公告日2016-06-29

    原文格式PDF

  • 申请/专利号CN201610046398.1

  • 发明设计人 孟德纯;马振;

    申请日2016-01-22

  • 分类号G06F17/28;G06F17/25;

  • 代理机构

  • 代理人

  • 地址 100083 北京市海淀区学院路30号科群大厦(西楼203房间)

  • 入库时间 2023-12-18 15:45:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-03

    授权

    授权

  • 2016-07-27

    实质审查的生效 IPC(主分类):G06F17/28 申请日:20160122

    实质审查的生效

  • 2016-06-29

    公开

    公开

说明书

技术领域

本发明涉及一种将英语文本转换为英语二级盲文的转换方法及转换装置,属于 基于计算机科学的盲文处理与分析技术领域。

背景技术

盲文又称点字,国际通用的点字由6个凸起的圆点为基本结构组成,是专供盲 人摸读、书写的文字符号。这六个圆点形成63种变化,即可表示63个字符,英文 一共有26个字母,按照互相联系进行一一对应,使用前缀大写符号的形式以表现 为大写字母,剩下的编码还包含了数字符号和常用标点,即一个小写字母对应一个 点字,追加前缀或后缀表示大写字母或数字,将点字连起来组成单词。这就是英语 盲文的基本方案,也是目前国内出版的英语盲文书籍所采用的。

由于盲文自身结构的特点和触觉感知速度的限制,书写、阅读速度慢是各种语 言盲文的共同特点。为了缓解这个问题,世界上许多语言的盲文都有简写方案。英 语盲文的简写方案(二级盲文),是更为流行、科学、精练的英语盲文书写方法,已 经有近百年的历史,是国际交流的基础,而上文提到的英语盲文基本方案反而没有 实用地位。

为了使广大盲人朋友能够学习并使用英语简写方案,必须扩大英语二级盲文的 出版量,但是目前国内英语二级盲文出版还停留在人工阶段,由于盲文出版物内容 的主要来源是明眼人的出版物,一般情况是录入人员拿到一本普通英文书,根据书 的内容逐句以盲文的形式录入到出版系统中,而从英语到盲文的过程是由录入人员 的大脑完成的,因此完成一篇英文的二级盲文录入是相当费时费力的,而且准确率 也不好保证,严重影响出版效率。

本文提出了一种英语二级盲文自动翻译方法,通过将普通英语文本自动翻译为 英语二级盲文,实现了英语二级盲文的快速录入,提升了英语二级盲文书籍的出版 效率。

下面列出了《中国盲文》中英语盲文的具体编码和简写规则:

英语盲文的基本方案(一级盲文):

英语盲文的简写方案(二级盲文)如下:

1.部分词简写

⒉整体词简写

⒊开头字母的简写

⒋末尾字母的简写

⒌词缩写

⒍简要简写规则

a、整体词and、for、of、the、with的简写符号以及单词a,它们之间不 需要空方。

b、整体词be、enough、were、his、in、was的简写符号都属于低层的。它 们前后都要空方,不能与标点符号连写。

c、整体词to、into、by的简写符号也属于低层的。它们跟后面的词或者数 字之间不空方。它们不能用作词的一部分。

d、部分词ea、bb、cc、dd、ff、gg的简写符号也是低层的。它们只能用于词 的中间,绝不能用在开头或末尾。

e、部分词be、con、dis的低层简写符号用在一个词的第一个音节上。它们 也能用在合成词的连号之后,或者一个词分作两行书写时用在下一行的开头。

f、部分词com的低层简写符号只能用在一个词或者一行的开头,同时它可 以不限制于一个音节。

g、部分词ing,ble的简写符号不能用在一个词的开头。它们能够用在一个 词的中间或末尾,也能用在一个词分作两行书写时的开头。

h、开头字母简写符号,是在一个词的第一个字母或简写符号之前加上第五 点,第四、五点或第四、五、六点而组成。它们可以用作整体词,也可以用作部分 词。

i、末尾字母简写符号,是在一组字母的最后一个字母之前加上第四、六点, 第五、六点或第六点而组成。它们只能用作部分词简写,绝不能用在一个词的开头。

发明内容

本发明的目的在于解决英语盲文书籍出版中的自动化录入问题,提供一种由普 通英语文本转换为英语二级盲文的方法,使英语盲文的录入工作可以由计算机自动 完成,进而提高出版效率。

为了实现上述目的,本发明采用了以下技术方案:

一种基于规则的英语二级盲文转换装置,包括逐字符扫描模块、基本规 则转换模块、字母匹配模块、数字转换模块、标点转换模块、简写规则转换 模块;逐字符扫描模块分别与字母匹配模块、数字转换模块、标点转换模块 相连,字母匹配模块与基本规则转换模块、简写规则转换模块分别相连;

所述逐字符扫描模块用于将一段文字逐个字符读取并判断是否需要转 换,如果读取的是字母使用字母匹配模块转换;如果读取的是数字使用数字 转换模块进行转换;如果是标点则使用标点转换模块进行转换;如果是空格 则转为空方;

所述基本规则转换模块用于将单个字符转为对应盲文字符;

所述字母匹配模块用于逐个字母与简写规则进行匹配,如果匹配成功使 用简写规则转换模块进行转换,否则使用基本规则转换模块进行转换;

所述数字转换模块用于根据规则进行数字转换;

所述标点转换模块用于根据规则进行标点转换;

所述简写规则转换模块用于使用指定简写规则将多个字母转为盲文字 符。

有益效果

本发明总结了英语二级盲文转换规则中的共同点,提出了一种简单快捷准确的 处理方法,使英语文本转换为二级盲文的过程自动化,有效提高了英语二级盲文出 版的效率,填补了国内英文到盲文自动排版技术的空白。

本发明的这种转换方法可扩展用于其它语种简写的转换中。

附图说明

图1是本发明实施例的一种英语二级盲文转换方法流程示意图。

图2是本发明实施例中字母转换流程示意图。

图3是本发明实施例中标点转换流程示意图。

图4是本发明实施例中数字转换流程示意图。

图5是本发明实施例的一种英语二级盲文转换装置结构组成示意图。

具体实施方式

下面结合附图对本发明进行详细说明。

根据前述英语简写方案,可以发现第六条规则中的内容是对前五条规则列举的 部分单词或字母组合的补充,如果没有第六条规则,那么可以将这五条规则构成四 组:整词简写(规则2和5),部分词开头可以简写的(规则1和3),部分词中 间可以简写的(规则1),部分词结尾可以简写的(规则1和4)。增加了第六条 规则后,上述四个组需要进行调整,以下逐条处理第六条规则的内容:

1、6.a中的规则是针对规则2中的and、for、of、the、with,并增加了一个单 词a,这条规则并没有影响简写,而是一条空方规则,这六个单词如果挨着就不需 要用空方分隔;

2、6.b中的规则也是针对规则2的,列举了be、enough、were、his、in、was 这几个单词,这条规则对简写的影响是如果挨着标点就不能简写,虽然强调了要空 方但实际上不影响,因为正常都要空方;

3、6.c中的规则还是针对规则2的,列举了to、into、by三个单词,这条规则 对前述总结的四组规则无影响,因为规则2就是要整词匹配,而且是一条空方规则, 后接词或数字不空方;

4、6.d中的规则是针对规则1的,列举了ea、bb、cc、dd、ff、gg这六个字母 组合,这条规则对简写的影响是将前述四组规则中开头、结尾两组包含的内容去掉 这六个字母组合;

5、6.e和6.f中的规则也是针对规则1的,列举了be、con、dis、com这四个 字母组合,在实际使用中是一致的,这条规则对简写的影响是将前述四组规则中间、 结尾两组包含的内容去掉这四个字母组合;

6、6.g中的规则还是针对规则1的,列举了ing,ble两个字母组合,由于背景 技术中涉及的这套规则不涉及到排版,所以不考虑分作两行书写的问题,该规则使 前述四组规则开头包含的内容去掉这两个字母组合;

7、6.h中的规则是针对规则3的,将规则3的适用范围进行了扩展,使前述四 组规则都要包括规则3中的单词;

8、6.i中的规则是针对规则4的,将规则4的适用范围扩展到中间部分;

综合以上,得出五组简写规则:

a、整词简写(二级盲文规则2、3和5,去掉be、enough、were、his、in、was)

b、部分词开头可以简写的(二级盲文规则1和3,去掉ea、bb、cc、dd、ff、 gg、ing、ble)

c、部分词中间可以简写的(二级盲文规则1、3和4,去掉be、con、dis、com)

d、部分词结尾可以简写的(二级盲文规则1、3和4,去掉ea、bb、cc、dd、 ff、gg、be、con、dis、com)

e、后跟标点不简写的整词(be、enough、were、his、in、was)

两条空方规则:

f、彼此挨着不空方(and、for、of、the、with、a)

g、后接词或数字不空方(to、into、by)。

从以上规则发现,a~d中有很多公用的部分,不利于程序判断,所以再对以 上规则进行拆分如下:

I、可以用在词的任何位置,既可以是整词也可以是部分词的,即规则3中 的全部词和规则1中去掉and、for、of、the、with、ea、bb、cc、dd、ff、gg、 ing、ble、be、con、dis、com的剩余部分;

II、必须整词匹配的,即规则5的全部词和规则2去掉be、enough、were、 his、in、was、to、into、by后的所有词;

III、只能在开头的字母组合,be、con、dis、com

IV、只能在中间的字母组合,ea、bb、cc、dd、ff、gg;

V、不能在开始的字母组合,规则4的全部和ing、ble;

VI、简写且彼此相连,and、for、of、the、with、a;

VII、后跟标点不简写的整词(be、enough、were、his、in、was);

VIII、后接词或数字不空方的整词(to、into、by)。

综上所述,一种英语二级盲文转换方法,如图1所示,包括如下步骤:

1)接收一个英文句子,设当前句由若干成分构成,初始令指针指向第一个成 分,各成分为一字母或一数字或一标点或一空格,逐个字符进行判断;

2)判断指针是否指向空:若是,则表示此时指针移动到最后一个成分后面, 无任何成分,转换结束;否则,读取指针指向的成分;

3)判断该成分是否为不需要翻译的字符(换行符或|等):若不是,继续4); 否则,指针指向下一成分,返回2);

4)判断该成分是字母、数字、标点还是空格,分别进行处理;如果是字母继 续,如果是数字跳转到6),如果是标点跳转到7),否则跳转到8);

5)按照字母的转换规则进行转换后跳转到9);

6)按照数字的转换规则进行转换后跳转到9);

7)按照标点的转换规则进行转换后跳转到9);;

8)直接转为空方,继续;

9)指针指向下一个字符,跳转到2)。

作为优选,如图2所示,所述步骤5)中按照字母的转换规则进行转换的具体 步骤如下:

1)判断是否为单词开始位置,如果是则继续,如果否则跳转到17);

2)判断当前字母是否为大写字母,如果是则增加大写字母号,再判断前面单 词是否按照规则VIII简写,如果是则删掉上一个空方,否则继续;

3)与规则I进行逐成分匹配,如果匹配成功则跳转到16),否则指针返回到 该步骤开始时位置继续;

4)与规则II进行逐成分匹配,如果匹配成功,则跳转到9),否则指针返回 到该步骤开始时位置继续;

5)与规则III进行逐成分匹配,如果匹配成功,则跳转到10),否则指针返 回到该步骤开始时位置继续;

6)与规则VI进行逐成分匹配,如果匹配成功,则跳转到11),否则指针返 回到该步骤开始时位置继续;

7)与规则VII进行逐成分匹配,如果匹配成功,则跳转到13),否则指针返 回到该步骤开始时位置继续;

8)与规则VIII进行逐成分匹配,如果匹配成功,则跳转到9),否则指针返 回到该步骤开始时位置跳转到15);

9)判断后面是否为非字母,即单词结束,如果是跳转到16),否则如果是与 规则II匹配而来则指针返回到步骤4)开始时位置跳转到5),如果是与规则VIII 匹配而来则指针返回到步骤8)开始时位置跳转到15);

10)判断当前匹配是否为be并且后面是为非字母,即匹配be整词,如果是则 作为规则VII匹配,跳转到14),否则跳转到16);

11)判断后面是否为非字母,即单词结束,如果是则继续,否则指针返回到步 骤6)开始时位置跳转到7);

12)前面单词是否为规则VI简写,如果是则去掉前面空方后,跳转到16);

13)判断后面是否为非字母,即单词结束,如果是则继续,否则指针返回到步 骤7)开始时位置跳转到8);

14)判断后面的字符是否为标点,如果是则继续,否则跳转到16);

15)使用基本方案转换该成分,结束;

16)按规则进行简写,结束;

17)判断是否为单词中间位置,如果是则继续,否则跳转到21);

18)与规则I进行逐成分匹配,如果匹配成功则跳转到16),否则指针返回到 该步骤开始时位置继续;

19)与规则IV进行逐成分匹配,如果匹配成功,则跳转到16),否则指针返 回到该步骤开始时位置继续;

20)与规则V进行逐成分匹配,如果匹配成功,则跳转到16),否则指针返 回到该步骤开始时位置跳转到15);

21)如果该单词包含两个以上大写字母,则该单词不进行简写,使用基本方案 转换该单词,即将该单词逐字母转换为盲文,结束;否则,跳转到15)。

作为优选,如图4所示,所述步骤6)中按照数字的转换规则进行转换的具体 步骤如下:

1)判断前面是否无数字,如果是则继续,否则跳转到4);

2)输出一个数字符号;

3)前面单词是否按照规则VIII简写,如果是则删掉上一个空方后继续,否则 直接继续;

4)按数字转换规则翻译成盲文,结束。

作为优选,如图3所示,所述步骤7)中按照标点的转换规则进行转换的具体 步骤如下:

1)判断是否为%,如果是则将%对应的盲文插入到数字盲文前,否则继续;

2)判断是否为“'”,如果是则继续,否则跳转到5);

3)判断前后是否为字母或数字,如果是则翻译为略字号,结束,否则继续;

4)判断之前存在的单引号数量,如果为奇数则翻译为后引号,否则翻译为前 引号,结束;

5)使用基本方案转换该成分,结束。

根据上述过程,给出如下转换实例:

例:接收如下英文句子:

Hewasinhisownroomwhenshecamein.

当读到第一个单词He时,没有匹配的简写规则,则照转,由于首字母大写, 所以在单词前追加大写字母号,之后判断后面的单词是was,无连写规则,追加空 方;

当读完第二个单词was时,其有整词简写规则,则按规则转换,之后判断后面 的单词是in,根据规则6.b不需要连写,追加空方;

与was属同类的in和his也按照上面流程进行转换;

当读到own时,ow符合部分词简写规则,进行转换,n照转,追加空方;

当读到room时,没有规则可以简写,照转,追加空方;

当读到when时,wh和en均在部分词简写规则中,分别简写组合后输出,追 加空方;

当读到she时,同own处理一样,sh简写;

当读到came时,同room一样照转;

当读到in时,由于后方有标点,不能简写,所以照转;

标点.照转,最后输出结果如下:

本发明基于上述方法实现了一种基于规则的英语二级盲文转换装置,如图 5所示,包括逐字符扫描模块、基本规则转换模块、字母匹配模块、数字转 换模块、标点转换模块、简写规则转换模块;

逐字符扫描模块用于将一段文字逐个字符读取并判断是否需要转换,如 果读取的是字母使用字母匹配模块进行转换;如果读取的是数字使用数字转 换模块进行转换;如果是标点则使用标点转换模块进行转换;如果是空格则 转为空方;

所述基本规则转换模块用于将单个字符转为对应盲文字符;

所述字母匹配模块用于逐个字母与简写规则进行匹配,如果匹配成功使 用简写规则转换模块进行转换,否则使用基本规则转换模块进行转换;

所述数字转换模块用于根据规则进行数字转换;

所述标点转换模块用于根据规则进行标点转换;

所述简写规则转换模块用于使用指定简写规则将多个字母转为盲文字 符。

本发明总结了英语二级盲文转换规则中的共同点,归纳出了一种简单快捷准确 的处理流程,即输入一个英文句子,逐个字符进行判断是否为不需要翻译的字符或 句子结尾,再判断该字符是字母、数字还是标点,分别进行处理,如果是百分数则 将%提前,然后根据上下文关系及词本身状况,增加或删除大小写标记,最后处理 特殊词的缩写情况;本发明方法使英语文本转换为二级盲文的过程自动化,有效提 高了英语二级盲文出版的效率。

本发明的这种转换方法可扩展用于其它语种简写的转换中。

以上所述是本发明的较佳实施例及其所运用的技术原理,对于本领域的技术人 员来说,在不背离本发明的精神和范围的情况下,任何基于本发明技术方案基础上 的等效变换、简单替换等显而易见的改变,均属于本发明保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号