首页> 中国专利> 一种派生词生成方法及系统

一种派生词生成方法及系统

摘要

本发明涉及一种派生词生成方法及系统,本发明通过建立派生语法规则数组,将输入的字符信息和派生语法规则数组中的派生语法规则数组进行匹配,获得匹配的派生语法规则数组;再根据获得的派生语法规则数组中的条件数组、以及输入的字符信息从语言数据库获得相匹配的单词;然后在该单词的后面添加上该获得的派生语法规则数组中的后缀字母字符序列从而生成派生词。因此,本发明提供的技术方案通过将语言数据库中的单词利用语法规则生成派生词,不再需要将派生词存储于语言数据库中,从而大大节省了语言数据库的存储空间。

著录项

  • 公开/公告号CN101533403A

    专利类型发明专利

  • 公开/公告日2009-09-16

    原文格式PDF

  • 申请/专利权人 广东国笔科技股份有限公司;

    申请/专利号CN200810218948.9

  • 发明设计人 高精鍊;陈炳辉;

    申请日2008-11-07

  • 分类号G06F17/30(20060101);G06F3/023(20060101);

  • 代理机构

  • 代理人

  • 地址 510620 广东省广州市天河区体育东路122号羊城国际商贸中心西塔1310

  • 入库时间 2023-12-17 22:40:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-12

    文件的公告送达 IPC(主分类):G06F17/30 收件人:广东国笔科技股份有限公司 文件名称:中止程序结束通知书 申请日:20081107

    文件的公告送达

  • 2018-05-08

    专利权保全的解除 IPC(主分类):G06F17/30 授权公告日:20101201 解除日:20180313 申请日:20081107

    专利权的保全及其解除

  • 2018-04-17

    文件的公告送达 IPC(主分类):G06F17/30 收件人:广东国笔科技股份有限公司 文件名称:恢复权利请求审批通知书 申请日:20081107

    文件的公告送达

  • 2017-11-28

    专利权的保全 IPC(主分类):G06F17/30 授权公告日:20101201 登记生效日:20170913 申请日:20081107

    专利权的保全及其解除

  • 2017-11-07

    专利权保全的解除 IPC(主分类):G06F17/30 授权公告日:20101201 解除日:20170913 申请日:20081107

    专利权的保全及其解除

  • 2016-10-19

    专利权保全的解除 IPC(主分类):G06F17/30 授权公告日:20101201 解除日:20160921 申请日:20081107

    专利权的保全及其解除

  • 2015-11-04

    专利权的保全 IPC(主分类):G06F17/30 授权公告日:20101201 登记生效日:20150921 申请日:20081107

    专利权的保全及其解除

  • 2010-12-01

    授权

    授权

  • 2009-11-11

    实质审查的生效

    实质审查的生效

  • 2009-09-16

    公开

    公开

查看全部

说明书

技术领域

本发明涉及一种应用于电子设备上的文字输入技术,尤其涉及一种派生词生成方法及系统。

背景技术

目前随着手机、PDA、机顶盒等嵌入式设备都具有文字输入软件,而每个文字输入软件都会包含一个语言数据库,对于用户来说该数据库包含的词语越多越好,但是嵌入式设备上面的存储空间很小,所以语言数据库一般来说只能使用最常用的一些单词。

对于拉丁语系列的语种,例如英语、德语等,都存在很多单词按照一定的语法规则增加后缀字符序列生成派生词的现象。如果将这些词都存入语言数据库中,势必会要求语言数据库扩大存储空间。但如果将语言数据库中单词按照一定语法规则能生成派生词,不用直接存储这些派生词,将大大减低对语言数据库存储空间的要求。

因此,业界迫切需求一种节省语言数据库存储空间的生成派生词的方法及系统。

发明内容

基于现有技术的不足,本发明需要解决的技术问题之一是提供一种节省语言数据库存储空间的生成派生词的方法。

本发明需要解决的技术问题之二是提供一种节省语言数据库存储空间的生成派生词的系统。

为解决上述问题之一,本发明提供一种派生词生成方法,该方法包括如下步骤:1)创建若干派生语法规则数组,每组派生语法规则数组包括后缀字母字符序列、要求被派生单词符合的条件数组,该条件数组包括对应该后缀字母字符序列所要求被派生单词具有的词性;2)输入用户字符序列;3)将所述用户字符序列与每组派生语法规则数组进行匹配,获得与该用户字符序列相匹配的派生语法规则数组;4)根据所述用户字符序列从语言数据库中获得单词,且该单词符合所述获得的派生语法规则数组中的条件数组的要求;在获得的单词后面加上后缀字母字符序列生成派生词,该后缀字母字符序列为该单词所符合的条件数组所属派生语法规则数组中的。

作为本发明方法的一个实施例,所述派生语法规则数组中还进一步包括有根据按键功能定义对应后缀字母字符序列的后缀按键字符序列;所述用户字符序列为用户按键字符序列;在所述步骤3中是将该用户按键字符序列与派生语法规则数组中的后缀按键字符序列进行比较,若用户按键字符序列的尾端包含后缀按键字符序列的部分或全部,则获得该后缀按键字符序列所属的派生语法规则数组。

作为本发明方法的一个实施例,所述派生语法规则数组中还进一步包括有根据按键功能定义对应后缀字母字符序列的后缀按键字符序列;所述用户字符序列为用户按键字符序列;该方法还进一步包括根据按键功能定义将用户按键字符序列转换为用户字母字符序列;所述步骤3将该用户字母字符序列与派生语法规则数组中的后缀字母字符序列进行比较,若用户字母字符序列的尾端包含后缀字母字符序列的部分或全部,则获得该后缀字母字符序列所属的派生语法规则数组。

作为本发明方法的一个实施例,所述用户字符序列为用户字母字符序列;在所述步骤3中是将该用户字母字符序列与派生语法规则数组中的后缀字母字符序列进行比较,若用户字母字符序列的尾端包含后缀字母字符序列的部分或全部,则获得该后缀字母字符序列所属的派生语法规则数组。

作为本发明方法的一个实施例,所述比较是从字符序列的后端向前逐一进行比较的。

作为本发明方法的一个实施例,所述用户字符序列为用户按键字符序列;所述步骤4进一步包括:根据所述用户按键字符序列从语言数据库获得相匹配的单词;将获得的单词的词性与所述获得的派生语法规则数组中的词性进行比较,获得词性一致的单词。

作为本发明方法的一个实施例,所述用户字符序列为用户按键字符序列,该用户按键字符序列根据按键功能定义转换为用户字母字符序列;所述步骤4进一步包括:根据所述用户字母字符序列从语言数据库获得相匹配的单词;将获得的单词的词性与所述获得的派生语法规则数组中的词性进行比较,获得词性一致的单词。

作为本发明方法的一个实施例,所述用户字符序列为用户字母字符序列;所述步骤4进一步包括:根据所述用户字母字符序列从语言数据库获得相匹配的单词;将获得的单词的词性与所述获得的派生语法规则数组中的词性进行比较,获得词性一致的单词。

作为本发明方法的一个实施例,所述条件数组中还包括有根据语法规则对应该后缀字母字符序列所要求被派生单词尾端具有的第二字母字符序列。

作为本发明方法的一个实施例,所述派生语法规则数组中还包括有根据语法规则对应该后缀字母字符序列所要求被派生单词在生成派生词时其尾端需要删除的第一字母字符序列;所述步骤4还进一步包括判断所述获得的单词的尾端是否具有与获得的派生语法规则数组中的第一字母字符序列,若是,则删除该单词尾端的第一字母字符序列,并在其后面添加该派生语法规则数组中的后缀字母字符序列生成派生词;若否,则在该单词的后面添加该派生语法规则数组中的后缀字母字符序列生成派生词。

为解决上述问题之二,本发明提供一种派生词生成系统,该系统包括:输入装置,用于输入用户字符序列;派生语法规则数组存储器,该存储器存储有若干组派生语法规则数组,每组派生语法规则数组包括后缀字母字符序列、要求被派生单词符合的条件数组,该条件数组包括对应该后缀字母字符序列所要求被派生单词具有的词性;第一匹配处理模块,用于将所述用户字符序列与每个派生语法规则数组相进行匹配,并获得与所述字符信息相匹配的派生语法规则数组;第二匹配处理模块,用于根据所述用户字符序列从语言数据库中获得单词,且获得的单词符合所述第一匹配处理模块获得的派生语法规则数组中的条件数组的要求;派生处理模块,用于在获得的单词后面加上后缀字母字符序列生成派生词,该后缀字母字符取自该单词所符合的条件数组所属的派生语法规则数组中;语言数据库,用于存储单词。

作为本发明方法的一个实施例,所述派生语法规则数组中还进一步包括有根据按键功能定义对应后缀字母字符序列的后缀按键字符序列;所述输入装置为按键输入装置,其输入的字符信息为用户按键字符序列;所述第一匹配处理模块通过该用户按键字符序列与派生语法规则数组中的后缀按键字符序列进行比较,若用户按键字符序列的尾端包含后缀按键字符序列的部分或全部,则获得该后缀按键字符序列所属的派生语法规则数组。

作为本发明方法的一个实施例,该系统还包括转换处理模块,用于根据按键功能定义将用户按键字符序列转换为用户字母字符序列;所述输入装置为按键输入装置,其输入的字符信息为用户按键字符序列;所述第一匹配处理模块通过该用户字母字符序列与派生语法规则数组中的后缀字母字符序列进行比较,若用户字母字符序列的尾端包含后缀字母字符序列的部分或全部,则获得该后缀字母字符序列所属的派生语法规则数组。

作为本发明方法的一个实施例,所述输入装置为手写输入装置,其输入的字符信息为用户字母字符序列;所述第一匹配处理模块通过该用户字母字符序列与派生语法规则数组中的后缀字母字符序列进行比较,若用户字母字符序列的尾端包含后缀字母字符序列的部分或全部,则获得该后缀字母字符序列所属的派生语法规则数组。

作为本发明方法的一个实施例,所述第一匹配处理模块进行的比较是从字符序列的后端向前逐一进行比较的。

作为本发明方法的一个实施例,所述输入装置为按键输入装置,其输入的字符信息为用户按键字符序列;所述第二匹配处理模块进一步包括:单词查找处理模块,用于根据所述按键输入装置输入的用户按键字符序列从语言数据库获得相匹配的单词;第一比较处理模块,用于将所述查找处理模块获得的单词的词性与所述第一匹配处理模块获得的派生语法规则数组中的词性进行比较,获得词性一致的单词。

作为本发明方法的一个实施例,该系统还包括转换处理模块,用于根据按键功能定义将用户按键字符序列转换为用户字母字符序列;所述输入装置为按键输入装置,其输入的字符信息为用户按键字符序列;所述第二匹配处理模块进一步包括:单词查找处理模块,用于根据所述转换处理模块转换后的用户字母字符序列从语言数据库获得相匹配的单词;第一比较处理模块,用于将所述查找处理模块获得的单词的词性与所述第一匹配处理模块获得的派生语法规则数组中的词性进行比较,获得词性一致的单词。

作为本发明方法的一个实施例,所述输入装置为手写输入装置,其输入的字符信息为用户字母字符序列;所述第二匹配处理模块进一步包括:单词查找处理模块,用于根据所述手写输入装置输入的用户字母字符序列从语言数据库获得相匹配的单词;第一比较处理模块,用于将所述查找处理模块获得的单词的词性与所述第一匹配处理模块获得的派生语法规则数组中的词性进行比较,获得词性一致的单词。

作为本发明方法的一个实施例,所述派生词语法规则组中还包括有根据语法规则对应该后缀字母字符序列所要求被派生单词尾端具有的第二字母字符序列。

作为本发明方法的一个实施例,所述派生语法规则数组中还包括有根据语法规则对应该后缀字母字符序列所要求被派生单词在生成派生词时其尾端需要删除的第一字母字符序列;所述派生处理模块还进一步包括:第二比较处理模块,用于将第二匹配处理模块获得的单词的尾端与第一匹配处理模块获得的派生语法规则数组中的第一字母字符序列进行比较,若该单词以第一字母字符序列结尾,则删去该单词以第一字母字符序列结尾的尾端字母字符序列;生成处理模块,用于在所述第二比较处理模块处理后的单词的单词后面添加该派生语法规则数组中的后缀字母字符序列生成派生词。

与现有技术相比较,本发明通过建立派生语法规则数组,将输入的字符信息和派生语法规则数组中的派生语法规则数组进行匹配,获得匹配的派生语法规则数组;再根据获得的派生语法规则数组中的条件数组、以及输入的字符信息从语言数据库获得相匹配的单词;然后在该单词的后面添加上该获得的派生语法规则数组中的后缀字母字符序列从而生成派生词。因此,本发明提供的技术方案通过将语言数据库中的单词利用语法规则生成派生词,不再需要将派生词存储于语言数据库中,从而大大节省了语言数据库的存储空间。

下面结合附图详细说明本发明,其作为本说明书的一部分,通过实施例来说明本发明的原理,本发明的其他方面、特征及其优点通过该详细说明将会变得一目了然。

附图说明

图1为本发明一种派生词生成方法在一个优选实施例中的流程图。

图2为图1中所示步骤S3在一个优选实施例中的流程图。

图3为图1中所示步骤S4在一个优选实施例中的流程图。

图4为本发明方法在一个优选实施例中具有的步骤A的流程图。

图5为图1中所示步骤S3在另一个优选实施例中的流程图。

图6为图1中所示步骤S4在另一个优选实施例中的流程图。

图7为本发明方法的步骤406在一个优选实施例中的流程图。

图8为本发明的输入装置在一个优选实施例中的结构示意图。

图9为本发明一种派生词生成系统在一个优选实施例中的结构框图。

图10为本发明系统的第二匹配处理模块在一个优选实施例中的结构框图。

图11为本发明系统的派生处理模块在一个优选实施例中的结构框图。

具体实施方式

本发明适用于所有拉丁语系,包括英语、德语、法语、土耳其语等,主要应用于手机、PDA、机顶盒等电子设备上。

本发明一种派生词生成方法,该方法包括如下步骤:1)创建若干派生语法规则数组,每组派生语法规则数组包括后缀字母字符序列、要求被派生单词符合的条件数组,该条件数组包括对应该后缀字母字符序列所要求被派生单词具有的词性;2)输入用户字符序列;3)将所述用户字符序列与每组派生语法规则数组进行匹配,获得与该用户字符序列相匹配的派生语法规则数组;4)根据所述用户字符序列从语言数据库中获得单词,且该单词符合所述获得的派生语法规则数组中的条件数组的要求;在获得的单词后面加上后缀字母字符序列生成派生词,该后缀字母字符序列为该单词所符合的条件数组所属派生语法规则数组中的。

其中输入用户字符序列的方式有两种:一种是通过按键输入装置输入的按键字符信息,该按键输入装置又可以分为实体键盘和虚拟键盘;另一种是通过手写输入装置输入的字母字符信息。上述两种输入方式都适用于本发明。

下面结合附图,详细说明按键字符信息与字母字符信息之间的关系。参考图8,该输入装置为按键输入装置,具体为数字小键盘。根据按键功能定义,所述按键2-9用于输入字母字符及阿拉伯数字,即每个按键字符对应代表输入一组字母字符或一个阿拉伯数字。这里我们将该按键输入的阿拉伯数字来代表该按键输入的按键字符信息。例如按下按键2,即以2表示对应输入的按键字符,根据对按键的功能定义,该按键2对应输入的字母字符为“A”“B”“C”。以下结合附图详细描述本发明的优选实施例。

参考附图1,本实施例的派生词生成方法包括如下步骤:

步骤S1.根据语法规则创建若干派生语法规则数组,每组派生语法规则数包括一个后缀字母字符序列、对应该后缀字母字符序列的后缀按键字符序列、条件数组、第一字母字符序列,该条件数组包括对应该后缀字母字符序列所要求被派生单词具有的词性、第二字母字符序列。

所述后缀按键字符序列是根据按键功能定义对应该后缀字母字符序列的按键字符信息序列。例如图8所示的键盘,当后缀字母字符序列为“ing”时,对应该后缀字母字符序列的后缀按键字符序列为“464”。该派生语法规则数组中的词性是对应后缀字母字符序列要求被派生单词具有的词性,例如后缀字母字符序列为“ing”要求被派生的单词的词性为动词。

所述第二字母字符序列是根据语法规则,对应后缀字母字符序列所要求被派生单词尾端具有的字母字符序列。例如英语后缀字母字符序列“es”,该后缀字母字符序列“es”要求被派生单词尾端具有的字母字符序列为“x”或“s”或“ch”或“sh”,因此在条件数组中对应后缀字母字符序列“es”的第二字母字符序列为“x”、“s”、“ch”、“sh”。

第一字母字符序列是根据语法规则对应后缀字母字符序列所要求被派生单词在生成派生词时需要删除其尾端的字母字符序列。例如在英语中:后缀字母字符序列“er”,当被派生的单词尾端以字母字符序列“e”结尾时,该后缀字母字符序列“er”要求被派生单词删除其尾端字母字符序列“e”后再添加该后缀字母字符序列“er”,因此在派生语法规则数组中对应后缀字母字符序列“es”的第一字母字符序列为“e”。

步骤S2.输入用户按键字符信息。

步骤S3.将所述用户按键字符序列与每组派生语法规则数组进行匹配,获得该用户按键字符序列相匹配的派生语法规则数组。参考图2,该步骤又进一步包括如下步骤:

301.在若干派生语法规则数组中取出一组,并从该组派生语法规则数组中取出后缀按键字符序列。

302.将步骤S2中所述用户按键字符序列与步骤301中取出的后缀按键字符序列从后端向前逐个字符地进行比较。若所述用户按键字符序列从后端向前按照顺序包含有后缀按键字符序列,则完全匹配;若用户按键字符序列从后端向前按照顺序包含有了用户按键字符序列的部分后缀按键字符序列,则部分匹配;若不符合上述两种情况,则不匹配。

例如,用户按键字符序列为9675464,后缀按键字符序列为464,用户按键字符序列9675464与后缀按键字符序列464从后端向前比较,用户按键字符序列9675464按照顺序完全包含了后缀按键字符序列464,因此用户按键字符序列9675464与后缀按键字符序列464完全匹配。

例如,用户按键字符序列为967546,后缀按键字符序列为464,用户按键字符序列967546与后缀按键字符序列464从后端向前比较,用户按键字符序列9675464按照顺序部分包含了后缀按键字符序列464中的46,因此用户按键字符序列967546与后缀按键字符序列464部分匹配。

303.根据步骤302的比较结果,判断两组按键字符序列是否匹配。若所述用户按键字符序列与后缀按键字符序列完全匹配或部分匹配,则进行步骤304;若不匹配,则进行步骤305。

304.获得步骤303中相匹配的后缀按键字符序列,并获得该后缀按键字符序列所属的派生语法规则数组。

305.判断所述用户按键字符序列是否已经与所有派生语法规则数组中的后缀按键字符序列匹配完毕,若是,则进行步骤S4;若否,则返回步骤301。

步骤S4.根据所述用户按键字符序列从语言数据库中获得符合所述获得的派生语法规则数组中的条件数组的单词。参考图3该步骤又进一步包括如下步骤:

400.由于语言数据库中储存了对应各个单词的按键字符序列,该按键字符序列为对应单词的字母字符序列的按键字符信息。根据所述用户按键字符序列与语言数据库中各个单词的按键字符序列进行比较,从语言数据库中获得与用户按键字符序列相匹配的单词。其包括但不限于以下二种情况:

一、根据步骤S3的匹配情况以及语法规则,该用户按键字符序列需要删除其尾端包含的部分或全部后缀按键字符序列,然后再与语言数据库中的单词按键字符序列进行比对,若相同,则获得该单词。

例如,用户按键字符序列为967546,对应该用户按键字符序列的字母字符序列为workin,在语言数据库中对应单词work存储的单词按键字符序列为9675。在步骤S3中用户按键字符序列967546与后缀按键字符序列464相匹配,用户按键字符序列967546包含了后缀按键字符序列464的46部分。因此,该用户按键字符序列967546需要删除46部分变成9675后,再与语言数据库中的单词按键字符序列去比对,从而获得单词work。

二、根据步骤S3的匹配情况以及语法规则,该用户按键字符序列需要删除其尾端包含的部分或全部后缀按键字符序列,再在其末端添加按键字符后与语言数据库中的单词按键字符序列进行比对,获得匹配的单词。

例如,用户按键字符序列为35464,对应该用户按键字符序列的字母字符序列为fling,在语言数据库中对应单词fly存储的单词按键字符序列为359。在步骤S3中用户按键字符序列35464与后缀按键字符序列464相匹配,用户按键字符序列35464包含了后缀按键字符序列464。因此,该用户按键字符序列35464需要删除464部分变成35后,再添加4变成354后与语言数据库中的单词按键字符序列去比对,从而获得单词fly。

401.根据步骤S3的匹配结果,查找是否有与用户按键字符序列相匹配的派生语法规则数组,若有,则进行步骤403,若没有,则执行步骤402。

402.结束操作。

403.从步骤400获得的单词中取出一个单词,并获得该单词的词性。

404.从步骤S3获得的派生语法规则数组中取出一组派生语法规则数组,并将步骤403中取出的单词与该派生语法规则数组中的条件数组进行匹配。当该派生语法规则数组的条件数组中不存在第二字母字符序列时,且该单词的词性与该条件数组中的词性一致,则该单词符合该条件数组的要求,即该单词与该派生语法规则数组相匹配;若词性不一致,则不匹配。当派生语法规则数组的条件数组中存在第二字母字符序列,则还需要将该单词的尾端与该第二字母字符序列进行比较,若该单词的尾端具有该第二字母字符序列、且该单词的词性与该条件数组中的词性一致,则该单词符合该条件数组的要求,即该单词与该派生语法规则数组匹配;否则,不匹配。

405.根据步骤404的匹配结果,判断是否匹配,若是,则进行步骤406;若否,则进行步骤407。

406.在获得的单词后面加上其所符合的条件数组所属派生语法规则数组中的后缀字母字符序列生成派生词。参考图7,其又包括如下步骤:

461.查找判断所述派生语法规则数组中是否存在第一字母字符序列,若存在,则进行步骤462;否则进行步骤465。

462.将单词的尾端与该第一字母字符序列从后往前进行比较。

463.判断该单词是否以该派生语法规则数组中的第一字母字符序列结尾,若是,进行步骤464;若否,则进行步骤465。

464.删除该单词尾端以第一字母字符序列结尾的字母字符序列。

465.在单词的后面添加该派生语法规则数组中的后缀字母字符序列生成派生词。

407.查找判断所述单词是否与步骤S4中获得的全部派生语法规则数组匹配完毕,若是,则进行步骤408;若否,则返回步骤404。

408.判断步骤S3中获得的单词是否还有未匹配的,若是,则进行步骤S5;若否,则返回步骤403。

步骤S5.将生成的派生词按照其匹配程度以及单词使用的频率等进行优先级排列,并将已经生成优先级的派生词加入到候选数组,供用户选择。

在其他实施例中,为节约程序,可以设置当输入的用户字符序列出现错误时直接结束操作。参考图4,该方法在所述步骤S2与S3之间还设有步骤A,该步骤A又包括如下步骤:

A01.根据步骤S2中所述用户字符序列从语言数据库中搜索与其匹配的单词,该用户字符序列可以是用户按键字符序列,也可以是用户字母字符序列。

A02.根据步骤A01搜索的结果,判断语言数据库中是否有与该字母字符序列相匹配的单词。若是,则进行步骤S3;若否,则执行步骤A03。

A03.结束操作。

在其他实施例中,所述步骤S3也可以通过用户字母字符序列与派生语法规则数组中的后缀字母字符序列进行匹配,该用户字母字符序列可以是步骤S2中通过手写输入装置输入的用户字母字符序列;也可以是步骤S2中通过按键输入装置输入用户按键字符序列后,再根据按键功能定义将该用户按键字符序列转换的用户字母字符序列。经过匹配后获得与该用户字母字符序列相匹配的派生语法规则数组。参考图5,该步骤进一步包括如下步骤:

S301.从派生语法规则数组的一组派生语法规则数组中取出后缀字母字符序列。

S302.将所述用户字母字符序列与步骤S301中取出的后缀字母字符序列从右至左进行比较。若所述用户字母字符序列从后端向前按照顺序包含有后缀字母字符序列,则完全匹配;若用户字母字符序列从后端向前按照顺序包含有了后缀字符序列的部分字母字符,则部分匹配;若不符合上述两种情况,则不匹配。

例如,用户字母字符序列为working,后缀字母字符序列为ing,字母字符序列working与后缀字母字符序列ing进行比较,该字母字符序列working按照顺序完全包含了后缀字母字符序列ing,因此字母字符序列working与后缀字母字符序列ing完全匹配。

例如,用户字母字符序列为workin,后缀字母字符序列为ing,字母字符序列workin与后缀字母字符序列ing进行比较,该字母字符序列workin按照顺序包含了字母字符序列in,因此字母字符序列working与后缀字母字符序列ing部分匹配。

例如,用户字母字符序列为workk,后缀字母字符序列为ing,字母字符序列working与后缀字符序列ing进行比较,该字母字符序列workk与后缀字母字符序列ing不匹配。

例如,用户字母字符序列为workign,后缀字母字符序列为ing,字母字符序列working与后缀字符序列ing进行比较,该字母字符序列workign与后缀字母字符序列ing不匹配。

S303.根据步骤S302的比较结果,判断两组字母字符序列是否匹配。若所述用户字母字符序列与后缀字母字符序列完全匹配或部分匹配,则进行步骤S304;若不匹配,则进行步骤S305。

S304.获得步骤S303中相匹配的后缀字符序列,获得该后缀字符序列所属的派生语法规则数组。

S305.判断所述用户字母字符序列是否已经与全部所述派生语法规则数组的后缀字母字符序列匹配完毕,若是,则进行步骤S4;若否,则返回步骤S301。

在其他实施例中,可以将所述步骤S2输入的用户按键字符序列根据按键功能定义转换为用户字母字符,这样所述步骤S4还可以按照以下方法实现。当然,若所述步骤S2是通过手写输入装置输入的用户按键字符序列,所述步骤S4也同样可以按照以下方法实现。参考图7,该步骤进一步包括如下步骤:

参考图6,该步骤进一步包括如下步骤:

S400.根据用户字母字符序列从语言数据库中获得匹配的单词,其包括但不限于以下二种情况:

一、根据步骤S3的匹配情况以及语法规则,该用户字母字符序列需要删除其尾端包含的部分或全部后缀字母字符序列,然后再与语言数据库中的单词字母字符序列进行比对,若相同,则获得该单词。

二、根据步骤S3的匹配情况以及语法规则,该用户字母字符序列需要删除其尾端包含的部分或全部后缀字母字符序列,再在其末端添加字母字符后与语言数据库中的单词字母字符序列进行比对,获得匹配的单词。

S401.根据步骤S3的匹配结果,查找判断步骤S3是否获得有相匹配的派生语法规则数组,若有,则进行步骤S404,若没有,则执行步骤S402。

S402.输出步骤S400中匹配到的单词。

S403.结束操作。

S404.从步骤S3获得的派生语法规则数组中取出一条派生语法规则数组,并取出该派生语法规则数组中的条件数组。

S405.从步骤S400获得的单词中取出一个单词,并获得该单词的词性。将步骤S404中取出的条件数组与该单词进行匹配。该匹配与上述实施例一步骤404中的介绍一致,这里就不再赘述了。

S406.根据步骤S405的匹配结果,判断是否匹配,若是,则进行步骤S407;若否,则进行步骤S408。

S407.在该单词的后面加上该派生语法规则数组中的后缀字母字符序列生成派生词。如图8所示,该步骤具体可以参考上述实施例一,这里也不再赘述了。

S408.查找判断步骤S404中取出的派生语法规则数组是否已经与步骤S400获得的全部单词匹配完毕,若是,则返回步骤S405;若否,则进行步骤S409。

S409.查找判断所述步骤S3中获得的派生语法规则数组是否还有未匹配的,若是,则返回步骤404;若否,则进行步骤S410。

S410.输出生成的派生词。

以下结合附图8-11,描述本发明派生词生成系统的优选实施例。首先参考图9,本实施例中的所述派生词生成系统包括有输入装置10、派生语法规则数组存储器20、语言数据库30、以及处理器40。

如图8所示,所述输入装置10为数字小键盘,该键盘包括十个数字按键0-9。根据对各个按键的功能定义,每个按键输入的按键字符对应一组字母字符序列。该键盘用于输入用户按键字符序列。

所述语言数据库30用于存储有单词、对应该单词的词性。

所述派生语法规则数组存储器20中存有若干组派生语法规则数组,每组包括一个后缀字母字符序列、对应该后缀字母字符序列的后缀按键字符序列、条件数组、第一字母字符序列,该条件数组包括对应该后缀字母字符序列所要求被派生单词具有的词性、第二字母字符序列。所述后缀按键字符序列是对应该后缀字母字符序列的按键字符序列。第一字母字符序列是根据语法规则,对应后缀字母字符序列所要求被派生单词在生成派生词时需要删除其尾端的字母字符序列。第二字母字符序列是根据语法规则,对应后缀字母字符序列所要求被派生单词尾端具有的字母字符序列。

所述处理器40进一步包括有第一匹配处理模块41,第二匹配处理模块42、派生处理模块43以及转换处理模块44。

所述第一匹配处理模块41将所述输入装置10输入的用户按键字符序列与所述派生语法规则数组表10中各组派生语法规则数组的后缀按键字符序列从后端向前进行比较。若所述用户按键字符序列从后端向前按照顺序完全包含有后缀按键字符序列,则该后缀按键字符序列与该用户按键字符序列完全匹配,即该用户按键字符序列与该后缀按键字符序列所属的派生语法规则数组匹配。若用户按键字符序列从后端向前按照顺序包含了后缀按键字符序列的部分按键字符,则该后缀按键字符序列与该用户按键字符序列部分匹配,即该用户按键字符序列与该后缀按键字符序列所属的派生语法规则数组匹配。若不符合上述两种情况,则不匹配。该第一匹配处理模块41通过比较并获得与所述用户按键字符序列相匹配的派生语法规则数组。

该转换处理模块44用于根据按键功能定义将用户按键字符序列转换为对应的用户字母字符序列。所述第二匹配处理模块42用于从语言数据库30中获得与所述用户字母字符序列、第一匹配处理模块41获得的与派生语法规则数组相匹配的单词。

参考图10,所述第二匹配处理模块42进一步包括单词查找处理模块421、第一比较处理模块422。该单词查找处理模块421用于根据用户字母字符序列从语言数据库30中进行查找,获得与该字母字符序列相匹配的单词,并获得该单词的词性。获得单词的方式包括但不限于以下二种情况:

一、根据第一匹配处理模块41的匹配情况以及语法规则,第二匹配处理模块42需要删除该用户字母字符序列尾端包含的部分或全部后缀字母字符序列,然后再与语言数据库中的单词字母字符序列进行比对,若相同,则获得该单词。

二、根据第一匹配处理模块41的匹配情况以及语法规则,第二匹配处理模块42需要删除该用户字母字符序列尾端包含的部分或全部后缀字母字符序列,再在其末端添加字母字符后与语言数据库中的单词字母字符序列进行比对,获得匹配的单词。

该第一比较处理模块422将查找处理模块421获得的单词与第一匹配处理模块41获得的派生语法规则数组中的条件数组进行匹配,并获得符合该条件数组的单词,即获得与该派生语法规则数组相匹配的单词。具体为,当该派生语法规则数组的条件数组中不存在第二字母字符序列,该第一比较处理模块422将查找处理模块421获得的单词的词性与该派生语法规则数组的条件数组中的词性进行比较,若词性一致,则该单词符合该条件数组的要求,即该单词与该条件数组所属的派生语法规则数组匹配;否则,不匹配。当该派生语法规则数组的条件数组中存在第二字母字符序列时,该第一比较处理模块422将查找处理模块421获得的单词的词性与该派生语法规则数组的条件数组中的词性进行比较,另外还需要将该单词的尾端与该第二字母字符序列进行比较,若该单词的尾端具有该第二字母字符序列、且该单词的词性与该派生语法规则数组中的词性一致,则该单词符合该条件数组的要求,即该单词与该条件数组所属的派生语法规则数组匹配;否则,不匹配。

所述派生处理模块43根据所述第二匹配处理模块42获得的单词以及与该单词相匹配的派生语法规则数组生成派生词。参考图11,该派生处理模块43进一步包括有第二比较处理模块431、生成处理模块432。当所述第一匹配处理模块41获得的派生语法规则数组中不存在第一字母字符序列,则所述生成处理模块432在单词后面添加该派生语法规则数组中的后缀字母字符序列生成派生词。当所述第一匹配处理模块41获得的派生语法规则数组中存在第一字母字符序列,该第二比较处理模块431将第二匹配处理模块42获得的单词的尾端与该派生语法规则数组中的第一字母字符序列进行比较,若该单词的尾端不以该第一字母字符序列结尾,则所述生成处理模块432在单词后面添加该派生语法规则数组中的后缀字母字符序列生成派生词;若该单词的尾端以该第一字母字符序列结尾,则删去该单词以第一字母字符序列的尾端字母字符序列,然后所述生成处理模块432在删除了尾端字母字符序列的单词后面添加该派生语法规则数组中的后缀字母字符序列生成派生词。

在其他实施例中,所述输入装置可以是手写输入装置,该手写输入装置向处理器输入用户字母字符序列。

在本发明派生词生成系统的其他实施例中,所述第一匹配处理模块可以通过将用户字母字符序列与各组派生语法规则数组中的后缀字母字符序列进行比较,从而获得相匹配的派生语法规则数组。在此实施例中,该系统的输入装置可以是输入用户字母字符序列的手写输入装置;也可以是按键输入装置输入的用户按键字符序列,该用户按键字符序列再由转换处理模块根据按键功能定义转换成用户字母字符序列。

若所述用户字母字符序列从后端向前按照顺序完全包含有该后缀字母字符序列,则该用户字母字符序列与该后缀字母字符序列完全匹配,即该用户字母字符序列与该后缀字母字符序列所属的一组派生语法规则数组匹配。若用户字母字符序列从后端向前按照顺序包含有了后缀字母字符序列的部分按键字符,则该用户字母字符序列与该后缀字母字符序列部分匹配,即该用户字母字符序列与该后缀字母字符序列所属的一组派生语法规则数组匹配。若不符合上述两种情况,则不匹配。

在其他实施例中,所述语言数据库中还存有对应各个单词字母字符序列的按键字符序列。所述单词查找处理模块可以根据用户按键字符序列与语言数据库中的按键字符序列进行比较,从而获得与该用户按键字符序列相匹配的单词。

由于拉丁语系存在共性,本发明可以应用于法语、德语、土耳其语等所有拉丁语系,限于篇幅,这里不一一单独介绍,本领域的普通技术人员完全可以根据上述实施例来生成各拉丁语的派生词。

以上所揭露的仅为本发明的较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明申请专利范围所作的等同变化,仍属本发明所涵盖的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号