公开/公告号CN102209083A
专利类型发明专利
公开/公告日2011-10-05
原文格式PDF
申请/专利权人 北京搜狗科技发展有限公司;
申请/专利号CN201010137311.4
发明设计人 王天一;
申请日2010-03-31
分类号H04L29/08(20060101);G06F17/30(20060101);
代理机构11319 北京润泽恒知识产权代理有限公司;
代理人苏培华
地址 100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
入库时间 2023-12-18 03:26:04
法律状态公告日
法律状态信息
法律状态
2015-03-18
授权
授权
2012-10-31
实质审查的生效 IPC(主分类):H04L29/08 申请日:20100331
实质审查的生效
2011-10-05
公开
公开
技术领域
本发明涉及输入法技术领域,特别是涉及一种用户词库同步更新的方法、更新服务器以及一种输入法系统。
背景技术
当前的输入法系统(包括中文、日文以及韩文等等)一般均是基于其词库系统以及词库系统中的词频来为使用者在信息输入过程中提供候选词及其排序。候选词及其排序是使用者在信息输入过程中首选词命中率高低的一个重要指标。当然,以中文输入法为例,从技术上讲,输入法系统本身是无法知悉那个词是用户最需要的;但是在浩如烟海的中文字词中,各个字词的使用和出现频率是不同的,将出现频率较高的字词排序在前就可以大大提高输入法系统的首选词命中率,即可以从概率上提高排序在前的词汇满足用户需要的可能性。
在现有技术中,输入法系统一般包括一系统词库,用于满足大多数用户的使用习惯,还包括一用户词库,用于记录特定用户的使用习惯,以更好的提高该用户的输入效率。但是随着计算机技术的飞速发展,现有的输入法用户一般都有可能使用多个设备端,例如,办公室计算机、家用计算机以及移动笔记本或者他人的计算机等等;并且还有可能在多台计算机之间频繁转换。因此,用户希望在各个设备端上的用户词库都能够反映该用户的使用习惯,如果在每个设备端上都重新学习记录,得到用户词库,则效率低下,严重影响用户的输入体验。
公开号为CN101030157的中国专利文献,公开了一种将用户词库在服务器端进行备份的解决方案,该方案可以保证用户在不同设备上使用的都是能够反映该用户使用习惯的同一个用户词库,即使该用户在不同设备上切换使用,也不会影响其使用体验。
但是上述解决方案仍然存在一定的问题,因为虽然一用户在各个设备端上具有一些相通的使用习惯,但是针对不同的设备端,实际上该用户还存在一些专门针对一设备端的使用习惯。例如,对于办公计算机和家用计算机,除了一些基本相同的字词使用习惯外,办公计算机可能存在一些专用于工作相关(例如,专业词汇等)的字词使用习惯,而家用计算机可能存在一些专用与娱乐和游戏的字词使用习惯。例如,“预料”一词在家用计算机的使用频率较高,而“语料”一词在办公计算机的使用频率较高,二者不同。如果简单的直接将用户词库通过服务器统一起来,则会过分强调用户词库在各个设备端上的针对该用户的共性,而忽略不同设备端的个性。
尤其当PC输入法逐渐应用到手机等移动终端上时,由于手机等移动终端键盘输入、选词的不便利性,上述忽略个性所导致的问题更加突出。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够改进现有的服务器端用户词库备份方案,满足用户在不同设备端上的共性需求和个性需求。
发明内容
本发明所要解决的技术问题是提供一种输入法用户词库同步更新的方法,其能够针对不同的设备端下载符合该设备需求的词条信息,即可以保证该用户的共性输入习惯,也可以兼顾该用户在当前设备上的个性输入习惯。
相应的,本发明还提供了一种用户词库更新服务器以及一种输入法系统,以实施上述方法,兼顾用户的共性输入习惯和在当前设备上的个性输入习惯。
为了解决上述问题,本发明公开了一种用户词库同步更新的方法,包括:针对不同用户维护不同的存储空间,在一用户的存储空间内针对该用户名下的不同设备存储有至少两个分设备用户词库;当需要为一用户名下的一当前设备端进行词库更新时,从所述用户存储空间下的分设备用户词库中选择符合当前设备端需求的至少一个分设备用户词库;从所选的分设备用户词库中获取所需更新的词条和/或参数,同步更新至所述当前设备端。
优选的,所述同步更新方法,还可以包括:接收当前设备端上传的需要更新的词条和/或参数;将所述接收到的词条和/或参数更新至该当前设备端对应的分设备用户词库。
优选的,所述同步更新方法,还可以包括:通过当前设备端的下载属性获取当前设备端的下载需求,其中,所述下载属性预设在服务器端,或者,所述下载属性附加在当前设备端发出的更新请求中;所述从用户存储空间下的分设备用户词库中选择符合当前设备端需求的至少一个分设备用户词库包括:根据所述当前设备端的下载属性,从该用户存储空间下的所述分设备用户词库中选择符合当前设备端需求的至少一个设备用户词库。
优选的,所述选择符合需求的用户词库包括:选择所述当前设备端对应的单个分设备用户词库为符合需求的用户词库;或者,选择除所述当前设备端对应的分设备词库以外的至少一个其他分设备用户词库为符合需求的用户词库;或者,选择属于同一设备类别的至少两个分设备用户词库为符合需求的用户词库。
优选的,所述针对不同设备的多个分设备用户词库为分别独立的多个词库文件;每个词库文件记录有词条来源设备的标识参数;或者,所述针对不同设备的多个分设备用户词库为一个词库文件,其中针对词条存储有其来源设备的标识参数,以形成虚拟的针对不同设备的多个分设备用户词库。
优选的,所述一个标识参数代表一个实体硬件设备;或者,依据用户设置,所述一个标识参数代表同属于一类的多个实体硬件设备。
依据本发明的另一实施例,还公开了一种用户词库的更新服务器,包括存储单元、通信单元以及更新处理单元,其中:
存储单元,用于针对不同用户维护不同存储空间,在一用户的存储空间内针对该用户名下的不同设备存储有至少两个分设备用户词库;
通信单元,用于接收设备端下载更新用户词库的请求;以及,将更新处理单元所获取的需要更新的词条和/或参数同步更新至当前设备端;
更新处理单元,用于从存储单元的所存储的分设备用户词库中选择符合当前设备端需求的至少一个分设备用户词库,获取其中所需更新的词条和/或参数。
优选的,所述通信单元还用于接收设备端所上传的需要更新的词条和/或参数;所述更新处理单元还用于将所接收到的词条和/或参数更新至所述存储单元该当前设备端对应的分设备用户词库。
优选的,所述符合需求的分设备用户词库包括:当前设备端对应的单个分设备用户词库;或者,除当前设备端对应的分设备词库以外的至少一个其他分设备用户词库;或者,属于同一设备类别的至少两个分设备用户词库。
依据本发明的另一实施例,还公开了一种输入法系统,位于一设备端,包括:用于记录基础字词及其参数的系统词库;以及,包括在同一用户名下的至少两个分设备用户词库的本地用户词库,所述至少两个分设备用户词库分别针对该输入法用户所使用的不同设备;下载单元,用于向服务器端发送下载更新请求,以及接收所下载的词条和/或参数,更新至本地用户词库。
优选的,所述的输入法系统还可以包括:上传单元,用于向服务器端上传当前设备端中需要更新的词条和/或参数。
优选的,所述的输入法系统还可以包括:
设备端交互单元,用于与另一设备端的输入法系统交互各自用户词库的同步更新信息;
临时服务器单元,用于依据所交互的用户词库更新情况,确定是否选择当前设备端作为临时服务器;如果是,则从本地用户词库中选择符合需求的至少一个分设备用户词库,获取其中所需更新的词条和/或参数发送至所述另一设备端。
优选的,所述的输入法系统还可以包括:权重单元,用于当同一词条分别在多个分设备用户词库重复出现时,则依据预置规则针对各个分设备用户词库中的该词条的参数赋予不同权重,并计算得到最终参数;所述参数用于候选项排序。
优选的,所述符合需求的分设备用户词库包括:当前设备端对应的单个分设备用户词库;或者,除当前设备端对应的分设备词库以外的至少一个其他分设备用户词库;或者,属于同一设备类别的至少两个分设备用户词库。
优选的,所述针对不同设备的多个分设备用户词库为分别独立的多个词库文件;每个词库文件记录有词条来源设备的标识参数;
或者,所述针对不同设备的多个分设备用户词库为一个词库文件,其中针对词条存储有其来源设备的标识参数,以形成虚拟的针对不同设备的多个分设备用户词库。
依据本发明的另一实施例,还公开了一种用户词库同步更新的方法,包括:交互第一设备端和第二设备端的用户词库的同步更新信息;依据交互比较结果,选取其中一个设备端作为临时服务器;其中,所述第一设备端和第二设备端存储有包括至少两个分设备用户词库的本地用户词库,所述至少两个分设备用户词库分别针对当前输入法用户所使用的不同设备;临时服务器接收另一设备端下载更新用户词库的请求;从临时服务器所存储的分设备用户词库中选择符合另一设备端需求的至少一个分设备用户词库;从所选的分设备用户词库中获取所需更新的词条和/或参数,同步更新至另一设备端。
优选的,所述选择符合需求的用户词库包括:选择当前下载设备端对应的单个分设备用户词库为符合需求的用户词库;或者,选择除当前设备端对应的分设备词库以外的至少一个其他分设备用户词库为符合需求的用户词库;或者,选择属于同一设备类别的至少两个分设备用户词库为符合需求的用户词库。
与现有技术相比,本发明具有以下优点:
本发明为了满足用户在多个设备端的共性输入需求,采用服务器端维护针对该用户的用户词库方式,以便将用户的共性输入习惯能够传递至该用户的各个设备端上;并且,本发明为了满足用户在不同设备端上的个性输入需求,针对一个用户帐户维护了多个分设备词库(至少两个),以体现该用户在不同设备上的输入习惯。
例如,可以在所维护的用户词库词条属性中加入词源设备信息,以实现分设备管理。由于词条的词源设备信息的存在,使得在设备端上传信息时,可以仅仅备份更新自己所对应的分设备词库,而不会改变其他的分设备词库;在下载时,则可以从多个分设备词库中获取当前设备端所需的词库进行下载,例如,相同类别的分设备词库等等。
更进一步,由于词条的词源设备信息的存在,在设备端进行具体输入时,可以通过权重等方式以体现用户在当前设备上的个性输入习惯(例如,提高或者降低词源设备信息为当前设备端的词条的候选项排序位置);并且由于同时也下载了其他设备新词,所以同时扩展了当前设备端用户词库中的词汇数量和范围,即仍然保证了该用户在不同设备端输入时的共性输入习惯。
附图说明
图1是本发明实施例所述一种用户词库同步更新的方法流程图;
图2是本发明实施例所述一个服务器端词库存储的示意图;
图3是本发明实施例所述另一个服务器端词库存储的示意图;
图4是本发明实施例所述第一设备端和第二设备端两个设备端之间的同步更新方法流程图;
图5是本发明实施例所述一种用户词库服务器实施例的结构框图;
图6是本发明实施例所述一种输入法系统实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
首先对本发明所涉及的用户词库进行简单介绍。本发明所述用户词库中的词条记录可以包括:用户输入的已有字词及相应的属性参数;和/或,用户输入的自造字词及相应的属性参数。对于用户词库的一条记录的数据存储结构可以为:
(词条;属性参数1;属性参数2;......;属性参数n)
其中,属性参数可以为词频信息、生成时间、最后使用时间、二元关系等等。输入法用户可以通过手动操作对词库记录中的词条、属性参数进行修改。输入法系统也可以通过对用户输入行为信息的检测依据预置规则对相应词条参数进行自动变更,例如,根据用户选词增加词频;或者,根据时间对词频信息进行衰减。
下面实施例中对于词条的属性参数都仅采用最常用的词频信息进行说明,但是对于本领域普通技术人员而言,将其扩展至其他属性参数,应该是显而易见的。
参照图1,示出了本发明一种用户词库同步更新的方法流程图,具体可以包括:
S101,服务器接收设备端的下载更新请求;
服务器端针对各个用户维护其相应的用户词库。本发明所述的设备端均指用户侧的设备。
实际应用中,一个用户可能使用到多个设备端,例如家用计算机、办公用计算机、PDA等等。本发明服务器的特点在于,其针对一个用户还可以维护分别针对多个设备的多个用户词库。在服务器端可以采用任何现有可行的方式实现用户词库的存储,例如,数据库的方式或者数据文件的方式等等。
由于服务器存储了针对不同用户的词库,因此在发起更新请求时通常需要包括用户标识信息(例如,用户注册的用户名,或者服务器分配的标识号等),并且为了满足当前设备端的个性化输入需求,还可以包括当前设备端的标识信息(例如当前设备端的硬件标识或者地址标识等)。
在本发明的另一优选实施例中,所述更新请求也可以不包括用户标识信息,而仅仅包括当前设备端的标识信息,只要设备标识信息能够保证唯一性即可,因为在使用者不变的情况下,确定了当前设备也就确定了当前用户。
为了更清楚说明,参照图2,示出了一个服务器端词库存储的示意图,一用户账号下存储有设备1用户词库、设备2用户词库、设备3用户词库、设备4用户词库和设备5用户词库。在图2中,上述5个分设备用户词库,可以为分别独立的5个词库文件,每个词库文件分别记录有词条来源设备的标识参数,即标识该词库文件是针对哪个设备的,以便记录该设备上的用户个性习惯。
参照图3,上述5个分设备用户词库还可以依据类别划分为不同组,以便仅仅更新某一组内的词库信息,而不影响其他组内的词库信息,即本发明不仅可以记录单个设备的输入习惯,还可以记录属于同一类别的输入习惯。
在本发明的一个优选实施例中,也可以不采用图2所示的方式,而采用一个词库文件存储上述5个词库中的所有词条信息。当然,为了能够在一个词库文件中形成针对不同设备的多个分设备用户词库,则可以针对该词库中的每个词条都设置一个属性参数——词条来源设备的标识参数;或者,也可以针对一组词条记录一个相应的属性参数——词条来源设备的标识参数,标识该组中的所有词条及其参数都是来源于该设备的。从而虽然服务器端的用户词库是以一个词库文件的形式存在的,但是可以形成虚拟的分别针对多个设备的多个分设备用户词库。
需要说明的是,实际应用中,也可以采用少于5个词库文件的方式,例如,采用2个词库文件,其中,词库文件1是用于存储设备1、设备2来源的词条信息的,词库文件2是用于存储设备3、设备4、设备5来源的词条信息的。
S102,从服务器端的所述至少两个分设备用户词库(同一用户名下针对多个设备的多个用户词库)中,选择符合需求的分设备用户词库;
由于本发明在维护词库时记录了单个设备的输入习惯,一方面可以保证所生成的分设备词库相对独立,同时,在步骤102中,也可以根据使用情况的变化,根据不同条件对各个分设备词库随时整合,或协同工作。
具体的,服务器端可以通过当前设备端的下载属性获取当前设备端的下载需求;其中,所述下载属性可以预设在服务器端,或者,所述下载属性也可以附加在当前设备端的更新请求中。下面以下载属性事前预设在服务器端的情况为例进行说明。
例如,当使用某些设备时,希望此设备的词库保持独立,则可以在服务器端建立该设备用户词库时设定一个独立备份还原的属性,即当前设备端的下载属性为仅仅下载更新当前设备端所对应的分设备用户词库。当具有该属性的设备端发起更新请求时,服务器只需要将其相应的设备用户词库更新至当前设备端即可,其它设备端的词库不会干扰当前设备端。即所述符合需求的分设备用户词库为:当前设备端对应的单个分设备用户词库。
再例如,当使用某些设备时,希望与该设备相同类别(如工作用台式机和笔记本)的设备之间的用户词库进行共享,而与其他类别的设备词库之间保持独立,则可以在服务器端建立该设备用户词库时设定一个类别属性,即当前设备端的下载属性为需要下载与该设备端相同类别下的分设备用户词库。当具有该属性的设备端发起更新请求时,将其所属类别中的其他设备用户词库更新至当前设备端即可,其他类别中的设备用户词库不会干扰当前设备端。即所述符合需求的分设备用户词库为:属于同一设备类别下的各个分设备用户词库。
再例如,当使用某些设备时,希望该设备与其他设备间的用户词库全部进行共享,则可以在服务器端建立该设备用户词库时设定一个全更新属性;即当前设备端的下载属性为需要更新该用户名下的所有分设备用户词库。当具有该属性的设备端发起更新请求时,将该设备用户词库与服务器同步,并将该用户名下的其他设备用户词库更新至当前设备端即可。即所述符合需求的分设备用户词库为:服务器端该用户名下所有设备的各个分设备用户词库。
需要说明的是,通常情况下,一般在下载更新过程中,不需要下载当前设备端在服务器端的相应分设备用户词库,因为服务器端所存储的相应分设备用户词库就是本地设备上传备份的,本地与服务器文件相比是相同的(甚或更新),因此只需要下载更新其他设备用户词库即可。但是,在某些情况下,例如,设备重装系统、本地用户词库损坏或丢失、用户手动强制刷新本地用户词库等等,在所选择的符合需求的分设备用户词库中也可以包括当前设备端在服务器端的的相应分设备用户词库。
在本发明的另一优选实施例中,下载需求更为灵活,所述更新请求还可以包括用户的个性化下载请求(即将当前下载设备端的下载属性附加在所述更新请求中),例如,用户在更新前指定某个类别,则可以下载所指定类别的设备用户词库,该指定类别可能和当前设备端的类别不同;或者,用户指定设备标识等等。
S103,获取其中所需更新的词条,将相应的词条和/或参数同步更新至当前设备端。
选择当前下载设备端所需的一个或者多个设备用户词库后,获取其中所需更新的词条和/或参数,将其下载更新至当前设备端。简单的,所需更新的词条可以为所选择的一个或者多个设备用户词库中的所有词条。当然,也可以采用增量更新的模式,即所需更新的词条也可以为所选择的分设备用户词库中,从上次同步更新以来发生变化的词条。例如,由于用户输入行为而导致的词条词频发生变化。如果该词条的属性参数中有一部分发生了变化,则可以将其所有属性参数都进行更新,也可以仅仅更新变化部分的属性参数即可。
服务器端可以分别独立存储分设备词库,其更新比较简单,各个分设备词库对应更新其中需要更新的词条即可。
而服务器端也可以采用词条合并存储的情况,例如,同一个词条出现在两个设备词库中,则在服务器端可以将其作为一个词条进行记录,保留最后使用时间靠后的那条记录中的词频、二元关系数据,及最后使用时间,但仍然记录生成时间较前一词的出生设备ID、及出生时间(词条来源信息)。当然,该词条在逻辑上仍然属于两个分设备词库中的词条。
下面对具体应用词条增量更新方式完成服务器与设备端的同步流程,进行简单说明。
设备端至服务器端的备份过程:
本地文件中的每个词条,其词频的多个数据字段一旦变化,每个词条需要有相应的变化标识进行标记。当需要上传服务器时,按变化标识将两次同步操作之间变化的数据增量传输至服务器端,传输完成后取消对应的变化标识。
服务器端至设备端的更新过程:
一般来讲,由于服务器上的词库是本地的备份性质,不会比本地的词库更新;但特别的,当一个词库对应多个设备时,不同设备交叉更新过程中,会造成服务器上的数据有部分新于当前本地设备词库。此时,这种服务器端的分设备词库中,也需要将与设备端不同的数据进行标记。
在本发明的另一实施例中,可以在服务器端对变化词条以设备进行区分。例如,当一个本地设备A向服务器上传数据后,则针对本地设备A上传更新的词条添加设备A的更新标识,以表示该词条被设备A更新过,其它设备在下次同步时,即需要下载这次由设备A上传的更新数据。当设备端B进行下载时,则将该词条及其参数下载至本地,并在该词条上添加设备端B已更新的标识,当下次设备端B再更新时,就可以不更新该词条;即更新时由每个设备按各自的标记进行同步。
在本发明的另一实施例中,也可以在服务器端对变化词条数据添加变化标识的同时,对每个词条加标更新时间;同时,本地设备词库的每个词条的也相应标记变化时间。在上传同步时,将标记需要上传的词条上传至服务器,再由服务器通过对比更新时间,按一定原则合并(如保留较新的数据,或按预定的权重算法合并两个数据等);在下载词库时,将本地设备上次同步时间,与服务器备份中词条的更新时间进行比较,将更新时间晚于上次同步时间的数据下传至本地设备保存。
在本发明的优选实施例中,词条参数中也可以包括“最后使用时间”的属性参数;若词库格式有“最后使用时间”一参数,则也可以直接复用为时间戳信息,作为最后更新时间。
在实际应用中,同步标记还可以包括变化类别属性,以表示新增、删除、变更等状态。具体的,由于同步标记属于信息同步技术领域的公知技术,在此不再详述。
上面主要介绍了设备端从服务器端下载更新的过程,一般情况下,本发明实施例还会包括:设备端将需要备份的词条和/或参数上传至服务器端的步骤;即备份过程和更新过程在一次通信中完成。例如,前述的同步更新实施例还可以包括:服务器端接收设备端上传用户词库的请求;设备端上传当前设备端中需要更新的词条参数,由所述服务器端同步更新至该当前设备端对应的用户词库。
由于设备端一般仅上传在本设备上发生变化的词条参数,因此,只需将在上一次上传备份后发生变化(如删除、新增、变更等)的词条及其参数全部上传至服务器端,服务器将其更新至相应的设备用户词库即可。当然,简单起见,也可以将全部词条及其参数上传至服务器端,但是明显的,会增加网络传输资源的压力。上传的词条参数可以包括同步标记,以方便其他设备的更新下载。
需要说明的是,对于首次上传备份时,需要首先在服务器上设定该设备属性,所述设备属性可以包括设备ID、设备类型(例如,可以包括自我同步设备、属于某类之内同步的设备、参与全局同步的设备)等等;所述设备属性还可以包括:是否人为规定网络用于限制每次通讯的流量限值、人工指定的同步触发条件(如每隔一周自动同步更新一次或者当新词条量达到100时自动更新)。优选的,对于首次备份而言,直接将本地设备用户词库全部上传至服务器端进行存储即可,可以不需要通过同步标记进行选择性上传。
当然,在实际应用中,对于某些设备端而言,其并不必然需要执行上传步骤。例如,对于一种特殊设备:临时设备,此类设备属性为仅仅从服务器端下载所需的设备用户词库(其他设备上传的),而该设备端不需要上传自己的分设备用户词库给服务器,服务器端也不需要维护针对该设备的用户词库。即上传步骤对于某些设备端而言,其并不是必须的。
上述实施例中,服务器端针对每个实体硬件设备维护有相应的分设备用户词库,例如通过设备ID进行区分;实际上,本发明也可以通过用户设置,使得服务器端所维护的一个分设备用户词库,可以对应该用户所使用的多个实体硬件设备。例如,对于通过办公用台式机和办公用笔记本,在服务器端都记录为一个设备标识,二者发起的下载更新请求或者上传备份请求视为同一个设备发出。
还需要说明的是,上面实施例中的下载更新过程是在服务器端和设备端完成的,而实际上,本发明也可以应用在两个设备端之间,即其中一个设备端充当虚拟服务器,从而在无实体服务器的情况下,也可以通过局域网络进行设备端到设备端的用户词库同步更新。具体的,可以包括:第一设备端和第二设备端进行词库同步信息的交互;依据所述第一设备端和第二设备端的用户词库更新情况,选取其中一个设备端作为临时服务器端。
参照图4,示出了第一设备端和第二设备端两个设备端之间的同步更新方法流程图。
S401,建立第一设备端和第二设备端的连接;
需要说明的是,所述第一设备端和第二设备端存储有包括多个分设备用户词库的本地用户词库,所述多个分设备用户词库分别针对当前输入法用户所使用的不同设备;
S402,交互用户词库的同步信息,比较更新情况;
第一设备端和第二设备端分别向对方发送同步请求,所述同步请求可以包括自身词库的同步信息(例如,各个设备词库与服务器端的更新情况);接收到同步信息后,将对方用户词库的更新情况与自己当前用户词库的更新情况作相应的比较,如最近一次更新日期等。
S403,判断是否需要同步更新;
根据上述比较结果,判断当前相连接的两个设备端是否需要同步更新,如果更新情况不同,则执行S404;如果更新情况相同,则说明在这两个设备端之间不需要同步更新,则执行S405,断开当前连接即可。
S404,依据交互比较结果,选取其中一个设备端(例如,更新日期最新)作为临时服务器,模拟服务器完成同步更新,然后执行S405;
具体的同步更新过程在前面的实施例中已经详细描述了,在此简单说明如下:
临时服务器接收另一设备端下载更新用户词库的请求;
从临时服务器所存储的分设备用户词库中选择符合另一设备端需求的至少一个分设备用户词库;
从所选的分设备用户词库中获取所需更新的词条和/或参数,同步更新至另一设备端
S405,断开当前连接。
在上述实施例中,由于具体的下载更新过程和前述的服务器端与设备端的交互过程相似,所以在此不再赘述。
具体的,所述符合需求的用户词库包括:当前下载设备端对应的单个分设备用户词库为符合需求的用户词库;或者,除当前设备端对应的分设备词库以外的至少一个其他分设备用户词库为符合需求的用户词库;或者,属于同一设备类别的至少一个分设备用户词库为符合需求的用户词库。
当一个设备因各种情况不再使用时,用户可以在服务器端通过设置界面删除该设备。在删除该设备的同时,可以选择仅仅删除该设备属性,而其对应的用户词库仍然保留,继续使用;或者也可以选择全部删除。例如,如果该设备的用户词库为自我同步属性,则可以删除相应的分设备用户词库;如果选择保留用户词库,则该用户词库的词源设备属性可以由其他选定设备继承,当然,也可以直接变更为无主设备词条(或无词源设备词条),以便被其他设备继续使用。
当用户通过某一设备端向服务器端上传备份的需要更新的词条和/或参数,其中包括删词记录时,则服务器端可以先记录删词信息,等到其他设备也完成同步下载更新后,再执行具体的删词操作。否则,上述删词信息可能只删除了服务器端相应分设备用户词库中的词条,而已经下载到各个设备端上的相应词条则继续保留。简单的,本发明可以在服务器端接收到删词信息后,直接主动发起针对该用户所有设备的同步删除请求,使得该用户的各个设备都可以同步删除该词条。
参照图5,示出了本发明一种用户词库服务器实施例的结构框图,包括存储单元、通信单元以及更新处理单元,其中:
存储单元501,用于针对不同用户维护不同存储空间,在一用户的存储空间内针对该用户名下的不同设备存储有至少两个分设备用户词库;
通信单元502,用于接收设备端下载更新用户词库的请求;以及,将更新处理单元所获取的需要更新的词条和/或参数同步更新至当前设备端;
更新处理单元503,用于从存储单元所存储的分设备用户词库中选择符合当前设备端需求的至少一个分设备用户词库,获取其中所需更新的词条和/或参数。
优选的,当设备端连接服务器端进行上传备份操作时,图5所示的服务器的通信单元502还可以用于接收设备端上传词条和/或参数的请求;以及接收设备端所上传的需要更新的词条和/或参数;所述更新处理单元503还可以用于将所上传的词条和/或参数更新至所述存储单元中该设备端对应的分设备用户词库。
在服务器端针对每个设备建立用户词库,可以保证所生成的针对各设备的分设备用户词库相对独立,可以根据使用情况的变化或者根据不同条件随时整合或协同,词库可以即时更新到符合用户使用的状态。具体的,所述符合需求的分设备用户词库可以包括:当前设备端对应的单个分设备用户词库;或者,除当前设备端对应的分设备词库以外的至少一个其他分设备用户词库;或者,属于同一设备类别的至少两个分设备用户词库。
关于服务器端具体如何存储针对不同设备的多个分设备用户词库,在前述实施例中已经详细描述了,在此不再赘述。
参照图6,示出了本发明一种输入法系统实施例的结构框图,所述输入法安装于某一设备端中,其可以包括:
输入接口单元601,用于接收用户的输入信息;
信息转换单元602,用于依据所接收的输入信息,在词库605中进行检索,得到相应的候选项并排序;
展现单元603,用于依序展现候选项;
结果输出单元604,用于接收用户的选择信息,输出指定的候选项或网址;
其中所述词库605包括:用于记录基础字词及其参数的系统词库6051,以及本地用户词库;本地用户词库可以划分为分别针对该输入法用户所使用的不同设备的多个分设备用户词库6052;例如,图6中示出了分别针对设备1和设备2的两个分设备用户词库;
以及,下载单元606,用于向服务器端发送下载更新请求,以及接收所下载的词条和/或参数,更新至本地用户词库。例如,将从服务器端下载的词条和/或参数分别更新至相应的分设备词库;因为服务器端针对该用户也存储有多个分设备用户词库。
优选的,图6所示的输入法系统,还可以包括:上传单元607,用于向服务器端发送上传用户词库的请求;以及上传当前设备端中需要更新的词条和/或参数。
在本发明的一些优选实施例中,在没有服务器端的情况下,两个设备端的输入法系统之间也可以实现用户词库的同步。因为两个设备端用户词库的更新情况不同,例如,在两个设备端中存在一个设备端更新比较新(例如更新时间接近现在)比较全(从服务器端更新的分设备词库多)的情况,因此可以通过两个设备端之间的同步更新,以满足在服务器端无法连接的情况下,实现用户词库的共享。此时,图6所述的输入法系统可以进一步包括:
设备端交互单元608,用于与另一设备端的输入法系统交互各自用户词库的同步信息;
临时服务器单元609,用于依据所交互的用户词库更新情况,确定是否选择当前设备端作为临时服务器;如果是,则从从本地用户词库中中选择符合需求的至少一个分设备用户词库,获取其中所需更新的词条和/或参数发送至所述另一设备端。
当同一词条分别在多个分设备用户词库重复出现时,在输入过程中,其词条参数会出现冲突,因此在本发明的一个优选实施例中,图6所述的输入法系统还可以包括:权重单元610,用于当同一词条分别在多个分设备用户词库重复出现时,则依据预置规则针对各个分设备用户词库中的该词条的参数赋予不同权重,并计算得到最终参数;所述参数用于候选项排序。
例如,当同一词条分别在多个分设备用户词库重复出现时,则赋予对应当前设备端的分设备用户词库中的该词条的参数为最大权重,计算得到最终参数。以词频为例,假设同一个词条“语料”在分别针对三个设备A、B、C(A为当前设备端)的用户词库中出现,其词频分别为a、b、c,则可以直接将设备端A对应的词频作为最终参数,或者计算(a*0.9+b*0.05+c*0.05),得到最终参数。
再例如,当同一词条分别在多个分设备用户词库重复出现时,则也可以按使用时间计算各词频参数的权重,并得出最后词频。例如,同一个词条“语料”在分别针对三个设备A、B、C(A为当前设备端)的用户词库中出现,其词频分别为a、b、c,其停用时间(最后使用时间距现在)分别为Ta=20,Tb=5,Tc=2,则在候选项排序中该词条的词频综合计算结果可以为:
(a×90%+b×97%+c×100%)/3
其中,假设针对三个停用时间Ta=20,Tb=5,Tc=2所对应的时间段,权重分别设置为1-10%、1-3%、1-0%。当然,在实际应用中,简单起见,也可以直接设置更新时间最近的权重为100%,即直接采用词频c进行词条“语料”的候选项排序。
在图6所示的设备端输入法系统中存储针对不同设备的多个分设备用户词库,可以采用前述的各种实现方式(服务器端),例如一个或者多个词库文件,总之,记录相应的词条来源设备信息即可,从而可以通过词源设备划分得到分别针对各个设备的用户词库,以便体现各个设备的个性化输入习惯。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本发明所提供的一种用户词库同步更新的方法、用户词库更新服务器以及一种设备端输入法系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
机译: 同步更新用户单词库的方法和系统
机译: 信息处理系统,更新服务器设备,用户管理设备,软件更新方法和程序
机译: Web站点构建和更新方法,Web站点构建和更新条目表传真设备,CTI服务器,使用的Web服务器或服务器设备以及Web站点构建和更新传真通信系统