首页> 中国专利> 用于在云输入法中更新语言模型的云端服务器及其终端

用于在云输入法中更新语言模型的云端服务器及其终端

摘要

一种用于在云输入法中更新语言模型的云端服务器及其终端。所述云端服务器包括:输入行为收集装置,从多个终端实时收集用户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符;解析装置,从收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入;语言模型更新装置,利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服务器的语言模型。可基于用户的完整输入行为来相对准确地更新语言模型。

著录项

  • 公开/公告号CN104049766A

    专利类型发明专利

  • 公开/公告日2014-09-17

    原文格式PDF

  • 申请/专利权人 百度国际科技(深圳)有限公司;

    申请/专利号CN201310076668.X

  • 发明设计人 肖日新;陈龙;何明哲;

    申请日2013-03-11

  • 分类号G06F3/023(20060101);G06F3/0489(20130101);

  • 代理机构11286 北京铭硕知识产权代理有限公司;

  • 代理人张云珠;戴嵩玮

  • 地址 518057 广东省深圳市南山区高新中二道5号生产力大楼D单元三层301

  • 入库时间 2023-12-17 01:10:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-31

    授权

    授权

  • 2014-10-22

    实质审查的生效 IPC(主分类):G06F3/023 申请日:20130311

    实质审查的生效

  • 2014-09-17

    公开

    公开

说明书

技术领域

本申请涉及云输入技术,更具体地说,涉及一种基于终端用户的输入行 为来实时更新语言模型的云端服务器以及相应的终端。

背景技术

随着互联网技术和信息处理技术发展到云计算的时代,基于云计算的各 种服务不断增加,其中,云输入是指应用了云计算技术的输入法,利用云输 入技术,终端无需下载和安装全部客户端软件,主要通过与云端服务器的在 线连接即可完成字符的输入。

图1示出根据现有技术的云输入系统。如图1所示,各种终端(例如, 笔记本电脑、个人计算机和移动终端等)通过互联网与云端服务器连接,通 过在终端执行用户输入即能够以在线的方式从云端服务器获取相应的候选字 符,相应地,用户可通过从候选字符中选取期望输入的字符来完成输入。

由于云端服务器的处理能力比终端设备强大很多倍,所以字库容量远远 大于客户端软件,相应的输入准确率也得以提高。

然而,目前的输入法中,通常仅关注于热门词条的更新,即,通过对用 户输入相应词语的频率的统计或者通过对互联网中频繁出现的词语的统计来 产生热门词条。这种方式仅改变了词语的候选次序,但无法有效全面地反映 用户的输入行为。而且,更新的热门词语每次都通过推送的方式传达到终端 用户,难以有效地应对海量用户。

发明内容

本发明的目的在于提供一种能够基于终端用户的输入行为来实时更新语 言模型的云端服务器以及相应的终端。

根据本发明的一方面,提供一种用于在云输入法中更新语言模型的云端 服务器,包括:输入行为收集装置,用于从多个终端实时收集用户的输入行 为,其中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制 操作以及相应的输出字符;解析装置,用于从收集的输入行为解析出最终输 出字符以及用于直接生成最终输出字符的有效字符输入;语言模型更新装置, 用于利用包括最终输出字符和有效字符输入的输入配对来更新设置于云端服 务器的语言模型。

所述云端服务器可还包括:输入行为预处理装置,用于从收集的输入行 为中排除误操作输入行为,其中,误操作输入行为是指并非为了产生输出字 符而进行的输入行为,其中,解析装置从排除了误操作输入行为以外的输入 行为解析出最终输出字符以及用于直接生成最终输出字符的有效字符输入。

在所述云端服务器中,控制操作可包括以下项中的至少一个:用于确认 当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出字符的 操作。

在所述云端服务器中,输入配对以语句为单位,并且,语言模型更新装 置可通过以下处理来更新语言模型:将输入配对添加到训练语料,在对作为 语句的最终输出字符执行词语切割和词性标注之后,基于获取的词语和相应 的有效字符输入来更新语言模型。

在所述云端服务器中,对于无法进行词语切割的词语,语言模型更新装 置可将其中被审核为新词的词语添加到语言模型中。

根据本发明的另一方面,提供一种用于在云输入法中更新语言模型的方 法,包括:从多个终端实时收集用户的输入行为,其中,所述输入行为包括 用户在输入字符时执行的字符输入操作和控制操作以及相应的输出字符;从 收集的输入行为解析出最终输出字符以及用于直接生成最终输出字符的有效 字符输入;利用包括最终输出字符和有效字符输入的输入配对来更新设置于 云端服务器的语言模型。

所述方法可还包括:从收集的输入行为中排除误操作输入行为,其中, 误操作输入行为是指并非为了产生输出字符而进行的输入行为,其中,从排 除了误操作输入行为以外的输入行为解析出最终输出字符以及用于直接生成 最终输出字符的有效字符输入。

在所述方法中,控制操作包括以下项中的至少一个:用于确认当前字符 的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。

在所述方法中,输入配对以语句为单位,并且,更新语言模型的步骤可 包括:将输入配对添加到训练语料,在对作为语句的最终输出字符执行词语 切割和词性标注之后,基于获取的词语和相应的有效字符输入来更新语言模 型。

所述方法还包括:对于无法进行词语切割的词语,将其中被审核为新词 的词语添加到语言模型中。

根据本发明的另一方面,提供一种用于云输入法的终端,包括:输入单 元,用于接收用户在输入字符时执行的字符输入操作和控制操作;收发单元, 用于从云端服务器接收与用户的字符输入操作相应的字符;输出单元,用于 输出从云端服务器接收的字符,其中,收发单元将用户的输入行为实时地发 送到云端服务器,其中,所述输入行为包括用户在输入字符时执行的字符输 入操作和控制操作以及相应的输出字符,并且,设置于云端服务器的语言模 型基于从各个终端实时发送的用户的输入行为而更新。

在所述终端中,控制操作包括以下项中的至少一个:用于确认当前字符 的确认操作、用于选择候选字符的选择操作、用于删除输出字符的操作。

根据本发明的示例性实施例,可基于用户的完整输入行为来相对准确地 更新语言模型,并通过这种方式直接影响终端用户的输入候选,而无需针对 各个用户进行热词或新词的推送。

附图说明

通过下面结合附图对本发明示例性实施例的描述,本发明的上述和其它 目的和特点将会变得更加清楚,其中:

图1示出根据现有技术的云输入系统;

图2示出根据本发明示例性实施例的云端服务器的框图;

图3示出根据本发明示例性实施例的终端的框图;

图4示出根据本发明示例性实施例的用于在云输入法中更新语言模型的 方法的流程图。

具体实施方式

现将详细参照本发明的实施例,所述实施例的示例在附图中示出,其中, 相同的标号始终指的是相同的部件。以下将通过参照附图来说明所述实施例, 以便解释本发明。

图2示出根据本发明示例性实施例的云端服务器的框图。参照图2,根 据本发明示例性实施例的云端服务器包括:输入行为收集装置10、解析装置 20和语言模型更新装置30。

在上述云端服务器中,输入行为收集装置10用于从多个终端实时收集用 户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入 操作和控制操作以及相应的输出字符。这里,为了更准确地反映用户期望输 入的内容,输入行为收集装置10所收集的输入行为不限于用户的输入字符, 而是包括用户在输入字符时执行的全部操作(包括字符输入操作和控制操作) 以及相应的输出字符,从而能更为准确地反映用户的输入意图。

相应地,解析装置20用于从收集的输入行为解析出最终输出字符以及用 于直接生成最终输出字符的有效字符输入。通过解析单元20的上述处理,云 端服务器可以从繁杂的用户输入操作中提取出对语言模型更新而言必要且准 确的信息。

此外,语言模型更新装置30用于利用包括最终输出字符和有效字符输入 的输入配对来更新设置于云端服务器的语言模型。

在实际的输入中,有时候会发生一些误操作的情况,例如,儿童胡乱敲 击键盘产生一连串无意义的字符,打字时不小心按下某个按键导致错误字符 的输入等等。

为了应对上述问题,所述云端服务器还可额外包括输入行为预处理装置 (未示出),用于从收集的输入行为中排除误操作输入行为,其中,误操作输 入行为是指并非为了产生输出字符而进行的输入行为,在这种情况下,解析 装置20从排除了误操作输入行为以外的输入行为解析出最终输出字符以及 用于直接生成最终输出字符的有效字符输入。

以下参照图3来描述与上述云端服务器连接以实现云输入的终端。如图 3所示,根据本发明示例性实施例的终端包括:输入单元100、收发单元200 和输出单元300。

在上述终端中,输入单元100用于接收用户在输入字符时执行的字符输 入操作。具体说来,不论用户采用何种输入法(如,拼音输入法或五笔字型 输入法),每个字符的输入均对应于一系列字符输入操作。例如,在拼音输入 法中,要想输入汉字“我”,则需连续按下与拼音字符“w”和“o”对应的“W” 键和“O”键。

相应地,收发单元200用于从云端服务器接收与用户的字符输入操作相 应的字符。例如,当用户的字符输入操作为连续按下“W”键和“O”键时, 收发单元200从云端服务器接收相应的字符“1.我”、“2.握”、“3.喔”、“4. 窝”等。

此时,输出单元300用于输出从云端服务器接收的字符。例如,输出单 元300可输出字符“1.我”、“2.握”、“3.喔”、“4.窝”。

除了字符输入操作之外,输入单元100还用于接收用户在输入字符时执 行的控制操作。作为示例,这里的控制操作可包括以下项中的至少一个:用 于确认当前字符的确认操作、用于选择候选字符的选择操作、用于删除输出 字符的操作。

例如,仍旧以用户要想输入汉字“我”为例,在输出单元300输出了字 符“1.我”、“2.握”、“3.喔”、“4.窝”的情况下,输入单元100可从用户接 收用于确认首选项“我”的“空格”键或用于选择与候选项“我”的序号“1” 对应的数字键“1”。此外,当用户想要删除已经确认的汉字“我”时,输入 单元100可从用户接收用于删除输出字符“我”的回退键。

相应地,收发单元200将用户的输入行为实时地发送到云端服务器,其 中,所述输入行为包括用户在输入字符时执行的字符输入操作和控制操作以 及相应的输出字符,并且,设置于云端服务器的语言模型基于从各个终端实 时发送的用户的输入行为而更新。

以上述情况为例,在用户想要输入汉字“我”的情况下,收发单元200 将用户在输入字符时执行的连续按下“W”键和“O”键的字符输入操作和按 下“空格键”或“1”键的控制操作以及相应的输出字符“我”发送到云端服 务器。

此外,在用户在输入“我”字之后又进行删除的示例中,收发单元200 还需要额外地将用于删除“我”字的按下回退键的操作发送到云端服务器。

由此可见,根据本发明示例性实施例的终端由于向云端服务器发送了用 户的全部输入行为,从而能够客观准确地反映用户的输入意图,以便云端服 务器更有效地更新语言模型。此外,发送的输入行为中以实际输出的字符为 准,进一步提高了反馈信息的准确性。

以下将参照图4来描述由根据本发明示例性实施例的云端服务器更新语 言模型的方法。

参照图4,在步骤S10,由输入行为收集装置10从多个终端实时收集用 户的输入行为,其中,所述输入行为包括用户在输入字符时执行的字符输入 操作和控制操作以及相应的输出字符。

如以上参照图3所述,由于云端服务器从多个终端实时地收集用户的完 整输入行为(包括字符输入操作和控制操作),并且,相应的输出字符也从终 端反馈给云端服务器,因此,云端服务器能够准确获取用户的输入意图。

作为附加处理,在收集到用户的输入行为之后,可额外地由输入行为预 处理装置从收集的输入行为中排除误操作输入行为,这里,误操作输入行为 是指并非为了产生输出字符而进行的输入行为。通过上述处理,能够对用户 输入行为的有效性进行进一步的筛选,从而有助于对语言模型进行更为有效 的更新。

接下来,在步骤S20,由解析装置20从用户的输入行为解析出最终输出 字符以及用于直接生成最终输出字符的有效字符输入。

具体说来,当收集的用户输入行为包括:字符输入操作“T”、“U”、“I”、 “S”、“E”、指示确认操作的“空格”键输入和指示删除前一字符操作的“回 退”键输入、以及相应的输出字符“褪色”时,解析装置20能够从用户的整 体输入行为解析出最终输出字符为“褪”,以及用于直接生成最终输出字符 “褪”的有效字符输入——字符输入操作“TUI”。

接下来,在步骤S30,由语言模型更新装置30利用包括最终输出字符和 有效字符输入的输入配对来更新设置于云端服务器的语言模型。

根据上述示例,语言模型更新装置30可利用由最终输出字符“褪”和相 应的有效字符输入“TUI”组成的输入配对来更新设置于云端服务器的语言模 型。

此外,作为优选方式,语言模型更新装置30可利用以“语句”为单位的 输入配对来更新语言模型。具体说来,假设由解析装置20解析出的输入配对 中,最终输出字符为“龚琳娜扮悟空雷人”,相应的有效字符输入为 “GONGLINNABANWUKONGLEIREN”,那么,语言模型更新装置30可将上述配对 加入训练预料中,通过对语句“龚琳娜扮悟空雷人”执行词语切割和词性标 注而得到名词“龚琳娜”、动词“扮”、名词“悟空”、形容词“雷人”,在此 基础上,可基于获取的上述词语以及相应的有效字符输入“GONGLINNA”、 “BAN”、“WUKONG”和“LEIREN”来更新语言模型。

可以看出,根据上述优选方式,语言模型更新装置30可基于“语句”为 单位来对语言模型进行更新,从而体现了比“热词”统计更为复杂的逻辑关 系,有利于建立完备可靠的语言模型,同时还能够完成对“热词”和“新词” 的有效处理。

通过上述更新方式,多次反复输入的“龚丽娜”会得以加强,在语言模 型中成为相应的“热词”,从而作为候选项的排序提前。另外,如果遇到无法 进行词语切割的词语,语言模型更新装置30可将其中被审核为新词的词语添 加到语言模型(例如,用于执行词语切割的词典或系统词库)中,也就是说, 通过上述方式,还能够有效地发现新词。

应注意,以上尽管以拼音输入法作为示例进行了描述,但本发明并不受 限于拼音输入法,任何其他的字符输入法均可应用于本发明的云输入系统。

根据本发明的云端服务器以及相应的终端,可基于用户的完整输入行为 来相对准确地更新语言模型,并通过这种方式直接影响终端用户的输入候选, 而无需针对各个用户进行热词或新词的推送。此外,通过以语句为单位进行 解析和更新,能够更为完整地体现词语在句子中的含义,有助于形成有效的 语言模型。由于云端服务器具有强大的处理能力,因此,可针对海量用户进 行输入行为的收集,并基于解析出来的有效信息来不断更新(例如,以1小 时为单位来进行更新)语言模型,从而使得所述海量用户能够及时使用到与 其输入意愿相一致的语言模型。

本发明的以上各个实施例仅仅是示例性的,而本发明并不受限于此。本 领域技术人员应该理解:在不脱离本发明的原理和精神的情况下,可对这些 实施例进行改变,其中,本发明的范围在权利要求及其等同物中限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号