首页> 中国专利> 一种用于提供输入字符串所对应的输入候选项的方法与设备

一种用于提供输入字符串所对应的输入候选项的方法与设备

摘要

本发明的目的是提供一种用于提供输入字符串所对应的输入候选项的方法与设备。其中,输入设备获取输入字符串;确定所述输入字符串的上下文信息;根据所述输入字符串,以及所述上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用。与现有技术相比,本发明通过根据输入字符串的上下文信息,确定与所述输入字符串对应的一个或多个输入候选项;并将所述一个或多个输入候选项中至少一个提供给所述输入字符串所对应的目标应用;从而提高了输入灵活度,与用户的输入需求相匹配,还提高了输入法的输入效率,改善了用户体验。

著录项

  • 公开/公告号CN103076892A

    专利类型发明专利

  • 公开/公告日2013-05-01

    原文格式PDF

  • 申请/专利权人 百度在线网络技术(北京)有限公司;

    申请/专利号CN201210592774.9

  • 发明设计人 陆阳阳;孟可丰;

    申请日2012-12-31

  • 分类号G06F3/023(20060101);

  • 代理机构北京汉昊知识产权代理事务所(普通合伙);

  • 代理人罗朋;周建华

  • 地址 100085 北京市海淀区上地十街10号百度大厦

  • 入库时间 2024-02-19 18:33:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-09-28

    授权

    授权

  • 2013-06-05

    实质审查的生效 IPC(主分类):G06F3/023 申请日:20121231

    实质审查的生效

  • 2013-05-01

    公开

    公开

说明书

技术领域

本发明涉及互联网技术领域,尤其涉及一种用于提供输入字符串 所对应的输入候选项的技术。

背景技术

对于中文输入而言,存在大量的同音异义词,而实际用户在输入 过程中仅会选择其中的一个,当前的输入法将多个输入候选项提供给 用户,由用户根据需求进行选择,当输入候选项较多时,用户进行选 择操作则会导致输入的缓慢低效。考虑到文字的输入间具有一定的语 义或逻辑关系,如何利用所述语义或逻辑关系,对输入候选项进行处 理,从而提升用户的使用体验,成为本领域技术人员亟需解决的一个 问题。

发明内容

本发明的目的是提供一种用于提供输入字符串所对应的输入候选 项的方法与设备。

根据本发明的一个方面,提供了一种用于提供输入字符串所对应 的输入候选项的方法,其中,该方法包括以下步骤:

a获取输入字符串;

b确定所述输入字符串的上下文信息;

c根据所述输入字符串,以及所述上下文信息,确定与所述输入 字符串对应的一个或多个输入候选项;

d将所述一个或多个输入候选项中至少一个提供给所述输入字 符串所对应的目标应用。

根据本发明的另一方面,还提供了一种用于提供输入字符串所对 应的输入候选项的输入设备,其中,该设备包括:

获取装置,用于获取输入字符串;

上下文确定装置,用于确定所述输入字符串的上下文信息;

候选项确定装置,用于根据所述输入字符串,以及所述上下文信 息,确定与所述输入字符串对应的一个或多个输入候选项;

提供装置,用于将所述一个或多个输入候选项中至少一个提供给 所述输入字符串所对应的目标应用。

与现有技术相比,本发明通过根据输入字符串的上下文信息,确 定与所述输入字符串对应的一个或多个输入候选项;并将所述一个或 多个输入候选项中至少一个提供给所述输入字符串所对应的目标应 用;从而提高了输入灵活度,与用户的输入需求相匹配,还提高了输 入法的输入效率,改善了用户体验。

而且,本发明还可以通过对与所述输入字符串对应的一个或多个 初步输入候选项进行处理,以获得所述一个或多个输入候选项;进一步 地,还可以根据所述初步输入候选项与所述上下文信息对应的搭配相关 度信息,对所述一个或多个初步输入候选项进行处理,以获得所述一个 或多个输入候选项;更进一步地,还可以根据对文本信息的分析处理, 获得搭配频度满足一定阈值的分词搭配关系,从而建立或更新所述词语 搭配数据库;从而提高了输入字符串与输入候选项的匹配准确度,与 用户的输入需求相匹配,提高了输入法的输入效率,改善了用户体验。

而且,本发明还可以确定包含所述输入字符串的增补字符串,并根 据所述增补字符串,获得与所述增补字符串对应的一个或多个增补输入 候选项,通过对所述增补输入候选项进行筛选处理,以获得所述一个或 多个输入候选项;从而提高了输入灵活度,提高了输入字符串与输入候 选项的匹配准确度,与用户的输入需求相匹配,提高了输入法的输入 效率,改善了用户体验。

而且,本发明还可以所述输入字符串所对应的相关文本进行自然语 言处理,从所述相关文本提取对应的焦点词语,以作为所述上下文;从 而提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求 相匹配,提高了输入法的输入效率,改善了用户体验。

而且,本发明还可以检测所述输入字符串是否超出预定的长度阈 值,若所述输入字符串超出所述长度阈值,根据所述输入字符串,以及 所述上下文信息,迭代确定与所述输入字符串对应的一个或多个输入候 选项;进一步地,通过检测所述输入字符串在输入词库中对应的一个或 多个抽样输入候选项中至少一个中的字数是超出预定的字数阈值,以确 定所述输入字符串是否超出预定的长度阈值;进一步地,当所述输入字 符串超出所述长度阈值,还可以确定部分输入候选项与其余输入候选 项,并根据所述一个或多个部分输入候选项,以及所述一个或多个其余 输入候选项,确定所述一个或多个输入候选项;从而提高了输入灵活度, 提高了输入字符串与输入候选项的匹配准确度,与用户的输入需求相 匹配,提高了输入法的输入效率,改善了用户体验。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述, 本发明的其它特征、目的和优点将会变得更明显:

图1示出根据本发明一个方面的一种用于提供输入字符串所对应 的输入候选项的输入设备示意图;

图2示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的输入设备示意图;

图3示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的输入设备示意图;

图4示出根据本发明另一个方面的一种用于提供输入字符串所对 应的输入候选项的方法流程图;

图5示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的方法流程图;

图6示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的方法流程图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1示出根据本发明一个方面的一种用于提供输入字符串所对应 的输入候选项的输入设备示意图;其中,所述输入设备包括获取装置 11、上下文确定装置12、候选项确定装置13、提供装置14。具体地, 获取装置11获取输入字符串;上下文确定装置12确定所述输入字符 串的上下文信息;候选项确定装置13根据所述输入字符串,以及所 述上下文信息,确定与所述输入字符串对应的一个或多个输入候选 项;提供装置14将所述一个或多个输入候选项中至少一个提供给所 述输入字符串所对应的目标应用。在此,输入设备包括但不限于网络 设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设 备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网 络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基 于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中, 云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个 虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通 过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例 如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但 不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网 络(Ad Hoc网络)等。本领域技术人员应能理解,其他的输入设备 同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用 方式包含于此。

上述各装置之间是持续不断工作的,在此,本领域技术人员应理 解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的 工作模式要求,进行输入字符串的获取、上下文信息的确定、输入候 选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符 串。

获取装置11获取输入字符串。具体地,所述获取装置11通过从 输入框中接收用户或其他应用等通过输入、选择、点击等操作所输入 的字符串;或者根据各种通信协议(Communications Protocol),通过各 种数据传输接口,获取从其他应用的输入框中的字符串;其中,所述 输入框如短信编辑框、内容输入框等。其中,所述输入字符串包括但不 限于通过如全拼或简拼等方式所输入的拼音编码字符等。

上下文确定装置12确定所述输入字符串的上下文信息。具体地, 所述上下文确定装置12通过根据获取装置11所获取的输入字符串, 利用当前所输入的字符串所属的文字等,将所述当前输入字符串所属 的文字与一个或多个词库进行匹配,获取与所述输入字符串相关联的 一种或多种匹配信息,并作为所述输入字符串的上下文信息;例如, 当输入“huacao”时,先确定所述输入字符串所属的文字可能为“花 草”,根据“花草”在所属词库中的匹配信息,确定其下文信息可能 为“茶”等;或者,所述上下文确定装置12通过根据与所述输入字 符串相对应的历史记录信息,对所述输入字符串的上下文信息进行确 定,例如,所述输入字符串前刚刚上屏的前一个输入字符串,则可作 为所述输入字符串的前文信息。在此,所述上下文信息包括但不限于 与所述输入字符串相对应的上文信息或下文信息;例如,当所述输入 为“shishi”时,当前次输入所上屏的词组为“客观”时,则所述“shishi” 对应的上文信息为“客观”;若屏幕上存在一个词组“计划”,且输入 “shishi”时,光标位于“计划”前,则其所对应的下文信息为“计 划”等。

候选项确定装置13根据所述输入字符串,以及所述上下文信息, 确定与所述输入字符串对应的一个或多个输入候选项。具体地,候选 项确定装置13通过根据获取装置11所获取的输入字符串,以及上下 文确定装置12所确定的上下文信息,通过将与所述输入字符串相对 应的一个或多个上下文信息直接作为一个或多个输入候选项,或者将 所述输入字符串相对应的上下文信息进行处理后作为输入候选项的 方式,确定与所述输入字符串对应的一个或多个输入候选项。例如, 继上例,当所述输入字符串为“shishi”时,其所对应的上文信息可 能为“客观”,“我”,“谈论”等,当所述上文信息为“客观”时,通 过利用将所述输入字符串,以及所述上下文信息进行匹配等的方式, 确定输入候选项为“事实”、“实时”、“实施”等;当所述上文信息为 “我”时,确定输入候选项为“试试”、“实施”、“试试”等;当所述 上文信息为“谈论”时,确定输入候选项为“时事”、“事实”、“世事” 等。

提供装置14将所述一个或多个输入候选项中至少一个提供给所 述输入字符串所对应的目标应用。具体地,提供装置14通过直接提 供,或根据各种通信协议(Communications Protocol),通过各种数据传 输接口,通过例如重新排序或筛选等方式,将所述一个或多个输入候 选项中至少一个提供给所述输入字符串所对应的目标应用。其中,所 述目标应用包括但不限于与所述获取装置11所对应的输入框相对应 的相同应用,或者与所述获取装置11所对应的输入框相关联的其他 应用等,如直接利用所述输入候选项进行搜索等。

优选地,所述候选项确定装置13还可以根据所述输入字符串,以 及所述上下文信息,确定包含所述输入字符串的增补字符串,其中,所 述增补字符串还包括所述上下文信息所对应的字符串;根据所述增补字 符串,在输入词库中进行匹配查询,以获得与所述增补字符串对应的一 个或多个增补输入候选项;根据所述上下文信息,对所述一个或多个增 补输入候选项进行筛选处理,以获得所述一个或多个输入候选项。具体 地,所述候选项定装置13还可以根据所述输入字符串,以及所述上下 文信息,通过将所述输入字符串结合所述上下文信息与例如输入词库进 行匹配等方式,确定包含所述输入字符串的增补字符串,例如,当输入 字符串为“xuxu”时,当上下文信息为“形态”,则确定所述增补字符 串为“rusheng”;或者,当输入字符串为”tianan”,上下文信息为“北 京”,则确定所述增补字符串为“men”,在此,所述增补字符串包括但 不限于通过匹配等方式,确定一个或多个通过拼接而成的多段字符串。 所述候选项定装置13通过将所述增补字符串在输入词库中进行匹配查 询,以获得与所述增补字符串对应的一个或多个增补输入候选项;继前 例,所述增补字符串为“rusheng”时所对应的增补输入候选项如“如生”、 “入声”、“入胜”等,所述增补字符串为“men”时,所对应的增补输 入候选项如“天安门”、“门”等。或者,所述增补输入候选项还可以 直接包括所述上下文信息,如直接生成“形态栩栩如生”、“北京天安门” 等。根据所述上下文信息,对所述一个或多个增补输入候选项进行筛选 处理,继前例,根据上下文信息,分别确定输入候选项为“栩栩如生”、 “天安门”从而获得所述一个或多个输入候选项;在此,若所述增补输 入候选项中包含上下文信息,则将所述增补输入候选项中的上下文信息 删除后,获得所述一个或多个输入候选项,如所述增补输入候选项“北 京天安门”中的“北京”删除,获得所述一个或多个输入候选项“天安 门”。

优选地,所述上下文确定装置12还可以通过对所述输入字符串所 对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词 语,以作为所述上下文,其中,所述焦点词语邻近所述输入字符串所对 应的输入位置。具体地,所述上下文确定装置12还可以通过分词或语 义分析等方式,对所述输入字符串所对应的相关文本进行自然语言处 理,其中,所述相关文本包括但不限于所述输入字符串本身所对应的文 本,或者所述输入字符串所对应的输入位置前后已经上屏的相关文本; 通过对所述相关文本中经由自然语言处理,提取对应的焦点词语以作为 所述上下文。例如,当所述输入字符串为“shishi”时,其对应的相关文 本为“上海地铁一期工程”,且所述输入字符串位于“上海地铁一期工 程”之后,通过对所述相关文本进行自然语言处理,提取焦点词语为“工 程”,并将“工程”作为上下文。进一步地,因此,当输入字符串为“shishi” 时,该输入设备根据所述上下文“工程”,确定输入候选项为“实施”、 “实时”、“试试”等。

图2示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的输入设备示意图;其中,所述输入设备包括获 取装置11’、上下文确定装置12’、候选项确定装置13’、提供装置14’, 在此,所述候选项确定装置13’包括匹配单元131’和处理单元132’。 具体地,获取装置11’获取输入字符串;上下文确定装置12’确定所述 输入字符串的上下文信息;匹配单元131’根据所述输入字符串,在输 入词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初 步输入候选项;处理单元132’根据所述上下文信息,对所述一个或多个 初步输入候选项进行处理,以获得所述一个或多个输入候选项;提供装 置14’将所述一个或多个输入候选项中至少一个提供给所述输入字符 串所对应的目标应用。其中,所述获取装置11’、上下文确定装置12’、 提供装置14’与图1所示对应装置相同或基本相同,故此处不再赘述, 并通过引用的方式包含于此。

上述各装置之间是持续不断工作的,在此,本领域技术人员应理 解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的 工作模式要求,进行输入字符串的获取、上下文信息的确定、初步输 入候选项的获取、输入候选项的确定、输入候选项的提供等,直至输 入设备停止获取输入字符串。

匹配单元131’根据所述输入字符串,在输入词库中进行匹配查询, 以获得与所述输入字符串对应的一个或多个初步输入候选项。具体地, 所述匹配单元131’通过获取所述输入字符串,将所述输入字符串与输入 词库中的词进行匹配,以获得与所述输入字符串对应的一个或多个初步 输入候选项。例如,当输入字符串为“shishi”时,根据在输入词库中进 行匹配查询后,获取“实时”、“试试”、“实施”、“事实”、“适时”、“逝 世”等多个初步输入候选项。

处理单元132’根据所述上下文信息,对所述一个或多个初步输入候 选项进行处理,以获得所述一个或多个输入候选项。具体地,处理单元 132’根据所述输入字符串的上下文信息,通过根据自然语言模型或词语 搭配数据库等,确定上下文信息与初步输入候选项的搭配概率,并根据 所述搭配概率对所述初步输入候选项进行筛选或排序,以获得输入候选 项。例如,继前例,当上下文信息为“客观”,则经处理后,将初步输 入候选项进行重新排序,顺序变为“事实”、“实时”、“试试”、“实施”、 “适时”、“逝世”等。

优选地,所述处理单元132’还可以根据所述上下文信息,在词语搭 配数据库中进行匹配查询,以确定所述初步输入候选项与所述上下文信 息对应的搭配相关度信息;根据所述搭配相关度信息,对所述一个或多 个初步输入候选项进行处理,以获得所述一个或多个输入候选项。具体 地,所述处理单元132’还可以根据所述上下文信息,在词语搭配数据库 中进行匹配查询,通过根据所述词语搭配数据库中的一个或多个词条与 所述上下文的匹配关系等,确定所述初步输入候选项与所述上下文信息 对应的搭配相关度信息;例如若或为bull变量,则所述搭配相关度信息 表示如是否存在搭配;或为连续变量,如所述搭配相关度信息表示搭配 概率为多少;在此,所述搭配相关度信息可根据如词语搭配数据库或其 他相关数据库中的上下文与初步输入候选项的组合频率等通过机器学 习获得。根据所述搭配相关度信息,通过对所述一个或多个初步输入候 选项进行如筛选或排序处理,获得所述一个或多个输入候选项。

更优选地,所述输入设备还包括文本处理装置(未示出)和建立 装置(未示出);其中,文本处理装置对一个或多个文本信息进行分析 处理,以获得搭配频度满足一定阈值的分词搭配关系;建立装置根据所 述分词搭配关系,建立或更新所述词语搭配数据库。具体地,文本处理 装置例如通过对各类日志、各类文章等进行获取,并对所获取文本信息 进行如先分词,后统计相邻词间的共现频率等分析方法,当所述共现频 率超过一定阈值时,则判断所述相邻词间存在一定的搭配关系,从而获 得搭配频度满足一定阈值的分词搭配关系;建立装置根据所述分词搭配 关系,建立所述词语搭配数据库,或对现有词语搭配数据库进行更新等, 在此,所述词语搭配数据库中包括但不限于分词搭配关系以及分词搭配 关系之间的搭配概率信息;并且,所述词语搭配数据库中可包含现有固 定词语,如成语、俗语等,同时经过所述更新,可以将由于现有网络应 用的快速发展所产生的新的词语及表述进行包含,从而有效提高用户的 输入效率。

图3示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的输入设备示意图;其中,所述输入设备包括 获取装置11”、上下文确定装置12”、候选项确定装置13”、提供装置 14”,在此,所述候选项确定装置13”包括检测单元133”和迭代单元 134”。具体地,获取装置11”获取输入字符串;上下文确定装置12” 确定所述输入字符串的上下文信息;检测单元133”检测所述输入字 符串是否超出预定的长度阈值;若所述输入字符串超出所述长度阈值, 迭代单元134”根据所述输入字符串,以及所述上下文信息,迭代确定与 所述输入字符串对应的一个或多个输入候选项;提供装置14”将所述一 个或多个输入候选项中至少一个提供给所述输入字符串所对应的目 标应用。其中,所述获取装置11”、上下文确定装置12”、提供装置 14”与图1所示对应装置相同或基本相同,故此处不再赘述,并通过 引用的方式包含于此。

上述各装置之间是持续不断工作的,在此,本领域技术人员应理 解“持续”是指上述各装置分别实时地或者按照设定的或实时调整的 工作模式要求,进行输入字符串的获取、上下文信息的确定、长度阈 值的检测、输入候选项的确定、输入候选项的提供等,直至输入设备 停止获取输入字符串。

检测单元133”检测所述输入字符串是否超出预定的长度阈值。具 体地,所述检测单元133”通过基于预置的或用户自行设置的长度阈值, 对所述输入字符串的长度进行检测,检测所述输入字符串的长度是否超 出了预定的长度阈值。例如,当预定的字符长度阈值为N,当所述输入 字符串的长度为N+1时,则检测单元133”检测所述输入字符串超出了 预定的长度阈值。

若所述输入字符串超出所述长度阈值,迭代单元134”根据所述输入 字符串,以及所述上下文信息,迭代确定与所述输入字符串对应的一个 或多个输入候选项。具体地,若所述输入字符串超出所述长度阈值,迭 代单元134”通过根据所述输入字符串,以及所述上下文信息,通过例 如根据所述长度阈值,对所述输入字符串进行分段等处理,确定与第 一个长度阈值的输入字符串所对应的所述输入候选项,并将所确定的 输入候选项再次作为上下文信息,从而迭代确定下一个长度阈值的输 入字符串所对应的输入候选项等的方式,确定与所述输入字符串对应 的一个或多个输入候选项。

优选地,所述检测单元133”还可以获取所述输入字符串在输入词 库中对应的一个或多个抽样输入候选项;检测所述一个或多个抽样输入 候选项中至少一个中的字数是超出预定的字数阈值,以确定所述输入字 符串是否超出预定的长度阈值。具体地,所述检测单元133”还可以通 过例如将所述输入字符串直接在所述输入词库中进行匹配,获取与所 述全部输入字符串所对应的一个或多个输入候选项,并从中随机抽取 或指定抽取(如选择第一个输入候选项等)方式,获取所述输入字符 串在输入词库中对应的一个或多个抽样输入候选项;通过对所述一个或 多个抽样输入候选项进行检测,如所述抽样输入候选项中的其中至少一 个字数超出预定的字数阈值,则确定所述输入字符串是否超出预定的长 度阈值。

优选地,所述迭代单元134”还可以当所述输入字符串超出所述长 度阈值,根据所述上下文信息,以及所述输入字符串中与所述上下文信 息相邻的部分输入字符串,确定与所述部分输入字符串对应的一个或多 个部分输入候选项;根据所述部分输入字符串,以及所述输入字符串中 其余输入字符串,确定与所述其余输入字符串对应的一个或多个其余输 入候选项,其中,所述部分输入候选项被用作所述其余输入字符串的上 下文信息;根据所述一个或多个部分输入候选项,以及所述一个或多个 其余输入候选项,确定所述一个或多个输入候选项。

具体地,当所述输入字符串超出所述长度阈值,根据所述上下文信 息,通过例如分词等处理,对所述输入字符串进行分词或分段等,从而 获取所述输入字符串中与所述上下文信息相邻的部分输入字符串,通过 将所述部分输入字符串结合所述上下文信息,确定与所述部分输入字符 串对应的一个或多个部分输入候选项;在此,所述确定方法与图1中所 述候选项确定装置13中的确定方法相同或相似,故此处不再赘述,并 通过引用的方式包含于此。所述迭代单元134”将所述部分输入候选项 作为其余输入字符串的上下文信息,通过迭代的方式,确定与所述其 余输入字符串相对应的一个或多个其余输入候选项;迭代后通过例如对 字符串之间的关系,对所述部分输入候选项与其余输入候选项进行拼接 等方式,确定一个或多个输入候选项。

图4示出根据本发明另一个方面的一种用于提供输入字符串所对 应的输入候选项的方法流程图。具体地,在步骤s1中,输入设备获 取输入字符串;在步骤s2中,输入设备确定所述输入字符串的上下 文信息;在步骤s3中,输入设备根据所述输入字符串,以及所述上 下文信息,确定与所述输入字符串对应的一个或多个输入候选项;在 步骤s4中,输入设备将所述一个或多个输入候选项中至少一个提供 给所述输入字符串所对应的目标应用。

上述各步骤之间是持续不断工作的,在此,本领域技术人员应理 解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的 工作模式要求,进行输入字符串的获取、上下文信息的确定、输入候 选项的确定、输入候选项的提供等,直至输入设备停止获取输入字符 串。

在步骤s1中,输入设备获取输入字符串。具体地,在步骤s1中, 输入设备通过从输入框中接收用户或其他应用等通过输入、选择、点 击等操作所输入的字符串;或者根据各种通信协议(Communications Protocol),通过各种数据传输接口,获取从其他应用的输入框中的字 符串;其中,所述输入框如短信编辑框、内容输入框等。其中,所述输 入字符串包括但不限于通过如全拼或简拼等方式所输入的拼音编码字 符等。

在步骤s2中,输入设备确定所述输入字符串的上下文信息。具 体地,在步骤s2中,输入设备通过根据步骤s1所获取的输入字符串, 利用当前所输入的字符串所属的文字等,将所述当前输入字符串所属 的文字与一个或多个词库进行匹配,获取与所述输入字符串相关联的 一种或多种匹配信息,并作为所述输入字符串的上下文信息;例如, 当输入“huacao”时,先确定所述输入字符串所属的文字可能为“花 草”,根据“花草”在所属词库中的匹配信息,确定其下文信息可能 为“茶”等;或者,在步骤s2中,输入设备通过根据与所述输入字 符串相对应的历史记录信息,对所述输入字符串的上下文信息进行确 定,例如,所述输入字符串前刚刚上屏的前一个输入字符串,则可作 为所述输入字符串的前文信息。在此,所述上下文信息包括但不限于 与所述输入字符串相对应的上文信息或下文信息;例如,当所述输入 为“shishi”时,当前次输入所上屏的词组为“客观”时,则所述“shishi” 对应的上文信息为“客观”;若屏幕上存在一个词组“计划”,且输入 “shishi”时,光标位于“计划”前,则其所对应的下文信息为“计 划”等。

在步骤s3中,输入设备根据所述输入字符串,以及所述上下文 信息,确定与所述输入字符串对应的一个或多个输入候选项。具体地, 在步骤s3中,输入设备通过根据步骤s1中所获取的输入字符串,以 及步骤s1中所确定的上下文信息,通过将与所述输入字符串相对应 的一个或多个上下文信息直接作为一个或多个输入候选项,或者将所 述输入字符串相对应的上下文信息进行处理后作为输入候选项的方 式,确定与所述输入字符串对应的一个或多个输入候选项。例如,继 上例,当所述输入字符串为“shishi”时,其所对应的上文信息可能 为“客观”,“我”,“谈论”等,当所述上文信息为“客观”时,通过 利用将所述输入字符串,以及所述上下文信息进行匹配等的方式,确 定输入候选项为“事实”、“实时”、“实施”等;当所述上文信息为“我” 时,确定输入候选项为“试试”、“实施”、“试试”等;当所述上文信 息为“谈论”时,确定输入候选项为“时事”、“事实”、“世事”等。

在步骤s4中,输入设备将所述一个或多个输入候选项中至少一 个提供给所述输入字符串所对应的目标应用。具体地,在步骤s4中, 输入设备通过直接提供,或根据各种通信协议(Communications Protocol),通过各种数据传输接口,通过例如重新排序或筛选等方式, 将所述一个或多个输入候选项中至少一个提供给所述输入字符串所 对应的目标应用。其中,所述目标应用包括但不限于与所述步骤s1 中所对应的输入框相对应的相同应用,或者与所述步骤s1中所对应 的输入框相关联的其他应用等,如直接利用所述输入候选项进行搜索 等。

优选地,在步骤s3中,输入设备还可以根据所述输入字符串,以 及所述上下文信息,确定包含所述输入字符串的增补字符串,其中,所 述增补字符串还包括所述上下文信息所对应的字符串;根据所述增补字 符串,在输入词库中进行匹配查询,以获得与所述增补字符串对应的一 个或多个增补输入候选项;根据所述上下文信息,对所述一个或多个增 补输入候选项进行筛选处理,以获得所述一个或多个输入候选项。具体 地,在步骤s3中,输入设备还可以根据所述输入字符串,以及所述上 下文信息,通过将所述输入字符串结合所述上下文信息与例如输入词库 进行匹配等方式,确定包含所述输入字符串的增补字符串,例如,当输 入字符串为“xuxu”时,当上下文信息为“形态”,则确定所述增补字 符串为“rusheng”;或者,当输入字符串为”tianan”,上下文信息为“北 京”,则确定所述增补字符串为“men”,在此,所述增补字符串包括但 不限于通过匹配等方式,确定一个或多个通过拼接而成的多段字符串。 在步骤s3中,输入设备通过将所述增补字符串在输入词库中进行匹配 查询,以获得与所述增补字符串对应的一个或多个增补输入候选项;继 前例,所述增补字符串为“rusheng”时所对应的增补输入候选项如“如 生”、“入声”、“入胜”等,所述增补字符串为“men”时,所对应的增 补输入候选项如“天安门”、“门”等。或者,所述增补输入候选项还 可以直接包括所述上下文信息,如直接生成“形态栩栩如生”、“北京天 安门”等。根据所述上下文信息,对所述一个或多个增补输入候选项进 行筛选处理,继前例,根据上下文信息,分别确定输入候选项为“栩栩 如生”、“天安门”从而获得所述一个或多个输入候选项;在此,若所述 增补输入候选项中包含上下文信息,则将所述增补输入候选项中的上下 文信息删除后,获得所述一个或多个输入候选项,如所述增补输入候选 项“北京天安门”中的“北京”删除,获得所述一个或多个输入候选项 “天安门”。

优选地,在步骤s2中,输入设备还可以通过对所述输入字符串所 对应的相关文本进行自然语言处理,从所述相关文本提取对应的焦点词 语,以作为所述上下文,其中,所述焦点词语邻近所述输入字符串所对 应的输入位置。具体地,在步骤s2中,输入设备还可以通过分词或语 义分析等方式,对所述输入字符串所对应的相关文本进行自然语言处 理,其中,所述相关文本包括但不限于所述输入字符串本身所对应的文 本,或者所述输入字符串所对应的输入位置前后已经上屏的相关文本; 通过对所述相关文本中经由自然语言处理,提取对应的焦点词语以作为 所述上下文。例如,当所述输入字符串为“shishi”时,其对应的相关文 本为“上海地铁一期工程”,且所述输入字符串位于“上海地铁一期工 程”之后,通过对所述相关文本进行自然语言处理,提取焦点词语为“工 程”,并将“工程”作为上下文。进一步地,因此,当输入字符串为“shishi” 时,该输入设备根据所述上下文“工程”,确定输入候选项为“实施”、 “实时”、“试试”等。

图5示出根据本发明一个优选实施例的一种用于提供输入字符串 所对应的输入候选项的方法流程图。具体地,在步骤s1’中,输入设 备获取输入字符串;在步骤s2’中,输入设备确定所述输入字符串的 上下文信息;在步骤s31’中,输入设备根据所述输入字符串,在输入 词库中进行匹配查询,以获得与所述输入字符串对应的一个或多个初步 输入候选项;在步骤s32’中,输入设备根据所述上下文信息,对所述一 个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选 项;在步骤s4’中,输入设备将所述一个或多个输入候选项中至少一 个提供给所述输入字符串所对应的目标应用。其中,所述步骤s1’、 步骤s2’、步骤s4’与图4所示对应步骤相同或基本相同,故此处不再 赘述,并通过引用的方式包含于此。

上述各步骤之间是持续不断工作的,在此,本领域技术人员应理 解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的 工作模式要求,进行输入字符串的获取、上下文信息的确定、初步输 入候选项的获取、输入候选项的确定、输入候选项的提供等,直至输 入设备停止获取输入字符串。

在步骤s31’中,输入设备根据所述输入字符串,在输入词库中进 行匹配查询,以获得与所述输入字符串对应的一个或多个初步输入候选 项。具体地,在步骤s31’中,输入设备通过获取所述输入字符串,将所 述输入字符串与输入词库中的词进行匹配,以获得与所述输入字符串对 应的一个或多个初步输入候选项。例如,当输入字符串为“shishi”时, 根据在输入词库中进行匹配查询后,获取“实时”、“试试”、“实施”、“事 实”、“适时”、“逝世”等多个初步输入候选项。

在步骤s32’中,输入设备根据所述上下文信息,对所述一个或多 个初步输入候选项进行处理,以获得所述一个或多个输入候选项。具体 地,在步骤s32’中,输入设备根据所述输入字符串的上下文信息,通过 根据自然语言模型或词语搭配数据库等,确定上下文信息与初步输入候 选项的搭配概率,并根据所述搭配概率对所述初步输入候选项进行筛选 或排序,以获得输入候选项。例如,继前例,当上下文信息为“客观”, 则经处理后,将初步输入候选项进行重新排序,顺序变为“事实”、“实 时”、“试试”、“实施”、“适时”、“逝世”等。

优选地,在步骤s32’中,输入设备还可以根据所述上下文信息, 在词语搭配数据库中进行匹配查询,以确定所述初步输入候选项与所述 上下文信息对应的搭配相关度信息;根据所述搭配相关度信息,对所述 一个或多个初步输入候选项进行处理,以获得所述一个或多个输入候选 项。具体地,在步骤s32’中,输入设备还可以根据所述上下文信息,在 词语搭配数据库中进行匹配查询,通过根据所述词语搭配数据库中的一 个或多个词条与所述上下文的匹配关系等,确定所述初步输入候选项与 所述上下文信息对应的搭配相关度信息;例如若或为bull变量,则所述 搭配相关度信息表示如是否存在搭配;或为连续变量,如所述搭配相关 度信息表示搭配概率为多少;在此,所述搭配相关度信息可根据如词语 搭配数据库或其他相关数据库中的上下文与初步输入候选项的组合频 率等通过机器学习获得。根据所述搭配相关度信息,通过对所述一个或 多个初步输入候选项进行如筛选或排序处理,获得所述一个或多个输入 候选项。

更优选地,所述方法还包括步骤s5’(未示出)和步骤s6’(未示 出);其中,在步骤s5’中,输入设备对一个或多个文本信息进行分析处 理,以获得搭配频度满足一定阈值的分词搭配关系;在步骤s6’中,输 入设备根据所述分词搭配关系,建立或更新所述词语搭配数据库。具体 地,在步骤s5’中,输入设备例如通过对各类日志、各类文章等进行获 取,并对所获取文本信息进行如先分词,后统计相邻词间的共现频率等 分析方法,当所述共现频率超过一定阈值时,则判断所述相邻词间存在 一定的搭配关系,从而获得搭配频度满足一定阈值的分词搭配关系;在 步骤s6’中,输入设备根据所述分词搭配关系,建立所述词语搭配数据 库,或对现有词语搭配数据库进行更新等,在此,所述词语搭配数据库 中包括但不限于分词搭配关系以及分词搭配关系之间的搭配概率信息; 并且,所述词语搭配数据库中可包含现有固定词语,如成语、俗语等, 同时经过所述更新,可以将由于现有网络应用的快速发展所产生的新的 词语及表述进行包含,从而有效提高用户的输入效率。

图6示出根据本发明另一个优选实施例的一种用于提供输入字符 串所对应的输入候选项的方法流程图。具体地,在步骤s1”中,输入 设备获取输入字符串;在步骤s2”中,输入设备确定所述输入字符串 的上下文信息;在步骤s33”中,输入设备检测所述输入字符串是否超 出预定的长度阈值;若所述输入字符串超出所述长度阈值,在步骤s34” 中,输入设备根据所述输入字符串,以及所述上下文信息,迭代确定与 所述输入字符串对应的一个或多个输入候选项;在步骤s4”中,输入设 备将所述一个或多个输入候选项中至少一个提供给所述输入字符串 所对应的目标应用。其中,所述步骤s1”、步骤s2”、步骤s4”与图4 所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式 包含于此。

上述各步骤之间是持续不断工作的,在此,本领域技术人员应理 解“持续”是指上述各步骤分别实时地或者按照设定的或实时调整的 工作模式要求,进行输入字符串的获取、上下文信息的确定、长度阈 值的检测、输入候选项的确定、输入候选项的提供等,直至输入设备 停止获取输入字符串。

在步骤s33”中,输入设备检测所述输入字符串是否超出预定的长 度阈值。具体地,在步骤s33”中,输入设备通过基于预置的或用户自 行设置的长度阈值,对所述输入字符串的长度进行检测,检测所述输入 字符串的长度是否超出了预定的长度阈值。例如,当预定的字符长度阈 值为N,当所述输入字符串的长度为N+1时,则在步骤s33”中,输入 设备检测所述输入字符串超出了预定的长度阈值。

若所述输入字符串超出所述长度阈值,在步骤s34”中,输入设备 根据所述输入字符串,以及所述上下文信息,迭代确定与所述输入字符 串对应的一个或多个输入候选项。具体地,若所述输入字符串超出所述 长度阈值,在步骤s34”中,输入设备通过根据所述输入字符串,以及 所述上下文信息,通过例如根据所述长度阈值,对所述输入字符串进 行分段等处理,确定与第一个长度阈值的输入字符串所对应的所述输 入候选项,并将所确定的输入候选项再次作为上下文信息,从而迭代 确定下一个长度阈值的输入字符串所对应的输入候选项等的方式,确 定与所述输入字符串对应的一个或多个输入候选项。

优选地,在步骤s33”中,输入设备还可以获取所述输入字符串在 输入词库中对应的一个或多个抽样输入候选项;检测所述一个或多个抽 样输入候选项中至少一个中的字数是超出预定的字数阈值,以确定所述 输入字符串是否超出预定的长度阈值。具体地,在步骤s33”中,输入设 备还可以通过例如将所述输入字符串直接在所述输入词库中进行匹 配,获取与所述全部输入字符串所对应的一个或多个输入候选项,并 从中随机抽取或指定抽取(如选择第一个输入候选项等)方式,获取 所述输入字符串在输入词库中对应的一个或多个抽样输入候选项;通过 对所述一个或多个抽样输入候选项进行检测,如所述抽样输入候选项中 的其中至少一个字数超出预定的字数阈值,则确定所述输入字符串是否 超出预定的长度阈值。

优选地,在步骤s34”中,输入设备还可以当所述输入字符串超出 所述长度阈值,根据所述上下文信息,以及所述输入字符串中与所述上 下文信息相邻的部分输入字符串,确定与所述部分输入字符串对应的一 个或多个部分输入候选项;根据所述部分输入字符串,以及所述输入字 符串中其余输入字符串,确定与所述其余输入字符串对应的一个或多个 其余输入候选项,其中,所述部分输入候选项被用作所述其余输入字符 串的上下文信息;根据所述一个或多个部分输入候选项,以及所述一个 或多个其余输入候选项,确定所述一个或多个输入候选项。

具体地,当所述输入字符串超出所述长度阈值,根据所述上下文 信息,通过例如分词等处理,对所述输入字符串进行分词或分段等, 从而获取所述输入字符串中与所述上下文信息相邻的部分输入字符 串,通过将所述部分输入字符串结合所述上下文信息,确定与所述部 分输入字符串对应的一个或多个部分输入候选项;在此,所述确定方 法与图4中所述步骤s3中的确定方法相同或相似,故此处不再赘述, 并通过引用的方式包含于此。在步骤s34”中,输入设备将所述部分输 入候选项作为其余输入字符串的上下文信息,通过迭代的方式,确 定与所述其余输入字符串相对应的一个或多个其余输入候选项;迭代 后通过例如对字符串之间的关系,对所述部分输入候选项与其余输入 候选项进行拼接等方式,确定一个或多个输入候选项。

对于本领域技术人员而言,显然本发明不限于上述示范性实施 例的细节,而且在不背离本发明的精神或基本特征的情况下,能够 以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将 实施例看作是示范性的,而且是非限制性的,本发明的范围由所附 权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要 件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中 的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一 词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述 的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实 现。第一,第二等词语用来表示名称,而并不表示任何特定的顺 序。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号