首页> 中国专利> 对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构

对拼写、打字和转换错误具有容错能力的将一种文本形式转换为另一种文本形式的语言输入体系结构

摘要

一种语言输入体系结构将语音文本(例如,汉语拼音)的输入字符串转换为语言文本(例如,中文汉字)的输出(字符)串,它所使用的方式能使打字错误以及在从语音文本转换为语言文本的过程中所出现的转换错误最小化。语言输入体系结构具有一个搜索引擎,一个或多个打字模型,一个语言模型,针对不同语言的一个或多个词典。每一个打字模型都在真正数据的基础上进行训练,并且学习输入错误概率。打字模型被这样配置,它根据每一个候选字符串被不正确地输入为输入字符串的输入错误概率,产生可以用来替换输入字符串的可能的各打字候选串的列表。可能的各打字候选串可以存储在数据库之中。语言模型根据一个可能的转换输出字符串代表该候选串的概率,为每一个打字候选串提供可能的转换串。搜索引擎将打字模型概率跟语言模型概率加以组合,以便找出能代表输入字符串的已转换形式的最可能的转换字符串。通过产生打字候选串,并且随后用相关的转换字符串来取代输入字符串,这种体系结构就能消除许多常见的打字错误。当使用多种打字模型时,本体系结构能自动地区分多种语言,而不需要为不同语言的输入而进行模式切换。

著录项

  • 公开/公告号CN1387650A

    专利类型发明专利

  • 公开/公告日2002-12-25

    原文格式PDF

  • 申请/专利权人 微软公司;

    申请/专利号CN00815293.4

  • 发明设计人 李凯夫;陈征;韩建;

    申请日2000-10-13

  • 分类号G06F17/27;G06F17/28;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人吴丽丽

  • 地址 美国华盛顿

  • 入库时间 2023-12-17 14:32:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-12-09

    未缴年费专利权终止 IPC(主分类):G06F17/27 授权公告日:20050608 终止日期:20141013 申请日:20001013

    专利权的终止

  • 2005-06-08

    授权

    授权

  • 2003-03-12

    实质审查的生效

    实质审查的生效

  • 2002-12-25

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号