要解决的问题:提供一种减少识别错误的影响的模型学习方法和信息提取方法。
解决方案:在判别模型中,终端设备在模型学习期间通过使用识别词串学习数据生成模型信息,该识别词串学习数据被赋予了提取对象信息,并且包括错误和参考词串学习数据,其被赋予了提取对象信息,并且不包含错误。然后,将识别定罪度同一性进行二值化,并通过使用识别词串和参考词串两者来生成模型信息。当提取信息时,将表示从输入数据中识别出的各个识别词是否正确的识别信念程度身份赋予识别词串。当识别信念程度同一性大于某个阈值时,该单词被“正确地”识别,而当否时,该单词被“错误地”识别。然后,所生成的模型信息用于将提取对象信息赋予识别词串,并且基于所赋予的提取对象信息来提取单词。
版权:(C)2008,日本特许厅&INPIT
公开/公告号JP4878220B2
专利类型
公开/公告日2012-02-15
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20060155970
申请日2006-06-05
分类号G10L15/06;G06N5/04;G10L15/14;
国家 JP
入库时间 2022-08-21 17:37:33