要解决的问题:提供一种文本校正程序,用于将文本校正为适合文本分析的文本,而不会将口语“非正式表达”中描述的文本信息确定为未知词,即使“非正式表达”。
解决方案:文本校正程序允许计算机用作:参考文本存储装置,用于通过分类为多个类别来存储多种校正参考文本信息;以及用于提取未知单词的未知单词提取装置,用于生成由未知单词和相邻词素构成的检索关键字的检索关键字生成装置;一种校正规则检索装置,用于以校正基准文本信息的类别为单位,利用检索关键字检索与未知单词相似的一个或多个校正规则候选。校正规则候选者选择装置,用于根据类别类别中的校正规则候选者中的文本构成索引选择一个校正规则候选者;一种类别选择装置,用于基于与以类别为单位选择的校正规则候选有关的校正规则的文本构成索引来选择得分最高的类别;校正规则选择装置,用于基于所选择的类别来选择校正规则。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP5448744B2
专利类型
公开/公告日2014-03-19
原文格式PDF
申请/专利权人 株式会社KDDI研究所;
申请/专利号JP20090265786
申请日2009-11-21
分类号G06F17/21;G06F17/27;
国家 JP
入库时间 2022-08-21 16:13:58