要解决的问题:提供一种文本校正程序,即使在文本信息包括“非正式表达”的情况下,也可以防止将包括口语“非正式表达”的文本信息确定为未知单词,从而将文本校正为适合文本分析的文本。
解决方案:文本校正程序允许计算机用作:参考文本存储装置,用于存储一组校正参考文本信息;以及参考文本检索装置,用于通过使用参考文本存储装置来检索与分析对象文本信息的内容相似的一种或多种校正参考文本信息;未知词提取装置,用于将分析对象文本信息划分为词素,并提取未知词;一种检索关键字产生装置,用于产生由该未知单词和该未知单词之前和之后的至少一个相邻语素组成的检索关键字;一种校正规则检索装置,用于利用来自校正参考文本信息的检索关键字检索一个或多个类似于未知单词的校正规则;校正规则选择装置,用于基于文本规则在校正规则中选择一个校正规则。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP5495425B2
专利类型
公开/公告日2014-05-21
原文格式PDF
申请/专利权人 株式会社KDDI研究所;
申请/专利号JP20090265784
申请日2009-11-21
分类号G06F17/21;G06F17/24;G06F17/27;G06F17/30;
国家 JP
入库时间 2022-08-21 16:15:08