要解决的问题:提供一种短语提取规则生成装置,短语提取规则生成方法和程序,即使学习数据包括语义上相似的类或其他类,也能够学习提取规则以按类别准确地对短语进行分类。 。
解决方案:短语提取规则生成装置2用于生成短语提取规则,用于从包括特征量和类别信息的学习数据中提取特定类别的短语。短语提取规则生成装置2包括特征空间转换单元20,特征空间转换单元20用于通过预先设置的每个类别的定义,通过分配给各个特征值类型的特征值类型和特征值权重来转换学习数据的特征空间;以及提取规则学习单元21,用于从特征空间转换单元20已经转换了特征空间的学习数据中学习短语提取规则。
版权:(C)2011,JPO&INPIT