要解决的问题:即使提供标记样品的过程不平衡,也要提高自动内容分类的准确性。
解决方案:一种用于输入类别未知的内容并对该内容的类别进行分类的自动内容分类装置,包括识别功能生成部和内容分类部。识别函数生成部通过条件概率模型和同时概率模型的加权组合,给出表示内容和类别之间的依赖性的强度的识别函数,并同时计算条件概率模型的参数,该条件概率模型是模型的参数。识别函数,同时概率模型的参数以及基于标记样本和未标记模型两者的统计信息的加权组合的权重。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP5308360B2
专利类型
公开/公告日2013-10-09
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20100007381
申请日2010-01-15
分类号G06F17/30;G06N3;G06N5/04;
国家 JP
入库时间 2022-08-21 16:55:24