要解决的问题:正确提取文档数据中包含的内容。解决方案:文档数据分析程序17使计算机实现掩模概念提取功能14,该掩模概念提取功能14将由计算机获得的分析对象的文档数据中包括的文档元素之中的第一定义词典15中包括的文档元素转换为掩模数据。通过将存储在数据库中的文档元素中的使用期限短于规定参考的文档元素进行关联,并使用表示其质量的掩码数据来构建文档而获得的参考第一定义词典15的文档元素相关性在图3中,参考第二定义字典16,该第二定义字典通过将存储在数据库中并且使用期限长于规定参考的文档元素与它们的属性数据相关联而获得,并且提取包括在由掩码转换的文档数据中的多个文档元素概念提取功能14并包含在se中条件定义字典16及其属性数据。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP5117560B2
专利类型
公开/公告日2013-01-16
原文格式PDF
申请/专利权人 株式会社東芝;東芝ソリューション株式会社;
申请/专利号JP20100250068
申请日2010-11-08
分类号G06F17/30;G06F17/27;G06F17/21;G06Q30/02;
国家 JP
入库时间 2022-08-21 16:57:07