首页> 外国专利> CONCEPTUAL DOCUMENT ANALYSIS AND CHARACTERIZATION

CONCEPTUAL DOCUMENT ANALYSIS AND CHARACTERIZATION

机译:概念性文件分析和表征

摘要

Data files are received from data sources that include textual content. The data files are categorized using a taxonomy of categories, where each category has sample textual content that defines a concept for the category. The categorizing includes comparing the textual content of the data file with the sample textual content for the category. A file score is calculated for each data file to compare the degree of similarity between the defined concept of the category and a determined concept for the data file. Each data file is associated with the category if the file score is equal to or greater than a pre-determined minimum score for the category. A portion of the data file and/or file score is be provided.
机译:从包括文本内容的数据源接收数据文件。数据文件使用类别分类法进行分类,其中每个类别都有样本文本内容,这些文本内容定义了类别的概念。分类包括将数据文件的文本内容与类别的样本文本内容进行比较。为每个数据文件计算文件分数,以比较类别的定义概念和数据文件的确定概念之间的相似程度。如果文件分数等于或大于类别的预定最低分数,则每个数据文件都与类别相关联。提供了数据文件和/或文件分数的一部分。

著录项

  • 公开/公告号EP3289491A4

    专利类型

  • 公开/公告日2018-12-19

    原文格式PDF

  • 申请/专利权人 ALTEP INC.;

    申请/专利号EP20160787054

  • 发明设计人 MILLER ROGER W.;VAN DEN BERGE WILLEM R.;

    申请日2016-04-27

  • 分类号G06F17/30;

  • 国家 EP

  • 入库时间 2022-08-21 12:28:36

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号