首页> 外国专利> Systems, methods and apparatus for relative frequency based phrase mining

Systems, methods and apparatus for relative frequency based phrase mining

机译:用于基于相对频率的短语挖掘的系统,方法和装置

摘要

Example systems, methods, processes, and apparatus identify phrases in electronic information. One or more phrase dictionaries (520) are created from content in one or more electronic documents (310, 505). A relative frequency value is generated for each phrase in each of the one or more phrase dictionaries (520). The relative frequency value for a phrase is based at least in part on a comparison between a frequency of the phrase in the electronic document (310, 505) and a frequency of each individual word in the phrase. One or more phrases are selected based at least in part on a threshold and the relative frequency value generated for each phrase. The selected one or more phrases and the relative frequency values associated with each of the selected one or more phrases are output for graphical display to a user.
机译:示例系统,方法,过程和设备识别电子信息中的短语。根据一个或多个电子文档(310、505)中的内容创建一个或多个短语词典(520)。为一个或多个短语词典中的每个词典中的每个短语生成相对频率值(520)。短语的相对频率值至少部分地基于电子文档(310、505)中的短语的频率与短语中每个单个单词的频率之间的比较。至少部分地基于阈值和针对每个短语生成的相对频率值来选择一个或多个短语。所选择的一个或多个短语和与所选择的一个或多个短语中的每个短语相关联的相对频率值被输出以用于图形显示给用户。

著录项

  • 公开/公告号EP2282271A1

    专利类型

  • 公开/公告日2011-02-09

    原文格式PDF

  • 申请/专利权人 BUZZMETRICS LTD.;

    申请/专利号EP20100008294

  • 发明设计人 EDEN TAL;

    申请日2010-08-09

  • 分类号G06F17/27;G06F17/30;

  • 国家 EP

  • 入库时间 2022-08-21 17:55:34

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号