首页> 外国专利> Spam feature calculation device, spam features calculation method, and the program

Spam feature calculation device, spam features calculation method, and the program

机译:垃圾邮件特征计算装置,垃圾邮件特征计算方法和程序

摘要

PROBLEM TO BE SOLVED: To calculate a feature capable of appropriately discriminating a spam page even if the spam page is automatically generated.SOLUTION: A spam feature calculation device for calculating a feature used to discriminate a spam document comprises: topic leaning means which calculates a topic parameter composed of a sample number of words to each topic from a training text which is a non-spam document and stores it in a topic parameter DB; and feature calculation means which divides a text of feature calculation target into prescribed units, obtains aggregation of divided texts, calculates a topic vector using the topic parameter stored in the topic parameter DB for each divided text, and calculates the feature on the basis of a difference between topic vectors.
机译:解决的问题:即使自动生成垃圾邮件页面,也要计算能够适当地区分垃圾邮件页面的特征。解决方案:用于计算用于区分垃圾邮件文档的特征的垃圾邮件特征计算设备包括:主题倾斜装置,其计算主题参数,由作为非垃圾文档的培训文本中每个主题的单词样本数组成,并将其存储在主题参数数据库中;特征计算装置将特征计算目标的文本划分为规定的单元,获得划分文本的集合,使用存储在主题参数DB中的主题参数针对每个划分的文本计算主题向量,并基于主题向量之间的差异。

著录项

  • 公开/公告号JP5824430B2

    专利类型

  • 公开/公告日2015-11-25

    原文格式PDF

  • 申请/专利权人 日本電信電話株式会社;

    申请/专利号JP20120178991

  • 发明设计人 数原 良彦;片岡 良治;

    申请日2012-08-10

  • 分类号G06F17/30;

  • 国家 JP

  • 入库时间 2022-08-21 14:39:53

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号