首页> 中国专利> 团购网站销售数据真实性检测方法及装置

团购网站销售数据真实性检测方法及装置

摘要

本申请提供了一种团购网站销售数据真实性检测方法,包括以下步骤:获取当前团单信息中显示的实时销售数量;获取当前团单的实时关注度;获取同一时段内当前团单信息中显示的实时销售数量和实时关注度的加权值的差值,若差值大于阈值,则确定当前团单的销售数据不真实,反之,则确定当前团单的销售数据真实。本申请还提供了一种实现前述方法的团购网站销售数据真实性检测装置。本申请的团购网站销售数据真实性检测方法及装置,能够解决团购网站销售数据真实性判断的问题。

著录项

  • 公开/公告号CN102360484A

    专利类型发明专利

  • 公开/公告日2012-02-22

    原文格式PDF

  • 申请/专利权人 奇智软件(北京)有限公司;

    申请/专利号CN201110300517.9

  • 发明设计人 朱明华;周鸿祎;

    申请日2011-09-30

  • 分类号G06Q30/00;G06F17/30;

  • 代理机构北京润泽恒知识产权代理有限公司;

  • 代理人苏培华

  • 地址 100016 北京市朝阳区酒仙桥路14号兆维大厦4层东侧单元

  • 入库时间 2023-12-18 04:34:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-20

    未缴年费专利权终止 IPC(主分类):G06Q30/02 专利号:ZL2011103005179 申请日:20110930 授权公告日:20160601

    专利权的终止

  • 2016-06-01

    授权

    授权

  • 2016-04-20

    专利申请权的转移 IPC(主分类):G06Q30/02 登记生效日:20160328 变更前: 变更后: 申请日:20110930

    专利申请权、专利权的转移

  • 2012-04-04

    实质审查的生效 IPC(主分类):G06Q30/00 申请日:20110930

    实质审查的生效

  • 2012-02-22

    公开

    公开

说明书

技术领域

本申请涉及网络数据处理技术领域,特别是涉及一种团购网站销售数 据真实性检测方法及装置。

背景技术

团购就是团体购物,指认识或不认识的消费者联合起来,加大与商 家的谈判能力,以求得最优价格的一种购物方式。根据薄利多销的原理, 商家可以给出低于零售价格的团购折扣和单独购买得不到的优质服务。 团购(group purchase)作为一种新兴的电子商务模式,通过消费者自行 组团、专业团购网站、商家组织团购等形式,提升用户与商家的议价能 力,并极大程度地获得商品让利,引起消费者及业内厂商、甚至是资本 市场关注。目前较为常见的团购方式为专业团购网站展示团购信息,网 站用户则可以直接在团购网站上进行商品的购买。

团购网站通常会再展示团购信息的同时展示该团购商品的销售数 量,通过这种方式来提示用户或者吸引更多用户进行团购商品的购买。 但是因为团购网站中所展示的所有信息都是由网站本身提供,在某些情 况下,团购网站为了自身的利益等原因,对于销售数量其可能并不会真 实展示,因此其销售数据的真实性和准确性也就无法得知。

发明内容

本申请所要解决的技术问题是提供一种团购网站销售数据真实性检测 方法及装置,能够解决团购网站销售数据真实性判断的问题。

为了解决上述问题,本申请公开了一种团购网站销售数据真实性检测 方法,包括以下步骤:

获取当前团单信息中显示的实时销售数量;

获取当前团单的实时关注度;

获取同一时段内当前团单信息中显示的实时销售数量和实时关注度 的加权值的差值,若差值大于阈值,则确定当前团单的销售数据不真实, 反之,则确定当前团单的销售数据真实。

进一步地,所述获取当前团单信息中显示的实时销售数量包括:

在当前团单的实时销售数量达到预定数量时获取。

进一步地,所述当前团单的实时关注度通过如下方式确定:

获取当前团单页面被点击的次数;

对所述被点击的次数进行修正得到所述当前团单被用户正常访问或 者浏览的次数;

所述被用户正常访问或者浏览的次数为当前团单的实时关注度。

进一步地,对所述被点击的次数进行修正包括:

对访问者的用户标识进行识别和过滤。

进一步地,所述实时关注度的加权值为对实时关注度进行归一化处理, 使之与实时销售数量具有相同的量化级后得到的归一化处理值,所述当前团 单信息中显示的实时销售数量和实时关注度的加权值的差值为:实时销 售数量变化值与归一化处理值的变化值的差值。

进一步地,所述实时关注度的加权值为将实时关注度转化得到的理论购 买数量,所述当前团单信息中显示的实时销售数量和实时关注度的加权值 的差值为:实时销售数量与理论购买数量的差值。

进一步地,所述将实时关注度转化得到理论购买数量包括:

根据当前团单的团单信息确定当前团单的具体商品;

确定所述具体商品的购买转化率;

根据购买转化率和实时关注度确定理论购买数量。

进一步地,所述同一时段内当前团单信息中显示的实时销售数量和实 时关注度的加权值的差值包括:

同一时间点的实时销售数量和理论购买数量的差值;或

同一时段内各相同时间点的实时销售数量和理论购买数量的差值之 和。

为了解决上述问题,本申请还公开了一种团购网站销售数据真实性检 测方法,包括以下步骤:

获取当前团单的团单信息和团单信息中显示的实时销售数量;

根据当前团单的团单信息确定所述当前团单的相关团单;

获取当前团单和相关团单的实时总关注度;

获取同一时段内当前团单信息中显示的实时销售数量和所述当前团 单和相关团单的实时总关注度的加权值的差值,若差值大于阈值,则确 定当前团单的销售数据不真实,反之,则确定当前团单的销售数据真实。

进一步地,所述根据当前团单的团单信息确定所述当前团单的相关团 单包括:

从当前团单的团单信息中提取当前团单的关键词;

对提取的关键词进行扩展得到扩展关键词集合;

根据扩展关键词集合从预存的团购云数据中查询并确定与扩展关键 词匹配的相关团单。

进一步地,所述从当前团单的团单信息中提取当前团单的关键词包 括:

从当前团单的名称和详细描述中提取关键词。

进一步地,所述当前团单和相关团单的实时总关注度通过如下方式确 定:

获取当前团单和相关团单页面被点击的总次数;

对所述被点击的总次数进行修正得到所述当前团单和相关团单被用 户正常访问或者浏览的总次数;

所述被用户正常访问或者浏览的总次数为当前团单和相关团单的实 时总关注度。

为了解决上述问题,本申请还公开了一种团购网站销售数据真实性检测 装置,包括:

当前团单信息获取模块,用于获取当前团单信息中显示的实时销售 数量;

实时关注度确定模块,用于获取当前团单的实时关注度;

比较模块,用于比较同一时段内当前团单信息中显示的实时销售数 量与实时关注度的加权值的差值,若大于阈值,则确定当前团单的销售 数据不真实,反之,则确定当前团单的销售数据真实。

进一步地,所述装置还包括:

触发模块,用于在当前团单信息中显示的实时销售数量达到预定数量时 触发获取当前团单的实时销售数量。

进一步地,所述实时关注度确定模块包括:

点击次数获取单元,用于获取当前团单页面被点击的次数;

修正单元,用于对所述被点击的次数进行修正得到所述当前团单被用 户正常访问或者浏览的次数;

实时关注度确定单元,用于确定被用户正常访问或者浏览的次数为 当前团单的实时关注度。

进一步地,所述修正单元包括:

用户标识识别子单元,用于对访问者的用户标识进行识别和过滤。

进一步地,所述装置还包括:

相关团单确定模块,用于根据当前团单的团单信息确定当前团单的 相关团单。

进一步地,所述相关团单确定模块包括:

关键词提取单元,用于从当前团单的团单信息中提取当前团单的关键 词;

扩展单元,用于对提取的关键词进行扩展得到扩展关键词集合;

查询单元,用于根据扩展关键词集合从预存的团购云数据中查询并确 定与扩展关键词匹配的相关团单。

进一步地,所述装置还包括:

转化模块,用于将实时关注度转化为理论购买数量。

进一步地,所述转化模块包括:

关键词获取单元,用于获取当前团单的关键词;

商品确定单元,用于根据当前团单的关键词确定当前团单所团购的具 体商品;

转化率确定单元,用于确定所述具体商品的购买转化率;

转化模型,用于根据购买转化率和实时关注度确定理论购买数量。

与现有技术相比,本申请具有以下优点:

本申请通过获取团单的实时关注度,并根据预先统计的数据进行加权处 理使之为评判销售数量的一个参考值,然后通过获取当前团单的实时销售数 量,与实时关注度的加权值进行差值比较,从而实现团购销售数据真实性的 检测。

进一步地,团单信息进行分析后获取其相关团单,并通过对相关团单的 实时数据监测和各种特定商品历史数据的分析,将当前团单和相关团单的实 时关注度转化为一个相对客观真实的理论购买数量,通过比较当前团单的实 时销售数据和理论购买数量的差值,从而来判断当前团单的实时销售数据是 否真实,从而使判断结果更为准确。

另外,在转化实时关注度为理论购买数量的过程中,通过服务器中预先 存储的各种团购网站的团购云数据来进行相关数据的处理,无需重新分析获 取,这就使转化的依据更为客观,处理的过程也更为简单,同时可以保证最 终判断结果的准确性。

附图说明

图1本申请的团购网站销售数据真实性检测的系统架构图;

图2是本申请的团购网站销售数据真实性检测方法实施例一的流程图;

图3是本申请的团购网站销售数据真实性检测方法实施例二的流程图;

图4是本申请的团购网站销售数据真实性检测装置实施例一的结构示意 图;

图5是本申请的团购网站销售数据真实性检测装置实施例二的结构示意 图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图 和具体实施方式对本申请作进一步详细的说明。

参照图1,示出实现本申请的团购网站销售数据真实性检测的一个系 统结构图。本申请是基于整合各团购网站信息的团购平台来实现销售数 据真实性检测。团购平台通过与各团购网站合作,能够获取到或者分析 得到各团购网站的团购云数据。团购网站销售数据真实性检测则基于团 购云数据来实现。首先,团购网站销售数据真实性检测系统从团购平台 的服务器中获取当前团单信息,如团单名称、详细描述、实时销售数量 等,再根据团单名称、详细描述等信息进行关键词提取等操作,然后从 团购云数据中确定出当前团单的相关团单的实时关注度,最终转化模型 将相关团单的实时关注度转化为理论购买数量,并与当前团单的实时销 售数量进行比较,从而对当前团单的销售数量的真实性进行判断。下面 结合具体的过程进行详细的说明。

参照图2,示出本申请的团购网站销售数据真实性检测方法实施例 一,包括以下步骤:

步骤101,获取当前团单信息中显示的实时销售数量。

团单指某一团购网站所提供的某一单商品的团购,当前团单信息中显 示的实时销售数量通过服务器与团购网站服务器之间的数据交互获取。

对实时销售数量的获取可以在当前团单的实时销售数量达到预定数 量时获取。因为如果实时销售数量很小,其数据可能出现虚假的可能性 很小,此时判断数据真实性也就没有意义,反而会增加服务器不必要的 负担。因此通过设定一个预定数量,当实际销售数量达到或者超过这个 数量时再进行获取和真实性检测。

步骤102,获取当前团单的实时关注度。

关注度是指团单被用户正常访问或者浏览的次数,通过服务器对用户 实时访问或者浏览行为进行监控和记录而确定。具体的,可以通过对团 单页面被点击的次数修正之后获取。因为,对团单页面的点击可能是恶 意浏览或者攻击,为了保证数据的准确性,需要对团单页面被点击的次 数进行修正,只保留团单页面被正常访问或者浏览而产生的点击次数作 为相关团单的关注度。

具体的,对团单页面被点击次数的修正通过对访问者的用户标识 (User Identification)进行识别和过滤来实现。通过此种处理方式可以去 掉数据中不合理的部分,使得到的最终数据更为客观和准确。

步骤103,获取同一时段内当前团单信息中显示的实时销售数量和实 时关注度的加权值的差值,若差值大于阈值,则确定当前团单的销售数 据不真实,反之,则确定当前团单的销售数据真实。

其中,实时关注度的加权值可以是对实时关注度进行进行归一化处 理,使之与实时销售数量具有相同的量化级后得到的归一化处理值。因为对 于关注度和实时销售数量来说,二者可能并不属于相同的量化级,通过对实 时关注度进行加权后再进行比较,这样得出的结果比较客观和准确。此时可 以通过比较同一时段内,实时销售数量的变化值和归一化处理值的变化值之 间的差值来判断是否销售数据是否真实。若实时销售数据是真实的话,其与 关注度的变化趋势应该是相同或者相似的,如果二者差值过大,则说明销售 数据可能存在不真实的部分。

实时关注度也可以是将实时关注度转化得到的理论购买数量,此时当前 团单信息中显示的实时销售数量和实时关注度的加权值的差值为实时销 售数量与理论购买数量的差值。其中,实时关注度转化为理论购买数量 可以通过预先对用户行为分析、已有团单数据的购买率的监测和分析后 得到。具体的包括以下步骤:

S1,获取相关团单的关键词;

S2,根据相关团单的关键词确定相关团单所团购的具体商品;

S3,确定所述具体商品的购买转化率;

S4,根据购买转化率和用户关注度确定理论购买数量。

其中,购买转化率可以根据对各种特定商品某一时间段的团购数据进 行采样确定,也可以通过对特定商品的较多历史团购数据通过模型进行 训练后确定。本申请中,将实时关注度转化为理论购买数量通过预定的 转化模型实现,根据前述步骤确定的转化模型如下:

F-model=a*Log(UF)*TransformRatio(Kw1,Kw2,Kw3...,KwN)

其中,UF为用户实时关注度,TransformRatio是系列关键词所表征 的某一特定商品的购买转化率函数,a为补足系数。

为了简化比较过程和数据处理过程,可以只比较同一时间点下当前团 单的实时销售数量与理论购买数量的差值,若大于阈值,则确定当前团 单的销售数据不真实,反之,则确定当前团单的销售数据真实。

优选地,因为某一时间点的销售数量容易被各种因素影响而出现较大 波动,例如,很多用户刚好在同一时间点购买同一商品,这就可能造成 这一时间点的销售数据增加,而使当前团单的实际销售数量与理论购买 数量的差值大于阈值,因此本申请还可以通过以下方式来进行比较:

累加某一预定周期内的各时间点下当前团单的实时销售数量与理论 购买数量的差值,若累加的差值之和大于阈值,则确定当前团单的销售 数据不真实,反之,则确定当前团单的销售数据真实。例如,预定周期 为1小时(10点到11点),其中包含十个时间点,可以每六分钟一次, 也可以按照其他方式来确定十个时间点,然后计算在每一个时间点当前 团单的实时销售数量与理论购买数量的差值,最后再将十个时间点的差 值累加后的值与预定的阈值进行比较。

因为对于某一周期内的数据被影响的可能会远小于某一时间点被影 响的可能,通过对某一周期内的数据来判断销售数据是否真实更为准确 和客观。

参照图3,示出本申请的团购网站销售数据真实性检测方法实施例 二,为了保证结果的准确性,在实施例一的基础上,还可以在检测过程 中引入相关团单,并根据相关团单的数据来检测,具体过程如下:

步骤201,获取当前团单的团单信息和和团单信息中显示的实时销售 数量。

团单信息指团单名称、对团购商品的描述等信息,团单信息和实时销 售数量可以根据服务器与发布该团单的团购网站服务器之间进行数据交 互来获取。

因为团单名称、对团购商品的描述等信息是固定不变的,因此获取一 次即可,而团单的实时销售数量随着时间的变化则可能发生变化,因此 团单的实时销售数量可以根据预定的时间,间隔一段时间获取一次。为 了保证获取数据的准确性以及方便后续分析,通常情况下,间隔时间为 几分钟。在获取后,对实时销售数量和对应的时间进行存储,例如,以 序列<Tm(i),S(i)>的方式,即在某个Tm(i)的时间戳下采集的实时销售数 量是S(i)。

步骤202,根据当前团单的团单信息确定所述当前团单的相关团单。

相关团单指其展示的团购商品与当前团单所展示的团购商品相同或 者相似的团单。例如,同是团购火锅的团单可以被确定为相关团单,同 是团购电影票的也可以确定为相关团单等等,具体的确定规则可以根据 实际情况限定。

相关团单的确定可以通过如下方式来实现:

步骤D1,从当前团单的团单信息中提取当前团单的关键词。

关键词为最能体现当前团单主要特性的概括性词语,本申请中,关键 词从团单名称和详细描述中提取。关键词提取可以根据常见的提取方式 实现,例如,通过基于组合词和同义词集的关键词提取,或者是基于语 义的关键词提取。为了保证关键词与当前团单的相关度,可以尽可能少 的提取,一般情况下选取3至5个关键词即可。

步骤D2,对提取的关键词进行扩展得到扩展关键词集合。

扩展包括同义词扩展或概念词引申扩展。通过扩展可以获取更多关键 词。为了保证关键词的准确性和相关性,本申请一般的扩展数量为原始 关键词数量的二倍。

步骤D3,根据扩展关键词集合从预存的团购云数据中查询并确定与 扩展关键词匹配的相关团单。

团购云数据是指团购平台中所有团购网站的团购相关数据。例如,各 团购网站每一团单的商品信息、关键词、被访问或者浏览的次数、实时 销量、最终销量,各商品所属的类别等等。其中一部分数据是直接通过 团购平台服务器和团购网站设定好的接口进行数据交互获取的,团购网 站实时将团购数据准备在接口中,服务器可以随时从接口中抓取。还有 一部分是用户在团购平台上所产生的行为信息(如浏览、购买等),这部 分数据是直接通过对用户行为实时监控和记录获取的。团购云数据可以 通过实时采集并更新来保证时效性,当然,为了保证数据的准确性,可 以通过预定的方式对某些数据进行修正,然后将修正后的数据也作为团 购云数据的一部分。

通过扩展的关键词可以从团购云数据中查询到与这些关键词匹配的 团单,这些团单即为当前团单的相关团单。

步骤203,确定当前团单和相关团单的实时总关注度。

总关注度是指当前团单和相关团单团单被用户正常访问或者浏览的 总次数,通过对用户实时访问或者浏览行为进行监控和记录而确定。具 体的,可以通过对团单页面被点击的总次数修正之后获取。因为,对团 单页面的点击可能是恶意浏览或者攻击,为了保证数据的准确性,需要 对团单页面被点击的总次数进行修正,只保留团单页面被正常访问或者 浏览而产生的点击次数作为相关团单的关注度。

具体的,对团单页面被点击次数的修正通过对访问者的用户标识 (User Identification)进行识别和过滤来实现。通过此种处理方式可以去 掉数据中不合理的部分,使得到的最终数据更为客观和准确。

步骤204,获取同一时段内当前团单信息中显示的实时销售数量和所 述当前团单和相关团单的实时总关注度的加权值的差值,若差值大于阈 值,则确定当前团单的销售数据不真实,反之,则确定当前团单的销售 数据真实。

可以理解,此处同一时段内当前团单信息中显示的实时销售数量和所 述当前团单和相关团单的实时总关注度的加权值的差值与前述实施例一 中的实时销售数量和实时关注度的加权值的差值的确定方法相同,可以 参照上述方式进行确定,在此不再赘述。

参照图4,示出本申请的一种团购网站销售数据真实性检测装置实施例 一,包括当前团单信息获取模块10、实时关注度确定模块30和比较模块50。

当前团单信息获取模块10,用于获取当前团单信息中显示的实时销 售数量。

实时关注度确定模块30,用于获取当前团单的实时关注度。

优选地,实时关注度确定模块30包括点击次数获取单元、修正单元 和实时关注度确定单元。其中,点击次数获取单元,用于获取团单页面 被点击的次数。修正单元,用于对所述被点击的次数进行修正得到所述 团单被用户正常访问或者浏览的次数。实时关注度确定单元,用于确定 被用户正常访问或者浏览的次数为当前团单的实时关注度。进一步地, 修正单元还包括用户标识识别子单元,用于对访问者的用户标识进行识 别和过滤。

比较模块50,用于比较同一时段内当前团单信息中显示的实时销售 数量与实时关注度的加权值的差值,若大于阈值,则确定当前团单的销 售数据不真实,反之,则确定当前团单的销售数据真实。

优选地,该装置还包括触发模块,用于在当前团单信息中显示的实时 销售数量达到预定数量时触发获取当前团单的实时销售数量。

优选地,该装置还包括转化模块40(如图5所示),当当前团单信息 中显示的实时销售数量与实时关注度的加权值的差值为实时销售数量与 理论购买数量的差值时,转化模块40用于将实时关注度转化为理论购买 数量。进一步地,转化模块40包括关键词获取单元、商品确定单元、转 化率确定单元和转化模型。其中,关键词获取单元,用于获取当前团单 的关键词。商品确定单元,用于根据当前团单的关键词确定当前团单所 团购的具体商品。转化率确定单元,用于确定所述具体商品的购买转化 率。转化模型,用于根据购买转化率和实时关注度确定理论购买数量。

参照图5,示出本申请的团购网站销售数据真实性检测装置实施例二, 包括当前团单信息获取模块10、相关团单确定模块20、实时关注度确定模 块30、转化模块40和比较模块50。

当前团单信息获取模块10,用于获取当前团单的团单信息和实时销 售数量。

相关团单确定模块20,用于根据当前团单的团单信息确定所述当前 团单的相关团单。

优选地,相关团单确定模块20包括关键词提取单元、扩展单元和查 询单元。其中,关键词提取单元,用于从当前团单的团单信息中提取当 前团单的关键词。具体的,从当前团单的名称和详细描述中提取当前团 单的关键词。扩展单元,用于对提取的关键词进行扩展得到扩展关键词 集合。查询单元,用于根据扩展关键词集合从预存的团购云数据中查询 并确定与扩展关键词匹配的相关团单。实时关注度确定模块30,用于获取 当前团单和相关团单的实时总关注度。

转化模块40,用于将实时关注度转化为理论购买数量。此时,转化 模块40转化的是当前团单和相关团单的实时总关注度。其过程与转化当 前团单的实时关注度相同,在此不再赘述。

比较模块50,用于获取同一时段内当前团单信息中显示的实时销售 数量和所述当前团单和相关团单的实时总关注度的加权值的差值,若差 值大于阈值,则确定当前团单的销售数据不真实,反之,则确定当前团 单的销售数据真实。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点 说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分 互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似, 所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上对本申请所提供的团购网站销售数据真实性检测方法及装置进行 了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了 阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想; 同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方 式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为 对本申请的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号