首页> 中国专利> 信息处理装置、基准值确定方法及程序

信息处理装置、基准值确定方法及程序

摘要

本发明公开了信息处理装置、基准值确定方法及程序。提供了根据本发明实施例的信息处理装置,该装置包括历史信息获取单元和基准值确定单元。历史信息获取单元获取与预定操作有关的历史信息。历史信息包括标识信息以及由分类对象/对分类对象执行预定操作时的时间信息。标识信息和时间信息被彼此相关联。基准值确定单元基于所获得的历史信息来计算操作次数信息。操作次数信息包括由单个分类对象/对单个分类对象执行的操作的次数。操作次数信息还包括具有相同操作次数的分类对象的数目。操作次数与分类对象的数目被彼此相关联。基准值确定单元基于操作次数信息来确定基准值。

著录项

  • 公开/公告号CN101996230A

    专利类型发明专利

  • 公开/公告日2011-03-30

    原文格式PDF

  • 申请/专利权人 索尼公司;

    申请/专利号CN201010240724.5

  • 发明设计人 佐塚直也;

    申请日2010-07-27

  • 分类号G06F17/30;

  • 代理机构北京东方亿思知识产权代理有限责任公司;

  • 代理人宋鹤

  • 地址 日本东京都

  • 入库时间 2023-12-18 01:48:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-09-21

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20130424 终止日期:20150727 申请日:20100727

    专利权的终止

  • 2013-04-24

    授权

    授权

  • 2011-05-18

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20100727

    实质审查的生效

  • 2011-03-30

    公开

    公开

说明书

技术领域

本发明涉及信息处理装置、基准值(reference value)确定方法及程序。

背景技术

由于因特网广泛普及,各种服务被提供在Web上。因此,使用服务的用户数目增加,并且对Web的访问次数与用户一起增加。结果,用户使用服务的频率变得更多样化,并且在每个服务中存储了大量访问历史信息。服务提供商可以通过分析访问历史信息并且根据使用频率将用户分类,从而提供对用户的详细关注。

就此而言,日本专利申请早期公开第2008-310514号公报建议了一种方法,用于基于访问历史信息来了解用户的整体趋势。

发明内容

在日本专利申请早期公开第2008-310514号公报所描述的方法中,可以了解用户的整体趋势。但是,难以确定某个用户是以高使用频率还是以低使用频率来使用服务的。这意味着没有用于基于访问历史信息来对用户分类的方法,并且即使基于访问历史信息对用户进行了分类,也难以客观地确定将用户大概地分为主要两个组所基于的基准值。

另一方面,如果能够客观地确定用于基于用户的访问历史信息之外的诸如内容的购买历史信息之类的分类对象(classification subject)的使用历史信息来将分类对象大概地分为两组的这样的基准值,则可以提高服务提供商的便利性。

鉴于前面的情况,希望提供能够客观地确定作为用于基于历史信息将分类对象分为两组的基础的基准值的信息处理装置、基准值确定方法及程序。

根据本发明一个实施例,提供了一种信息处理装置,该装置包括:历史信息获取单元,用于获取与预定操作有关的历史信息,历史信息包括标识信息和时间信息,时间信息是被附加有唯一标识信息的分类对象执行预定操作的时间或者对分类对象执行预定操作的时间,标识信息和时间信息被彼此相关联;以及基准值确定单元,用于基于所获得的历史信息来计算操作次数信息,操作次数信息包括由单个分类对象在预定时段内执行的操作的次数或者在预定时段内对单个分类对象执行的操作的次数,操作次数信息还包括具有相同操作次数的分类对象的数目,操作次数与分类对象的数目被彼此相关联,基准值确定单元基于操作次数信息来确定基准值,基准值是用作用于将分类对象分为两组的基础的操作的次数。

基准值确定单元优选地基于操作次数信息来检测最大数目的分类对象所属的操作次数,并且基准值确定单元优选地根据使检测到的分类对象的数目最大的操作次数来确定基准值。

基准值确定单元还可以包括:参数设定单元,用于设置用于确定基准值的参数;函数计算单元,用于基于历史信息计算函数,函数由操作次数与具有该操作次数的分类对象相对于分类对象总数的比率的乘积来表示;分布图计算单元,用于基于由参数设定单元设置的表示对数的底的参数来将包括在操作次数信息中的操作次数分类为多个组,并且计算由利用属于各个组的操作次数计算出的函数的值的总和表示的分布图;群组检测单元,用于检测产生分布图的最大值的组;以及基准值计算单元,用于基于检测出的组来计算基准值。

当未能检测到产生分布图的最大值的组时,群组检测单元可以请求参数设定单元增大表示对数的底的参数的值,分布图计算单元可以基于由参数设定单元通知的表示对数的底的新的参数,再次计算分布图,并且群组检测单元可以再次检测产生分布图的最大值的组。

当群组检测单元未能检测到产生分布图的最大值的组时,群组检测单元可以请求参数设定单元改变表示预定时段的参数的值,函数计算单元可以基于表示预定时段的新通知的参数再次计算函数,分布图计算单元可以基于新计算出的函数来再次计算分布图,并且群组检测单元可以再次检测产生分布图的最大值的组。

函数计算单元可以计算由下式1表示的函数f(q)。

f(q)=q×(aq/N)(1≤q≤qmax)         ...(式1)

其中,在上面的式1中,

q表示操作次数,

aq表示在时段t内操作次数为q的分类对象的数目,

N表示时段t内分类对象的总数,以及

qmax表示时段t内q的最大值。

分布图计算单元可以利用表示对数的底的参数b来计算Logbq(具有底b和真数q的对数),并且将Logbq的整数部分为j的操作次数分类到同一组中,并且分布图计算单元可以采用与属于该组的操作次数q相对应的f(q)的总和作为分布图P(j)(整数部分0≤j≤Logbq)。

群组检测单元可以检测产生P(j)的最大值的j*,并且基准值计算单元从属于检测到的j*的操作次数q*中选出基准值。

信息处理装置还可以包括:存储单元,用于存储历史信息。历史信息获取单元可以从存储单元获取历史信息。

历史信息获取单元可以从布置在信息处理装置外面的另一信息处理装置获取历史信息。

根据本发明另一实施例,提供了一种基准值确定方法,该方法包括以下步骤:获取与预定操作有关的历史信息,历史信息包括标识信息以及时间信息,时间信息是被附加有唯一标识信息的分类对象执行预定操作的时间或者对分类对象执行预定操作的时间,标识信息和时间信息被彼此相关联;并且基于所获得的历史信息来计算操作次数信息,操作次数信息包括由单个分类对象在预定时段内执行的操作的次数或者在预定时段内对单个分类对象执行的操作的次数,操作次数信息还包括具有相同操作次数的分类对象的数目,操作次数与分类对象的数目被彼此相关联,并且基于操作次数信息来确定基准值,基准值是用作用于将分类对象分为两组的基础的操作的次数。

根据本发明又一实施例,提供了一种使得计算机实现下面的功能的程序:历史信息获取功能,用于获取与预定操作有关的历史信息,历史信息包括标识信息以及时间信息,时间信息是被附加有唯一标识信息的分类对象执行预定操作的时间或者对分类对象执行预定操作的时间,标识信息和时间信息被彼此相关联;以及基准值确定功能,用于基于所获得的历史信息来计算操作次数信息,操作次数信息包括由单个分类对象在预定时段内执行的操作的次数或者在预定时段内对单个分类对象执行的操作的次数,操作次数信息还包括具有相同操作次数的分类对象的数目,操作次数与分类对象的数目被彼此相关联,并且基准值确定功能基于操作次数信息来确定基准值,基准值是用作用于将分类对象分为两组的基础的操作的次数。

根据上述本发明的实施例,可以基于历史信息来客观地确定用作用于将分类对象分类为两组的基础的基准值。

附图说明

图1是示出根据本发明第一实施例的信息处理装置的配置的框图;

图2A是示出历史信息的示例的说明图;

图2B是示出历史信息的示例的说明图;

图3是示出根据实施例的基准值确定单元的配置的框图;

图4是示出根据实施例的基准值确定单元的说明图;

图5是示出根据实施例的基准值确定单元的说明图;

图6是示出根据实施例的基准值确定单元的说明图;

图7是示出根据实施例的基准值确定单元的说明图;

图8是示出根据实施例的基准值确定方法的流程图;以及

图9是示出根据本发明实施例的信息处理装置的硬件配置的框图。

具体实施方式

下面,将参考附图详细描述本发明的优选实施例。注意,在本说明书和附图中,用相同的标号来表示具有基本上相同的功能和结果的结构元件,并且省略对这些结构元件的重复描述。

将以下面的顺序进行说明。

(1)第一实施例

(1-1)关于信息处理装置的配置

(1-2)关于基准值确定方法

(2)根据本发明实施例的信息处理装置的硬件配置

(3)总结

(第一实施例)

<关于信息处理装置的配置>

将参考图1至图6详细描述根据本发明第一实施例的信息处理装置的配置。

[关于信息处理装置的整体配置]

首先,将参考图1详细描述根据本实施例的信息处理装置的整体配置。图1是示出根据本实施例的信息处理装置的配置的框图。

例如,如图1所示,根据本实施例的信息处理装置10主要包括历史信息获取单元101、基准值确定单元103、基准值发送单元105以及存储单元107。另外,例如图1所示,根据本实施例的信息处理装置10可以包括用户信息分类单元109。

历史信息获取单元101例如由CPU(中央处理单元)、ROM(只读存储器)、RAM(随机存取存储器)、通信设备等实现。历史信息获取单元101获取历史信息,该历史信息包括附加给分类对象的唯一标识信息,以及与分类对象执行预定操作的时间有关的时间信息或者与对分类对象执行预定操作的时间有关的时间信息。在历史信息中,时间信息和唯一标识信息被彼此相关联。

由被附加有唯一标识信息的分类对象执行的预定操作的示例可以包括:由被附加有唯一ID等的用户(分类对象)执行的对预定服务的访问操作(预定操作)。另一方面,对被附加有唯一标识信息的分类对象执行的预定操作的示例可以包括:对被附加有唯一ID等的内容(分类对象)执行的对内容的购买操作(预定操作)。

历史信息获取单元101例如可以从由根据本实施例的信息处理装置10拥有的存储单元获取上面的历史信息,或者可以从能够与信息处理装置10通信的另一信息处理装置(例如,图1所示的服务提供装置20)获取上面的历史信息。替代地,历史信息获取单元101可以从诸如CD-ROM、DVD-ROM、闪存等之类的各种记录介质获取历史信息。该另一信息处理装置(服务提供装置20)可以有线或无线地直接连接到信息处理装置10,或者可以经由诸如因特网之类的通信网络连接到信息处理装置10。

历史信息获取单元101可以响应于由信息处理装置10的用户执行的用户操作或者响应于从服务提供装置20发送来的诸如对开始基准值确定处理的请求之类的某种触发而获取历史信息,或者可以在除上述定时以外的任何定时处自动获取历史信息。

历史信息获取单元101将所获得的历史信息发送给后面将描述的基准值确定单元103。此外,历史信息获取单元101可以将从外面获得的历史信息临时记录在后面将描述的存储单元107等中。

在下面的说明中,将与由被附加有唯一ID的用户执行的对预定服务的访问操作有关的历史信息描述作为示例。但是,由根据本发明实施例的信息处理装置使用的历史信息不限于此示例。

基准值确定单元103例如由CPU、ROM、RAM等实现。基准值确定单元103基于所获得的历史信息来计算操作次数信息,操作次数信息包括在预定时段内执行的操作的次数以及与这些操作具有相同数目的分类对象数目,其中,操作次数和分类对象数目被彼此相关联。此外,基准值确定单元103基于计算出的操作次数信息来计算基准值,即,用作用于将分类对象分成两组的基础的操作次数。换言之,基准值确定单元103计算与操作的次数有关的分布图来作为操作次数信息,并且基于计算出的操作次数信息的分布图来确定基准值,即,用作用于将分类对象分成两组的基础的操作次数。

当基准值确定单元103基于从历史信息获取单元101发送来的历史信息确定了基准值时,基准值确定单元103将所确定的基准值发送给后面将描述的基准值发送单元105。此外,基准值确定单元103可以将所确定的基准值存储到后面将描述的存储单元107等中。

如在下面的说明中将详细描述的,根据本实施例的基准值确定单元103对计算出的操作次数信息(与操作的次数有关的分布图)执行统计处理,由此确定用于将分类对象分成两组的基准值。因此,根据本实施例的信息处理装置10可以基于历史信息客观地确定基准值。

基准值发送单元105例如由CPU、ROM、RAM、通信设备等实现。基准值发送单元105将从基准值确定单元103发送来的、用作用于将分类对象分成两组的阈值的基准值发送给预定装置和/或处理单元。更具体地,当布置在外面的服务提供装置20等请求基准值发送单元105确定基准值时,基准值发送单元105就将与基准值有关的所接收信息发送给作出请求的服务提供装置。此外,基准值发送单元105可将与基准值有关的所接收信息发送给布置在信息处理装置10中的处理单元。由于基准值发送单元105所确定的基准值被发送,因此,布置在服务提供装置20和信息处理装置10中的处理单元使用该基准值将分类对象分为两组,并且可以分析分类对象的趋势。

存储单元107存储上面的历史信息。此外,存储单元107可以存储与被附加给分类对象的标识信息有关的信息。与被附加给分类对象的标识信息有关的信息的示例可以包括与被附加给用户(即分类对象)的用户ID有关的用户信息,以及被附加给各种内容(即分类对象)的内容ID和内容元数据。

存储单元107可以存储当根据本实施例的信息处理装置10执行某些处理时需要存储的各种参数或处理进展,并且可以按照需要存储各种数据库等。存储单元107可由历史信息获取单元101、基准值确定单元103、基准值发送单元105以用户信息分类单元109等自由读取和写入。

用户信息分类单元109例如由CPU、ROM、RAM等实现。用户信息分类单元109基于从基准值发送单元105发送来的与基准值有关的信息并且基于从存储单元107获得的用户信息,即与分类对象有关的一类信息来将用户分为两组。更具体地,基于与基准值有关的信息,用户信息分类单元109将用户分类为:在预定时段内执行操作的次数等于或多于基准值的用户;以及执行操作的次数少于基准值的用户。因此,用户信息分类单元109可以容易地将一系列用户分类为:在该时段内积极地执行预定操作的积极用户;以及未积极地执行预定操作的不积极用户。

当用户可被容易地分为两组时,例如,服务提供商可以区分提供给各个分类类别的服务。另外,服务提供商了解到各个用户的使用随着时间的变化。因此,服务提供商可以客观地了解到谁是最重要客户,并且可以利用各个用户的使用变化来提供高增值服务,例如促进使用。

[关于历史信息的一个示例]

接下来,将参考图2A和2B描述由根据本实施例的信息处理装置10使用的历史信息。图2A和2B是示出历史信息的一个示例的说明图。

根据本实施例的信息处理装置10使用与分类对象执行的操作或者对分类对象执行的操作有关的历史信息(日志信息),来确定用于对分类对象进行分类的基准值。由根据本实施例的信息处理装置10使用的历史信息可以以任何形式生成,只要该历史信息以将分类对象独有的标识信息和关于操作被执行的时间和日期的时间信息彼此相关联的方式来包括该标识信息和该时间信息即可。此外,根据本实施例的信息处理装置10不仅可以使用历史信息,而且可以使用其它信息,只要该信息允许标识出分类对象与操作被执行的时间之间的关系即可。

图2A和图2B示出了与用户(即分类对象)对提供预定服务的服务提供装置执行的操作有关的历史信息的一个示例。

例如,如图2A所示,历史信息可以以将用户(即分类对象)所独有的标识信息与被附加有该标识信息的用户执行访问的时间信息彼此相关联的方式来简单地描述该标识信息和时间信息。替代地,例如,如图2B所示,历史信息可以记录与用户在某一时段内(例如,图2B的示例中,在一个月的时段内)执行了操作(积极)还是未执行操作(不积极)有关的信息。

如后面将详细描述的,根据本实施例的信息处理装置10通过标识出某一时段t来执行用于确定基准值的统计处理。因此,优选地,将历史信息描述为允许表明可在统计处理期间指定的最短时段中的操作次数。

[关于基准值确定单元的配置]

接下来,将参考图3至图7详细描述根据本实施例的基准值确定单元103的配置。图3是示出根据本实施例的基准值确定单元103的配置的框图。图4至图7是示出根据本实施例的基准值确定单元的说明图。

例如,如图3所示,根据本实施例的基准值确定单元103包括函数计算单元121、分布图计算单元123、参数设定单元125、群组检测单元127以及基准值计算单元129。

函数计算单元121例如由CPU、ROM、RAM等实现。函数计算单元121基于从历史信息获取单元101发送来的历史信息,计算由操作次数与具有该操作次数的分类对象相对于分类对象的总数的比率的乘积所表示的函数。下面将参考图4描述由该函数计算单元121执行的函数计算处理。

当函数计算单元121接收到历史信息时,函数计算单元121请求后面将描述的参数设定单元125设置表示如下时段的参数t,该时段用作将历史信息组织来生成分布图的基础。当函数计算单元121接收到来自参数设定单元125的表示时段的参数t时,函数计算单元121基于接收到的参数t来生成图4的中央所示的分布图。为了生成该分布图,首先,函数计算单元121通过参考历史信息来标识出时段t中的最大访问次数qmax,并且对分别与访问次数1至qmax相对应的用户的数目aq进行计数。另外,函数计算单元121确定在该时段内执行操作的用户总数N。因此,函数计算单元121可以针对每个访问次数q,计算执行操作的用户数目相对于用户总数的比率(aq/N)。

然后,函数计算单元121基于所生成的分布图来生成由下式101表示的函数f(q)。这里,与访问次数相对应的参数q等于或大于1并且等于或小于qmax

f(q)=q×(aq/N)(1≤q≤qmax)         ...(式101)

在下面的说明中,将一组访问次数{q|1,2,...,qmax}称为操作次数信息。

图4所示的分布图使得能够了解到用户的整体趋势,例如,在某个时段t内执行的最大访问次数和最小访问次数、由最大数目的用户进行的访问次数以及用户的分布和标准偏差。然而,用于大概地将用户的趋势分为两组的基准值可以不从图4所示的分布图确定。根据本实施例的基准值确定单元103可以通过从分布图计算由上面的式101表示的函数并且进一步执行下述处理来客观地确定用于大概地将用户的趋势分为两组的基准值。

当函数计算单元121从后面将描述的参数设定单元125接收到参数t的新值时,函数计算单元121基于接收到的新参数t来再次计算函数f(q)。

函数计算单元121将计算出的函数f(q)以及操作次数信息发送给后面将描述的分布图计算单元123。此外,函数计算单元121不仅可以将函数f(q)以及操作次数信息发送给分布图计算单元123,而且可以将表示时段的参数t发送给分布图计算单元123。另外,函数计算单元121可将计算出的函数f(q)存储到存储单元107等中。

分布图计算单元123例如由CPU、ROM、RAM等实现。分布图计算单元123基于由后面将描述的参数设定单元125设置的表示对数的底的参数来将包括在操作次数信息中的操作次数分为多组。此外,分布图计算单元123将由利用属于各个组的操作次数计算出的函数值f(q)的和表示的函数用作分布图P(j)。下面,将详细描述由该分布图计算单元123执行的分布图计算处理。

当分布图计算单元123从函数计算单元121接收到函数f(q)时,分布图计算单元123请求后面将描述的参数设定单元125设置表示对数的底的参数b。当分布图计算单元123从参数设定单元125接收到表示对数的底的参数b时,分布图计算单元123基于接收到的参数b和操作次数信息来计算Logbq(具有底b和真数q的对数)。当计算出了包括在操作次数信息中的所有操作的次数(访问的次数)的对数时,所获得的对数值被分类为若干个组,在每个组中,“整数部分是相同的值,但小数部分是不同的”。分布图计算单元123将Logbq的整数部分的值(下面标识为j)相同的访问次数q分到同一组。更具体地,基于操作次数信息1至qmax生成了从组j=0到组j=(Logbqmax的整数部分)的多个组。包括在操作次数信息中的访问次数q被分到这些组中的任一组。然后,分布图计算单元123将与被分到同一组的访问次数q相对应的f(q)的和用作分布图P(j)。

下面,将利用具体示例来详细进行说明。例如,假设其Logbq的整数部分为19(j=19)(换言之,访问次数q的Logbq为19.XXX...)的访问次数包括五个数,即,q1至q5。在此情况中,分布图计算单元123在j为19时,获得P(19)=f(q1)+f(q2)+f(q3)+f(q4)+f(q5)来作为分布图P(j)。分布图计算单元123通过从j=0至j=(Logbqmax的整数部分)执行类似计算,从而计算出分布图P(j)。

图5示出了由分布图计算单元123通过上述处理计算出的分布图P(j)的示例。在图5中,水平轴表示Logbq的整数部分的值j(该值也称为群组的索引),并且垂直轴表示当给出每个值j时的P(j)的值。

例如在仅将访问次数考虑在内的处理中,表示访问次数1的数据与表示访问次数101的数据之间的100次访问差值被与表示访问次数1000的数据与表示访问次数1100的数据之间的100次访问差值同样地对待。这里,在前者的情况中,表示100次访问的这样的数据优选地被处理为统计意义值。但是在后者的情况中,这样的数据优选地被处理为无统计意义的值。因此,根据本实施例的基准值确定单元103还基于访问次数的对数值来将访问次数分类为若干组,由此能够在统计意义的差值与无统计意义的差值之间进行区分。因此,根据本实施例的基准值确定单元103可以更精确地确定基准值。

此外,当分布图计算单元123接收到来自函数计算单元121的具有不同值的参数t的新函数f(q)时,分布图计算单元123基于所接收到的新的函数f(q)来再次计算分布图P(j)。另一方面,当分布图计算单元123从后面将描述的参数设定单元125接收到参数b的新值时,分布图计算单元123基于接收到的新参数b再次计算分布图P(j)。

分布图计算单元123将计算出的分布图P(j)发送给后面将描述的群组检测单元127。分布图计算单元123可以将参数b和参数t的值与分布图P(j)一起发送给群组检测单元127。此外,分布图计算单元123可将所获得的分布图P(j)存储到存储单元107等中。

参数设定单元125例如由CPU、ROM、RAM等来实现。参数设定单元125响应于由函数计算单元121作出的请求来设置表示时段的参数t。参数设定单元125响应于由分布图计算单元123作出的请求来设置表示对数的底的参数b。

表示时段的参数t确定历史信息中哪些范围(时间范围)的数据被用于确定基准值。因此,参数t是与函数f(q)和分布图P(j)的数据的数目有关的参数。参数设定单元125可以采用由信息处理装置10的用户根据从输入单元(未示出)输入的用户操作而指定的值来作为参数t的初始值。此外,参数设定单元125可以将从先前登记的多个时段,例如日、周、月等中选出的任何值设置为参数t的初始值。

表示对数的底的参数b指示出多少操作被分在同一组中。因此,优选地,根据出现在将被分析的历史信息中的操作次数信息的条数来适当地设置参数b的值。参数设定单元125将参数b的初始值设置为诸如100.05,100.1...之类的值。

图6示出了在改变参数b的值的情况下利用同一函数f(q)计算出的分布图P(j)的示例。如通过比较图6中的曲线图可以清楚的,将明白,随着参数b的值变得越小,水平轴的范围j变得越宽,并且随着参数b的值变得越大,水平轴的范围j变得越窄。这意味着当参数b的值较小时,值范围中被分在同一组中的值的数目(即,操作次数)减小,并且当参数b的值较大时,值范围中被分在同一组中的值的数目增大。

在每个曲线图中,关注允许函数P(j)产生峰值的值j。应当明白,在b=100.02的示例中,产生波峰的值j包括从99.5到100(操作次数q)的范围中的值。同样,在b=100.1的示例中,产生波峰的值j包括q=80至100。在b=100.3的示例中,产生波峰的值j包括q=63至126。在b=100.6的示例中,产生波峰的值j包括q=63至251。

另一方面,如从图6可清楚的,当参数b的值变得越小,则分布图的值更显著地变化。当参数b的值变得越大,则分布图的形状变得越平滑。

参数设定单元125将如此设定的参数t发送给函数计算单元121,并且将如此设定的参数b发送给分布图计算单元123。此外,参数设定单元125可将当前设定的参数t、b的值记录到存储单元107等中。

当后面将描述的群组检测单元127请求参数设定单元125改变参数b或参数t时,参数设定单元125改变在该时刻时设定的参数b或参数t的值。例如,当群组检测单元127请求参数设定单元125改变参数b时,参数设定单元125通过将表示为10x的参数b中的x的值增加0.05来改变参数b的值,并且将参数b发送给分布图计算单元123。此外,当群组检测单元127请求参数设定单元125改变参数t时,参数设定单元125将参数t的值改变为比当前设定的值大的值(例如,是当前设定值的两倍的值),以增加用于分析的数据的数目。此后,参数设定单元125将参数t的新的值发送给函数计算单元121。

群组检测单元127例如由CPU、ROM、RAM等实现。群组检测单元127基于从分布图计算单元123发送来的分布图来检测产生了分布图P的最大值的群组。更具体地,群组检测单元127基于从分布图计算单元123发送来的分布图P(j),来检测允许P(j)产生最大值的变量j(即,群组)。

如上所述,变量j是其Logbq的整数部分为j的一组操作次数q。P(j)被定义为与属于同一组的操作次数q相对应的f(q)的和。因此,允许P(j)产生最大值的变量j(下面称为j*)给出了最大数目的分类对象所属的操作次数q(更具体地,操作次数q的数值范围)。

另一方面,存在群组检测单元127不能检测出允许P(j)产生最大值的群组的情况。在此情况中,首先,群组检测单元127请求参数设定单元125改变表示对数的底的参数b。然后,当群组检测单元127从分布图计算单元123接收到基于新的参数b的新分布图P(j)时,群组检测单元127对接收到的新分布图P(j)执行检测处理,以检测出允许P(j)产生最大值的变量j。同样在这种场合中当群组检测单元127未检测到允许P(j)产生最大值的变量j时,群组检测单元127可以请求参数设定单元125再次改变参数b。

在即使参数b被请求改变了一次或多次时也未能检测到允许P(j)产生最大值的变量j的情况中,群组检测单元127判定包括在P(j)中的数据的数目不足以检测出产生最大值的变量j。在这种场合中,群组检测单元127请求参数设定单元125改变表示时段的参数t,以便增加包括在P(j)中的数据的数目。此后,函数计算单元121基于新的参数t来计算新的函数f(q),并且分布图计算单元123基于新的函数f(q)计算新的分布图P(j)。当群组检测单元127从分布图计算单元123接收到基于新的参数t的新的分布图P(j)时,群组检测单元127对接收到的新的分布图P(j)执行检测处理,以便检测出允许P(j)产生最大值的变量j。同样在这种场合中当群组检测单元127未检测到允许P(j)产生最大值的变量j时,群组检测单元127可以请求参数设定单元125再次改变参数b,并且可以请求参数设定单元125再次改变传输t。

当群组检测单元127检测到允许P(j)产生最大值的变量j*时,群组检测单元127将检测到的群组j*发送给后面将描述的基准值计算单元129。此外,优选地,群组检测单元127不仅将检测到的j*而且将与被检测的分布图P(j)相对应的参数b的值发送给基准值计算单元129。因此,后面将描述的基准值计算单元129可以容易地计算出包括在检测到的j*中的操作次数(访问次数)q的值。

另一方面,在即使改变了参数b和参数t也未能检测到j*的情况中,群组检测单元127可以向基准值计算单元129通知最大值未能被检测到,并且可以显示错误并终止处理。

可能存在这样的情况,其中,允许P(j)产生最大值的多个变量j可能存在于同一分布图P(j)中。在这样的情况中,群组检测单元127可以将所有所检测到的群组j*发送给基准值计算单元129,或者可以将群组j*中的任一个发送给基准值计算单元129。此外,群组检测单元127可以在请求改变参数b和参数t的值的同时重复处理,直到确定了产生最大值的仅一个变量j为止。

替代地,群组检测单元127不仅可以将产生最大值的群组j*发送给基准值计算单元129,而且可以将多种类型的变量j,例如产生第二大值的变量j、产生第三大值的变量j等发送给基准值计算单元129。这是因为可以存在这样的情况,其中,通过利用这些值可以确定出不仅能够将分类对象分为仅两组而且能够分为三组或更多组的基准值。

例如,在图5所示的分布图P(j)的情况中,当j=19时P(j)产生最大值。因此,群组检测单元127将j*=19发送给基准值计算单元129。在此情况中,具有属于超过j=19的群组的访问次数q的用户被大概地分类为频繁执行访问的积极用户。另一方面,具有属于小于j=19的群组的访问次数q的用户被大概地分类为未频繁执行访问的不积极用户。属于j=19的群组的访问次数q具有根据参数b确定的预定范围。因此,存在这样的可能性:具有属于j=19的群组的访问次数q的用户可以由后面将描述的基准值计算单元129根据计算出的基准值而被大概地分类为积极用户和不积极用户。

基准值计算单元129例如由CPU、ROM、RAM等实现。基准值计算单元129根据从群组检测单元127发送来的j*来计算用于将分类对象分为两组的基准值。更具体地,由于与j*相对应的操作次数q*具有根据参数b的值确定的预定数值范围,因此,基准值计算单元129首先基于变量j*和参数b来计算操作次数q*的范围。然后,基准值计算单元129从如此计算出的操作次数q*的范围内选出任意值作为基准值。

例如,基准值计算单元129可以采用操作次数q*的范围中的中间值来作为用于对操作对象分类的基准值。替代地,基准值计算单元129可以根据用于基准值确定的水平设定(level setting)来采用操作次数q*的范围中的最大值作为基准值,或者可以采用最小值作为基准值。当q*的范围中的最大值被选为基准值时,可以以较严格的方式来对分类对象分类。当q*的范围中的最小值被选为基准值时,可以以相对宽松的方式来对分类对象进行分类。

基准值计算单元129将计算出的基准值发送给基准值发送单元105。此外,基准值计算单元129可将计算出的基准值存储在存储单元107中。

到此为止,已描述了根据本实施例的基准值确定单元103的配置。

具有上述配置的根据本实施例的信息处理装置10可以基于历史信息通过统计处理来客观地确定用于将分类对象分为两组的基准值。因此,利用上述基准值的服务提供装置20或用户信息分类单元109可以客观地容易地将分类对象分为两组。

因此,提供预定服务的提供商不是向所有用户提供相同质量的服务,而可以向不积极用户提供简单的服务。因此,可以减小施加给提供商的负担。从用户的角度来说,积极类别中的用户可以接收到相对好的服务,并且认为该用户积极地使用服务。

此外,例如如图7所示,可以计算并比较同一服务的但在不同时段中的基准值。通过这样做,可以了解到分类对象的趋势随着时间的改变。这使得能够指明有可能从积极用户转移到不积极用户的用户,并且服务提供商可以促使这些用户积极地使用服务。此外,通过找出分类对象随着时间的改变,服务提供商可以标识出一直被分类为积极用户的重要客户,并且可以向这些重要客户提供高增值的服务。

到此为止,已描述了根据本实施例的信息处理装置10的功能的示例。上面的构成元件中的每个可以由通用构件和电路制成,或者可以由专用于每个构成元件的功能的硬件制成。替代地,所有的构成元件的功能可由CPU等来执行。因此,可以根据实现本实施例时的技术状态来按照需要改变所使用的配置。

可以作出用于实现根据本实施例的上述信息处理装置的功能的计算机程序,并且该计算机程序可以在个人计算机等上来实现。此外,可以提供存储这样的计算机程序的计算机可读记录介质。记录介质的示例包括磁盘、光盘、磁光盘和闪存。此外,上面的计算机程序例如可以通过网络来分发而不用记录介质。

<关于基准值确定方法>

接下来,将参考图8详细描述根据本实施例的基准值确定方法。图8是示出根据本实施例的基准值确定方法的流程图。在下面的说明中,例如,用户(即分类对象)对提供某种服务的服务提供装置执行访问操作。

首先,信息处理装置10的历史信息获取单元101从存储单元107或服务提供装置20获取表示用户的访问次数的历史信息,并且将历史信息发送给基准值确定单元103。

当基准值确定单元103的函数计算单元121获得了历史信息时,函数计算单元121请求参数设定单元125设置参数t。响应于函数计算单元121,参数设定单元125设置表示时段的参数t作为初始值(步骤S101),并且将参数t通知给函数计算单元121。

函数计算单元121参考历史信息,并且对每个用户在由参数t设定的时段中的访问次数以及在该时段中执行访问操作的用户的总数进行计数(步骤S 103),并且生成分布图。

然后,函数计算单元121基于所生成的分布图和先前描述的式101来计算函数f(q)(步骤S105),并将计算出的函数f(q)发送给分布图计算单元123。

具有所获得的函数f(q)的分布图计算单元123请求参数设定单元125设置对数的底的参数b。响应于分布图计算单元123的请求,参数设定单元125设置表示函数的底的参数b的初始值(步骤S107),并且将参数b通知给分布图计算单元123。

分布图计算单元123根据上述过程基于通知来的参数b和函数f(q)来计算分布图P(j)(步骤S109),并且将计算出的分布图P(j)发送给群组检测单元127。

当群组检测单元127从分布图计算单元123接收到分布图P(j)时,群组检测单元127开始检测允许P(j)产生最大值的变量j(即,j*)(步骤S111),并且判断是否成功地检测到j*(步骤S113)。

当检测到j*时,群组检测单元127将检测到的j*发送给基准值计算单元129,并且基准值计算单元129执行下述步骤S121。

另一方面,当未能检测到j*时,群组检测单元127在请求参数设定单元125改变参数b的同时执行对j*的检测(步骤S115),并且判断是否成功地检测到j*(步骤S117)。

当检测到j*时,群组检测单元127将检测到的j*发送给基准值计算单元129,并且基准值计算单元129执行下述步骤S121。

另一方面,当未能检测到j*时,群组检测单元127请求参数设定单元125改变参数t,并且参数设定单元125改变参数t(步骤S119)并通知给函数计算单元121。此后,基准值确定单元103返回步骤S105,并执行对基准值的检测处理。

当基准值计算单元129接收到检测到的j*时,基准值计算单元129基于检测到的j*来计算与j*相对应的操作次数q*的范围,并确定基准值(步骤S121)。

根据本实施例的信息处理装置可以通过执行根据上述过程的基准值检测方法来基于历史信息客观且容易地确定用于将分类对象分为两组的基准值。

(硬件配置)

接下来,将参考图9详细描述根据本发明实施例的信息处理装置10的硬件配置。图9是示出根据本方发明实施例的信息处理装置10的硬件配置的框图。

该信息处理装置10主要包括CPU 901、ROM 903和RAM 905。此外,该信息处理装置10还包括主机总线907、桥接器909、外部总线911、接口913、输入设备915、输出设备917、存储设备919、驱动器921、连接端口923以及通信设备925。

CPU 901用作运算处理装置和控制设备,并且根据记录在ROM 903、RAM 905、存储设备919或可移除记录介质927中的各种程序来控制信息处理装置10的整体操作或一部分操作。ROM 903存储由CPU 901使用的程序、操作参数等。RAM 905主要存储在CPU 901运行时使用的程序以及在运行期间适当变化的参数等。这些经由主机总线907彼此相连,主机总线907是由诸如CPU总线等之类的内部总线构成的。

主机总线907经由桥接器909连接到诸如PCI(外围组件互连/接口)总线之类的外部总线911。

输入设备915是供用户操作的操作装置,例如鼠标、键盘、触摸面板、按钮、开关和操纵杆。此外,输入设备915可以是例如使用红外线或其它无线电波的远程控制装置(所谓的遥控器),或者可以是从外部连接的设备929,例如遵循信息处理装置10的操作的移动电话或PDA。此外,输入设备915例如基于由用户利用上面的操作装置输入的信息来生成输入信号,并且由用于将输入信号输出给CPU 901的输入控制电路构成。信息处理装置10的用户可以通过操作该输入装置915来向信息处理装置10输入各种数据并且可以指示信息处理装置10执行处理。

输出设备917是由能够通过视觉或听觉向用户通知所获取的信息的设备构成的。这样的设备的示例包括诸如CRT显示设备、液晶显示设备、等离子体显示设备、EL显示设备和灯之类的显示设备、诸如扬声器和耳机之类的音频输出设备、打印机、移动电话、传真机等。例如,输出设备917输出通过信息处理装置10执行的各种处理获得的结果。更具体地,显示设备以文本或图像的形式显示通过信息处理装置10执行各种处理获得的结果。另一方面,音频输出设备将诸如被再现的音频数据和声音数据之类的音频信号转换为模拟信号,并输出该模拟信号。

存储设备919是被配置作为信息处理装置10的存储单元的示例的、用于存储数据的设备,并且用来存储数据。存储设备919例如由诸如HDD(硬盘驱动器)之类的磁存储设备、半导体存储设备、光存储设备或磁光存储设备构成。该存储设备919存储要由CPU 901执行的程序、各种数据,以及从外面获得的各种数据。

驱动器921是用于记录介质的读写器,并且被嵌入在信息处理装置10中或者从外面附接到信息处理装置10。驱动器921读取记录在诸如磁盘、光盘、磁光盘或半导体存储器之类的所附接的可移除记录介质927中的信息,并且将所读取的信息输出给RAM 905。此外,驱动器921可以对诸如磁盘、光盘、磁光盘或半导体存储器之类的所附接的可移除记录介质927进行写入。可移除记录介质927例如是DVD介质、HD-DVD介质或蓝光介质。可移除记录介质927可以是CompactFlash(CF;注册商标)、闪存、SD存储卡(安全数字存储卡)等。替代地,可移除记录介质927例如可以是配备有非接触IC芯片或电子装备的IC卡(集成电路卡)。

连接端口923是允许设备直接连接到信息处理装置10的端口。连接端口923的示例包括USB(通用串行总线)端口、IEEE1394端口、SCSI(小型计算机系统接口)端口等。连接端口923的其它示例包括RS-232C端口、光学音频端子、HDMI(高清晰多媒体接口)端口等。通过连接到该连接端口923的从外部连接的设备929,信息处理装置10直接获取来自从外部连接的设备929的各种数据,并且将各种数据提供给从外部连接的设备929。

通信设备925是由例如用于连接到通信网络931的通信设备构成的通信接口。通信设备925例如是有线或无线LAN(局域网)、蓝牙(注册商标)、用于WUSB(无线USB)的通信卡等。替代地,通信设备925可以是用于光通信的路由器、用于ADSL(非对称数字订户线)的路由器、用于各种通信的调制解调器等。该通信设备925例如可以根据因特网上的诸如TCP/IP之类的预定协议来与其它通信设备进行信号等的发送和接收。连接到通信设备925的通信网络931是由有线地或无线地连接的网络等构成的,并且例如是因特网、家庭LAN、红外通信、无线电波通信、卫星通信等。

到此为止,已示出了能够实现根据本发明实施例的信息处理装置10的功能的硬件配置的示例。上述每个结构元件可以利用通用材料来配置,或者可以由专用于每个结构元件的功能的硬件来配置。因此,可以根据实现本实施例时的技术水平来适当地改变要使用的硬件配置。

(总结)

如在此之前所描述的,根据本发明实施例的信息处理装置10可以通过统计处理仅基于历史信息来客观地确定用于将分类对象分为两组的基准值。因此,使用上述基准值的服务提供装置20或用户信息分类单元109可以客观地且容易地将分类对象分为两组。

本领域技术人员应当明白,可以根据设计要求和其它因素进行各种修改、组合、子组合和变更,只要它们在所附权利要求或其等同物的范围之内。

本申请包含与2009年8月7日向日本专利局提交的日本在先专利申请JP 2009-184720中公开的主题有关的主题,该申请的全部内容通过引用结合于此。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号