首页> 中国专利> 一种个人数据空间环境下的任务识别系统和方法

一种个人数据空间环境下的任务识别系统和方法

摘要

一种个人数据空间环境下的任务识别系统和方法,其中该系统包括:数据库,用于存储用户操作日志表、用户文件表、以及用户行为日志表;监控模块,用于监控用户操作,获取用户的操作记录,生成用户行为记录;时序关联图产生模块,用于基于用户行为日志表生成时序关联图;以及任务识别模块,用于在时序关联图上识别任务。

著录项

  • 公开/公告号CN101609462A

    专利类型发明专利

  • 公开/公告日2009-12-23

    原文格式PDF

  • 申请/专利权人 孟小峰;

    申请/专利号CN200910090036.2

  • 发明设计人 孟小峰;

    申请日2009-07-29

  • 分类号G06F17/30(20060101);G06F11/30(20060101);

  • 代理机构11003 北京中创阳光知识产权代理有限责任公司;

  • 代理人尹振启

  • 地址 100872 北京市海淀区中关村大街59号中国人民大学信息学院

  • 入库时间 2023-12-17 23:10:12

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-09-23

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20110518 终止日期:20140729 申请日:20090729

    专利权的终止

  • 2011-05-18

    授权

    授权

  • 2010-02-17

    实质审查的生效

    实质审查的生效

  • 2009-12-23

    公开

    公开

说明书

技术领域

本发明涉及任务识别技术领域,尤其是涉及一种个人数据空间环境下的任务识别系统和方法。

背景技术

计算机技术的飞速发展在给人们提供了很大便利的同时,也给人们带来新的数据管理的问题:用户面临的数据的数量和种类越来越多,这些个人数据信息具有异构、分布、演化的特性,传统的数据库管理技术不能对其进行有效管理;与此同时,用户管理个人数据的手段以及可以投入管理数据的精力并没有提高。在这种情况下,管理纷繁复杂的个人数据使得人们日益力不从心。如何有效的进行个人数据管理,成为一个极富挑战性的问题,于是人们提出了一种新的数据管理技术:个人数据空间。

不同于传统的数据管理技术,主体人的特性在个人数据空间中具有重要作用,对于主体行为特性的研究以及在个人数据空间管理中的应用日益成为研究热点。主体的数据管理需求有多种,在不同的环境下往往需要采用不同的方法。例如有的时候需要根据关键字查询,有的时候需要通过资源浏览器查询,有的时候需要基于任务进行查询。但是现阶段的个人数据管理工具所提供的方法比较有限,无法适应个人数据管理需求。

桌面搜索和文件系统的资源浏览器是目前最常使用的个人数据管理工具。桌面搜索的核心是通过对桌面文件建立全文索引支持关键字查询。这种方法有以下局限性:一是对于一些很长时间没有使用的文件,用户往往不能准确回忆起所需要的关键字,这种情况下这种搜索技术就不能有效的工作;二是这种方式不能够支持一些基于语义关联的复杂查询,而且全文索引也往往导致比较低的效率。资源浏览器搜索需要用户能够回忆起文件的存放路径。因此这些工具在一些情况下不能很好地满足用户需求。例如当用户想查找一篇个人文档,但又记不起文件的存放位置和关键字信息的时候,这些工具就不能很好的支持用户查询。

观察发现任务(Task)是人们组织管理个人数据的重要方式。例如人们往往基于任务构建个人目录结构;往往需要查询与某个任务关联的文件等。

本发明就是基于用户任务管理的需求,提出了一种自动的个人任务识别方法。

发明内容

本发明是鉴于上述技术问题而产生的。本发明的一个目的是提出一种个人数据空间环境下的任务识别系统和方法。

在一个方面中,根据本发明的个人数据空间环境下的任务识别系统包括:数据库,用于存储用户操作日志表、用户文件表、以及用户行为日志表;监控模块,用于监控用户操作,获取用户的操作记录,生成用户行为记录;时序关联图产生模块,用于基于用户行为日志表生成时序关联图;以及任务识别模块,用于在时序关联图上识别任务。

在这个方面中,其中监控模块进一步包括:获取单元用于扫描用户最近访问的文件夹,获取用户最近访问的文件F,同时根据用户操作日志表获取该表中所记录的用户最近访问文件F’;判断单元,用于判断文件F和F’是否是同一个文件,并且在判断出文件F和F’不是同一个文件的情况下,进一步判断文件F是否存在于用户文件表中;文件插入单元,用于在判断单元判断出文件F不存在于用户文件表中的情况下将文件F插入到用户文件表中;时间比较单元,用于在判断单元判断出文件F存在于用户文件表中的情况下将新操作的文件F的修改时间t与用户文件表中该文件原来的修改时间t’进行比较;操作类型确定单元,用于在时间比较单元比较出t>t’的情况下确定操作类型为“修改”,同时对用户文件表中相应记录的最近修改时间字段进行更新,否则确定操作类型为“只读”;操作记录插入单元用于将新的用户操作记录插入到用户行为日志表中。

在这个方面中,其中时序关联图产生模块进一步包括:初始时序关联图构建单元,用于基于用户行为日志表构建初始的时序关联图;优化时序关联图生成单元,用于基于初始的时序关联图生成优化的时序关联图。

在这个方面中,其中任务识别模块进一步包括:矩阵表示单元,用于以邻接矩阵方式表示时序关联图;核心文件确定单元,用于基于操作类型来确定每个任务的核心文件;稠密块寻找单元,用于基于每个核心文件寻找该文件在时序关联图的稠密块。

在一个方面中,根据本发明的个人数据空间环境下的任务识别方法包括步骤:A、监控用户操作,获取用户的操作记录,生成用户行为记录;B、基于用户行为日志表生成时序关联图;以及C、在时序关联图上识别任务。

在这个方面中,其中步骤A进一步包括:A1、扫描用户最近访问的文件夹,获取用户最近访问的文件F,同时根据用户日志表获取该表中所记录的用户最近访问文件F’;A2、判断文件F和F’是否是同一个文件,如果是,则不进行操作,继续执行步骤A1;如果不是,则转步骤A3;A3:判断文件F是否存在于用户文件表中,如果不存在,则将F插入到用户文件表中,并转步骤A5;如果存在,则转步骤A4;A4:将新操作的文件F的修改时间t与用户文件表中该文件原来的修改时间t’进行比较,如果t>t’,则确定文件F的操作类型为“修改”,否则确定文件F的操作类型为“只读”;A5:将以上步骤所生成新的用户操作记录插入到用户行为日志表中。

在这个方面中,其中步骤B进一步包括:B1、基于用户行为日志表构建初始的时序关联图;B2、基于初始的时序关联图生成优化的时序关联图。

在这个方面中,其中在步骤B1中:对应每个单独的用户文件,生成图上的一个点;根据两个文件之间是否存在时序关联,在两个文件对应的顶点之间建立边。

在这个方面中,其中在步骤B2中:在初始的时序关联图上寻找时序链结构,将时序链结构合并为一个顶点,其中时序链结构为在时序关联图G上,若存在点v1,v2,...,vn(n≥4)以使得vi(i=2,...,n-1)仅与vi-1、vi+1相邻,且v1、vn度数不等于2,则v2,...,vn-1构成时序链结构。

在这个方面中,其中步骤C进一步包括:C1、以邻接矩阵方式表示时序关联图,每个顶点对应一个用户文件,每个边对应用户之间的时序关联度;C2、基于操作类型确定每个任务的核心文件;C3、基于每个核心文件,寻找该文件在时序关联图的稠密块。

在这个方面中,其中步骤C3进一步包括:C3-1、将核心文件A以及与之直接关联的文件Bi加入到顶点集合T中,其中文件Bi为在时序关联图中与核心文件A相邻的顶点;C3-2、对于T中每个顶点Fi而言,对与Fi相邻的每个顶点Vij进行检测;C3-3、如果存在两条边E1(Vij,V1)和E2(Vij,V2),且V1,V2∈T,则将Vij加入到T中;C3-4、重复步骤C3-2和C3-3,直到T中的顶点数目不再增加为止,此时T中顶点即为对应核心文件A所在的稠密块。

通过本发明,可自动监控用户行为,识别个人任务信息,不会为用户增加额外的负担。本发明是实现个人任务管理的基础

附图说明

结合随后的附图,从下面的详细说明中可显而易见的得出本发明的上述及其他目的、特征及优点。在附图中:

图1示出了根据本发明的任务识别系统的方框图;

图2示出了根据本发明的四个表的示例;

图3示出了根据发明的监控模块的方框图;

图4示出了根据发明的时序关联图产生模块的方框图;

图5示出了根据发明的任务识别模块的方框图;

图6示出了根据本发明的任务识别方法的流程图;

图7示出了根据本发明的任务识别方法的子流程图;

图8示出了根据本发明的任务识别方法的另一子流程图;

图9示出了根据本发明的任务识别方法的又一子流程图;

图10示出了根据本发明的用户行为日志表的示例;

图11示出了根据本发明的基于用户行为日志构建时序关联图的示例;

图12示出了根据本发明的一个时序链结构的合并示例;

图13示出了根据本发明的稠密快的示例;

图14示出了与图11中的时序关联图相对应的邻接矩阵的示例。

具体实施方式

为了更全面地理解本发明及其优点,下面结合附图及具体实施例对本发明做进一步详细地说明。

为了便于理解期间,首先对几个概念进行简单地描述。

用户文件:指用户数据空间中的最小的操作单位,记为Item。

用户行为:指用户对个人数据空间的一次操作,包括以下属性:操作时间(AccessTime)、操作的数据文件(FileName),操作类型(OperationType)。

任务:从数据管理的角度,任务是一系列个人数据文件的集合,根据在任务中地位的不同,这些文件可以分为两类:表示任务目标的核心文件(Core File);为完成任务目标参考访问的数据文件(ReferenceFile)。

接下来,参考图1,对根据本发明的系统框图进行详细地说明。

如图1所示,根据本发明的系统包括数据库、监控模块、时序关联图产生模块、任务识别模块。

数据库中主要包括如图2所示的用户操作日志表、用户文件表、文件时序关联表、以及任务表。此外,该数据库还包括如图10所示的用户行为日志表。当然本发明并不局限于这些表,而是可以保护任何适当的表。

监控模块用于监控用户操作,获取用户的操作记录,生成用户行为记录。随后参考图3,对该监控模块进行更详细地描述。

时序关联图产生模块用于基于用户行为日志表生成时序关联图。随后参考图4,对该时序关联图产生模块进行更详细地描述。

任务识别模块用于在优化的时序关联图上识别任务。随后参考图5,对该任务识别模块进行更详细地描述。

下面参考图3,对根据本发明的监控模块进行说明。

如图3所示,该监控模块包括获取单元、判断单元、文件插入单元、时间比较单元、操作类型确定单元、以及操作记录插入单元。

获取单元用于扫描用户最近访问的文件夹,获取用户最近访问的文件F,同时根据用户操作日志表获取该表中所记录的用户最近访问文件F’。

判断单元用于判断文件F和F’是否是同一个文件,并且在判断出文件F和F’不是同一个文件的情况下,进一步判断文件F是否存在于用户文件表中。

文件插入单元用于在判断单元判断出文件F不存在于用户文件表中的情况下将文件F插入到用户文件表中。

时间比较单元用于在判断单元判断出文件F存在于用户文件表中的情况下将新操作的文件F的修改时间t与用户文件表中该文件原来的修改时间t’进行比较。

操作类型确定单元用于在t>t’的情况下确定操作类型O为“修改”,同时对用户文件表中相应记录的最近修改时间字段进行更新,否则确定操作类型O为“只读”。

操作记录插入单元用于将新的用户操作记录(文件名F,操作时间t,操作类型O)插入到用户行为日志表中。

下面参考图4,对根据本发明的时序关联图产生模块进行说明。

该时序关联图产生模块包括初始时序关联图构建单元和优化时序关联图生成单元。

初始时序关联图构建单元用于基于用户行为日志表构建初始的时序关联图。

优化时序关联图生成单元用于基于初始的时序关联图生成优化的时序关联图。

下面参考图5,对根据本发明的任务识别模块进行说明。

如图5所示,该任务识别模块包括矩阵表示单元、核心文件确定单元、以及稠密块寻找单元。

矩阵表示单元用于以邻接矩阵方式表示时序关联图,每个顶点对应一个用户文件,每个边对应用户之间的时序关联度。

核心文件确定单元用于基于操作类型来确定每个任务的核心文件。

稠密块寻找单元用于基于每个核心文件构建该文件在时序关联图的稠密块。具体地说,该稠密块寻找单元进一步包括

接下来,参考图6,对根据本发明的个人数据空间环境下的任务识别方法进行详细地说明。

如图6所示,该个人数据空间环境下的数据识别方法包括步骤:

A、监控用户操作,获取用户的操作记录,生成用户操作记录。

由于本发明是一种自动的识别个人任务的方法,因此用户操作日志是进行任务识别的重要依据。

具体地说,如图7所示,该步骤A进一步包括:

步骤A1):扫描用户最近访问的文件夹,获取用户最近访问的文件F,同时根据用户操作日志表获取该表中所记录的用户最近访问文件F’。

如图2所示,用户操作日志表包括:访问时间、文件名称、文件路径、以及操作类型。

步骤A2):根据文件名称和文件路径来判断文件F和F’是否是同一个文件,如果是,则认为访问的数据文件没有变化,不进行操作,继续执行步骤A1;如果不是,则认为发生了新的数据操作,转步骤A3;

步骤A3):根据文件名称和文件路径来判断文件F是否存在于用户文件表中,如果不存在,则说明访问了一个新的用户文件(即原来没有访问过的文件),则将F插入到用户文件表中,并转步骤A5;如果存在,则转步骤A4。

如图2所示,用户文件表包括:文件标识符、文件名称、存放路径、以及最近修改时间。

步骤A4):将新操作的文件F的修改时间t与用户文件表中该文件原来的修改时间t’进行比较,如果t>t’,则认为用户对文件F进行的操作类型O为“修改”,同时对用户文件表中相应记录的最近修改时间字段进行更新;否则,认为用户对F进行了只读访问,操作类型O为“只读”。

步骤A5):将以上步骤所生成新的用户操作记录(文件名F,操作时间t,操作类型O)插入到用户行为日志表中。如图10所示,图10给出了用户行为日志表的示例。

B、基于用户行为日志表生成时序关联图。

具体地说,如图8所示,该步骤B进一步包括:

步骤B1):基于用户行为日志表构建初始的时序关联图。

构建规则如下:对应每个单独的用户文件,生成图上的一个点;根据两个文件之间是否存在时序关联,在两个文件对应的顶点之间建立边。例如,如果文件A在文件B后被用户访问,则认为数据项A与数据项B之间存在时序关联。图11示出了基于用户行为日志构建时序关联图的示例,左边示出了一个日志片段,右边示出了基于该日志片段生成的时序关联图。

步骤B2):基于初始的时序关联图生成优化的时序关联图。

具体地说,在初始的时序关联图上寻找时序链结构,将时序链结构合并为一个顶点。其中将时序链结构定义为:在时序关联图G上,若存在点v1,v2,...,vn(n≥4)以使得vi(i=2,...,n-1)仅与vi-1、vi+1相邻,且v1、vn度数不等于2,则v2,...,vn-1构成时序链结构,其中度数定义为与一个顶点相关联的边的数目。图12示出了一个时序链结构的合并示例,图12左图中顶点a、b和c构成一个时序链结构,右图为将a、b和c合并为一个顶点的视图。

C、在优化的时序关联图上识别任务。

具体地说,如图9所示,该步骤C进一步包括:

步骤C1):以邻接矩阵方式表示时序关联图,每个顶点对应一个用户文件,每个边对应用户之间的时序关联度。图14示出了与图11中的时序关联图相对应的邻接矩阵。其中对角线元素设定为1;对于非对角线元素,为1表示所对应的两个顶点之间存在一条边(在时序关联图中),为0表示不存在这样的边。

步骤C2):基于操作类型确定每个任务的核心文件。由于用户操作日志表中记录了操作类型信息,因此可以基于日志中用户修改过的文件来确定用户的核心文件列表Core List。

CoreList的构建方法如下:用户操作日志表中每一条记录包含一个操作类型字段。该字段有两个取值:修改或只读(新建用户文件操作包含在修改类型之内)。日志表中所有操作类型标志为“修改”的记录涉及的数据对象集合构成CoreList。

CoreList中的每一个文件是一个任务的核心文件。

步骤C3):基于每个核心文件,寻找该文件在时序关联图的稠密块。

首先,对稠密块进行说明。其定义如下:G是一个稠密块,其不仅符合块的定义,而且满足条件:不存在e1,e2,使得G-e1-e2由两个连通分支G1和G2组成,且G1和G2的顶点数都大于1。图13给出了稠密快的示例。其中G1是一个稠密块,G2是一个普通的块。对稠密块G1来说,不存在两条边使得当这两条边被割掉时,G1被分为两个度数均大于1的连通分支。在G1中,割掉边e1,e2形成的两连通分支中有一个度数为1。G2是一个普通的块,它满足块的定义:连通且不存在割点。但是当e3、e4被去掉,该块可以被分成度数分别为2和3的两个连通分支,因此不是稠密块。按照此方法,一个稠密快如果包含一个核心文件(即用户修改或建立的文件),则该稠密快中所有顶点对应的文件构成一个任务。

在该步骤中,G是基于时序关联表构建的时序关联图,图的每个顶点代表一个用户文件,边表示两个文件被访问的时序关系。以图11所示的时序关联图为例,可以得到其关联矩阵,如图14所示。

假设A是一个任务的核心文件,其所对应的稠密块所包含的顶点集合为T。以A为核心寻找稠密快的具体步骤如下:

步骤C3-1):开始时T={A},即只包含所对应的核心文件。将与A直接关联的文件Bi加入到顶点集合T中。其中文件Bi定义为在时序关联图中A与Bi为相邻顶点。该例子中与顶点A直接相邻的顶点包括B,C,D,因此T={A,B,C,D}。

步骤C3-2):对于T中每个顶点Fi而言,对与Fi相邻的每个顶点Vij进行检测;

步骤C3-3):如果存在两条边E1(Vij,V1)和E2(Vij,V2),且V1,V2∈T,则将Vij加入到T中;

步骤C3-4):重复步骤C3-2)和C3-3),直到T中的顶点数目不再增加为止。

在本例中,与A,B,C,D相邻的顶点只有E,而且,不存在两条与E相邻的边,其另外两个顶点在{A,B,C,D}中。所以不再继续执行。因此T={A,B,C,D}对应一个包含核心文件A的稠密快。

步骤C3-5):将T中所有顶点对应的文件加入到F中,F即为一个任务所关联的用户文件,且该任务目标文件是A。

至此,根据本发明的任务识别方法的工作流程已结束。在步骤C3-4中所得到的T即就是任务识别的结果。任务识别的结果就是找出与一个任务关联的数据文件的集合。

通过上述可知,本发明具有简洁、高效、容易实现的特性。基于本发明,用户只需按照自己的行为习惯操作个人数据文件,本发明自动的监控用户行为,识别个人任务信息,不会为用户增加额外的负担。本发明是实现个人任务管理的基础。通过自动标识个人任务,可以支持用户实现基于任务的数据查询、数据备份等操作。

对于本领域的普通技术人员来说可显而易见的得出其他优点和修改。因此,具有更广方面的本发明并不局限于这里所示出的并且所描述的具体说明及示例性实施例。因此,在不脱离由随后权利要求及其等价体所定义的一般发明构思的精神和范围的情况下,可对其做出各种修改。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号