法律状态公告日
法律状态信息
法律状态
2013-08-28
授权
授权
2012-03-07
实质审查的生效 IPC(主分类):G06F17/30 申请日:20110927
实质审查的生效
2012-01-11
公开
公开
技术领域
本发明涉及联机分析技术,尤其涉及一种构建事实表的方法和装置。
背景技术
传统的关系型数据库应用系统主要是面向业务操作而设计的,无论是查 询,统计,还是生成报表,都是对指定数据进行事务处理和简单的统计汇总。 随着数据库技术的广泛应用,企业数据库中积累了大量的原始数据,如何对 日益增加的数据进行收集、管理、分析以及转化,以更好地辅助决策和指导 行动,已变得越来越重要。联机分析处理(On-Line Analysis Processing, OLAP)技术正是在这一需求的驱动下发展起来的,并日益得到广泛的应用。
OLAP是由关系数据库之父E.F.Codd提出的一种数据动态分析模型, 它允许以一种称为多维数据集的多维结构访问来自商业数据源的经过聚合 和组织整理的数据。以此为标准,OLAP作为单独的一类产品同联机事务处 理(On-Line Transaction Processing,OLTP)得以明显区分。联机分析处理 (OLAP)是以海量数据为基础的复杂分析技术,它支持各级管理决策人员 从不同的角度快速灵活地对数据仓库中的数据进行复杂查询和多维分析处 理,并且能以直观易懂的形式将查询和分析结果展现给决策人员。联机分析 处理是数据仓库之上的增值技术。
OLAP技术主要是通过组织由事实表和维度表构成的多维立方体数据, 让数据分析人员从多个角度探索和分析数据集。事实表是指其中保存了大量 业务度量数据的表,并事实表中的度量值一般称之为事实。围绕着事实表的 是多个维度表,业务度量数据可以根据维度进行汇总。维度一般是对事实颗 粒的按照某种方式进行的聚合,不同维度分析,就是从不同的角度观察事实。 事实表数据和维度表数据通过关联组合实现多维数据存取,给分析人员提供 一个多维数据超立方体,使分析人员不需要了解数据库的物理结构的情况下 根据他所关注的目的不同,在与其习惯的企业逻辑结构相似的多维结构内进 行多维操作,如上钻,下钻,旋转,切片和切块,能够迅速、一致、交互地 从各个方面观察信息,以达到深入理解数据的目的。
由于数据量过于庞大导致数据查询计算非常耗时,在现有OLAP技术 中,事实表往往是根据用户的使用习惯预先定义的。简单的说,就是将经常 用到的查询内容预先生成事实表,在用户使用时直接调用已经生成的事实表 进行数据分析,这样便可避免临时生成事实表而导致的过于耗时的问题。例 如,对于包含数十个数据项的数据记录,预先生成包含其中经常使用的几个 或者十几个数据项的事实表。如此一来,在进行数据分析时,便可直接使用 预先生成的事实表即可。在具体应用过程中,针对用户关心内容的不同,可 以预先生成所包含数据项不同的多个事实表,以此来满足不同用户的需要。
然而,用户需要往往不断发生变化,这导致预先生成的事实表经常无法 满足用户的需要。另外,预先生成包含所有数据项的事实表会导致事实表过 大,无法正常使用。
因此,需要一种技术方案,可有效解决预先生成的事实表无法满足用户 需要的问题。
发明内容
有鉴于此,实有必要提供一种构建事实表的方法,以解决预先生成事实 表无法满足用户需要的问题。
同时,提供一种构建事实表的装置,以解决预先生成事实表无法满足用 户需要的问题。
根据本发明实施例的一个方面,提供一种构建事实表的方法,所述方法用 于根据至少一条数据记录构建事实表,其中,每一数据记录包含不同类别的多 个子记录,每一子记录包含不同类别的多个数据项,所述多个子记录分别存储 在多个业务实体中,且不同数据记录的相同类型的子记录存储在同一业务实体 中,所述方法包括:
响应用户选择的至少一个业务实体,对于用户选择的每一业务实体,显示 该业务实体中存储的子记录中包含的数据项的类别;
响应用户选择的数据项类别,根据用户选择的所有数据项类别,在用户选 择的所有业务实体中提取对应的数据项,作为原始数据项;
将归属相同数据记录的原始数据项组装成数据条目,根据生成的所有数据 条目构建事实表。
根据本发明实施例提供的一个方面,提供一种构建事实表的装置,所述装 置用于根据至少一条数据记录构建事实表,其中,每一数据记录包含不同类别 的多个子记录,每一子记录包含不同类别的多个数据项,所述多个子记录分别 存储在多个业务实体中,且不同数据记录的相同类型的子记录存储在同一业务 实体中,所述装置包括:
显示控制模块,用于响应用户选择的至少一个业务实体,对于用户选择的 每一业务实体,显示该业务实体中存储的子记录中包含的数据项的类别;
提取模块,用于响应用户选择的数据项类别,根据用户选择的所有数据项 类别,在用户选择的所有业务实体中提取对应的数据项,作为原始数据项;
生成模块,用于将归属相同数据记录的原始数据项组装成数据条目,根 据生成的所有数据条目构建事实表。根据本发明实施例提供的技术方案,用 户可以根据自身需要选择业务实体,并进一步选择业务实体中包含的数据项 类别。在这种情况下,本发明提供的技术方案可根据用户选择的数据项类别 在用户选择的业务实体中提取对应的数据项,作为原始数据项,再将归属相 同数据记录的原始数据项组装成数据条目,根据生成的所有数据条目构建事 实表。如此一来,用户可根据自身需要构建想要的事实表,充分满足实际所 需的数据分析的需求。
附图说明
图1是依据本发明一示范性实施例的构建事实表的方法的流程图;
图2是依据本发明一示范性实施例的构建事实表的装置的逻辑结构示 意图。
具体实施方式
图1是依据本发明一示范性实施例的构建事实表的方法100的流程图。构 建事实表的方法100用于根据至少一条数据记录构建事实表,其中,每一数据 记录包含不同类别的多个子记录,每一子记录包含不同类别的多个数据项,所 述多个子记录分别存储在多个业务实体中,且不同数据记录的相同类型的子记 录存储在同一业务实体中。例如,上述数据记录可以为客户的电信业务使用记 录,该电信业务使用记录可以包含客户的基本信息、客户的语音类业务使用记 录和客户的数据类业务使用记录等多个子记录。客户的基本信息可以存储在一 业务实体中,该业务实体可以包含例如客户姓名、住址、联系方式等不同类别 的多个数据项;客户的语音类业务使用记录可以存储在另一业务实体中,该业 务实体可以包含例如通话开始时间、通话结束时间、被叫号码等不同类别的多 个数据项;客户的数据类业务使用记录可以存储在又一业务实体中,该业务实 体可以包含例如已使用时长、已使用流量等不同类别的多个数据项。在具体实 现过程中,业务实体可以通过例如但不限于物理数据表的方式来实现。
基于上述数据记录,本发明实施例提供的构建事实表的方法100包括:
步骤102,响应用户选择的至少一个业务实体,对于用户选择的每一业务 实体,显示该业务实体中存储的子记录中包含的数据项的类别。
具体来说,用户例如运营商经营分析人员,可以根据自身需要选择所需的 业务实体。例如,仍以上文描述的电信业务使用记录为例,如果用户想要分析 客户的语音类业务使用情况,则只需选择包含客户的基本信息的业务实体和包 含客户的语音类业务使用记录的业务实体,而无需选择包含客户的数据类业务 使用记录的业务实体。
步骤104,响应用户选择的数据项类别,根据用户选择的所有数据项类别, 在用户选择的所有业务实体中提取对应的数据项,作为原始数据项;
具体来说,在选择的业务实体中,用户可以根据自身需要在该业务实体所 记录的数据项所属的数据项类别中,选择所需的数据项类别。例如,仍以上文 描述的电信业务使用记录为例,若用户在分析客户的语音类业务使用情况时选 择了包含客户的基本信息的业务实体和包含了客户的语音类业务使用记录的业 务实体,则对于包含客户的基本信息的业务实体而言,用户可以只选择客户姓 名这一数据项类别;而对于包含客户的语音类业务使用记录的业务实体,用户 可以只选择通话开始时间和通话结束时间这两项数据项类别。在选定数据项类 别之后,本发明实施例提供的技术方案在用户选择的所有业务实体中提取对应 的数据项,作为原始数据项。在具体实现过程中,可通过构建对应的数据库查 询语句,例如但不限于结构化查询语言(Structured Query Language,SQL)语 句,来从用户选择的业务实体中提取对应的数据项。
步骤106,将归属相同数据记录的原始数据项组装成数据条目,根据生成 的所有数据条目构建事实表。
例如,仍以上文描述的电信业务使用记录为例,用户在分析客户的语音类 业务使用情况时选择了包含客户的基本信息的业务实体和包含了客户的语音类 业务使用记录的业务实体。对于包含客户的基本信息的业务实体,用户选择了 客户姓名这一数据项类别;对于包含客户的语音类业务使用记录的业务实体, 用户选择了通话开始时间和通话结束时间这两项数据项类别。则针对某一客户 而言,组装成的数据条目将包含客户姓名、通话开始时间和通话结束时间三个 数据项类别。由于包含上述数据项的数据条目数据量较小,构建事实表时过程 简单,计算量不大,而且生成的事实表可以充分满足用户的需要。实际上,生 成的所有数据条目共同组成一动态的业务实体。
在具体实现过程中,上述步骤106中根据生成的所有数据条目构建事实表 可以具体包括,响应用户设置的筛选条件,在生成的所有数据条目中移除不满 足所述筛选条件的数据条目,并根据剩余的数据条目构建所述事实表。例如, 若用户只想对通话开始时间在一特定时间之后的客户的语音类业务使用行为进 行分析,则可将上述特定时间设置为筛选条件,以便从生成的所有数据条目中 移除通话开始时间在该特定时间之前的数据条目,然后根据剩余的数据条目构 建所述事实表。
此外,在具体实现过程中,在上述步骤104之后,上述构建事实表的方法 100还可包括,响应用户添加的数据项类型、用户为该添加的数据项类型选定 的至少一个相关联的业务实体、用户在每一相关联的业务实体所存储的数据项 中为该添加的数据项类型选定的至少一个相关联的数据项和用户输入的计算公 式,根据上述用户选定的相关联的数据项和上述计算公式计算添加的数据项类 型对应的数据项,将算得的数据项添加到所述原始数据项中。例如,若用户想 在客户的通话开始时间和通话结束时间的基础上统计客户的通话时长,则可添 加通话时长这一数据项类型。此后,为计算该通话时长数据项,用户选择存储 有客户的通话开始时间和通话结束时间的业务实体,然后在该业务实体中选择 通话开始时间和通话结束时间这两个数据项,再输入相关的计算公式,即,通 话时长等于通话结束时间减去通话开始时间。如此一来,便可计算添加的通话 时长这一数据项类型对应的数据项,即通话时长数据项,然后将该通话时长数 据项添加到原始数据项中。
在具体实现过程中,上述算得的数据项可以为上述用户选定的相关联的数 据项的和、差或者平均值。例如,上述添加的通话时长这一数据项即为通话开 始时间和通话结束时间这两项数据项的差。
根据本发明实施例提供的技术方案,用户可以根据自身需要选择业务实 体,并进一步选择业务实体中包含的数据项类别。在这种情况下,本发明提 供的技术方案可根据用户选择的数据项类别在用户选择的业务实体中提取 对应的数据项,作为原始数据项,再将归属相同数据记录的原始数据项组装 成数据条目,根据生成的所有数据条目构建事实表。如此一来,用户可根据 自身需要构建想要的事实表,充分满足实际所需的数据分析的需求。此外, 用户除了可以根据自身需要选择业务实体和数据项类别之外,还可添加衍生 或者汇总的数据项类别,并指定在计算该衍生或者汇总的数据项类别对应的 数据项时所需的相关联的数据项和计算公式以计算添加的数据项类别所对 应的数据项,以满足实际应用的需要。
图2是依据本发明一示范性实施例的构建事实表的装置200的逻辑结构示 意图。本发明实施例提供的构建事实表的装置200用于根据至少一条数据记录 构建事实表,其中,每一数据记录包含不同类别的多个子记录,每一子记录包 含不同类别的多个数据项,所述多个子记录分别存储在多个业务实体中,且不 同数据记录的相同类型的子记录存储在同一业务实体中。有关数据记录的内容 已经在上文进行了清楚的描述,因此此处不再赘述。
构建事实表的装置200包括显示控制模块202、提取模块204和生成模块 206。
显示控制模块202用于响应用户选择的至少一个业务实体,对于用户选择 的每一业务实体,显示该业务实体中存储的子记录中包含的数据项的类别;
提取模块204用于响应用户选择的数据项类别,根据用户选择的所有数据 项类别,在用户选择的所有业务实体中提取对应的数据项,作为原始数据项;
生成模块206用于将归属相同数据记录的原始数据项组装成数据条目,根 据生成的所有数据条目构建事实表。
在具体实现过程中,生成模块206还用于响应用户设置的筛选条件,在生 成的所有数据条目中移除不满足所述筛选条件的数据条目,并根据剩余的数据 条目构建所述事实表。
在具体实现过程中,构建事实表的装置200还可包括一计算模块,用于响 应用户添加的数据项类型、用户为该添加的数据项类型选定的至少一个相关联 的业务实体、用户在每一相关联的业务实体所存储的数据项中为该添加的数据 项类型选定的至少一个相关联的数据项和用户输入的计算公式,根据上述用户 选定的相关联的数据项和上述计算公式计算添加的数据项类型对应的数据项, 将算得的数据项添加到所述原始数据项中。在具体实现过程中,所述算得的数 据项可以为上述用户选定的相关联的数据项的和、差或者平均值。
本领域普通技术人员可知,上述方法中的全部或部分步骤可以通过程序指 令相关的硬件完成,该程序可以存储于一计算机可读存储介质中,该计算机可 读存储介质如ROM、RAM和光盘等。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保 护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。
机译: 候选合格表构建装置,候选合格表构建方法,候选合格表构建程序
机译: 一种构建三维物品的装置和一种构建三维物品的方法
机译: 一种构建三维物品的装置和一种构建三维物品的方法