首页> 中国专利> 基于用于可视化数据集的适合度来排列可视化类型

基于用于可视化数据集的适合度来排列可视化类型

摘要

在此描述用于排列可视化类型的技术。为了排列可视化类型,为可视化类型中的每一种生成可视化元数据,且为数据集生成数据集元数据。然后,通过使用数据映射规则和图选择规则,基于可视化元数据和数据集元数据来计算合适性分数。然后,根据所计算的分数来排列可视化类型。然后,可以显示包括对应于根据排列而被排序的可视化类型的可视表示的用户界面。然后,可以选择可视表示中的一种来将对应的可视化类型应用到数据集。

著录项

  • 公开/公告号CN102027445A

    专利类型发明专利

  • 公开/公告日2011-04-20

    原文格式PDF

  • 申请/专利权人 微软公司;

    申请/专利号CN200980117837.1

  • 申请日2009-03-30

  • 分类号G06F3/14(20060101);G06F17/18(20060101);G06F15/17(20060101);

  • 代理机构31100 上海专利商标事务所有限公司;

  • 代理人黄嵩泉;潘明婳

  • 地址 美国华盛顿州

  • 入库时间 2023-12-18 02:09:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-05-20

    专利权的转移 IPC(主分类):G06F3/14 变更前: 变更后: 登记生效日:20150506 申请日:20090330

    专利申请权、专利权的转移

  • 2014-11-05

    授权

    授权

  • 2011-06-08

    实质审查的生效 IPC(主分类):G06F3/14 申请日:20090330

    实质审查的生效

  • 2011-04-20

    公开

    公开

说明书

背景技术

桌面生产力应用程序通常提供用于可视化数据的许多选项。举例来说,电子表格应用程序可以允许用户选择柱形图、线形图、饼图、直方图、面积图、散点图或用于可视化数据集的内容的另一类型的图。每一类型的图可以或多或少有效地被用于表示给定的数据集中的数据。作为一个示例,饼图可以很好地适用于可视化某些数据集,而散点图不能很好地适用于可视化相同的数据集。

为了可视化数据集,桌面生产力应用程序一般要求用户选择可用的可视化类型中的一种。然而,作出这样的选择是困难的,这是因为许多用户可能不知道最适用于他们的数据集的可视化类型且可能不知道他们自己的数据的范围和程度。许多用户可能还不知道所有可用的可视化类型,尤其是在提供大量的可视化类型或者罕见的或领域专用的可视化类型可用的场合。结果,对于许多用户来说,选择显示他们的特定的数据集的最佳可视化类型是困难的。

一旦用户已经选择可视化类型,一般来说有必要配置该可视化类型以供与数据集一起使用。举例来说,通常有必要将数据集内的数据列映射到所选择的可视化类型的轴。在一些情况下,桌面生产力应用程序可以作出关于数据的基本假设以便自动地执行映射。如果应用程序不执行此函数,或如果由该应用程序生成的映射不是最佳的,那么桌面生产力应用程序可以询问用户应如何将数据集中的数据映射到所选择的图类型的轴。对于没有接受过在他们的数据集中的数据和所选择的可视化类型之间指定最佳映射的训练的用户来说,这也是令人沮丧的。

相对于这些考虑和其他考虑,呈现本公开内容。

发明内容

在此描述用于排列可视化类型的技术。具体地,通过使用在此所呈现的技术,根据可视化类型与特定的数据集一起使用的适合度来排列可视化类型。然后,可以向用户呈现示出所排列的可视化类型的用户界面,由此允许用户为他们的数据集选择最适合的可视化类型。另外,通过在此所呈现的排列过程,使用被应用到数据集的特性的规则,配置每一可视化类型以供与数据集一起使用。以此方式,用户可以更容易地选择最适用于他们的数据集的可视化类型,并避免如先前所要求的配置用于数据集的可视化类型的冗长过程。

根据在此所呈现的一个方面,提供包括用于可视化数据集的内容例如表格数据的一个或多个可视化类型的桌面生产力应用程序。可视化类型可以包括各种类型的图表、示意图、图形和用于数据集的内容的其他形式的可视呈现。为了协助用户选择可视化类型中的一种并配置所选择的可视化类型,在此所呈现的桌面生产力应用程序还提供用于根据可用的可视化类型与特定的数据集一起使用的适合度来排列可用的可视化类型的功能。

为了排列可视化类型,为可视化类型中的每一种生成可视化元数据。可视化元数据是描述可视化类型的一种或多种属性的数据。举例来说,可视化元数据可以描述用于特定的可视化类型的优选的输入。还为数据集生成数据集元数据。数据集元数据是描述数据集的一种或多种属性的数据。举例来说,数据集元数据可以描述数据集的数据类型、数学性质或其他固有的性质。对数据集元数据的性质应用计算以指示用于可视化类型的优选的输入。

一旦已经生成可视化元数据和数据集元数据,就为可视化类型中的每一种计算合适性分数。基于可视化元数据和数据集元数据来生成合适性分数,且合适性分数指示每一可视化类型与数据集一起使用的合适性。为了生成合适性分数,使用数据映射规则来创建数据集中的列和可视化类型中的每一轴或数列之间的映射。数据映射规则指定数据应如何优选地被映射到可视化类型中的每一轴或数列。然后,考虑到该映射而利用图选择规则来为可视化类型计算合适性分数。一旦合适性分数已经被生成,那么就根据该分数来排列可视化类型。在排列过程中还可以利用其他因素例如用户简档。

一旦可视化类型已经被排列,就可以显示包括对应于根据排列而被排序的可视化类型的可视表示的用户界面。举例来说,可以显示对应于按合适性分数的降序排列的可视化类型中的每一种的缩略图。用户可以选择可视表示中的一种来将对应的可视化类型应用到数据集。然后,可使用在排列进程中为所选择的可视化类型而生成的映射来将所选择的可视化类型映射到数据集。

应明白,上述主题还可以被实现为计算机控制装置、计算机进程、计算系统、或被实现为制品例如计算机可读介质。阅读下列具体实施方式并观察关联的图后将明显看出这些特征和各种其他特征。

提供本发明内容以便以简化形式描述下面在具体实施方式中进一步描述的概念选集。本发明内容不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。此外,所要求保护的主题不限于解决本发明内容的任何部分中提到的任何或所有缺点的实现。

附图说明

图1是示出在此所提供的若干软件组件的诸方面和被用于在此所呈现的一种实施方式的说明性数据集的软件体系结构图;

图2是示出在此所提供的一种实施方式中的若干软件组件的另外的方面的软件体系结构图;

图3-图4是示出根据在此所呈现的一种实施方式的用于排列可视化类型的一个说明性例程的流程图;

图5是示出在此所呈现的一种实施方式中在此提供的用于显示经排列的可视化类型的列表的说明性用户界面;以及

图6是示出用于能够实现在此所呈现的实施方式的诸方面的计算系统的说明性计算机硬件和软件体系结构的计算机体系结构图。

具体实施方式

下列具体实施方式涉及用于排列可视化类型的技术。尽管是在与计算机系统上的操作系统和应用程序的执行协同执行的程序模块的一般上下文中呈现在此描述的本主题,但本领域的技术人员将认识到,其他实现可以与其他类型的程序模块组合执行。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外,本领域的技术人员将明白,在此描述的本主题可以与包括手持式设备、多处理器系统、基于微处理器的或可编程的消费性电子设备、小型计算机、大型计算机等等在内的其他计算机系统配置一起实践。

在下列具体实施方式中,对附图进行引用,附图由此形成具体实施方式的部分,且被示出为具体实施方式或示例的阐释。诸图中,贯穿多个图中相似的数字代表相似的元件,现在参见诸图,将描述用于排列可视化类型的适合度的计算系统和方法论。

现在转到图1,将提供关于由在此所呈现的实施方式提供的若干软件组件的细节。具体地,在此所呈现的实施方式提供桌面生产力应用程序102,其被配置为提供基于一个或多个可视化类型110A-110N用于可视化数据集106的适合度来排列该一个或多个可视化类型110A-110N。在此描述的一种实现中,桌面生产力应用程序102包含能够创建和编辑电子表格文档的电子表格应用程序。然而,应明白,在此所呈现的实施方式不限于与电子表格应用程序一起实现。相反,在此所呈现的实施方式可以与任何桌面生产力应用程序和提供用于可视化数据集的功能的其他类型的应用程序一起使用。

通过使用桌面生产力应用程序102,用户可以创建、编辑、或查看包括数据集106在内的文档104。在一种实施方式中,数据集106包含表114。然而,应明白,数据集106可以包含其他类型的结构化数据,包括已经以另一方式被格式化的数字形式或自由形式的文本数据。通过使用桌面生产力应用程序102,用户还可以用图形可视化数据集106的内容。在这一点上,桌面生产力应用程序102维持含有可视化类型110A-110N的储存库108,并包括用于呈现可视化类型110A-110N的功能。如以上简述,可视化类型110A-110N可以包括各种类型的图表(chart)、示意图(diagram)、图形(graph)和用于可视化数据集106的内容的其他形式的可视表示。根据诸实现,可视化类型110A-110N包括柱形图、线形图、饼图、直方图、面积图、散点图和其他图。

为了协助用户选择可视化类型110A-110N中的一种以供与数据集106一起使用,桌面生产力应用程序102包括用于根据可用的可视化类型110A-110N与数据集106一起使用的适合度来排列可用的可视化类型110A-110N的功能。在这一点上,桌面生产力应用程序102被配置为利用规则引擎112。正如将在下面所讨论,规则引擎112包括用于为可视化类型110A-110N中的每一种生成相对于数据集106的合适性分数的功能。尽管规则引擎112已经被示出为是图1中的桌面生产力应用程序102的部分,但规则引擎112可以是独立于桌面生产力应用程序102而执行的独立的软件组件。关于规则引擎112的结构和执行的另外的细节将在下面相对于图2而被提供。

如上面所简述,在此描述的一种实施方式中,数据集106包含表114。在图1中示出的说明性的表114包括多个列116A-116D和多个行118A-118D。正如将在下面更详细地讨论,在一种实施方式中,规则引擎112被配置成将表114的列116A-116D映射到每一可视化类型110A-110N的轴或数列。基于此映射对于表114内含有的数据的类型的合适性,生成指示可视化类型110A-110N中的每一种与表114一起使用的合适性的合适性分数210。关于此过程的另外的细节将在下面相对于图2-图4而被提供。

现在转到图2,将提供关于规则引擎112以及与其一起使用的若干另外的软件组件的操作的另外的细节。如在图2中所示出,规则引擎112采用数据集元数据206和可视化元数据208作为输入。可视化元数据208是为可视化类型110A-110N中的每一种所指定的、描述可视化类型中的每一种的一种或多种属性的数据。举例来说,可视化元数据208可以描述用于特定的可视化类型的优选输入。在这一点上,可视化元数据208可以指定可视化类型110A-110N中的每一种内的各种轴或数列,并指定关于轴或数列中的每一种的优选类型的数据的属性。

数据集元数据206是描述数据集106的一个或多个固有属性的数据。举例来说,如以上所讨论,数据集元数据206可以描述数据集106的数据类型、数学性质或其他性质。可以为整个数据集106指定数据集元数据206,或者,在表格数据的情况中,独立地为每一列116A-116D中的每一个指定数据集元数据206。正如将在下面更详细地讨论,规则引擎112利用数据集元数据206和可视化元数据208来生成数据集106内的数据集和可视化类型110A-110N中的每一种内的轴或数列之间的映射。一旦此映射已经被生成,就为可视化类型110A-110N中的每一种计算合适性分数210。合适性分数指示每一可视化类型110在可视化数据集106的内容时使用的合适性。

为了生成合适性分数210,规则引擎112利用数据映射规则202来创建数据集106中的列116A-116D与可视化类型110中的每一轴或数列之间的映射。如上面所简述,数据映射规则202指定应优选地被映射到可视化类型110A-110N中的每一种中的每一轴或数列的类型数据。数据映射规则202还可以使用来自数据集元数据的其他属性来协助数据集和可视化类型中的轴或数列之间的映射。一旦此映射已经被创建,规则引擎112就利用图选择规则204来为可视化类型110A-110N中的每一种计算合适性分数210。

正如将在下面更详细地描述,一旦已经为可视化类型110A-110N中的每一种生成合适性分数210,就可以根据所计算的分数210来排列可视化类型110A-110N。应明白,除了合适性分数210之外,还可以利用其他因素来告知可视化类型110A-110N的排列。举例来说,在此所呈现的一种实现中,用户简档用作对排列过程的输入。用户简档可以指定,举例来说,用户与其他可视化类型相比更喜欢某些类型的可视化类型110A-110N。作为示例,用户可以在他们的用户简档中指定他们喜欢被配置为用于显示科学数据的可视化类型110。通过在排列过程期间使用此信息,某些可视化类型110A-110N可以被排列为高于其他可视化类型。在其他实施方式中,可以利用社会或大群体的喜好来更改合适性分数。关于规则引擎112及其在生成合适性分数210时对数据集元数据206、可视化元数据208、数据映射规则202和图选择规则204的使用的操作另外的细节将在下面相对于图3-图4而被提供。

现在转到图3-图4,将提供关于在此所呈现的用于排列可视化类型与数据集一起使用的适合度的实施方式的另外的细节。具体地,图3-图4是阐释在此所呈现的用于排列可视化类型110A-110N与数据集106一起使用的适合度的一个过程的流程图。应明白,在此描述的逻辑操作被实现为(1)计算机实现的动作的序列或运行在计算系统上的程序模块和/或(2)互连的机器逻辑电路或计算系统内的电路模块。该实现是取决于计算系统的性能和其他要求的选择。因此,在此描述的逻辑操作不同地被称为状态操作、结构设备、动作或模块。这些操作、结构设备、动作和模块可以在软件、固件、专用数字逻辑和其任何组合中实现。还应明白,可以执行比在诸图中示出的和在此描述的更多或更少的操作。还可以以与在此描述的那些操作不同的次序来执行这些操作。

在操作302,例程300开始,其中为可视化类型110A-110N中的每一种生成可视化元数据208。正如上面所讨论,可视化元数据208是描述可视化类型110的一种或多种属性的数据。应明白,在为特定的数据集106执行可视化类型110A-110N的排列的时刻之前,可以为可视化类型110A-110N中的每一种生成和存储可视化元数据302。以此方式,可以为可视化类型110A-110N中的每一种执行操作302一次且不重复操作。从操作302,例程300进行到操作304。

在操作304,桌面生产力应用程序102生成数据集元数据206。正如上面所讨论,数据集元数据206是描述数据集106的一个或多个固有属性的数据。一旦数据集元数据206已经被生成,例程300就进行到操作306,其中初始化被用来存储标识当前的可视化类型的数据的临时变量。该变量初始被设定为储存库108中的第一可视化类型110A。从操作306,例程300进行到操作308。

在操作308,对由临时变量指定的可视化类型110A评估其与数据集106一起使用的合适性。正如将在下面相对于图4更详细地讨论,规则引擎112通过为每一可视化类型计算合适性分数210来评估每一可视化类型110A-110N的合适性。关于此过程将在下面相对于图4提供另外的细节。

一旦已经为当前的可视化类型生成合适性分数210,例程300就进行到操作310,其中就储存库108中是否还有应该为其计算合适性分数210的另外的可视化类型作出判断。如果是,例程300就从操作310进行到操作312,其中临时变量的值被设定到储存库108中接下来的可视化类型110B。从操作312,例程300返回到操作308,如上所述。

应明白,根据诸实施方式,可以放弃考虑不适当的可视化类型。举例来说,可以放弃具有低于设定的阀值或可配置的阀值的合适性分数的所有可视化类型。在这些情形中,在操作310之前,可以从考虑中排除基于可视化类型的合适性分数而被认为不适用于或不适宜于数据集的可视化类型。

在操作310,如果判断储存库108中的所有可视化类型110A-110N都已经被考虑,则例程300进行到操作314。在操作314,桌面生产力应用程序102示出根据可视化类型中的每一个的所计算的合适性分数210而被排列的可视化类型中的每一个。如以上还讨论,排列过程可以包括基于其他准则例如用户简档的内容来修改排列。

正如将在下面相对于图5更详细地讨论,在一种实现中还提供用户界面,该用户界面包括根据递减的合适性分数210来排序的可视化类型110A-110N中的每一种的图形表示。通过此用户界面,用户可以选择可视表示中的一种来使对应的可视化类型110应用到数据集106。关于这样的用户界面的另外的细节将在下面相对于图5而被提供。

从操作314,例程300进行到操作316,其中桌面生产力应用程序102接收对已经以经排列的次序被呈现给用户的可视化类型110A-110N中的一种的选择。响应于这样的选择,例程300从操作316继续进行到操作318,其中利用所选择的可视化类型110来呈现数据集106。为了呈现所选择的可视化类型,使用在数据集106内含有的列116A-116D和所选择的可视化类型110内的轴或数列之间所生成的映射来将数据集106内的数据映射到所选择的可视化类型110。一旦已经利用所选择的可视化类型110来呈现数据集106,例程300就进行到操作320,例程300在此结束。

正如上面参考操作308所讨论,规则引擎112被配置为对每一可视化类型评估其与数据集106一起使用的合适性。图4示出阐释关于此过程的另外的细节的例程400。具体地,例程400在操作402开始,其中数据集106内的列116A-116D被映射到当前的可视化类型110中的轴或数列。为了执行此过程,规则引擎112利用数据映射规则202。正如上面所讨论,数据映射规则202指定应优选地被映射到当前的可视化类型110内的每一轴或数列的数据类型。

从操作402,例程400进行到操作404,其中规则引擎112判断是否已经排除考虑当前的可视化类型110。举例来说,如果数据集106的列116A-116D没有适当地映射到可视化类型内的轴或数列,则可以排除考虑该可视化类型。还可以排除与数据集106一起使用的其他类型的不适合性的可视化类型。如果当前的可视化类型已经被排除,例程400就从操作404进行到操作408。然而,如果当前的可视化类型没有被排除,例程400就从操作404进行到操作406。

在操作406,规则引擎112使用图选择规则204来为当前的可视化类型110计算合适性分数210。正如上面所讨论,图选择规则考虑到在操作402所执行的映射而提供指示当前的可视化类型与数据集106一起使用的合适程度的分数。一旦已经为当前的可视化类型计算了合适性分数210,例程400就进行到操作408,其中例程400返回到操作308,如参考图3所描述。

现在转到图5,将提供关于在上面简述的用于呈现经排列的可视化类型110A-110N的列表的用户界面的另外的细节。正如上面所讨论,图5中所示出的用户界面可以被用来向用户呈现已经根据可视化类型110A-110N与数据集106一起使用的合适性来排列的可视化类型110A-110N的列表。在这一点上,可视化类型110A-110N按照递减序的合适性分数210次数而列出。以此方式,最合适的可视化类型110被最先呈现给用户。

在一种实现中,用户界面包括含有对应于可视化类型110A-110N的表示502A-502C的用户界面窗口500。还根据对应的可视化类型110A-110N的递减的合适性分数210来排序表示502A-502C。

在一种实现中,当对应的可视化类型110A-110N被应用于数据集106时,表示502A-502C包含该对应的可视化类型110A-110N的图形表示。举例来说,当对应的可视化类型110A-110N被用于呈现数据集106时,表示502A-502C可以对应于该对应的可视化类型110A-110N图形的缩略图。以此方式,用户可以查看当可视化类型110A-110N中的每一种被用于呈现数据集106的内容时示出可视化类型110A-110N中的每一种将如何显现的预览图像。

通过图5中所示出的用户界面,还为用户提供关于可视化类型110A-110N中的每一种与数据集106一起使用的合适性的重要信息。应明白,图5中所阐释的用户界面已经被以简化形式示出且仅仅是说明性的。结果,还应明白,可以呈现利用其他类型的用户界面控件来根据基于可视化类型110A-110N中的每一种与数据集106一起使用的适合度的排列而示出可视化类型110A-110N中的每一种的合适性的其他类型的用户界面。

图6示出用于能够执行在此描述的、用于以上面所呈现的方式来排列可视化类型110A-110N的适合度的软件组件的计算机600的说明性计算机体系结构。在图6中示出的计算机体系结构阐释常规的台式计算机、便携式计算机、手持式计算机、膝上型计算机或服务器计算机,且可以被用于执行在此所呈现的软件组件任何方面。

图6中所示出的计算机体系结构包括中央处理单元602(″CPU″)、系统存储器608(包括随机存取存储器614(″RAM″)和只读存储器(″ROM″)616)和将存储器耦合到CPU 602的系统总线604。基本输入/输出系统被存储在ROM616中,其含有例如在启动期间帮助在计算机600内的元件之间传递信息的基本例程。计算机600进一步包括用于存储在此更详细地描述的操作系统618、应用程序和其他程序模块的大容量存储设备610。

大容量存储设备610通过连接到总线604的大容量存储控制器(未示出)而被连接到CPU 602。大容量存储设备610及其关联的计算机可读介质为计算机600提供非易失性存储。尽管在此含有的计算机可读介质的描述是指大容量存储设备例如硬盘或CD-ROM驱动器,但本领域的技术人员应明白,计算机可读介质可以是可以由计算机600访问的、任何可用的计算机存储介质。

作为示例而非限制,计算机可读介质可以包括以用于存储信息例如计算机可读指令、数据结构、程序模块或其他数据的任何方法或技术实现的易失性介质和非易失性介质、可移动介质和不可移动介质。例如,计算机可读介质包括但不限于RAM、ROM、EPROM、EEPROM、闪速存储器或其他固态存储器技术、CD-ROM、数字多用途盘(“DVD”)、HD-DVD、蓝光或其他光存储、磁带盒、磁带、磁盘存储或其他磁存储设备、或可以用于存储所期望的信息并可以由计算机600访问的任何其他介质。

根据各种实施方式,计算机600可以通过网络例如网络620使用到远程计算机的逻辑连接而在网络化环境中操作。计算机600可以通过被连接到总线604的网络接口单元606而连接到网络620。应明白,网络接口单元606还可以被用于连接到其他类型的网络和远程计算机系统。计算机600还可以包括用于接收和处理来自包括键盘、鼠标或电子笔在内的许多其他设备的输入/输出控制器612。类似地,输入/输出控制器可以向显示屏、打印机或其他类型的输出设备(图6中也未示出)提供输出。

如以上简要所述,多个程序模块和数据文件可以被存储在计算机600的大容量存储设备610和RAM 614中,包括适于控制网络化的台式计算机、膝上型计算机或服务器计算机的操作的操作系统618。大容量存储设备610和RAM 614还可以存储一个或多个程序模块和数据文件。具体地,大容量存储设备610和RAM 614可以存储桌面生产力应用程序102和文档104,其中的每一个都在上面相对于图1-图5而详细描述。如上面还描述,大容量存储设备610还可以存储用户简档620,用户简档620包括与计算机600的用户关联的数据。大容量存储设备610和RAM 614还可以存储其他类型的程序模块。

基于前述内容,应明白,在此提供用于排列可视化类型的适合度的技术。尽管已经用对计算机结构特征、方法论动作和计算机可读介质来说专用的语言来描述了在此所呈现的本主题,但应理解,在所附权利要求中界定的本发明不必限于在此描述的这些具体特征、动作或介质。相反,具体特征、动作或介质是作为实现权利要求的示例形式而公开的。

上述的本主题仅仅作为示例而提供的,且不应被解释成限制。在不遵循下列的所阐释和描述的示例实施方式和应用程序且不偏离本发明的真实精神和范围的前提下,可以对在此描述的本主题进行各种修改和变化,本发明在下列权利要求中陈述。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号