首页> 中国专利> 使用参考和视觉数据的语义自动发现的数据丰富

使用参考和视觉数据的语义自动发现的数据丰富

摘要

本发明涉及使用参考和视觉数据的语义自动发现的数据丰富。提供用于自动丰富报告文档的表中的数据的方法、系统和计算机程序产品。接收文档中包含的数据表。确定数据表的列中所存储的数据的类别。检索与所确定的类别相关联的增强信息。增强信息可包括视觉增强(如,符号、图像、等等)和/或可包括与所确定的列数据的类别相关的参考数据。允许用户选择所检索到的增强信息中的增强信息。所选的增强信息被显示在文档中。允许用户接受所选的增强信息被存储在文档中。

著录项

  • 公开/公告号CN102930048A

    专利类型发明专利

  • 公开/公告日2013-02-13

    原文格式PDF

  • 申请/专利权人 微软公司;

    申请/专利号CN201210461614.0

  • 申请日2012-11-15

  • 分类号G06F17/30;

  • 代理机构上海专利商标事务所有限公司;

  • 代理人陈斌

  • 地址 美国华盛顿州

  • 入库时间 2024-02-19 17:52:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-07-17

    授权

    授权

  • 2017-07-25

    发明专利公报更正 卷:33 号:14 IPC(主分类):G06F0017300000 更正项目:专利申请公布后的驳回 误:驳回 正:撤销驳回 申请日:20121115

    发明专利更正

  • 2017-04-05

    发明专利申请公布后的驳回 IPC(主分类):G06F17/30 申请公布日:20130213 申请日:20121115

    发明专利申请公布后的驳回

  • 2015-08-26

    专利申请权的转移 IPC(主分类):G06F17/30 变更前: 变更后: 登记生效日:20150805 申请日:20121115

    专利申请权、专利权的转移

  • 2013-03-20

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20121115

    实质审查的生效

  • 2013-02-13

    公开

    公开

查看全部

说明书

技术领域

本发明涉及数据丰富,尤其涉及使用参考和视觉数据的语义自动发现的数 据丰富。

背景技术

诸如公司、合伙企业或其它商业实体之类的组织可生成和/或以其它方式累 积大量数据、信息和知识。这种数据、信息和知识可被称为公司数据。公司数 据可包含文本、代码、数字和其它信息。这种组织中的个人有时会发现组织这 种公司数据并在报告中向实体演示这种公司数据是有用的。各种应用可用于基 于公司数据生成报告,包括电子表格工具,如Microsoft(由美国华盛顿 州雷蒙德市的微软公司开发)、Google DocsTM的Google Spreadsheet(由美国加利 福尼亚州芒廷维市的谷歌公司开发)、以及IBM Lotus Symphony Spreadsheets (由美国纽约州阿蒙克市的IBM公司开发);报告服务,如SQL服务器报告服 务(由微软公司开发)、Crystal ReportsTM(由美国加利福尼亚州圣何塞市和法国巴 黎的SAP Business Objects开发)、以及Reports(由美国加利福尼亚州 雷德伍德市的Oracle公司开发);以及商业智能客户机(如,IBMHyperion、以及SAP Business ObjectsTM)。

基于公司数据生成的报告存在问题。这种报告可能是视觉上沉闷的,因为 它们主要示出成列的原始数据。此外,这种报告可能难以被用户搜索以在视觉 上定位相关数据(例如,用户可能必须阅读/浏览报告的全部文本),并且在这种 报告缺乏视件和/或进一步的描述信息时,这种报告对用户来说可能不是难忘 的。因此,基于公司数据的报告通常缺乏丰富性并且具有有限的使用。

当前,报告的生成器可向报告手动添加视件和进一步的数据。然而,该添 加是长且乏味的手动过程。Google Spreadsheet包括称为“Google Lookup”的 功能部件以向报告添加数据。然而,为了这样做,Google Spreadsheet使用户明 确构建查询来获得数据,并将查询手动附加到电子表格。

发明内容

提供本发明内容以便以简化形式介绍将在以下具体实施方式中进一步描 述的一些概念。本发明内容并不旨在标识所要求保护主题的关键特征或必要特 征,也不旨在用于限制所要求保护主题的范围。

提供用于自动丰富报告文档的表中的数据的方法、系统和计算机程序产 品。例如,可基于报告的表的列中的数据的自动检测,将丰富添加到报告。基 于所检测到的列数据,可从本地和/或远程源检索丰富。这种丰富的示例包括视 觉丰富、参考数据、允许生成空间报告的地理丰富、等等。丰富可被添加到表 的现有列和/或表的新列以增强该表。此外,图和其它图形表示可基于可显示视 觉丰富的经增强的表来生成(例如,可生成“信息图(info graphics)”,它是信息、 数据或知识的图形视觉表示)。

在一个方法实现中,接收文档中包含的数据表。确定数据表的列中存储的 数据的类别。检索与所确定的类别相关联的增强信息。增强信息可包括视觉增 强(如,符号、图像、等等)和/或可包括与所确定的列数据的类别相关的参考数 据。允许用户选择所检索到的增强信息中的至少一些。所选的增强信息被显示 在文档中。如果需要,允许用户接受所选的增强信息被存储在文档中。

在系统实现中,数据增强系统包括列分析器(可任选的)、增强检索器、用 户界面模块(可任选的)、和列修改器。列分析器确定文档中包含的表的列中存 储的数据的类别。列分析器被配置成比较列数据与多个所存储的数据集以确定 数据的类别。所存储的数据集对应于多个数据类别。增强检索器检索用于与所 确定的类别相关联的列的增强信息。用户界面模块提供用户界面,该用户界面 允许用户选择所检索到的增强信息中的至少一些增强信息。列修改器允许所选 的增强信息被显示在文档中。

本文也描述了用于自动丰富表数据,以及用于实现附加实施例的计算机程 序产品。

下面将参考各个附图,详细描述本发明的进一步特点和优点,以及本发明 的各实施例的结构和操作。值得注意的是,本发明不仅限于此处所描述的特定 实施例。本文呈现这些实施例仅用于说明性的用途。基于本文所包含的描述, 其它实施例对于相关领域的技术人员将是显而易见的。

附图说明

结合到本说明书并构成本说明书的一部分的附图示出了本发明,且与描述 一起,进一步用于说明本发明的原理,并允许那些相关领域技术人员实施和使 用本发明。

图1示出根据示例实施例的包括用于自动增强表中的数据的数据增强系统 的数据增强环境的框图。

图2示出根据示例实施例的包含被配置成增强表中的数据的文档编辑器工 具的计算机系统的框图。

图3示出根据示例实施例的提供用于自动增强表数据的过程的流程图。

图4示出根据示例实施例的数据增强系统的框图。

图5示出根据示例实施例的从一个或多个远程源收集增强数据的数据增强 系统的框图。

图6示出根据实施例的电子表格编辑器工具窗口中的示例表。

图7示出根据实施例的图6的示例窗口,其中显示允许所标识的增强数据 被添加到表的用户界面。

图8示出根据示例实施例的提供用于在表中显示视觉丰富的过程的流程 图。

图9示出根据示例实施例的用于在表的现有列中显示视觉丰富的过程。

图10示出根据示例实施例的提供用于在表的新列中显示视觉丰富的过程 的流程图。

图11示出根据实施例的图6的示例窗口,其中所选的增强数据被包括在 表的现有列和新列中。

图12示出根据实施例的图6的示例窗口,其中被选为增强数据的图像被 包括在表的新列中。

图13示出根据示例实施例的用于在表的新列中显示作为所标识的增强数 据的参考数据的过程。

图14示出根据实施例的图6的示例窗口,其中所选的增强数据被包括在 表的新列中。

图15示出根据示例实施例的包括图生成器的数据增强系统的框图。

图16示出了可用于实现本发明的各实施例的示例计算机的框图。

当结合其中相同的附图标记标识对应的元素的附图时,本发明的特征和优 点将从以下阐述的详细描述中变得更加显而易见。在附图中,相同的参考标号 一般指相同的、功能上相似的和/或结构上相似的元素。其中元素第一次出现的 附图由对应的参考标号中最左侧的数字指示。

具体实施方式

I.介绍

本说明书公开了包括本发明的各特征的一个或多个实施例。所公开的实施 例只例示了本发明。本发明的范围不仅限于所公开的实施例。本发明由所附的 权利要求进行限定。

说明书中对“一个实施例”、“实施例”、“示例实施例”等等的引用表 示所描述的实施例可包括特定特征、结构或特性,但是,每一个实施例可不必 包括该特定特征、结构,或特征。此外,这些短语不一定指相同的实施例。此 外,当关于某一实施例描述特定特征、结构或特性时,不管是否被明确描述, 关于其他实施例来实现该特征、结构或特性被认为是在本领域技术人员的知识 范围内。

本发明的多个示例性实施例在以下描述。应当理解,在此提供的任何章节 /子章节标题不旨在限制。本文档中描述了各实施例,并且任何类型的实施例可 被包括在任何章节/子章节下。

II.各示例实施例

基于公司数据生成的报告存在问题。这种报告可能是视觉上沉闷的,可能 难以被用户搜索以在视觉上定位相关数据(例如,用户可能必须阅读/浏览报告 的全部文本),并且在这种报告缺少视件(如图像)时,这种报告对用户来说可能 不是难忘的。此外,这种报告通常不包含参考数据。参考数据被定义为针对现 有表列数据获得的附加数据、与列数据的类别相关联、并且通常比列数据更具 体(不宽泛)。例如,表的列中的数据的类别可以是“汽车”。“汽车”的参考 数据的示例可包括“汽车型号”、“汽车制造商”、“汽车颜色”、等等。基 于公司数据生成报告的技术不能够向报告自动添加这种参考数据。因此,出于 所有这些原因,基于公司数据的报告通常缺乏丰富性并且具有有限的使用。当 前,报告的生成器可向报告手动添加视觉实体和参考数据。然而,视觉实体和 参考数据的这种添加是长且乏味的手动过程。

诸实施例提供了针对报告的自动数据丰富技术。例如,在一实施例中,可 基于报告的表的列中的值的自动语义检测,将丰富添加到报告数据。这种丰富 的示例包括视觉丰富(例如,图像、符号、颜色、字体大小、字体类型、等等)、 属性丰富(添加参考数据、基于数字参考数据的值的对视觉丰富的大小调整或其 它修改、等等)、允许生成空间报告的地理丰富(例如,添加地理数据,如多边 形、中心点、等等)、等等。在诸实施例中,这种丰富可在商业智能的任何一个 或多个级别上执行。例如,可以使用报告工具(例如,电子表格工具,诸如 Microsoft Crescent、MicrosoftGoogle DocsTM的Google Spreadsheet、IBM Lotus Symphony Spreadsheets、Microsoft SSRS(SQL服务器报告服务);报告服 务,诸如SQL服务器报告服务、Crystal ReportsTM、以及Reports;以 及商业智能客户机,诸如IBMHyperion、以及SAP Business  ObjectsTM等等),使用数据建模(诸如BISM(商业智能语义模型)、Microsoft Excel 的Microsoft PowerPivot附件等等),和/或使用数据提取、转换和加载(ETL)(诸 如通过Microsoft SSIS(SQL服务器集成服务)/DQS(数据质量服务))来执行丰 富。

在一实施例中,自动发现逻辑可确定列包含特定语义内容,例如通过确定 其值集是已知类别的数据集的子集(例如,CA、WA和NJ是五十个已知美国州 代码的子集)。自动发现逻辑可执行匹配,其可能需要或不需要找出精确匹配(例 如,自动发现逻辑对打字错误和/或未知值可以是有弹性的)。可使用各种匹配 技术,例如访问字典数据结构、通过对临时表执行内联接来使用SQL(结构化查 询语言)、执行网络搜索(例如在因特网上搜索)、使用类似于DQS的逻辑、来 自地址簿的人的图片、等等。

诸实施例可在各种环境中实现。例如,图1示出根据示例实施例的包括用 于自动增强表中的数据的数据增强系统102的数据增强环境100的框图。如图 1所示,数据增强系统102接收表108,该表可任选地包含在文档104(例如, 电子表格文档、文字处理文档、或可包含表的其它类型的文档)或其它数据结构 中。数据增强系统102分析表108的一个或多个列,以确定一个或多个列所包 含的数据的一个或多个类别。数据增强系统102基于所确定的一个或多个列数 据类别来检索增强信息106。数据增强系统102通过将增强信息106中包括的 增强包括在表108中来增强表108,以生成经增强的表110(在图1的示例中, 示为包括在文档104中)。经增强的表110包括相对于表108的一个或多个增强, 其可以是一个或多个视觉增强和/或参考数据。这种增强可被包括在经增强的表 110的现有列和/或新列中。

在诸实施例中,图1的环境100可以各种方式进行配置。例如,图2示出 了根据示例实施例的在计算机系统200中实现的文档编辑器工具202的框图。 文档编辑器工具202被配置成自动增强表中的数据。如图2所示,计算机系统 200包括文档编辑器工具202和存储204。此外,文档编辑器工具202包含数 据增强系统102。文档编辑器工具202可以是可购得的文档编辑器(例如,电子 表格编辑器工具,诸如Microsoft Crescent、MicrosoftGoogle DocsTM的Google Spreadsheet、以及IBM Lotus Symphony Spreadsheets;文字处理工具, 诸如Word等等)、专用文档编辑器、或允许人类可读表列数据被查 看和/或编辑的其它工具,包括本文别处提到的或以其它方式已知的任何其它文 档编辑工具或系统。数据增强系统102可构建在文档编辑器202中(例如,以程 序代码的形式等等),或者可耦合到文档编辑器202,例如以附件或插件的形式。 如本文所述,数据增强系统102为文档编辑器工具202提供自动数据增强功能。

如图2所示,文档编辑器工具200访问存储204以检索文档104(或包括表 108的其它数据结构)。文档编辑器工具202接收增强信息106,该增强信息可 本地地存储在计算机系统200中(例如,在存储204或其它本地存储中)和/或可 从计算机系统200远程地访问。如图2所示,当生成时,文档编辑器工具202 在存储204中(文档104中)存储经增强的表110。

存储204可包括存储数据和/或代码的任何类型的存储机构中的一个或多 个,包括磁盘(例如,在硬盘驱动器中)、光盘(例如,在光盘驱动器中)、 磁带(例如,在磁带驱动器中)、诸如RAM设备、ROM设备等的存储器设备、 和/或任何其他合适类型的存储介质。计算机系统200可以是任何类型的固定或 移动计算设备,包括桌面计算机(例如,个人计算机等)、移动计算机或计算 设备(例如,设备、RIM设备、个人数字助理(PDA)、 膝上型计算机、笔记本计算机、平板计算机(例如,Apple iPadTM)、上网本等 等)、智能电话(例如,Apple iPhone、Google AndroidTM电话、Microsoft电话等)或其它类型的计算设备。

注意,图2是出于说明的目的提供的,并且在其它实施例中,数据增强系 统102可以以其它方式实现(例如,与文档编辑器工具分离),如本领域的技术 人员根据本文的教导所能知晓的。

可以以各种方式来配置数据增强系统102以执行其功能。例如,图3示出 根据示例实施例的提供用于自动增强表数据的过程的流程图300。在一实施例 中,流程图300可以由数据增强系统102来执行。参考图4描述流程图300如 下。图4示出根据示例实施例的包括数据增强系统402的计算机系统400的框 图。如图4所示,计算机系统400包括数据增强系统402、存储404和显示器 406。计算机系统400是图2的计算机系统200的示例,而数据增强系统402 是数据增强系统102的示例。如图4所示,数据增强系统402包括列分析器408、 增强检索器410、用户界面模块412和列修改器414。基于关于流程图300和 图4的数据增强系统402的以下讨论,进一步的结构和操作实施例对相关领域 技术人员是显而易见的。

流程图300开始于步骤302。在步骤302,接收文档中包含的数据表。例 如,如图4所示,数据增强系统402的列分析器408可接收表108。列分析器 408可以直接接收表108,或者可以接收包括表108的文档104(图1)并且可以 从文档104提取表108的数据。表108可包括任何数量的行和列的数据,该数 据具有任何形式(例如数字数据,串数据等等)。

在步骤304,确定数据表的列中存储的数据的类别。在一实施例中,列分 析器408被配置成分析表108的一个或多个列以确定其中包含的数据的类别。 例如,在一实施例中,列分析器408可被配置成比较表108的列的数据与多个 存储的数据集416(例如存储在存储404中),以标识列中包含的数据的类别。

数据集416是与多个数据类别相对应的多个数据集。数据集416可包括任 何数量的数据集,包括几十个、几百个、几千个、以及甚至更大数量的数据集。 数据集416中的数据集可与任何数量的不同数据类别相关。列分析器408可比 较表108的列的数据与数据集416,以标识列数据的类别。如果列数据与数据 集416中的数据集中包含的数据基本上匹配,则列分析器408可指示匹配的数 据集的数据类别就是该列的类别。如图4所示,列分析器408输出所确定的类 别420,其指示为列数据所确定的类别。在某些实施例中,由于与多个数据集 匹配,可将列归类到多个类别中。

例如,数据集416中的第一数据集可包括一千个人名并且可以是人名类别, 数据集416中的第二数据集可包括五十个美国州的二位州代码并且可以是美国 州类别,而数据集416中的第三数据集可包括一千种食物名并且可以是食物类 别。列分析器408可比较表108的一个或多个列的数据与这三个数据集,以确 定其各自的类别。如果表108的第一列包括数据值MN、CA、VA和WA,则 列分析器408可确定这些数据值与第二数据集的二位州代码匹配,并因此可指 示该第一列具有美国州的类别。如果表108的第二列包括数据值John Smith、 Jane Doe、William Jones和Fred Jackson,则列分析器408可确定这些数据值与 第一数据集中包括的名字匹配,并因此可指示该第二列具有人名的类别。可针 对表108的一个或多个列中的任何数量执行该过程,以标识列的类别。

注意,在一实施例中,表108的列中包括的每个数据值必须在由列分析器 408分配数据集类别的数据集中被找到。在另一实施例中,表108的列中包括 的预定百分比(例如90%、80%、75%等)的数据值必须在由列分析器408分配数 据集类别的数据集中被找到。此外,在一实施例中,列分析器408可能能够标 识表108的列中的拼写错误的单词(当单词存在时)(例如,使用拼写检查器),以 使正确拼写的单词能够与数据集的数据匹配,以在标识列的类别时实现改进的 准确性。

注意,在一实施例中,列分析器408和增强检索器410可组合在一起。在 另一实施例中,列分析器408可以不存在。在这种实施例中,可允许用户手动 确定数据表的列中存储的数据的类别(在步骤304)。例如,在一实施例中,可允 许用户与用户界面交互以选择数据表的列,并指示所选列的列类型(例如国家名 称等)。可允许用户请求为所选列检索丰富,或者可自动为所选列检索丰富。

再参考图3,在步骤306,检索与所标识类别相关联的增强信息。例如, 在一实施例中,图4的增强检索器410接收为表108的列所确定的类别420。 增强检索器410可被配置成基于为列所确定的类别420来检索增强信息(图1)。 在诸实施例中,增强检索器410可检索本地地存储在计算机系统400中(例如在 存储404中)的本地增强信息106a,和/或可检索相对于计算机系统400远程地 存储的远程增强信息106b。如图4所示,增强检索器410可生成接收增强指示 422,其指示本地增强信息106a和/或远程增强信息106b中接收到的一个或多 个增强。例如,接收增强指示422可提供接收到的增强的列表,这些增强是标 签、标题和/或指示接收到的增强的其它信息的形式。

例如,存储在存储404中的本地增强信息106a可包括在计算机系统400 处生成的数据、不可移动和/或可移动存储中包括的数据、从可移动存储加载的 数据、从网络下载的数据等等。任何形式的增强信息可被包括在本地增强信息 106a中,包括视觉增强(例如,符号、图像、视频等)和参考数据。本地增强信 息106a的数据可具有任何格式并且可以任何方式存储在存储404中,包括作为 基本数据、类属关键字数据(例如,男性/女性、颜色名称等)、公共商业词汇数 据(例如“商店”、“在线”、“转售者”、“新”、“旧”、“翻新”、“高”、 “低”、“计划”、“人力资源”、“管理”、“研发”等)、基于国际标准和 统计的数据(例如,国家(ISO 3166-1)、州/地区(ISO 3166-2)、货币(ISO 4217)、 语言(ISO 639)、美国人口普查地区和地点等)、为便于发现在客户机中高速缓存 的数据等等。

由增强检索器410从远程位置检索的远程增强信息106b可从任何位置检 索,包括经由网络从一个或多个计算设备检索。例如,图5示出根据示例实施 例的通信系统500的框图,其中计算机系统400中的数据增强系统402包括增 强检索器410,其从一个或多个基于网络的位置收集增强数据。如图5所示, 系统500包括计算机系统400、第一服务器504、第二服务器506、第三服务器 508和网络510。在诸实施例中,第一至第三服务器504、506和508中的任何 一个或多个可存在。下面描述系统500。

计算机系统400和服务器504、506和508可以以任何方式,以有线和/或 无线方式,通过网络510通信耦合。例如,计算机系统400和服务器504、506 和508可在聚集多个数据源的单个云系统中耦合在一起,或者可以以其它方式 耦合在一起。网络510的示例包括LAN(局域网)、WAN(广域网),或诸 如因特网的网络的组合。可被包括在网络510中的通信链路的示例包括IEEE 802.11无线LAN(WLAN)无线链路、微波存取全球互通(Wi-MAX)链路、蜂窝 网络链路、无线个域网(PAN)链路(例如,蓝牙TM链路)、以太网链路、USB(通 用串行总线)链路等。服务器504、506和508各自可以是本文描述的或以其它 方式已知的任何类型的计算设备。

第一服务器504包括数据源520。数据源520可以是任何网络可访问的信 息源,包括其中可共享数据集和/或可购买/租用对数据的访问的数据市场。这 种通过网络510可访问的数据市场的示例是微软Windows AzureTM市场。数据 源502可提供任何形式的信息,包括作为存储数据、数据馈源等。如图5所示, 数据丰富系统402可向数据源520发送数据请求526。数据请求526可包括对 于所请求信息的一个或多个关键字,包括提供所确定的列类别420中指示的一 个或多个数据类别作为关键字。可定义模式,根据该模式数据发布者可在信息 512中标记其数据(例如,标记其图像等),以使其数据可响应于数据请求被提供。 数据源520可访问第一服务器501的本地存储中存储的信息512以获取所请求 的信息(例如,符号、图像、视频、参考数据等),并且可将所请求的数据提供 给增强检索器510作为远程增强信息106b。

第二服务器506包括搜索引擎522。搜索引擎522可以是任何类型的网络 可访问的搜索引擎。通过网络510可访问的搜索引擎522的示例包括但不限于 Yahoo!SearchTM(http://www.yahoo.com)、Microsoft BingTM(http://www.bing.com)、以及GoogleTM(http://www.google.com)。搜索引擎522 可提供任何形式的信息,包括所接收的搜索查询的结果中的信息。如图5所示, 数据丰富系统402可向搜索引擎522发送搜索查询528。搜索查询528可包括 一个或多个搜索关键字,包括提供所确定的类别420中指示的一个或多个数据 类别作为搜索关键字。搜索引擎522可访问第二服务器506的本地存储中或其 它网络可访问位置处存储的信息514。信息514可包括各种类型的可搜索信息, 如娱乐相关信息(例如,书籍、CD(压缩盘)等)、名人、购物、运动、技术、旅 行、股票/公司等。例如,信息514可包括网页或由搜索万维网的web爬行器获 得的其它对象(例如,符号、图像、视频、参考数据等)。信息514可使用索引、 表、和/或其它数据结构来将搜索关键字与相关对象相关联。响应于搜索查询 528,搜索引擎522可将至信息514的对象的链接发送或提供给增强检索器510 作为远程增强信息106b。

第三服务器508包括在线/基于网络的参考门户524。参考门户524可以是 任何类型的网络可访问的参考门户。通过网络510可访问的参考门户524的示 例包括但不限于美国加利福尼亚州旧金山市的维基媒体基金会支持的 (http://www.wikipedia.com)、美国伊利诺伊州芝加哥市的大英百科全 书公司发布的大英百科全书(http://www.britannica.com/)等。参考门户524可 提供任何形式的信息,包括在所接收的查询的结果中的信息。如图5所示,数 据丰富系统402可向参考门户524发送查询530。查询530可包括一个或多个 关键字,包括提供所确定的类别420中指示的一个或多个数据类别作为关键字。 参考门户524可访问第三服务器508的本地存储中或其它网络可访问位置处存 储的信息516。例如,参考门户524可提供包含响应于查询530提供的信息514 的数据、图像等的一个或多个结构化的信息盒。响应于查询530,参考门户524 可将信息516的对象发送给增强检索器510作为远程增强信息106b。

此外,如上所述,增强检索器410可收集参考数据。例如,在一实施例中, 存储404可将参考数据包括在本地增强信息106a中。如上所述,数据集416 是与多个数据类别相对应的多个数据集。本地增强信息106a可包括针对数据集 416中的一个或多个数据集的参考数据。例如,本地增强信息106a可包括将类 别(所标识的类别420)映射到本地增强信息106a中的参考数据集的映射(例如, 数据结构)。例如,如果列类别被确定为美国州,则本地增强信息106a中包括 的映射可将美国州映射到诸如州人口、州鸟、州加入联邦的日期等的参考数据 集。增强检索器410可从存储404中的本地增强信息106a收集该参考数据。作 为补充和/或替换,增强检索器410可以用与本地收集参考数据类似的方式,或 不同的方式,例如执行查询(例如,使用关键字)以搜索与所标识的列数据的类 别相关的参考数据,来从远程源(例如图5的服务器504、506、508等)收集参 考数据。

如图5所示,计算机系统400可任选地包括高速缓存518。当存在时,高 速缓存518可被用于存储所接收的远程增强信息106b。高速缓存518可包括一 个或多个存储器设备和/或适用于高速缓存存储的其它存储设备。作为补充和/ 或替换,所接收的远程增强信息106b可被存储在比高速缓存518更长期的存 储中。

再参考图3,在步骤308,允许用户选择所检索的增强信息中的增强信息。 例如,如图4所示,用户界面模块412接收所接收的增强信息422,其指示由 增强检索器410所接收的增强。在一实施例中,用户界面模块412被配置成生 成由显示器406显示的用户界面418,其显示所接收的增强指示并允许用户选 择增强中的一个或多个。例如,用户界面416可以是图形用户界面(GUI),其提 供一个或多个GUI元素,例如按钮、复选框、下拉菜单、文本框等,以允许用 户查看并选择增强。用户可通过键盘、姆指旋轮、定点设备、滚球、触控点、 触敏显示器、任何数量的虚拟界面元素、语音识别系统等来与用户界面418交 互。如图4所示,用户界面模块412生成所选的丰富指示424,其指示用户所 选的将被包括在表108中的一个或多个丰富。

出于说明的目的,图6示出由电子表格工具(例如,图2的文档编辑器工具 202)生成并由显示设备(例如,图4的显示器406)显示的电子表格窗口600。提 供电子表格窗口600以示出示例表606。表606是表108(图1)的示例。表606 的示例包括六列608a-608f并包括九行。表606的第一列608a包括“头衔”数 据,表606的第二列608b包括“雇佣日期”数据,表606的第三列608c包括 “性别”数据,表606的第四列608d包括“国家”数据,表606的第五列608e 包括“汽车颜色”数据,并且表606的第六列608f包括“汽车制造商”数据。 在诸实施例中,表可包括任何数量的列和行,并且其中可包含任何类型和数量 的数据。表606的维数和内容是出于说明的目的在本文中提供的。

如图6所示,电子表格窗口600包括丰富请求用户界面元素602。进一步 的用户界面元素也可显示在电子表格窗口600中,以允许用户与其中显示的电 子表格交互,如本领域的技术人员所知晓的(例如,打开文档、保存文档、实现 文档的格式化和/或其它编辑、改变文档视图等的用户界面元素)。为了便于说 明,在图6中未示出这种附加的用户界面元素。

丰富请求用户界面元素602可以是任何类型的图形用户界面元素,例如按 钮、文本输入框、复选框、下拉菜单和/或任何其它合适类型的用户界面元素。 电子表格窗口600的用户可与丰富请求用户界面元素602交互,以通过扫描列 608a-608f来标识它们并找出丰富,从而获取为表606检索的丰富信息。例如, 可执行图3的流程300作为用户与丰富请求用户界面元素602交互的结果(例 如,通过用定点设备点击用户界面元素602的按钮等)。用户界面元素602可显 示文本“找出丰富”,或者可提供通知用户其目的的其它指示。在如上所述相 对于表606执行步骤302、304和306之后,图4的用户界面模块412可生成 用户界面418以允许用户选择一个或多个定位的丰富。

例如,图7示出了根据示例实施例的在窗口600上显示的用户界面702。 用户界面702是允许所标识的增强数据被添加到表606的示例图形用户界面。 例如,如用户界面702中所指示地,为表606定位四种类型的丰富数据。用户 界面702声明“为您的数据定位丰富信息”,并请求用户“请选择添加哪些丰 富信息”。用户界面702列出可被添加到表606的四种类型的丰富数据-“男 性/女性颜色”、“男性/女性符号”、“国旗图像”和“人口数据”。用户可 选择用户界面702中所列出的四种类型的丰富数据中的一个或多个,并且可选 择“添加”按钮(例如,通过鼠标点击)来将所选择的丰富数据添加到表606。作 为替换,用户可选择“取消”按钮来取消将任何丰富数据添加到表606(例如, 以退出图3的流程300)。

注意,图7中示出的用户界面702的配置是作为示例实施例提供的。在替 换实施例中,用户界面702可包括附加和/或替换特征。例如,在一实施例中, 用户界面702可具有用户可选择以执行附加和/或具体丰富搜索的一个或多个 按钮(和/或其它用户界面元素),例如指示搜索可在具体数据源中执行的按钮、 指示搜索可在搜索引擎处执行的按钮、指示搜索可在基于网络的参考门户处执 行的按钮等等。当选择按钮时,可执行相对应的丰富搜索。

注意,用户界面模块412是可任选的。在另一实施例中,所检索的增强信 息中的增强信息可被自动选择(例如,通过增强检索器410和/或通过列修改器 414),而不是在步骤308中由用户选择。此外,注意,流程300的步骤304和 步骤308可一起执行。例如,可允许用户在单个操作中确定列类别并选择增强 信息(例如,以与图7中所示的类似的方式,在同一操作中在“性别-图标”和 “性别-颜色”之间选择)。如此,在诸实施例中,步骤304可在步骤306之前 或之后执行。

再参考图3,在步骤310,在文档中显示所选的增强信息。例如,如图4 所示,列修改器414接收表108和所选的丰富指示424,其指示用户所选的将 被包括在表108中的一个或多个丰富。此外,列修改器414从增强检索器410 接收所选的丰富信息426。所选的丰富信息426包括由增强检索器410接收的 在所选的丰富指示424中被指示以包括在表108中的丰富信息。列修改器414 被配置成修改表108的一个或多个列,以使所选的增强信息被显示在表108中。

例如,在一实施例中,所选的丰富信息可包括一个或多个视觉丰富集,例 如颜色、符号、图像、视频等。在这种实施例中,可执行图8中所示的流程800。 流程800提供根据示例实施例的用于在表中显示视觉丰富的过程。可对于表的 一个或多个列执行流程800。描述流程800如下。

在步骤802,选择与列中的每个数据值相对应的视觉丰富集中的视觉丰富。 例如,表的列在该列的不同行中可包括不同数据值,并且可为该列选择视觉丰 富集。列修改器414可对于每个不同的数据值从视觉丰富集中选择不同的视觉 丰富(例如,不同颜色、不同符号、不同图像等)。

在步骤804,为列的每个数据值显示相对应的所选的视觉增强。列修改器 414可被配置成在表108中显示为每个数据值选择的视觉增强。

例如,在一实施例中,列修改器414可在数据值的列和行中显示为该数据 值选择的视觉增强。例如,在一实施例中,列修改器414可执行图9中所示的 步骤902。在步骤902,显示视觉丰富集中的至少一个视觉丰富作为列的背景。

在另一实施例中,列修改器414可在表的新列中显示为数据值选择的视觉 增强。例如,在一实施例中,列修改器414可执行图10中所示的流程1000。 在流程1000的步骤1002,将新列插入到表中。在流程1000的步骤1004,在 新列中显示视觉丰富集中的视觉丰富。

例如,图11示出根据实施例的图6的窗口600,其中所选的增强数据被包 括在经增强的表1102中。参考图7,与窗口600交互的用户可选择向表606添 加“男性/女性颜色”和“男性/女性符号”。丰富检索器410可本地地获取相 对应的颜色和/或符号(例如,作为本地增强信息106a)和/或远程地获取相对应的 颜色和/或符号(例如,作为远程增强信息106b)。图11的经增强的表1102是表 606的经修改形式,其中根据图9的步骤902(向列添加背景颜色)和根据流程 1000(向新列添加符号)结合了所接收的修改。

如图11所示,经增强的表1102包括表606的列608a-608e(列608f在图 11中不可见,但可存在于更右侧),并且包括新列1104。列修改器414通过向 列608c的背景添加颜色(在图11中示为灰度)来修改列608c。列608c的每个不 同数据值被分配相对应的背景颜色。例如,对于列608c的行2、3、5和9中的 数据值“男性”,列608c中行2、3、5和9的背景被改为蓝色(示为第一量的 灰度阴影)。此外,对于列608c的行4和6-8中的数据值“女性”,列608c中 行4和6-8的背景被改为红色(示为第二量的灰度阴影)。

此外,新列1104被添加在列608c和608d之间。新列1104具有标签“男 性/女性符号”,并包括对于列608c中每个相对应的数据值的男性/女性符号。 例如,对于列608c的行2、3、5和9的每一行中存在的数据值“男性”,列 1104在行2、3、5和9中包括男性符号。此外,对于列608c的行4和6-8中 存在的数据值“女性”,列1104在行4和6-8的每一行中包括女性符号。

在另一示例中,图12示出根据实施例的图6的窗口600,其中所选的增强 数据被包括在经增强的表1202中。例如,参考图7,与窗口600交互的用户可 选择向表606添加“国旗图像”。丰富检索器410可本地地获取相对应的国旗 图像(例如,作为本地增强信息106a)和/或远程地获取相对应的国旗图像(例如, 作为远程增强信息106b)。图12的经增强的表1202是表606的经修改形式, 其中根据流程1000(向新列添加国旗图像)结合了所接收的修改。

如图12所示,经增强的表1202包括表606的列608a-608e(列608f在图 12中不可见,但可存在于更右侧),并且包括新列1204。新列1204被添加在列 608d和608e之间。新列1204具有标签“国旗”,并包括相邻列608d中各个 对应数据值的国旗图像。例如,对于列608d的行2、3、5和7的每一行中存 在的数据值“US”,列1204在行2、3、5和7中包括美国国旗图像。对于列 608d的行4和8的每一行中存在的数据值“CA”,列1204在行4和8中包括 加拿大国旗图像。此外,对于列608d的行6和9中存在的数据值“UK”,列 1204在行6和9的每一行中包括英国国旗图像。

如此,列修改器414允许对表进行视觉增强。此外,参考数据可被自动收 集并添加到表。例如,在一实施例中,在图3的步骤308选择的丰富信息可包 括一个或多个参考数据集。可收集任何类型的参考数据。出于说明的目的,可 在表中呈现的数据的示例类别列出如下,并且可为其检索的相对应的参考数据 集的示例也被列出:

国家和地区(例如,“布基纳法索”):人口、GDP(国民生产总值)、首都、 最大城市等。

美国州(例如,“田纳西州”或“TN”):面积、地方长官名字、昵称、州 花等。

河流(例如,“亚马逊河”):发源地、长度等。

城镇(例如,“芝加哥”):州、市长名字、海拔等。

音乐家(例如,“约翰·列侬”):生日、出生地、国籍等。

演员(例如,“奥黛丽·赫本”):生日、出生地、国籍等。

政治家(例如,“安瓦尔·萨达特”):生日、出生地、国籍等。

美国总统(例如,“扎卡里·泰勒”):生日、出生地、政党等。

棒球运动员(例如,“魏德·巴格斯”):比赛、击球、自责分率(ERA)、位 置等。

化学元素(例如,“氦”):原子序数、发现者、原子量等。

化学化合物(例如,“异丙醇”):化学式、熔点、沸点、密度等。

恒星(例如,“参宿四”):星座、距离、质量、温度等。

行星(例如,“土星”):卫星数量、白天长度、距太阳距离、大气等。

恐龙(例如,“迅猛龙”):高度、重量、生活时间等。

船(例如,“USS切萨皮克”):长度、排水量、定员、启用等。

公司(例如,“惠普”):雇员、CEO(首席执行官)、订单符号等。

参考数据集的这些示例出于说明的目的而提供,并不旨在限制。

在这种实施例中,可执行图13中所示的步骤1302。步骤1302是根据示例 实施例的用于在表的新列中显示参考数据作为所标识的增强数据的过程。可对 于表的一个或多个列执行步骤1302。在步骤1302,允许参考数据的至少一部 分被显示在表中。例如,在上述步骤306(图3),可针对表108的列检索包括参 考数据集的增强信息。列可在该列的不同行中包括不同的数据值。列修改器414 可针对每个不同数据值从参考数据集中选择不同的参考数据(例如,不同卫星数 量、不同州人口、不同高度等)。列修改器414可被配置成在表108中显示为每 个数据值选择的参考数据。

例如,图14示出根据实施例的图6的窗口600,其中所选的参考数据被包 括在经增强的表1402中。例如,参考图7,与窗口600交互的用户可选择向表 606添加“人口数据”。丰富检索器410可本地地获取相对应的人口数据(例如, 作为本地增强信息106a)和/或远程地获取相对应的人口数据(例如,作为远程增 强信息106b)。图14的经增强的表1402是表606的经修改形式,其中根据步 骤1302(向新列添加人口数据)结合了所接收的修改。

如图14所示,经增强的表1402包括表606的列608a-608e(列608f在图 14中不可见,但可存在于更右侧),并且包括新列1404。新列1404被添加在列 608d和608e之间。新列1404具有标签“人口”,并包括列608d中每个相对 应的数据值的人口数。例如,对于列608d的行2、3、5和7的每一行中存在 的数据值“US”,列1404在行2、3、5和7中包括美国人口为312,452,000的 参考数据值。对于列608d的行4和8的每一行中存在的数据值“CA”,列1404 在行4和8中包括加拿大人口为34,620,000的参考数据值。此外,对于列608d 的行6和9的每一行中存在的数据值“UK”,列1404在行6和9中包括英国 人口为62,435,709的参考数据值。可对经增强的表1402进行各种进一步和/或 替换类型的增强。例如,对经增强的表1402的增强的另一示例是包括其大小 与同一行中的人口数成比例的圆形或其它形状的附加列。

如此,在诸实施例中,视觉增强和/或参考数据可被添加到表的一个或多个 现有列和/或一个或多个附加列中。对于表的任何数量的列,视觉增强和/或参 考数据的任何组合可被添加到表中。当在文档编辑器工具中查看该表时,这种 增强信息可以是可见的。通过允许生成包括视觉增强和/或参考数据的表,数据 增强系统402向包括表的报告提供增强/丰富。注意,在一实施例中,在表中被 修改和/或被添加到表的列在表的显示窗口(例如,窗口600)中可被标识为已经 被丰富,例如通过在列的上方、下方或其它附近位置和/或在文档中别处的列名 附近显示丰富图标。

例如,在诸实施例中,可基于视觉增强和/或参考数据生成一个或多个图。 例如,图15示出根据示例实施例的包括图生成器1502的数据增强系统402的 框图。图生成器1502允许基于被添加到表的视觉增强和/或参考数据来生成图。

例如,如图15中显示的,图生成器1502可接收经增强的表110。用户可 与由图生成器1502(和/或由文档编辑器工具)生成的用户界面交互,以选择经增 强的表110的一个或多个列用于制图,或者图生成器1502可自动选择经增强 的表110的一个或多个列用于制图。如图15所示,图生成器1502可生成图数 据1504,该图数据可由显示器(例如,图4的显示器406)在窗口中显示为图。 经增强的表110的一个或多个列可包括参考数据,并且图可具有与参考数据列 相对应、以及与经增强的表110中包含的表108的原始列相对应的一个或多个 轴。此外,所检索的一个或多个视觉增强可在图中被显示为标绘点(例如,在标 绘国家人口数据(x轴)对国家销售数字的图中,国旗图像可被标绘为标绘点)。 如此,通过基于参考数据生成图并允许该图包括视觉增强,图生成器1502允 许数据增强系统402向包括表的报告提供甚至更大的增强/丰富。

在步骤312,允许用户接受所选的增强信息被存储在文档中。例如,如图 4所示,列修改器110生成经增强的表110,并且经增强的表110可由显示器 406显示。在一实施例中,由列修改器110提供给表110的增强可被自动保存(例 如,在源文档104中)。在另一实施例中,文档编辑器工具可允许用户手动保存 具有对经增强的表110的增强的文档104。如果用户选择保存文档104,则文 档104可被保存到存储。作为替换,用户可决定不保存具有经增强的表110的 文档104,和/或可使用文档编辑器工具的其它功能部件中的“撤消”功能部件 来去除一个或多个增强。

III.示例计算设备实施例

数据增强系统102、数据增强系统402、列分析器408、增强检索器410、 用户界面模块412、列修改器414、数据源520、搜索引擎522、参考门户524、 图生成器1502、流程300、流程800、步骤902、流程1000以及步骤1302可 以用硬件、软件、固件或它们的任何组合来实现。例如,数据增强系统102、 数据增强系统402、列分析器408、增强检索器410、用户界面模块412、列修 改器414、数据源520、搜索引擎522、参考门户524、图生成器1502、流程 300、流程800、步骤902、流程1000和/或步骤1302可以被实现为被配置成在 一个或多个处理器中执行的计算机程序代码。作为替换,数据增强系统102、 数据增强系统402、列分析器408、增强检索器410、用户界面模块412、列修 改器414、数据源520、搜索引擎522、参考门户524、图生成器1502、流程 300、流程800、步骤902、流程1000和/或步骤1302可以被实现为硬件逻辑/ 电路。例如,在一实施例中,数据增强系统102、数据增强系统402、列分析 器408、增强检索器410、用户界面模块412、列修改器414、数据源520、搜 索引擎522、参考门户524、图生成器1502、流程300、流程800、步骤902、 流程1000和/或步骤1302可以一起在片上系统(SoC)中实现。SoC可包括集 成电路芯片,该集成电路芯片包括以下一个或多个:处理器(如微控制器、微 处理器、数字信号处理器(DSP)等等)、存储器、一个或多个通信接口、和/ 或用于执行其功能的进一步的电路和/或嵌入的固件。

图16描绘了其中可以实现本发明的各实施例的计算机1600的示例性实 现。例如,计算机系统200、计算机系统400、服务器504、服务器506和/或 服务器508可以在与计算机系统1600类似的计算机系统中实现,其包括计算 机1600的一个或多个特征和/或替换特征。计算机1600可以是例如常规个人计 算机、移动计算机、服务器或工作站形式的通用计算设备,或者计算机1600 可以是专用计算设备。此处所提供的对计算机1600的描述只是为了说明,并 不是限制性的。如相关领域的技术人员所知道的,本发明的各实施例可以在其 他类型的计算机系统中实现。

如图16所示,计算机1600包括一个或多个处理器1602、系统存储器1604, 以及将包括系统存储器1606的各种系统组件耦合到处理器1604的总线1602。 总线1606表示若干类型的总线结构中的任何一种总线结构的一个或多个,包 括存储器总线或存储器控制器、外围总线、加速图形端口,以及处理器或使用 各种总线体系结构中的任何一种的局部总线。系统存储器1604包括只读存储 器(ROM)1608和随机存取存储器(RAM)1610。基本输入/输出系统1612(BIOS) 储存在ROM 1608中。

计算机1600还具有一个或多个以下驱动器:用于读写硬盘的硬盘驱动器 1614、用于读或写可移动磁盘1616的磁盘驱动器1618、以及用于读或写诸如 CD ROM、DVD ROM或其他光介质之类的可移动光盘1620的光盘驱动器 1622。硬盘驱动器1614、磁盘驱动器1616,以及光驱动器1620分别通过硬盘 驱动器接口1624、磁盘驱动器接口1626,以及光学驱动器接口1628连接到总 线1606。驱动器以及它们相关联的计算机可读介质为计算机提供了对计算机可 读指令、数据结构、程序模块,及其他数据的非易失存储器。虽然描述了硬盘、 可移动磁盘和可移动光盘,但是,也可以使用诸如闪存卡、数字视频盘、随机 存取存储器(RAM)、只读存储器(ROM)等等之类的其他类型的计算机可 读存储介质来储存数据。

数个程序模块可被储存在硬盘、磁盘、光盘、ROM或RAM上。这些程序 包括操作系统1630、一个或多个应用程序1632、其他程序模块1634以及程序 数据1636。应用程序1632或程序模块1634可包括例如用于实现数据增强系统 102、数据增强系统402、列分析器408、增强检索器410、用户界面模块412、 列修改器414、数据源520、搜索引擎522、参考门户524、图生成器1502、流 程300、流程800、步骤902、流程1000和/或步骤1302(包括流程300、800和 100中的任何步骤)和/或本文描述的进一步实施例的计算机程序逻辑(例如,计 算机程序代码)。

用户可以通过诸如键盘1638和定点设备1640之类的输入设备向计算机 1600中输入命令和信息。其他输入设备(未示出)可包括话筒、操纵杆、游戏 手柄、圆盘式卫星天线、扫描仪等。这些及其他输入设备常常通过耦合到总线 1602的串行端口接口1642连接到处理器1606,但是,也可以通过其他接口, 诸如并行端口、游戏端口、通用串行总线(USB)端口,来进行连接。

显示设备1644也通过诸如视频适配器1646之类的接口连接到总线1606。 除了监视器之外,计算机1600还可包括其他外围输出设备(未示出),如扬 声器和打印机。

计算机1600通过适配器或网络接口1650、调制解调器1652、或用于通过 网络建立通信的其他手段连接到网络1648(例如,因特网)。可以是内置的或 外置的调制解调器1652可以经由串行端口接口1642连接到总线1606,如图 16所示,或者可以使用包括并行接口的另一接口类型连接到总线1606。

如此处所用的,术语“计算机程序介质”、“计算机可读介质”以及“计算机 可读存储介质”被用于泛指介质,诸如与硬盘驱动器1614相关联的硬盘、可 移动磁盘1618、可移动光盘1622,以及其他介质,诸如闪存卡、数字视频盘、 随机读取存储器(RAM)、只读存储器(ROM)等。这些计算机可读存储介 质与通信介质(不包括通信介质)相区别且不重叠。通信介质通常在诸如载波 等已调制数据信号中承载计算机可读指令、数据结构、程序模块或者其它数据。 术语“已调制数据信号”是指具有以在信号中编码信息的方式被设定或改变其 一个或多个特征的信号。作为示例而非限制,通信介质包括无线介质,如声学、 RF、红外和其它无线介质。实施例也针对这些通信介质。

如上文所指示的,计算机程序和模块(包括应用程序1632及其他程序模 块1634)可被储存在硬盘、磁盘、光盘、ROM或RAM上。这样的计算机程 序也可以通过网络接口1650、串行端口接口1642或任何其他接口类型来接收。 这样的计算机程序,当由应用执行或加载时,使得计算机1600能实现此处所 讨论的本发明的特征。相应地,这样的计算机程序表示计算机1600的控制器。

本发明还涉及包括储存在任何计算机可使用介质上的软件的计算机程序 产品。这样的软件,当在一个或多个数据处理设备中执行时,使数据处理设备 如此处所描述的那样操作。本发明的各实施例使用现在已知的或将来已知的任 何计算机可使用或计算机可读介质。计算机可读介质的示例包括,但不仅限于, 诸如RAM、硬盘驱动器、软盘、CD ROM、DVD ROM、zip磁盘、磁带、磁 存储设备、光存储设备、MEM(存储器)、基于纳米技术的存储设备等等之类 的存储设备。

VI.结论

尽管上文描述了本发明的各实施例,但是,应该理解,它们只是作为示例 来呈现的,而不作为限制。那些精通有关技术的人员将理解,在不偏离如所附 权利要求书所定义的本发明的精神和范围的情况下,可以在形式和细节方面进 行各种修改。因此,本发明的范围不应该受到上述示例性实施例的任一个的限 制,而只应根据下面的权利要求和它们的等效内容进行定义。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号