首页> 外国专利> JOINING WEB DATA WITH SPREADSHEET DATA USING EXAMPLES

JOINING WEB DATA WITH SPREADSHEET DATA USING EXAMPLES

机译:使用示例将Web数据与电子表格数据结合起来

摘要

Provided are methods and systems for joining semi-structured data from the web with relational data in a spreadsheet table using input-output examples. A first sub-task performed by the system learns a string transformation program to transform input rows of a table to URL strings that correspond to the webpages where the relevant data is present. A second sub-task learns a program in a rich web data extraction language to extract desired data from the webpage given the example extractions. Hierarchical search and input-driven ranking are used to efficiently learn the programs using few input-output examples. The learnt programs are then run on the remaining spreadsheet entries to join desired data from the corresponding web pages.
机译:提供了使用输入-输出示例将电子表格中来自Web的半结构化数据与相关数据结合在一起的方法和系统。系统执行的第一子任务学习字符串转换程序,以将表的输入行转换为与存在相关数据的网页相对应的URL字符串。第二个子任务以丰富的Web数据提取语言学习程序,以给出示例提取来从网页中提取所需数据。分层搜索和输入驱动的排名用于使用很少的输入输出示例来有效地学习程序。然后,将在剩余的电子表格条目上运行所学习的程序,以将相应网页中的所需数据加入其中。

著录项

  • 公开/公告号US2018232351A1

    专利类型

  • 公开/公告日2018-08-16

    原文格式PDF

  • 申请/专利权人 MICROSOFT TECHNOLOGY LICENSING LLC;

    申请/专利号US201715633875

  • 发明设计人 RISHABH SINGH;JEEVANA PRIYA INALA;

    申请日2017-06-27

  • 分类号G06F17/24;H04L29/12;H04L29/08;G06F17/30;G06F3/0482;

  • 国家 US

  • 入库时间 2022-08-21 13:00:25

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号