首页> 中国专利> Web信息抽取方法

Web信息抽取方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

Web信息抽取方法属于互联网技术领域。如何才能从冗杂的Web页面中抽取出需要的信息已经成为多数研究者希望解决的问题。Web信息抽取方法：基于特征比较法建立抽取规则的过程中计算结点相似度，具体步骤选择数据项特征，构建数据项特征，计算相似度；深度遍历整个DOM树完成后，就计算出了所有结点的综合相似度S，最终得到综合相似度S最大的结点，就是需要找的相似结点；相似结点对于的内容就是待抽取信息。本文针对互联网上煤矿安全事件信息的特点，提出了面向煤矿安全事件的Web信息抽取方法，为用户提供更加快速、准确的煤矿安全事件信息服务。

著录项

公开/公告号CN105677638B

专利类型发明专利
公开/公告日2018-10-09

原文格式PDF
申请/专利权人北京工业大学;
展开▼

申请/专利号CN201610005979.0
发明设计人沈琦;刘泽伟;李婧;陈博;王宇;
展开▼

申请日2016-01-05
分类号G06F17/27(20060101);
代理机构11203 北京思海天达知识产权代理有限公司;
代理人刘萍
地址 100124 北京市朝阳区平乐园100号
入库时间 2022-08-23 10:18:28

法律信息

法律状态公告日

法律状态信息

法律状态
2018-10-09

授权

授权
2016-07-13

实质审查的生效 IPC(主分类):G06F17/27 申请日:20160105

实质审查的生效
2016-07-13

实质审查的生效 IPC(主分类):G06F 17/27 申请日:20160105

实质审查的生效
2016-06-15

公开

公开
2016-06-15

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于HTML源代码和网页快照的Web信息抽取方法与系统 [P] . 中国专利： CN113312568A . 2021-08-27
2. 一种全程化Web信息抽取集成方法 [P] . 中国专利： CN104408101B . 2018.01.09
3. STEEL SHEET, TAILORED BLANK, HOT-PRESS FORMED ARTICLE, STEEL PIPE, HOLLOW QUENCHING FORMED ARTICLE, METHOD FOR MANUFACTURING STEEL SHEET, METHOD FOR MANUFACTURING TAILORED BLANK, METHOD FOR MANUFACTURING HOT-PRESS FORMED ARTICLE, METHOD FOR MANUFACTURING STEEL PIPE, AND METHOD FOR MANUFACTURING HOLLOW QUENCHING FORMED ARTICLE [P] . EP3812083A1 . 2021-04-28

机译：钢板，定制坯料，热压成型制品，钢管，中空淬火成型制品，制造钢板的方法，制造量身定制的空白，制造方法热压成型制品，制造钢管的方法，以及制造钢材的方法，以及制造钢材的方法，以及制造钢材的方法，以及制造钢管的方法，以及用于制造钢管的方法，以及制造钢管的方法，以及制造钢管的方法，以及用于制造钢管的方法，以及用于制造钢管的方法，以及用于制造钢管的方法，以及制造钢管的方法，以及制造钢管的方法，以及用于制造钢管的方法，以及制造钢管的方法，以及制造钢管的方法，以及用于制造钢管的方法，以及制造钢管的方法，以及制造钢管的方法，以及制造钢材的方法，以及制造钢管的方法，以及用于制造钢管的方法，方法制造中空淬火成型制品
4. METHOD FOR DETERMINING SOFTWARE, METHOD FOR USING SOFTWARE, RECORDING MEDIUM, PROCESSOR, METHOD FOR MAINTAINING SOFTWARE, METHOD FOR TRANSPORTING SOFTWARE, METHOD FOR MANAGING SOFTWARE, AND METHOD FOR PREPARING PROCESSING ROUTE DIAGRAM, METHOD FOR PREPARATING PALLET FUNCTION, METHOD FOR DECIDING PALLET REGION, METHOD FOR PREPARING PALLET-CHAIN-FUNCTION, METHOD FOR PREPARING PHASE ELEMENT, METHOD FOR PREPARING LOGICAL ELEMENT, METHOD FOR PREPARING OPERATION ELEMENT, METHOD FOR MOUNTING SOFTWARE, METHOD FOR DEVELOPING SOFTWARE, METHOD FOR REPLACING DATA STRUCTURE, METHOD FOR REPLACING DATA VALUE, METHOD FOR ANALIZING CONVENTIONAL PROGRAM, METHOD FOR DEVELOPING AND MANAGING SOFTWARE, METHOD FOR METHOD FOR APPLICATING AND MANAGING SOFTWARE, PARALLEL COMPUTER AND JUDGEMENT SUPPORTING DEVICE. [P] . 日本专利： JP2001005651A . 2001-01-12

机译：确定软件的方法，使用软件的方法，记录介质，处理器，维护软件的方法，运输软件的方法，管理软件的方法，准备工艺路线图的方法，准备托盘功能的方法，确定方法的方法准备托盘链功能的方法，准备阶段元素的方法，准备逻辑元素的方法，准备操作元素的方法，安装软件的方法，开发软件的方法，替换数据结构的方法，替换数据值的方法，方法对于常规程序的分析，软件的开发和管理方法，软件的应用和管理方法，并行计算机和判决支持设备。
5. DATA GENERATION DEVICE, DATA GENERATION METHOD, BASE STATION, MOBILE STATION, SYNCHRONIZATION DETECTION METHOD, SECTOR IDENTIFICATION METHOD, INFORMATION DETECTION METHOD AND METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, INFORMATION AND SYSTEM DETECTION METHOD, METHOD FOR DETECTING INFORMATION AND SYSTEM, SECTOR IDENTIFICATION, INFORMATION AND SYSTEM METHOD [P] . EA200970024A1 . 2009-06-30

机译：数据生成设备，数据生成方法，基站，移动站，同步检测方法，行业识别方法，信息检测方法和方法，信息和系统检测方法，信息和系统检测方法，信息和系统检测方法，方法，信息和系统检测方法，信息和系统检测方法，信息和系统检测方法，方法，信息和系统检测方法，信息和系统检测方法，信息和系统检测方法，信息和系统检测方法，信息和系统检测方法，行业识别，信息和系统方法