一种基于XML和规则库的专利数据抽取方法

常国锋; 苗长芬

首页> 中文期刊> 《新乡学院学报：自然科学版》 >一种基于XML和规则库的专利数据抽取方法

一种基于XML和规则库的专利数据抽取方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

通过对现有网页数据抽取方法的分析,结合专利网页数据的特点,提出了一种基于XML文件和规则库的专利数据抽取方法。通过自定义标签对网页进行格式化,克服了以往网页采集中只针对和标签进行分割提取数据的不足,实现了专利数据的有效采集。实验结果表明该方法具有很高的准确性和适用性。

著录项

来源
《新乡学院学报：自然科学版》 |2014年第6期|30-32|共3页
作者
常国锋; 苗长芬;
展开▼
作者单位

新乡学院计算机与信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机网络;
关键词
XML; 规则库; 专利; 抽取;

相似文献

中文文献
外文文献
专利

1. 一种基于XML和规则库的专利数据抽取方法 [J] . 常国锋 ,苗长芬 . 新乡学院学报：自然科学版 . 2014,第006期
2. 一种基于XML的Web信息抽取方法 [J] . 陈佳 ,胡燕 ,轩艳艳 . 计算机与数字工程 . 2007,第006期
3. 一种基于XML的Web信息抽取方法 [J] . 李剑波 ,李小华 ,董树明 . 情报杂志 . 2006,第008期
4. 一种基于XML的Web数据抽取的实现 [J] . 李雪竹 . 科学技术与工程 . 2008,第009期
5. 基于键规则的XML实体抽取方法 [J] . 刘显敏 ,李建中 . 计算机研究与发展 . 2014,第001期
6. 基于规则库的电子病历信息抽取研究 [C] . 苏韶生 ,杨勇 ,程敏婷 . 2014中华医院信息网络大会 . 2014
7. 基于XML的网页结构复用及抽取方法研究 [A] . 陶湘龙 . 2007

1. 基于XML中间模型安全检测规则库的建立方法 [P] . 中国专利： CN102279792A . 2011-12-14

2. 一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法 [P] . 中国专利： CN105069560B . 2018.05.01

3. AUTOMATION METHOD FOR SERIES OF OPERATION CONCERNING CONSTRUCTION OF CLASSIFICATION RULE BASE USED FOR MORPHEME ANALYSIS OF JAPANESE LANGUAGE, STRUCTURE OF BASIC RULE BASE AND OUTPUT DATABASE NECESSARY TO AUTOMATE CONSTRUCTION OF CLASSIFICATION RULE BASE AND COMPUTER READABLE RECORDING MEDIUM WITH AUTOMATED PROGRAM FOR CONSTRUCTION OF CLASSIFICATION RULE BASE INCLUDING BASIC RULE BASE RECORDED THEREON [P] . 外国专利： JP2002358317A . 2002-12-13

机译：用于日语语言形态分析，基本规则库和输出数据库的分类规则库构建的一系列操作的自动化方法，对于分类规则库的自动构建和具有记录的计算机自动读取是必要的包括记录的基本规则

4. A method for executing a process based on an XML process language, particularly a process based on the BPEL language [P] . 外国专利： EP2028610A1 . 2009-02-25

机译：一种用于基于XML流程语言执行流程的方法，尤其是基于BPEL语言的流程

5. Expression e.g. XML Path expression, evaluating method for processing XML data flow, involves evaluating each sub-expression relative to location path on data of structured document using XML path browser [P] . 外国专利： FR2908539A1 . 2008-05-16

机译：表达例如XML路径表达式，一种处理XML数据流的评估方法，涉及使用XML路径浏览器评估相对于结构化文档数据上的位置路径的每个子表达式

相关主题

一种基于XML和规则库的专利数据抽取方法

摘要

著录项

相似文献

相关主题

期刊订阅