基于伪属性语义匹配的Deep web信息抽取

郑皎凌; 唐常杰; 姜; 杨宁; 李红军

首页> 中文期刊>四川大学学报（工程科学版） >基于伪属性语义匹配的Deep web信息抽取

基于伪属性语义匹配的Deep web信息抽取

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

已有的Deep Web信息抽取算法主要对结构规范的网页进行模版的提取,目前多数Deep Web网页在结构上是非规范的,网页中记录属性字段可能缺失或重复、原子属性字段可能被html标签分隔.为了正确抽取这些非规范网页,提出了一种新方法:引入了记录的伪属性及其语义匹配概念,通过实现记录间伪属性序列的语义匹配实现信息抽取;提出了伪属性序列的模型及其语义匹配算法和记录Wrapper模型及其生成算法.实验表明,在结构不规范deep web网页的抽取上,能达到91%的查全率和93%的查准率,相对其它算法有一定优势.

著录项

来源
《四川大学学报（工程科学版）》|2009年第2期|173-178|共6页
作者
郑皎凌; 唐常杰; 姜; 杨宁; 李红军;
展开▼
作者单位

四川大学,计算机学院数据库与知识工程研究所,四川,成都,610065;

成都信息工程学院,软件工程系,四川,成都,610225;

四川大学,计算机学院数据库与知识工程研究所,四川,成都,610065;

四川大学,计算机学院数据库与知识工程研究所,四川,成都,610065;

四川大学,计算机学院数据库与知识工程研究所,四川,成都,610065;

四川大学,计算机学院数据库与知识工程研究所,四川,成都,610065;

西南科技大学,计算机学院,四川,绵阳,621010;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
dee pweb; 信息抽取; 伪属性; 语义匹配;

相似文献

中文文献
外文文献
专利

1. 一种基于视觉特征的Deep Web信息抽取方法 [J] . 孙璐 ,陈军华 ,廉德胜 . 计算机与数字工程 . 2016,第006期
2. 基于模板和领域本体的Deep Web信息抽取研究 [J] . 顾韵华 ,高原 ,高宝 . 计算机工程与设计 . 2014,第001期
3. 基于节点属性与正文内容的海量Web信息抽取方法 [J] . 王海艳 ,曹攀 . 通信学报 . 2016,第010期
4. 基于属性值序列图模型的deep Web新数据发现策略 [J] . 鲜学丰 ,崔志明 ,赵朋朋 . 通信学报 . 2016,第003期
5. 一种基于中文Deep Web的属性相似度计算方法 [J] . 高华玲 . 科技创新导报 . 2014,第032期
6. 一种带属性约束的Web服务语义匹配方法的研究 [C] . FENG Jian-Zhou ,冯建周 ,KONG Ling-Fu . 2012年第三届中国计算机学会服务计算学术会议 . 2012
7. 基于视觉分块与语义DOM的Deep Web信息抽取研究 [A] . 孙璐 . 2016

基于伪属性语义匹配的Deep web信息抽取

摘要

著录项

相似文献

相关主题

期刊订阅