一种基于领域本体的Deep Web实体信息提取的后处理方法

余伟; 陶皖

首页> 中文期刊>安徽工程大学学报 >一种基于领域本体的Deep Web实体信息提取的后处理方法

一种基于领域本体的Deep Web实体信息提取的后处理方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目前大多数的Deep Web信息抽取方法依赖Web页面结构,忽略了页面中包含的语义信息及关系,导致抽取结果不理想.针对此问题,提出一种基于领域本体的Deep Web实体信息后处理方法.首先,根据DOM树节点相似性原理和VSM(Vector Space Model)的余弦值方法确定数据区域和实体区域;然后,依据数据区域和实体区域的概念和实例构建领域本体,在领域本体的指导下对实体进行语义标注,将量化的标注结果添加到实体与本体的相似度计算中;最后,提出基于领域本体的实体信息抽取算法,获得实体中与本体相似度最大的子树.选取天气、图书、购物网站数据进行测试,实验结果表明,与已有方法相比,所提方法的F值提高了3.6％～4.9％.该方法不仅能减少抽取信息时对Web页面结构的依赖,而且能充分利用页面中的语义信息和关系,使得抽取结果更精确.

著录项

来源
《安徽工程大学学报》|2016年第5期|88-94|共7页
作者
余伟; 陶皖;
展开▼
作者单位

安徽工程大学计算机与信息学院,安徽芜湖241000;

安徽工程大学计算机应用技术重点实验室,安徽芜湖 241000;

安徽工程大学计算机与信息学院,安徽芜湖241000;

安徽工程大学计算机应用技术重点实验室,安徽芜湖 241000;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;人工智能理论;
关键词
Deep Web; 信息抽取; 实体区域定位; 领域本体; 后处理;
入库时间 2023-07-25 21:24:59

相似文献

中文文献
外文文献
专利

1. 一种基于领域本体的Deep Web实体信息提取的后处理方法 [J] . 余伟12 ,陶皖12 . 安徽工程大学学报 . 2016,第005期
2. 一种基于领域本体的Deep Web数据自动标注方法 [J] . 杨舟 ,岳亮 ,卓林 . 苏州大学学报（工科版） . 2011,第004期
3. Deep Web中一种基于本体和BP网络的模式匹配方法 [J] . 颜无瑕 ,曹宝香 . 济南大学学报（自然科学版） . 2011,第001期
4. 基于模板和领域本体的Deep Web信息抽取研究 [J] . 顾韵华 ,高原 ,高宝 . 计算机工程与设计 . 2014,第001期
5. 基于领域本体的Deep Web内容获取技术研究 [J] . 张明 ,刘宇 ,郗亚辉 . 广西师范大学学报（自然科学版） . 2011,第001期
6. 一种基于本体的面向特定领域的Web服务匹配方法 [C] . . 2008全国软件与应用学术会议(NASAC'08) . 2008
7. 一种基于领域本体的语义Web服务匹配和组合方法 [A] . 焦燕廷 . 2011

一种基于领域本体的Deep Web实体信息提取的后处理方法

摘要

著录项

相似文献

相关主题

期刊订阅