一种基于语义及统计分析的Deep Web实体识别机制

寇月; 申德荣; 李冬; 聂铁铮

首页> 中文期刊>软件学报 >一种基于语义及统计分析的Deep Web实体识别机制

一种基于语义及统计分析的Deep Web实体识别机制

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

分析了常见的实体识别方法,提出了一种基于语义及统计分析的实体识别机制(deep Web entity identification mechanism based on semantics and statistical analysis,简称SS-EIM),能够有效解决Deep Web数据集成中数据纠错、消重及整合等问题.SS-EIM主要由文本匹配模型、语义分析模型和分组统计模型组成,采用文本粗略匹配、表象关联关系获取以及分组统计分析的三段式逐步求精策略,基于文本特征、语义信息及约束规则来不断精化识别结果;根据可获取的有限的实例信息,采用静态分析、动态协调相结合的自适应知识维护策略,构建和完善表象关联知识库,以适应Web数据的动态性并保证表象关联知识的完备性.通过实验验证了SS-EIM中所采用的关键技术的可行性和有效性.

著录项

来源
《软件学报》|2008年第2期|194-208|共15页
作者
寇月; 申德荣; 李冬; 聂铁铮;
展开▼
作者单位

东北大学,信息科学与工程学院,辽宁,沈阳,110004;

东北大学,信息科学与工程学院,辽宁,沈阳,110004;

东软集团有限公司,商用软件事业部,辽宁,沈阳,110179;

东北大学,信息科学与工程学院,辽宁,沈阳,110004;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机网络;
关键词
deep Web; 数据集成; 实体识别; 数据消重; 表象整合;
入库时间 2022-08-18 05:35:05

相似文献

中文文献
外文文献
专利

1. 一种基于领域本体的Deep Web实体信息提取的后处理方法 [J] . 余伟12 ,陶皖12 . 安徽工程大学学报 . 2016,第005期
2. 一种基于领域本体的Deep Web实体信息提取的后处理方法 [J] . 余伟 ,陶皖 . 安徽工程大学学报 . 2016,第005期
3. D-EEM:一种基于DOM树的Deep Web实体抽取机制 [J] . 寇月 ,李冬 ,申德荣 . 计算机研究与发展 . 2010,第005期
4. 基于语义Web Service的Deep Web动态竞争情报采集 [J] . 刘高勇 ,汪会玲 ,吴金红 . 情报杂志 . 2008,第003期
5. 一种Deep Web查询结果的实体抽取方法 [J] . 赵海霞 ,李道申 ,刘勇 . 计算机工程与应用 . 2012,第036期
6. D-EEM：一种基于DOM树的Deep Web实体抽取机制 [C] . 寇月 ,李冬 ,申德荣 . 2008中国计算机大会 . 2008
7. 基于DOM树的Deep Web实体抽取的研究与实现 [A] . 李冬 . 2008

一种基于语义及统计分析的Deep Web实体识别机制

摘要

著录项

相似文献

相关主题

期刊订阅