面向列语义识别的共现属性交互模型构建与优化

高珊; 袁宛竹; 卢卫; 王兰; 张静; 杜小勇

首页> 中文期刊> 《软件学报》 >面向列语义识别的共现属性交互模型构建与优化

面向列语义识别的共现属性交互模型构建与优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

政务数据治理正在经历从“物理数据汇聚”到“逻辑语义汇通”的新阶段.逻辑语义汇通是指针对各孤岛政务系统因长期“自治”而形成的元数据缺失、元数据同名不同义以及同义不同名等问题,在不重建或修改原系统代码以及不物理汇聚各政务数据的前提下,通过技术手段,统一各孤岛信息系统元数据的语义表达,实现元数据的语义互联互通.该工作是将各孤岛信息系统的元数据语义对齐到已有的标准元数据上,具体地,将标准元数据名称看作语义标签,对孤岛关系数据的列投影进行语义识别,从而建立列名和标准元数据的语义对齐,实现孤岛元数据标准化治理.已有基于列投影的语义识别技术无法捕捉到关系数据的列顺序无关性特征以及属性语义标签之间的相关性特征,针对这一问题,提出了基于预测阶段和纠错阶段的两阶段模型:在预测阶段,提出了共现属性交互的CAI模型(co-occurrence-attribute-interactionmodel),利用并行化的自注意力机制保证列顺序无关的共现属性交互;在纠错阶段,结合语义标签之间的共现性,通过引入纠错机制(correction mechanism),优化CAI模型预测结果.在政务基准数据和Magellan等多组公开英文数据集上进行了实验,结果表明,引入纠错机制的两阶段模型,在宏平均和加权平均两个指标上,比已有最优模型最多可分别提高20.03%, 13.36%.

著录项

来源
《软件学报》 |2023年第3期|1010-1026|共17页
作者
高珊; 袁宛竹; 卢卫; 王兰; 张静; 杜小勇;
展开▼
作者单位

数据工程与知识工程教育部重点实验室(中国人民大学);

中国人民大学信息学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
孤岛政务; 逻辑语义汇通; 列语义识别; 共现交互; 注意力机制;

相似文献

中文文献
外文文献
专利

1. 基于共现潜在语义向量空间模型的语义核构建 [J] . 牛奉高 ,张亚宇 . 情报学报 . 2017,第008期
2. 面向Web文本语义挖掘的SKR/MetaMap输出概念共现分析系统的开发尝试 [J] . 黄亚明 ,李国胜 . 现代图书情报技术 . 2007,第001期
3. 基于语义共现图的中文微博新闻话题识别 [J] . 王路路 ,郑涛 ,程倩倩 . 计算机工程与应用 . 2014,第017期
4. 共现潜在语义向量空间模型的进一步研究 [J] . 牛奉高 ,李星 . 情报杂志 . 2017,第012期
5. 基于词项共现关系图模型的中文观点句识别研究 [J] . 王明文 ,付翠琴 ,徐凡 . 中文信息学报 . 2015,第006期
6. 基于词共现和语义分析的开放分类聚类研究 [C] . JIA Zhen ,贾真 ,YIN Hongfeng . 2012全国高性能计算学术年会 . 2012

面向列语义识别的共现属性交互模型构建与优化

摘要

著录项

相似文献

相关主题

期刊订阅