首页> 中文期刊> 《中国生物医学工程学报》 >本体支持的生物医学领域元数据异质性与可兼容性研究

本体支持的生物医学领域元数据异质性与可兼容性研究

         

摘要

利用本体支持数据元素的表示,是提升元数据机器可理解性的重要手段.采用生物医学通用数据元素数据库caDSR中的数据,评价相关的数据元素之间的语义异质性,并利用机器学习对元数据可兼容性进行判别.首先,从caDSR中选取60对通用数据元素,涉及人口学、生活方式、既往病史和实验室测量等方面.依据ISO/IEC111179标准抽提数据元素的必要组分,利用NCIT的本体支持,就每对关联数据元素的相似度进行评价.依据数据元素内部各组分的语义相似度,利用支持向量机,对数据元素间的可兼容性做出预测,其准确度超过80%.研究结果显示,目前在caDSR数据库中,对于元数据的定义存在较大的异质性,这些异质性在数据元素的概念域尤其集中.虽然如此,通过机器学习的方法,还是能够依据现有的数据元素的定义实现数据可兼容性的自动判断.研究所建立的方法,对于优化数据元素构建流程、丰富数据标准化工具具有一定的应用价值.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号