首页> 中文学位 >结合编辑距离和Google距离的语义标注方法研究
【6h】

结合编辑距离和Google距离的语义标注方法研究

代理获取

目录

文摘

英文文摘

1 绪 论

2 语义Web和本体

3 语义标注

4 结合编辑距离和Google距离的语义标注方法

5 实验与结果分析

6 总结与展望

致 谢

参考文献

附 录

展开▼

摘要

Web已经成为人类获取信息和得到服务主要方式之一,Internet技术的高速发展使它成为了一个庞大的知识库,但同时也带来了许多问题。首先,Web规模的膨胀使得整个Web上的有用信息无法得到有效的利用,人们在这海量的信息中获取“知识”的难度增大;其次,在当前Web中计算机的主要作用是显示信息,很少参与到信息的处理中,使得许多智能应用无法在Web上实现。语义Web便是在这种需求背景下产生的,旨在使Web文档具有机器可理解的语义,使不同平台中的数据得到共享和重用,便于人机之间进行交流和合作。这样,Web巨大的潜能才能得到充分发挥。
   这种机器可理解的语义信息,就是通过语义标注技术产生并添加到Web资源中的。语义标注是利用本体知识对网页中的概念或概念实例进行描述的。通过语义标注的作用,Web中的资源具有了语义,因此语义标注是实现语义Web的基础。
   本文首先介绍了语义Web相关知识背景,包括语义Web的起源、体系结构、本体知识等,阐述了语义标注的含义、它与本体之间的相互作用,以及在语义Web发展过程中的重要地位。
   然后,对当前存在的一些典型的语义标注系统进行深入分析和比较。针对这些标注系统的不足和缺陷,引入了语法和语义分析的思想,提出了一种结合编辑距离和Google距离的语义标注方法。该方法在领域本体的指导下,充分考虑了Web资源与本体在语法上的形似度和语义上的相关度,从这两方面综合度量两者之间的关联程度,从而用本体知识对资源进行有效的标注。其中,对标注结果还进行了分类处理:与本体关联程度高但在本体中尚无定义的实例,将其标注结果反馈到本体库中,对本体库进行扩充;与本体关联程度低的实例则反馈到词汇过滤表中,用于辅助对文档的预处理过程,这两个过程都是循环反馈的。
   其次,在对传统标注工具分析时发现这些工具几乎都无法直接标注word文档,为此,对word文档的特点分析后,将本文方法改进后直接标注word文档。
   最后,为了验证本文提出的语义标注方法的有效性,在葡萄酒领域设计和实现了语义标注实验。在实验中,分别针对Web文档和word文档进行了相应的测试。结果表明,本文提出的方法切实可行,标注性能良好,对领域文档的表达方式没有特别要求,并支持对word文档的语义标注,弥补了传统标注工具几乎无法直接标注以word文档表示的资源的不足之处。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号