首页> 中文学位 >基于语音变量的RDF模糊查询方法研究
【6h】

基于语音变量的RDF模糊查询方法研究

代理获取

目录

声明

摘要

第1章绪论

1.1研究背景及意义

1.1.1研究背景

1.1.2研究目标及意义

1.2国内外研究现状

1.2.1 RDF/S查询

1.2.2模糊查询

1.2.3偏好查询

1.2.4 RDF模糊查询

1.2.5现有RDF模糊查询方法存在的问题

1.3本文工作

1.3.1研究内容

1.3.2论文结构

第2章基础理论与方法

2.1 RDF及查询方法

2.1.1 RDF

2.1.2 RDF查询定义及SPARQL语言

2.1.3 RDF查询方法

2.2模糊集理论

2.2.1经典集合和模糊集合定义

2.2.2模糊量词与语言层次结构

2.3模糊查询技术

2.3.1关系数据库的模糊查询

2.3.2 Web数据的模糊查询

2.4本章小结

第3章数值类型RDF模糊查询方法

3.1引言

3.2模糊SPARQL语法

3.2.1绝对量词的模糊SPARQL结构

3.2.2相对量词的模糊SPARQL结构

3.2.3模糊SPARQL语法

3.3绝对量词的模糊查询处理

3.3.1表示程度的模糊查询条件转换

3.3.2表示范围的模糊查询条件转换

3.3.3去模糊化转换规则

3.4相对量词模糊查询处理

3.4.1查询对象区间不确定的处理

3.4.2属性上的相对量词模糊查询处理

3.5方法验证

3.5.1绝对量词RDF模糊查询方法验证

3.5.2相对量词RDF模糊查询方法验证

3.5.3方法有效性分析

3.6本章小结

第4章文字类型RDF模糊查询方法

4.1引言

4.2语义词典基本概念

4.3扩展关键词的RDF模糊查询方法

4.3.1扩展的模糊SPARQL描述

4.3.2特定领域的RDF集模糊查询

4.3.3领域无关的RDF数据模糊查询

4.4方法验证

4.5本章小节

第5章支持偏好条件的RDF模糊查询方法

5.1引言

5.2偏好查询相关理论

5.3单极偏好RDF模糊查询方法

5.3.1包含偏好条件的模糊SPARQL语法结构

5.3.2模糊偏好查询处理方法

5.4双极偏好RDF模糊查询方法

5.4.1包含双极偏好条件的模糊SPARQL描述

5.4.2单变量双极偏好查询处理

5.4.3双变量双极偏好查询处理

5.4.4优化结果的排序方法

5.5方法验证

5.6本章小结

第6章RDF模糊查询系统的设计

6.1引言

6.2系统结构

6.3可视化的系统设计

6.3.1点选-录入方式

6.3.2 SPARQL方式

6.4模糊查询实现方法

6.4.1模糊条件处理

6.4.2模糊结果的手动调整

6.5系统可操作性验证

6.6本章小结

第7章总结与展望

7.1本文的主要贡献与结论

7.2 RDF数据查询方法研究展望及未来工作

参考文献

致谢

攻读博士期间发表的论文

展开▼

摘要

语义Web是对现有万维网的一种扩展,它赋予Web资源语义,使计算机能够理解Web信息。随着语义Web的发展,用于描述Web数据语义的RDF数据量飞速增长,有效获取RDF有用信息成为亟待解决的问题,致使RDF查询方法的研究日益得到关注。 针对RDF三元组方式的数据,传统的查询方法不能支持其数据的检索,众多机构或组织的研究者们针对RDF图数据的特点定义了多种查询语言,这些RDF查询语言是查询RDF数据获取其中所表达的语义信息的重要手段。常见的RDF查询语言多达几十种,应用最为广泛的是W3C组织发布的SPARQL语言。目前,基于SPARQL语言的RDF查询方法能较好地支持RDF的精确查询,然而实际应用中的信息获取有时需要通过模糊查询得到近似结果,当前已有一些工作致力于RDF的模糊查询,但其研究与应用主要集中在数据库框架下,要求用户以定量的方式表达模糊查询请求,而针对自然语言的模糊查询方式在现有的RDF模糊查询的研究中涉及较少。本研究以模糊集理论为基础,考虑用户日常查询的操作习惯,针对语义Web中存在的大量RDF数据,从满足普通用户模糊查询需求和偏好的角度入手,基于语言变量,以扩展标准SPARQL语言为前提,研究了不同类型RDF数据特点,提出数值类型RDF模糊查询方法和文字类型RDF模糊查询方法;分析了偏好特点,针对多模糊条件中包含偏好信息的单极性和双极性特点提出了单极偏好RDF模糊查询方法及双极偏好RDF模糊查询方法;基于提出的方法,构建了一个支持模糊条件的可视化RDF查询系统。本文的研究内容主要包括: (1)为解决使用隶属度表达查询条件模糊程度而造成的用户理解困难问题,提出了数据类型RDF模糊方法。首先,分析了使用隶属度的定量方式表达模糊的定性问题存在的弊端,从语言变量的模糊表达方式入手,扩展了经典SPARQL,以支持使用语言的方式表达模糊条件的描述:其次,针对数值型RDF数据特点,分析了绝对量词和相对量词模糊特征,提出了绝对量词及相对量词的模糊查询方法并基于模糊集理论给出了模糊条件转换规则;最后,构建了实验系统,运行典型实例,通过对结果的分析验证了方法的可行性。 (2)文字类型RDF模糊查询的关键问题是查询关键词的模糊匹配,综合应用《同义词词林》和《知网》的相关理论,提出了扩展关键词的RDF模糊查询方法。定义了词语距离计算公式,并将词语距离作为词语语义相似度的计算参数;给出了一个通过词语义原组合的方式计算词语语义相似度的公式,调用公式计算词语语义相似度并将语义相似度大予0.5的词语作为查询的扩展关键词,添加到查询关键词集合中,由此将查询中的模糊关键词转换为一组精确关键词,利用现有的SPARQL查询引擎实现文字类型RDF的模糊查询。最后,通过实验系统验证了所提方法的可用性。 (3)针对日常表达中包含的偏好信息,分析其偏好特点,将模糊查询中的偏好划分为单极偏好和双极偏好两类,并分别给出了对应的RDF偏好查询方法。使用语言的方式描述查询中的偏好条件;扩展了SPARQL语言支持偏好表达。针对单极偏好查询问题,通过偏好属性加权计算的方式计算偏好度,以偏好度为关键字调用排序机制优化结果实现偏好查询。双极偏好查询,调用语言变量的RDF模糊查询方法实现去模糊化转换后得到近似的结果,利用偏好满意度函数来评价结果符合双极偏好条件的程度,定义了一个优先度函数通过排序的方法实现结果优化。实验系统及相应的实验结果验证了所提方法的有效性。 (4)随着RDF查询方法的广泛研究,产生了一些RDF的查询验证系统,然而针对RDF的模糊查询尚未见到较为成熟的系统,为实现以用户为中心的操作,构建了一个RDF模糊查询系统,该系统隐藏了复杂的处理过程及用户难以理解的模糊参数,可较好地支持精确和模糊查询。通过可视化的操作界面能帮助用户较为容易地完成选择查询、组查询及偏好查询操作;提供了“点选-录入”操作和SPARQL语言两种查询方式,以满足普通用户及专业用户的不同查询习惯;设置了手动调整模糊匹配值的方式,帮助用户根据需求调整结果,以满足不同精度的模糊查询需要。

著录项

  • 作者

    王海荣;

  • 作者单位

    东北大学;

  • 授予单位 东北大学;
  • 学科 计算机应用技术
  • 授予学位 博士
  • 导师姓名 马宗民;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    语音; 变量; RDF; 模糊查询;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号