首页> 中文学位 >语义搜索系统中的术语发现研究
【6h】

语义搜索系统中的术语发现研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.1.1 语义搜索系统

1.1.2 研究兴趣描述

1.1.3 术语发现

1.2 研究内容

1.3 内容安排

第二章 相关研究

2.1 基于unithood的术语发现

2.1.1 基于对数似然的方法

2.1.2 基于点互信息的方法

2.1.3 基于二值独立模型的方法

2.2 基于termhood的术语发现

2.2.1 基于词频的方法

2.2.2 基于术语内部结构的方法

2.2.3 基于对比度分析的方法

2.2.4 基于语境分析的方法

2.3 基于特征独立的术语发现

2.4 本章小结

第三章 基于STRBN模型的术语发现方法

3.1 术语的本质

3.2 TRBN模型

3.2.1 贝叶斯网简介

3.2.2 TRBN模型的构造

3.2.3 TRBN模型上的推理

3.3 STRBN模型

3.3.1 TRBN模型的简化

3.3.2 STRBN模型的构造

3.3.3 STRBN模型与其他模型的关系

3.3.4 STRBN模型的参数估计

3.3.5 STRBN模型的求解

3.4 STRBN模型中的特征

3.4.1 术语的重要性

3.4.2 术语的亲和性

3.4.3 术语的时间特性

3.4.4 术语的领域特性

3.5 基于STRBN模型的术语termhood值计算

3.6 本章小结

第四章 语义搜索系统中的术语发现模块

4.1 语义搜索系统的特点

4.2 语义搜索系统体系结构

4.3 术语发现流程

4.3.1 词性标注

4.3.2 语法过滤

4.3.3 特征计算

4.3.4 术语选择

4.4 实验结果与分析

4.4.1 基于特征独立的术语发现

4.4.2 基于特征组合的术语发现

4.4.3 基于STRBN模型的术语发现

4.5 术语在语义搜索系统中的应用

4.5.1 语义搜索系统中的本体

4.5.2 基于研究兴趣的搜索服务

4.6 本章小结

第五章 总结与展望

5.1 总结

5.2 展望

致谢

参考文献

作者简介

展开▼

摘要

语义搜索(SemanticSearch)是一种将语义Web技术与搜索系统相结合以提高搜索效果的技术。学术语义搜索系统是以特定领域的实体作为搜索对象的语义搜索系统,使用具有明确含义的术语描述特定领域。术语发现是学术语义搜索系统的关键技术之一,主要利用术语和论文之间的关系作为度量依据。但是本文中的学术语义搜索系统不提供论文正文,仅提供由论文标题和摘要构成的短文本语料库,限制了术语特征的度量。因此,本文提出一种新的术语发现方法,解决短文本语料库中的术语发现问题。
   在学术语义搜索系统中,与术语相关的实体包括研究人员、论文和特定领域的概念体系。本文首先利用术语和相关实体之间的关系,提出了术语的亲和性、时间特性和领域特性三种新特征。然后利用贝叶斯网(BayesianNetwork)描述特征之间的关系,构造简单的术语发现贝叶斯网(simpletermrecognitionbayesiannetwork,STRBN)模型。最后基于STRBN模型组合多个特征作为术语发现的依据。
   本文设计并实现了学术语义搜索系统中的术语发现模块,提出了基于STRBN模型的术语发现方法。术语发现模块使用来自电信和计算机领域的7,750,000个论文标题和4,500,000篇论文摘要构成的短文本语料库进行实验,基于STRBN模型的术语发现方法在精度上超过基线方法10%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号