首页> 中文学位 >数据库自然语言通用接口技术的研究
【6h】

数据库自然语言通用接口技术的研究

代理获取

目录

文摘

英文文摘

原创性声明及版权授权说明

第1章绪论

1.1国内外的研究状况

1.2存在问题

1.3研究的意义

1.4本文的工作

1.5本文的组织结构

第2章自然语言通用接口综述

2.1一般流程

2.2接口的特点

2.3基于规则的方法

2.4问题提出

2.4.1通用接口分析

2.4.2目标查询

2.5处理技术

2.5.1分词方法

2.5.2命名实体的研究

2.5.3句法结构的分析

2.5.4关键词的抽取

2.5.5关键词扩展

2.5.6知网(HowNet)介绍

2.6本章小结

第3章自然语言通用接口的问题理解技术

3.1数学模型

3.1.1分类体系

3.1.2数学模型

3.2知网的应用

3.3实验设计

3.4实验测试及结果分析

3.5问题分类的实现

3.6本章小结

第4章自然语言通用接口知识库和模式库技术

4.1知识库设计

4.1.1词典设计

4.1.2通用设计方法

4.1.3专用设计方法

4.2模式库设计

4.2.1设计思路

4.2.2结构设计

4.2.3检索算法

4.2.4结果分析

4.3本章小结

第5章基于模式分类的检索技术

5.1检索技术

5.1.1相似度计算

5.1.2问题提出

5.2分类设计

5.3特征的选取

5.4实验设计

5.5本章小结

第6章系统的整体实现及评价

6.1系统实现

6.1.1系统框架

6.1.2实验界面

6.2实验结果及评测

6.2.1评测指标

6.2.2对比实验

6.3本章小结

结 论

附录

参考文献

致谢

攻读硕士期间发表(含录用)的学术论文

展开▼

摘要

随着数据库应用及信息检索技术的广泛普及,越来越多的非专业用户需要一种易于掌握的界面去访问所需的信息。数据库自然语言接口(NLIDB)技术在这种需求中应运而生。NLIDB是人工智能领域的一个研究热点,是问答系统的一个重要的分支。NLIDB是指允许用户以某种自然语言(如汉语)的形式访问存储在数据库中的信息。它涉及了数据库系统、自然语言处理、人工智能、人机界面等多方面的知识。30多年来,NLIDB的研究取得了很大的进步,但在其通用性、可移植性等方面,还需要做进一步的工作。正是本着这一出发点,本文开展对数据库自然语言通用接口(NLTIDB)的研究。 命名实体识别是问答系统的关键技术之一。在对NLTIDB进行查询时将要涉及一些飞机名称等实体词,本文通过改进互信息计算的方法识别了查询语句中的命名实体,从而改善系统查询的效果。 本文设计了领域的知识库和模式库。为了使NLIDB具有通用性,我们在知识库方面设计了通用知识库和领域知识库;在模式库方面设计了一种含有多种信息标记的模式扩展结构,将问题模式、信息抽取模式和数据库信息添加到模式扩展结构中并保存在模式库里。知识库和模式库的设计可以极大减少领域信息嵌入代码的程度,并且为系统查询分析提供了资源条件,与NLTIDB配合有助于改善查询功能。 通常信息检索方法有关键词匹配和相似度计算两种方法,本文尝试使用层级最大熵的方法和支持向量机的方法进行信息检索。最大熵和支持向量机是机器学习的重要方法。本文以模式库作为检索资源,从词法、语块、句法和语义的层次分析找出特征向量并进行训练,通过机器学习的方法将问句从模式库中检索出相匹配的类型。实验证明机器学习的方法完成信息检索任务是可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号