首页> 中文学位 >面向文本的自动语义标注技术研究与实现
【6h】

面向文本的自动语义标注技术研究与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

插图索引

表格索引

符号对照表

缩略语对照表

目录

第一章 绪论

1.1 选题背景与意义

1.2 国内外研究现状

1.3 论文工作内容

1.4 论文组织结构

第二章 语义网和语义标注

2.1 语义网基础

2.2 命名实体识别

2.3 语义标注方法及分类

2.4 本章小结

第三章 基于条件随机场的命名实体识别

3.1 条件随机场模型

3.2 基于CRFs模型的命名实体识别算法

3.3 实验结果分析

3.4 本章小结

第四章 自动语义标注方法研究

4.1 自动语义标注方法基本框架

4.2 依存关系

4.3 基于依存树的关系抽取

4.4 实验结果分析

4.5 本章小结

第五章 自动语义标注系统的设计与实现

5.1 应用需求分析

5.2 系统详细设计

5.3 系统实现

5.4 系统测试

5.5 本章小结

第六章 总结与展望

参考文献

致谢

作者简介

1. 基本情况

2. 教育背景

展开▼

摘要

互联网在人类社会中扮演了越来越重要的角色,成为人们工作生活中主要的信息来源和交互平台。互联网所包含的海量数据资源中蕴含着海量信息,必须对数据进行有效地处理才能从中挖掘出有价值的信息。语义标注技术是将计算机无法直接处理的半结构化和非结构化的多媒体数据转变为语义数据的有效手段。语义标注是语义推理的基础,是以本体为指导、为多媒体数据添加概念实例、数据属性和对象属性的过程,使数据资源从机器可读上升到机器可理解,能够有效实现跨域多源数据资源的集成和共享,为上层数据资源的语义检索和管理提供支持。本文研究了一种面向中文文本的自动语义标注框架,主要工作包括三个方面:
  1.论文设计了一种自动语义标注框架,包括创建实例、概念标注和属性标注三个阶段。在前两个阶段中,利用命名实体识别算法完成对实体类、时间类和数字类命名实体的自动识别与概念标注。基于条件随机场模型的语义标注算法具有避免独立性假设、避免标注偏置、能够融合大量特征等特点,通过分析了不同实体类命名实体(人名、地名和机构名)的构词特征,并据此推断在具体的识别过程中使用的识别颗粒度(基于字或基于词)。最后通过实验验证了算法的有效性。
  2.在自动语义标注框架的属性标注阶段,论文利用句法分析器为中文语句构造句法依存树,考虑到对中文长句子的句法解析准确率较低情况,设计了针对中文长句的预处理方法。并基于句法依存树提出了7条启发式规则用于实现关系抽取。最后通过实验证实,预处理操作和启发式规则均能够较大程度上提升关系抽取算法的总体性能。
  3.基于自动语义标注框架和关系抽取方法,论文设计并实现了面向文本的自动语义标注系统。系统主要包括管理本体文件、自动创建实例、自动完成对实例的属性标注等功能,能够实现基于本体、面向文本的自动语义标注,并实现了自动标注功能和对本体的管理功能。系统测试结果表明,本文所开发的语义标注系统能够实现面向文本的自动语义标注,具有较高的性能表现和实用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号