面向文本的自动语义标注技术研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网在人类社会中扮演了越来越重要的角色，成为人们工作生活中主要的信息来源和交互平台。互联网所包含的海量数据资源中蕴含着海量信息，必须对数据进行有效地处理才能从中挖掘出有价值的信息。语义标注技术是将计算机无法直接处理的半结构化和非结构化的多媒体数据转变为语义数据的有效手段。语义标注是语义推理的基础，是以本体为指导、为多媒体数据添加概念实例、数据属性和对象属性的过程，使数据资源从机器可读上升到机器可理解，能够有效实现跨域多源数据资源的集成和共享，为上层数据资源的语义检索和管理提供支持。本文研究了一种面向中文文本的自动语义标注框架，主要工作包括三个方面：
　　1.论文设计了一种自动语义标注框架，包括创建实例、概念标注和属性标注三个阶段。在前两个阶段中，利用命名实体识别算法完成对实体类、时间类和数字类命名实体的自动识别与概念标注。基于条件随机场模型的语义标注算法具有避免独立性假设、避免标注偏置、能够融合大量特征等特点，通过分析了不同实体类命名实体（人名、地名和机构名）的构词特征，并据此推断在具体的识别过程中使用的识别颗粒度（基于字或基于词）。最后通过实验验证了算法的有效性。
　　2.在自动语义标注框架的属性标注阶段，论文利用句法分析器为中文语句构造句法依存树，考虑到对中文长句子的句法解析准确率较低情况，设计了针对中文长句的预处理方法。并基于句法依存树提出了7条启发式规则用于实现关系抽取。最后通过实验证实，预处理操作和启发式规则均能够较大程度上提升关系抽取算法的总体性能。
　　3.基于自动语义标注框架和关系抽取方法，论文设计并实现了面向文本的自动语义标注系统。系统主要包括管理本体文件、自动创建实例、自动完成对实例的属性标注等功能，能够实现基于本体、面向文本的自动语义标注，并实现了自动标注功能和对本体的管理功能。系统测试结果表明，本文所开发的语义标注系统能够实现面向文本的自动语义标注，具有较高的性能表现和实用价值。

著录项

作者
崔愉;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科计算机科学与技术
授予学位硕士
导师姓名陈平;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
语义标注; 命名实体识别; 关系抽取; 交互平台;

相似文献

中文文献
外文文献
专利

1. 面向答疑文本的词类标注方法的研究与实现 [J] . 王朝静 ,郑庆华 . 计算机工程与应用 . 2004,第016期
2. 面向生物文本挖掘的语义标注研究 [J] . 陈波12 ,吕晨2 ,魏小梅2 . 湖北文理学院学报 . 2015,第007期
3. 面向生物文本挖掘的语义标注研究 [J] . 陈波 ,吕晨 ,魏小梅 . 湖北文理学院学报 . 2015,第007期
4. 面向文本文档的语义标注研究综述1） [J] . . 情报学报 . 2014,第004期
5. 面向语义出版的学术文本词汇语义功能自动识别 [J] . 程齐凯 ,李信 . 数字图书馆论坛 . 2017,第008期
6. 基于文本语义相似度的文本语义关系标注 [C] . 秦春秀 ,赵捧未 . 第二十届全国计算机信息管理学术研讨会 . 2006
7. 图像的自动语义标注技术研究与实现 [A] . 王宝琛 . 2008

面向文本的自动语义标注技术研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅