首页> 中文学位 >中文文本空间关系标注方法研究
【6h】

中文文本空间关系标注方法研究

代理获取

摘要

自然语言与GIS的集成是目前GIS的重要研究方向之一。由于自然语言的词汇、句法和语义都存在不确定性,通过设计标注体系和语料标注实现自然语言的形式化,有助于计算机获得更丰富、更有价值的空间信息,从而提高语言处理水平。不同应用中的空间语言存在很大差异,研究者通常根据不同目的选择不同的结构化方式。面向GIS的空间语言形式化需要充分考虑GIS和自然语言中地理信息的表达方式。空间关系是地理信息的重要组成部分,本文围绕中文文本中空间关系标注方法展开的研究,主要研究内容和成果包括三个部分:
   (1)设计面向中文文本的地理命名实体和空间关系标记语言。标记语言是构建空间关系语料库的基础,本文参考现有地理信息标记语言,在分析中文文本和GIS中地理命名实体和空间关系的表达特点的基础上,设计了相应的标记语言。
   (2)制定中文文本中地理命名实体和空间关系标注规范。通过分析和实际标注地理命名实体和空间关系,将其在中文文本中的多种描述方式总结归类,并举例说明不同情况如何标注,以规范语料库标注,使标注方式尽可能统一。
   (3)构建地理命名实体和空间关系标注语料库。为验证本文的标注方法,选取《中国大百科全书(地理分册)》为数据源,自然语言处理软件GATE为标注平台,构建地理命名实体和空间关系标注语料库。该语料库为文本中地理信息抽取、空间场景构建等研究提供了数据基础。
   本文研究表明,在充分考虑中文文本和GIS中空间关系描述特征的基础上,制定中文文本空间关系标记语言和标注规范,可以有效地标注中文文本中的空间关系,为文本中空间关系抽取和场景构建提供了数据基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号