基于语义的文本地理范围提取方法

张毅; 王星光; 陈敏; 刘瑜

首页> 中文期刊>高技术通讯 >基于语义的文本地理范围提取方法

基于语义的文本地理范围提取方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了能够处理网页文档中的地理信息,提出了一个新颖的自动提取文本地理位置的方法.该方法通过一个三阶段的地理语义处理过程,实现了文本的多尺度地理标注.首先,在地理知识库的支持下,识别文本中的地名；其次,基于地理的和非地理的语义消除地名歧义并且应用证据理论合成排歧证据；最后,基于相关认知理论构建文本的地理参照树,再根据实体间的语义关系计算得到焦点地理实体,从而确定文本的地理位置.以上算法在地理信息检索原型系统GeoSeracher中得到实现,评估结果表明其具有较高的准确度.%To process geographic information in Web pages, this paper presents a novel method for extracting the geographic scopes of documents. It assigns the multi-scale geographic scope to a document through a three-stage process for dealing with geographic semantics. Firstly, the toponyms in a document are recognized under the support of the geographic knowledge base. Secondly, the ambiguous toponyms are disambiguated based on geographic and non-geographic semantics, and the evidences for disambiguation are combined by the evidence theory. Lastly, a geo-referenced tree is constructed based on a cognitive theory and the geographic focuses are obtained according to sematic relationships. The geographic location of a document is therefore determined. The above method was implemented in GeoSearcher, a prototype system for geographic information retrieval. The evaluation results show that the proposed method can reach the higher accuracy.

著录项

来源
《高技术通讯》|2012年第2期|165-170|共6页
作者
张毅; 王星光; 陈敏; 刘瑜;
展开▼
作者单位

北京大学遥感与地理信息系统研究所北京100871;

北京大学遥感与地理信息系统研究所北京100871;

北京大学遥感与地理信息系统研究所北京100871;

北京大学遥感与地理信息系统研究所北京100871;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
地理信息检索(GIR); 文本地理范围; 证据理论;

相似文献

中文文献
外文文献
专利

1. 基于多语义因子分层聚类的文本特征提取方法 [J] . 王靖 ,柳青 ,张德海 . 计算机应用研究 . 2020,第010期
2. 基于潜在语义分析的文本指纹提取方法 [J] . 崔彤彤 ,崔荣一 . 中文信息学报 . 2018,第005期
3. 基于潜在语义索引和遗传算法的文本特征提取方法 [J] . 郝占刚 ,王正欧 . 情报科学 . 2006,第1期
4. 一种自发性口语评测文本语义相似度评分特征提取方法 [J] . 宋阳 ,王岚 . 集成技术 . 2013,第001期
5. 基于文本特征提取方法的文本分类研究 [J] . 文峤 . 电脑知识与技术 . 2018,第018期
6. 基于文本语义相似度的文本语义关系标注 [C] . 秦春秀 ,赵捧未 . 第二十届全国计算机信息管理学术研讨会 . 2006
7. 基于语义的中文文本特征提取方法研究 [A] . 于群 . 2017

基于语义的文本地理范围提取方法

摘要

著录项

相似文献

相关主题

期刊订阅