公开/公告号CN103324749A
专利类型发明专利
公开/公告日2013-09-25
原文格式PDF
申请/专利权人 福建邮科通信技术有限公司;
申请/专利号CN201310281315.3
申请日2013-07-05
分类号G06F17/30(20060101);
代理机构35100 福州元创专利商标代理有限公司;
代理人蔡学俊
地址 350005 福建省福州市仓山区科技园6区1号
入库时间 2024-02-19 20:34:51
法律状态公告日
法律状态信息
法律状态
2016-06-22
授权
授权
2013-11-27
著录事项变更 IPC(主分类):G06F17/30 变更前: 变更后: 申请日:20130705
著录事项变更
2013-10-30
实质审查的生效 IPC(主分类):G06F17/30 申请日:20130705
实质审查的生效
2013-09-25
公开
公开
技术领域
本发明涉及文本地址空间化处理技术,特别是一种基于标准文本地址的空间化解析及纠偏方法。
背景技术
2012年,各GIS类业务系统陆续调用平台基础地图,平台也在面临着越来越多的需求挑战。其中标准地址空间库的建设需求在业务系统中尤为突出,资源系统正在对全省非标准地址按照电信行业地址规范进行标准化,但所获得的标准地址均为文本性的地址,无法进行可视化定位,虽然国内已建成全国1:25万等比例尺的地名数据库,但精度较低,暂无基于楼宇建筑的空间地名库的电信业务应用,其次,邮政、快递行业应用中所使用的地名库粒度较粗,一般到区、县、投递站粒度,以文本应用为主,而电信企业业务需精细到户的管理,还有电力、广电等行业目前地名应用也是以文本应用为主,其业务特点和数据模型与电信差别较大,而且目前国内较为成熟的GPS、导航等应用均以道路数据、POI兴趣点数据为主,建筑物数据极少;所以,电信自己急需建设自己的标准地址空间库,以满足电信业务精细化的管理。
发明内容
本发明的目的是提供一种基于标准文本地址的空间化解析及纠偏方法,能在地图上直观的表示出客户的分布情况,能大大提高客户位置的精度。
本发明采用以下方案实现:一种基于标准文本地址的空间化解析及纠偏方法,其特征在于:首先根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;然后进行经纬度解析,并对解析后的数据再进行纠偏处理,赋予文本地址空间信息。
在本发明一实施例中,所述经纬度解析按如下方式:
(1)、将需要空间化的标准地址通过谷歌地名地址进行解析,获得坐标结果写入 "X","Y"字段,结果保存为Access2007和Excel2003两种数据格式;
(2)、在原有字段基础上增加[UpdateAddress] ,[SecondAddress],[Bark]三个字段;
其中,[UpdateAddress]:标准化地址;
[SecondAddress]:定位地址;
[Bark]:特殊记录说明;
(3)、地址定位原则:
a.带有“道路”名称的定位到道路
b.带有“村”名称的定位到xx村;
c.带有“大道”名称的 定位到xx大道;
f.带有 "小学","中学","卫生院"、"xx局"、"政府"名称的,定位到其POI点;
g.对于以上仍然不能定位的情况,按照地址依次定位到所在乡、镇、县。
在本发明一实施例中,对于所述[Bark] 主要有以下几种情况:
已废弃:地址已经废弃;
再丢弃:地址已经丢弃;
再丢弃:地址已经废弃,但是定位到乡\镇\县;
再次标准化:较为重要POI,可以把地址做的更加详细;
再次标准化:较为重要POI,但是定位到乡\镇\县。
在本发明一实施例中,所述纠偏处理是:根据坐标点经纬度信息,确定其所在行政区域和经纬网,运用多元线性回归算法,找到影响坐标偏移的因子以及其权重,结合因子信息与权重信息,获得影响数据偏移的因子以及权重,从而确定解析方案,进行数据反偏移解析。
在本发明一实施例中,所述的影响坐标偏移的因子为8项。
本发明能在地图上直观的表示出客户的分布情况,能大大提高客户位置的精度,进而量化分析和科学决策在这个区域内,市场的占有率情况,并实现客户资源的空间管理,和对客户群进行成分分析,为以后的规划选址,开拓市场,有了很好的数据准备和决策依据。
具体实施方式
本发明根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;以OGC数据服务的形式进行接入应用,包括地址标准化、地址空间化、地址格式存储、地址接入应用;所述地址标准化为客户端应用程序,支持在PC电脑和智能手机上运行,实现客户与所述系统的交互;地址空间库是空间定位型的关系数据库,是将国家基本比例尺地形图上各类地名注记包括楼宇建筑物、居民地、水系、山脉、海洋、岛屿、沙漠等的名称,连同其属性特征、行政区域、所属道路、更新日期、XY坐标、经纬度位置信息等录入计算机建成的图形数据库。
本发明首先根据地址分级规范标准化地址,以Google地址解析进行地址空间化,采用树型结构进行存储建立的地址空间库;然后进行经纬度解析,并对解析后的数据再进行纠偏处理,赋予文本地址空间信息。
具体的,数据先从SRM的数据库读取(例如:三明市数据2900547条),以电信标准地址为根据按照研究的算法分批处理(县为单位)数据,从这些数据中抽取34W(343759)条来定位其经纬度。将这34W条数据利用经纬度解析工具自动解析其地址所对应的经纬度。
本发明中,还可以通过人为的对上述经纬度进行人工验证,该人工验证可以在经纬度存在问题时(比如地址解析出来的经纬度明显的不对、多条地址解析出来的经纬度一样等),所以解析出来的经纬度可以经过人工验证。比如有些地址的原始地址不能在谷歌地图上定位到,所以可能需要变换地址关键字对其再次定位;另或是一些地址需要重新删减地址的一部分才能在谷歌地图上进行定位;或是一些模糊的地址需要反馈给地址录入的单位对其确认。
数据处理有两个重要的步骤和流程,经纬度解析和数据逆偏,经纬度解析的具体说明如下:
1、将需要空间化的标准地址通过谷歌地名地址进行解析,获得坐标结果写入 "X","Y"字段,结果保存为Access2007和Excel2003两种数据格式。
2、在原有字段基础上增加
[UpdateAddress] ,[SecondAddress],[Bark]三个字段。
[UpdateAddress]:标准化地址
[SecondAddress]:定位地址
[Bark]:特殊记录说明
【 对于[Bark] 主要有以下几种情况:
已废弃:地址已经废弃;
再丢弃:地址已经丢弃;
再丢弃(定位到乡\镇\县):地址已经废弃,但是定位到乡\镇\县;
再次标准化:较为重要POI,可以把地址做的更加详细;
再次标准化(定位到乡\镇\县):较为重要POI,但是定位到乡\镇\县;】
3、地址定位原则:
a.带有“道路”名称的 定位到道路
【如果地址包含既“道路”又包含“xx厂或者xx公司”,按照实验结果,定位结果是一样的,且定位“道路”更准确】。
b.带有“村”名称的 定位到xx村;
c.带有“大道”名称的 定位到xx大道;
d.带有如“版洋”名称的 定位到xx版洋;
e.带有如“龙丁坂”名称的 定位到xx龙丁坂;
f.带有 如"小学","中学","卫生院"、"xx局"、"政府"等名称的,定位到其POI点;
g.对于以上仍然不能定位的情况,按照地址依次定位到所在乡、镇、县。
以此种方式对全省所有的需要空间化的标准地址进行解析,再将解析后的经纬度进行数据逆偏处理。
数据逆偏的方法概述如下:读取加密的经纬度数据之后,根据坐标点经纬度信息,确定其所在行政区域和经纬网,运用多元线性回归算法,找到影响坐标偏移的因子以及其权重,结合因子信息与权重信息,获得影响数据偏移的8项因子以及权重,从而确定解析方案,进行数据反偏移解析,从而得到准确的经纬度信息。数据准确率保证在10米以内。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
机译: 一种基于用户设备位置信息的DNS服务器将域名解析为多个IP地址的方法
机译: 基于分配地址分配的树状结构网络的网络节点的操作方法,一种网络的形成方法以及一种包括能够降低基于分布地址的树状结构网络的地址浪费的网络节点的系统
机译: 基于网络中动态路由和地址系统的信息搜索,信息匹配和信息提供-内容依赖的动态DNS(域名服务)=本地通用地址解析(LUAR)