首页> 中国专利> 一种基于信息熵的地理曲线曲折度度量方法

一种基于信息熵的地理曲线曲折度度量方法

摘要

本发明公开了一种基于信息熵的地理曲线曲折度度量方法,涉及地理信息科学技术领域,本发明依次完成识别弯曲单元、叠加确定不同尺度下的弯曲嵌套关系并建立弯曲层次树、删除无效弯曲和基于信息熵理论度量地理曲线的曲折度的工作,采用将尺寸复杂度和层次复杂度相结合的综合复杂度的进行曲折度的描述,完整地展现了曲线的部分与整体曲折度,同时较为全面地考虑了弯曲不同层次间的嵌套关系,克服了现有技术的缺陷,可以较好地描述曲线曲折度,全面地反映曲线的形态和结构特征,受曲线长度影响小,充分利用弯曲层次树完整反映弯曲之间的邻近关系与层次特性,并采用信息熵理论度量复杂度,易于操作实现,对地理特征的研究具有重要意义。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-09

    专利权的转移 IPC(主分类):G06F16/29 专利号:ZL2016104106790 登记生效日:20220829 变更事项:专利权人 变更前权利人:安徽大学 变更后权利人:合肥深蓝空间智能科技有限公司 变更事项:地址 变更前权利人:230601 安徽省合肥市经济技术开发区九龙路111号 变更后权利人:230000 安徽省合肥市高新区黄山路602号合肥国家大学科技园C311 变更事项:专利权人 变更前权利人:杨传勇 高园园 谭树东 殷志祥 胡海 变更后权利人:

    专利申请权、专利权的转移

  • 2019-07-23

    授权

    授权

  • 2016-11-23

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160603

    实质审查的生效

  • 2016-10-26

    公开

    公开

说明书

技术领域

本发明涉及地理信息科学技术领域,具体涉及一种基于信息熵的地理曲线曲折度度量方法。

背景技术

地理曲线的曲折度是一种地理特征曲线的描述方法,和曲线本身所蕴含的地理特征有重要关系,对地理特征的研究具有重要意义,而常用的地理特征描述方法描述十分不清晰,如海岸线的曲折度描述多用“极为曲折”、“较为曲折”、“相对平直”等模糊概念进行判断,缺乏明确的判断指标,非常不利于领海基线类型的确定;因此,定量表达曲线曲折度具有重要的应用价值。

目前主要采用基于曲折度指数、基于角度量算以及分形维等方法对地理曲线曲折度进行度量。曲折度指数是一个可以反映线要素整体形态的量化指标,曲折度指数数值越大,则曲线越复杂,但曲折度指数不能反映复杂嵌套的短曲线的曲折度,无法全面的反映曲线的形态;基于角度量算的曲折度度量方法将曲线上直线段之间的角度值相加,用相加的结果来表示曲线的复杂度,但是这种表示方法受曲线长度的影响;分形维方法主要研究不规则事物的自相似性,但分形维值只是一个统计量,它仅能反映曲线的整体情况,而无法与曲线具体的弯曲单元对应,分形维只是曲线的一个特性,通过分形维不能得到曲线的其他结构特征,均无法针对各种长度地曲线全面地反应其曲线形态及结构特征。

发明内容

(一)解决的技术问题

本发明所要解决的技术问题是提供了一种基于信息熵的地理曲线曲折度度量方法,以解决上述问题。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:一种基于信息熵的地理曲线曲折度度量方法,包括以下步骤:

1)识别弯曲单元:对曲线进行不同宽度的粘连变换,将粘连变换的结果与原始曲线叠加,得到不同尺度的弯曲多边形,连接弯曲划分点得到弯曲识别图,通过与原始地理曲线进行相交运算得到每一尺度下的弯曲,并计算各个弯曲单元的量化指标,存储在相关属性域中;

2)叠加确定不同尺度下的弯曲嵌套关系,建立弯曲层次树:对不同层次的弯曲多边形进行叠置分析,判断每一弯曲多边形的归属,建立每一弯曲的弯曲层次树;

3)删除无效弯曲:删除每一层的无效弯曲,最终得到每一个层次的弯曲单元;

4)基于信息熵理论度量地理曲线的曲折度:采用信息熵理论计算弯曲层次树代表的地理曲线的曲折度。

进一步的,所述弯曲划分点为原始曲线与弯曲变换线的交点。

进一步的,叠加确定不同尺度下的弯曲嵌套关系通过判断不同层次中各个弯曲多边形的归属来实现,将每一尺度下的弯曲多边形与上一级较大尺度下的弯曲多边形叠加,确定小尺度多边形的归属,从而得到相应的嵌套关系,确定每一个弯曲单元的层次,最终建立以原始曲线作为根节点的弯曲层次树。

进一步的,建立弯曲层次树的方法为对每一弯曲的层次树,从下至上循环判断每一层有双亲结点的叶结点是否有兄弟结点,若有兄弟结点,则该结点保留,若无兄弟结点,则删除该结点;继续向上一层搜索,判断该层叶结点是否有双亲结点,若无,则结束循环,若有,则继续判断其是否有兄弟结点,直至遍历完每一层的所有叶结点。

进一步的,所述无效弯曲为非上层弯曲分裂得到的直接由上层弯曲继承而来的弯曲。

进一步的,采用信息熵理论计算弯曲层次树代表的地理曲线曲折度的方法为采用尺寸复杂度和层次复杂度的综合复杂度来度量地理曲线的曲折度,综合复杂度的计算公式为:

ZC=P1SCA+P2SCL+P3SCW+P4LC,

其中,分别表示不同类型的复杂度所占的权重,权重之和为1。

进一步的,所述SC为尺寸复杂度,所述SC的计算中以弯曲单元为基本单元,计算公式为:

>SC=N>log(N)-Σnnilog(ni),>

其中,为弯曲层次树的有效弯曲单元的总数,为每一类中的有效弯曲的数量。

进一步的,所述LC为层次复杂度,所述LC的计算中以层次树的一层为基本单元,计算公式为:

>LC=Nlog(N)-Σnnilog(ni),>

其中,为弯曲层次树的有效弯曲单元的总数,为每层中的有效弯曲的数量。

(三)有益效果

本发明提供了一种基于信息熵的地理曲线曲折度度量方法,依次完成识别弯曲单元、叠加确定不同尺度下的弯曲嵌套关系并建立弯曲层次树、删除无效弯曲和基于信息熵理论度量地理曲线的曲折度的工作,采用将尺寸复杂度和层次复杂度相结合的综合复杂度的进行曲折度的描述,完整地展现了曲线的部分与整体曲折度,同时较为全面地考虑了弯曲不同层次间的嵌套关系,克服了现有技术的缺陷,可以较好地描述曲线曲折度,全面地反映曲线的形态和结构特征,受曲线长度影响小,充分利用弯曲层次树完整反映弯曲之间的邻近关系与层次特性,并采用信息熵理论度量复杂度,易于操作实现,对地理特征的研究具有重要意义。

附图说明

图1为本发明圆粘连变换分解图;

图2为本发明粘连变换前后图形形态变化示意图;

图3本发明不同变换曲线得到的弯曲图;

图4为本发明不同变换曲线得到的弯曲图对应层次树图;

图5为本发明弯曲面积、弯曲长度及弯曲宽度示意图;

图6为本发明的流程图;

图7为本发明原始曲线C和不同尺度的弯曲划分点连接图;

图8为本发明变换宽度为6海里时的粘连变换图;

图9为本发明变换宽度为3.8海里时的粘连变换图;

图10为本发明变换宽度为6海里和3.8海里时粘连变换图所对应的弯曲层次树图;

图11为本发明删除每一层无兄弟的叶结点前弯曲18对应的弯曲层次树图;

图12为本发明循环删除每一层无兄弟的叶结点后弯曲18对应的弯曲层次树图;

图13为本发明变换宽度为1海里时的粘连变换图;

图14为本发明变换宽度为0.4海里时的粘连变换图;

图15为本发明变换宽度为1海里时粘连变换图对应的层次树图;

图16为本发明变换宽度为0.4海里时粘连变换图对应的层次树图;

图17为本发明变换宽度为0.4海里时粘连变换图对应的层次树图中节点8的层次树图。

图18为本发明原始曲线C示意图;

图19为本发明曲线C的弯曲识别图;

图20为本发明的弯曲叠加示意图;

图21为本发明删除无效弯曲前弯曲2的弯曲层次树图;

图22为本发明删除无效弯曲后弯曲2的弯曲层次树图;

图23为本发明删除无效弯曲后原始曲线C的弯曲层次树图。

图中:

1-a、原图;1-b、加壳变换;1-c、加壳变换图;1-d、蜕皮变换;1-e、彩图变黑;1-f、蜕皮变换图;1-g、叠加图;

2-a、粘连变换前后图形无变化的圆弧(圆心角不大于180度的圆弧);2-b、粘连变换前后图形有变化的圆弧(圆心角大于180度的圆弧);2-c、直线与圆弧组合图形;

3-A、原始曲线;3-B、原始曲线弯曲层次树图;3-C、原始曲线按尺度一粘连变换图;3-D、原始曲线和按尺度一粘连变换后叠加图;3-E、原始曲线和按尺度一粘连变换后叠加图对应弯曲层次树图;3-F、原始曲线按尺度二粘连变换图;3-G、原始曲线和按尺度二粘连变换后叠加图;3-H、原始曲线和按尺度二粘连变换后叠加图对应弯曲层次树图;3-I、原始曲线按尺度三粘连变换图;3-J、原始曲线和按尺度三粘连变换后叠加图;3-K、原始曲线和按尺度三粘连变换后叠加图对应弯曲层次树图;

4-A、图3中未经粘连变换的原始曲线3-A对应的弯曲层次树;4-B、图3中原始曲线3-A经粘连变换线3-B变换后得到的弯曲层次树;4-C、图3中原始曲线3-A经粘连变换线3-C变换后得到的弯曲层次树;4-D、图3中原始曲线3-A经粘连变换线3-D变换后得到的弯曲层次树。

7-a、原始曲线C;7-b、L为6海里时的弯曲划分点连接图;7-c、L为3.8海里时的弯曲划分点连接图;7-d、L为2海里时的弯曲划分点连接图;7-e、L为1海里时的弯曲划分点连接图;7-f、L为0.4海里时的弯曲划分点连接图;

9-a、L为6海里时粘连变换图所对应的弯曲层次树图;9-b、L为3.8海里时粘连变换图所对应的弯曲层次树图;

11-a、删除第4层中无兄弟的叶结点后弯曲18所对应的弯曲层次树;11-b、删除第3层中无兄弟的叶结点后,弯曲18所对应的弯曲层次树;11-c、删除第2层中无兄弟的叶结点后,弯曲18所对应的弯曲层次树;11-d、删除第1层中无兄弟的叶结点后,弯曲18所对应的弯曲层次树;

19-a、图18原始曲线C粘连宽度为200km时得到的弯曲识别图;19-b、图18原始曲线C粘连宽度为50km时得到的弯曲识别图;19-c、图18原始曲线C粘连宽度为30km时得到的弯曲识别图;19-d、图18原始曲线C粘连宽度为15km时得到的弯曲识别图;

20-a、图18原始曲线C粘连宽度为200km时得到的弯曲识别图对应的弯曲叠加示意图;20-b、图18原始曲线C粘连宽度为50km时得到的弯曲识别图对应的弯曲叠加示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

结合图1~23所示,包括以下步骤:

1)识别弯曲单元:对曲线进行不同宽度的粘连变换,将粘连变换的结果与原始曲线叠加,得到不同尺度的弯曲多边形,连接弯曲划分点得到弯曲识别图,通过与原始地理曲线进行相交运算得到每一尺度下的弯曲,并计算各个弯曲单元的量化指标,存储在相关属性域中;

2)叠加确定不同尺度下的弯曲嵌套关系,建立弯曲层次树:对不同层次的弯曲多边形进行叠置分析,判断每一弯曲多边形的归属,建立每一弯曲的弯曲层次树;

3)删除无效弯曲:删除每一层的无效弯曲,最终得到每一个层次的弯曲单元;

4)基于信息熵理论度量地理曲线的曲折度:采用信息熵理论计算弯曲层次树代表的地理曲线的曲折度。

优选的,所述弯曲划分点为原始曲线与弯曲变换线的交点。

优选的,叠加确定不同尺度下的弯曲嵌套关系通过判断不同层次中各个弯曲多边形的归属来实现,将每一尺度下的弯曲多边形与上一级较大尺度下的弯曲多边形叠加,确定小尺度多边形的归属,从而得到相应的嵌套关系,确定每一个弯曲单元的层次,最终建立以原始曲线作为根节点的弯曲层次树。

优选的,建立弯曲层次树的方法为对每一弯曲的层次树,从下至上循环判断每一层有双亲结点的叶结点是否有兄弟结点,若有兄弟结点,则该结点保留,若无兄弟结点,则删除该结点;继续向上一层搜索,判断该层叶结点是否有双亲结点,若无,则结束循环,若有,则继续判断其是否有兄弟结点,直至遍历完每一层的所有叶结点。

优选的,所述无效弯曲为非上层弯曲分裂得到的直接由上层弯曲继承而来的弯曲。

优选的,采用信息熵理论计算弯曲层次树代表的地理曲线曲折度的方法为采用尺寸复杂度和层次复杂度的综合复杂度来度量地理曲线的曲折度,综合复杂度的计算公式为:

ZC=P1SCA+P2SCL+P3SCW+P4LC,

其中,分别表示不同类型的复杂度所占的权重,权重之和为1。

优选的,所述SC为尺寸复杂度,所述SC的计算中以弯曲单元为基本单元,计算公式为:

>SC=N>log(N)-Σnnilog(ni),>

其中,为弯曲层次树的有效弯曲单元的总数,为每一类中的有效弯曲的数量。

优选的,所述LC为层次复杂度,所述LC的计算中以层次树的一层为基本单元,计算公式为:

>LC=N>log(N)-Σnnilog(ni),>

其中,为弯曲层次树的有效弯曲单元的总数,为每层中的有效弯曲的数量。

为便于实施参考起见,首先介绍本发明涉及的粘连变换、弯曲层次树、弯曲单元量化指标和信息熵(复杂度):

(1)粘连变换

基于地图代数的缓冲区变换可以方便而快速地得到缓冲宽度为L的点、线、面及复杂实体的缓冲区,并且根据距离变换的不同,将其区分为内缓冲区变换和外缓冲区变换。

具体算法为:首先使用相应距离尺度直接对实体实施距离变换(内、外),得到全空间各点的距离;然后取距离值为1~L(L为缓冲区宽度)的所有像元,提取缓冲区(内、外)。这时将外缓冲区称为壳,内缓冲区称为皮。实体加外缓冲区的过程为“加壳”变换,实体去内缓冲区的过程为“蜕皮”变换。

对图形X的加壳变换定义为式一:

XK0(L)=X∪XB0(l,L)=X+XB0(L),

式中,X为实体集合,K0(L)表示实施L的加壳变换,B0(1,L)表示表明取距离值从1到L的象元,即宽度为L的缓冲区;XB0(L)为壳,指实体外表邻近厚度为L的外壳。

对图形X的蜕皮变换定义为式二:

XKI(L)=XXBI(l,L)=X-XBI(L),

式中,KI(L)表示实施L的去皮变换,XBI(L)为皮,指实体表面厚度均为L的层面。

利用加壳与蜕皮变换,可以进一步得到粘连变换,粘连变换可定义如式三:

X·L(l1,l2)=XKO(l1)·KI(l2),

式中,l1,l2为适宜正整数或0,粘连变换即首先对图形进行宽度为l1的加壳变换,然后,再对其进行宽度为l2的蜕皮变换;一般情况下,取加壳宽度与蜕皮宽度相等,即令l1=l2,并统称为粘连宽度1。

粘连变换对图形形态的保形效果,具有以下特性:

a、对圆、直线等基本标准图形,具有保持基本形态不变的特性,即“保平”、“保凸”特性。

以曲线的标准图形圆为例,如图1,对半径为r的圆,首先进行宽度为L的加壳变换,变换后的图形仍为圆,其半径为R=r+L,再对变换后的图形进行宽度为L的蜕皮变换,然后将蜕皮变换后的图形1-f与原图1-a进行叠加,得到叠加图1-g,得到1-a与1-f完全重合,这说明圆在粘连变换前后图形保持不变。

b、对于凹、凸、直线组合图形,具有“保凸”、“保平”、“填凹”特性。

在粘连变换中,圆弧在变换前后图形的变化程度取决于圆弧的圆心角,当圆弧的圆心角不大于180°(体现为凸形)时,粘连变换前后图形保持不变,体现保凸的形态特性,如图2-a所示,当圆心角大于180°时,粘连变换表现减凹的形态特性,如图2-b所示;圆弧和直线组合图形在粘连变换中图形变化程度与两者夹角有关,当夹角大于180°时,直线与圆弧形成凸部,粘连变换前后图形不变,当夹角小于180°时,直线与圆弧形成凹部,随着粘连变换宽度增大,凹部逐渐被填平,如图2-c所示,进一步验证了粘连变换保凸、保平、填凹的保形特性。

c、“填凹”程度可控。

根据粘连变换的形态变化特性:若粘连变换宽度为L,则宽度(此处弯曲宽度定义为该弯曲的最大凹宽,记为D)小于2L的凹形弯曲将逐渐平滑,且弯曲宽度越小,变换宽度越大,平滑效果越明显,同时,以下宽的弯曲将被填平,临界变换宽度L'与最大凹宽D的关系满足式四:

>L=(D2)2>

这也意味着,用圆弧最大凹宽D反算出临界变换宽度L',再对图形进行宽度L'的粘连变换,变换的结果将填平图形中所有凹部。如表1,对半径R=20像元、不同圆心角的圆弧进行宽度为L粘连变换,分别取L<L',L=L'和L>L'三种情况下的变换结果,可知,粘连变换后图形光滑度增加,其保凸、保平、填凹趋势随L增大而加剧;当粘连变换宽度L增加到L=L',若继续进行宽度为D(D>L)的粘连变换,图形不再变化。

表1 半径R=20像元,不同圆心角的圆弧粘连变换情况

粘连变换在图形形态的保持上具有“保凸”、“保平”、“填凹”的特性,并且“填凹”的程度可以由粘连变换的宽度L的值来控制,利用这些特性,可以从不同侧面和不同层次上实现曲线弯曲单元的自动识别。

(2)弯曲层次树

弯曲层次树,是指基于不同尺度的粘连变换识别弯曲,在得到不同尺度下弯曲的基础上,用一棵层次树来描述弯曲单元的嵌套关系。在弯曲层次树中,某一粘连变换尺度下识别出的弯曲代表层次树的一层,每一弯曲代表该层的一个结点。

下面将以弯曲的标准形态——圆弧为例,说明弯曲层次树的基本概念。如图3中3-A,曲线L由四层不同大小的弯曲嵌套而成,最大的弯曲1(代表曲线L)从左到右依次嵌套了1a、1b、1c三个弯曲,而这三个弯曲又依次嵌套了1a.1、1a.2、1a.3、1b.1、1b.2、1c.1、1c.2七个弯曲,弯曲1c.2又嵌套了1c.2a、1c.2b两个弯曲。对曲线L进行三个不同尺度下的粘连变换,得到的变换线依次为图3中的3-B、3-C和3-D,变换线与原始曲线的叠加图依次为图3中的3-E、3-F和3-G,每一粘连变换尺度对应弯曲层次树中的一层,从而建立每一尺度下对应的弯曲层次树。如图4的4-B、4-C和4-D,根结点1代表曲线L;结点1有三个子结点,依次为结点1a、1b、1c,表示曲线L依次嵌套了1a、1b、1c三个弯曲;结点1a、1b、1c分别有3个子结点、2个子结点和2个子结点,说明弯曲1a、1b、1c依次嵌套了3个弯曲、2个弯曲和2弯曲;依此类推……。最后,树的叶结点代表某一粘连变换尺度下所能识别的最小弯曲单元。

在弯曲层次树中,曲线中的每个弯曲单元对应一个结点,层次树的结构反映了弯曲之间的拓扑特性,而弯曲单元的量化指标又可以存储在弯曲层次树的对应结点中。这样,就可以用一棵弯曲层次树来表达一段曲线中弯曲嵌套的拓扑特性,同时,也能描述每个弯曲单元的大小形态。也就是说,可以用一棵弯曲层次树来描述一段曲线的曲折。该弯曲层次树描述一段曲线曲折度的能力见表2:

表2 弯曲层次树表达曲线曲折度的能力

(3)弯曲单元量化指标

弯曲单元是组成曲线的最小的单元,本来应该是一小段一小段的弧段,为方便对其各种指标的度量,弯曲层次树中以面替代线,用粘连变换识别出的弯曲多边形来代表各个弯曲单元。现有弯曲单元量化指标主要包括弯曲单元面积、长度、宽度等。以下具体介绍弯曲单元的量化指标。

a.弯曲面积S

弯曲面积S一般指弯曲起点与终点所连直线与弯曲段所围多边形面积,如图5中直线段AB与A点、B点之间的弧段所围多边形面积。

b.弯曲长度L

弯曲长度L定义为弯曲单元的总长度,如图5中AB(或BC)之间曲线的总长度。本文中弯曲长度可直接在ArcGIS中通过属性计算器计算长度得到。

c.弯曲宽度W

般情况下,弯曲宽度W定义为该弯曲起点与终点之间的直线距离,如图5中AB或BC之间的直线距离。基于粘连变换的弯曲宽度仍然采用该定义,但是弯曲端点的确定是基于粘连变换综合线。具体操作为:在识别弯曲的步骤中,得到弯曲多边形,对弯曲多边形周长和弯曲长度求差即可得到弯曲宽度。

(4)复杂度与信息熵

信息熵是对信息有用程度的度量。在地学研究中,信息熵是研究特征与分布的有效手段,而复杂度是对组成的描述,两个看似不同的概念却有着非常密切的联系。本文用复杂度来度量曲线的曲折度,以此来定量描述曲线的形态。

熵可以度量某一现象或事件在空间集中或分散的程度,是不确定性的科学称谓。熵是系统的组织程度和有序程度的度量,可以用来表征系统的不确定程度,去除冗余的平均信息即为信息熵。信息熵可以用来度量信息量的大小,描述信息的有用程度。通过信息熵可以有效实现信息的量化,其具体的计算公式如式五:

>H(X)=-ΣnPilogPi,>

其中,公式中Pi是事件xi的出现概率,n表示事件一共有n个,对数函数取不同的底,计算出的熵值结果不同。

信息熵有广泛的应用,但是熵的理论在科学范畴内抽象难懂。张学文在广义集合理论中把神秘的熵概念和熵原理改造得很通俗,同时又扩大了它的应用领域。

他从组成论的角度用复杂度来替代熵,提出了广义集合的概念和复杂度定律。经过改造,信息熵理论更加通俗易懂,更加易于应用。

组成论将所有的组成问题一般化,用统一的模型和规律研究不同领域的组成问题。其中,广义集合是用来研究统一的组成规律的数学模型。集合语言可以用于定性分析,而广义集合语言则可以用于定量分析。集合是具有特定性质的事物的总体,集合中主要关注两两不同的元素有哪些。而广义集合不仅要明确这种不同,同时还要关注共同性:通过共性将元素分类,明确每类中的元素各有多少。如果一个总体可以分为多个地位相同的个体,而每个个体都有确定的属性值,那么这个总体就称为广义集合。广义集合中不仅可以有一种属性,同时也可以有多种属性,就称为多维广义集合。本文主要研究一维的广义集合。为了准确的描述广义集合,需要引入两个新的概念,即标志和个体。标志是指集合中两两相异的元素,而个体是指元素所属的种类,个体是组成集合的基本要素。标志用来描述差别,个体则侧重说明各个要素之间地位相同。

广义集合是一种数学模型,所以会有一个分布函数与之对应。此处的函数与普遍意义的数学中的函数不同,它可以是一个经验公式,主要说明的就是组成的问题。明确一种组成,就是发现一个客观规律,每种组成都可以用广义集合来描述,所以每个广义集合都的分布函数就是一个规律。明确每个具体的广义集合就是明确一种组成,发现一个客观规律,其实就是得到一个分布函数。表3所示为一些广义集合的例子:

表3 广义集合例子说明

广义集合个体名称标志名称分布函数要说明的问题人口每个人人的年龄不同年龄的人各有多少每座山山的海拔不同海拔的山各有多少湖泊每个湖泊湖泊的面积不同面积的湖泊各有多少土地每平方公里土地土地类型不同类型的国土各有多少河流每段分支分支的长度不同长度的分支有多少

复杂度可以描述广义集合的组成情况,反应其内部状态,复杂度的计算公式如式6:

>C=-Σnnilog(ni/N),>

公式中n表示标志值的个数,即共有多少类;ni表示每种标志值中个体的数量,即每类中的元素个数;N表示个体总量。每个广义集合都有一个本身特有的复杂度,复杂度的最小值为0,此时所有元素的值都相同,仅有一个类别。由复杂度计算公式可以看出,复杂度的值与计算时所采用的对数函数的底有关,对数的底不同,求得的复杂度值也不同。

广义集合中的个体差异越大,其复杂度也就越大。当每个个体的特征都相同即不存在差异事,复杂度为零。用广义集合的语言来表示为标志值的差别越大,复杂度值越大;标志值完全相同,则复杂度为零。通俗的理解,组成越复杂,复杂度越大。

信息熵表示不确定性,复杂度表示丰富程度,二者有一定的关系。信息熵是从随机试验的角度分析事物,最终得到结果的不确定性;复杂程度是从内在差异的角度分析事物,这种差异在广义集合中的表现是存在不同的标志值,最终得到的是事物的丰富程度,即该广义集合有怎样的组成。分析信息熵的计算公式一和复杂度的计算公式二,其中Pi=ni/N,将这个关系带入到复杂度的计算公式二中,并结合公式一,可以得到信息熵与复杂度的对应关系:C=NH。由这个关系式可知,复杂度与信息熵呈现正相关趋势,复杂度越大,信息熵也就越大,即组成越复杂,结局越不确定。正因为二者之间的正比例关系,关于信息熵的很多知识也自然地归入复杂度的概念[63]。根据这个关系也可以得出这样的结论,之所以有不确定程度是因为客观存在一个广义集合有复杂度,正是由于组成的复杂才导致了结果的不确定性。

实施例1:

以下结合附图6和实施例详细说明本发明技术方案中使用弯曲层次树进行曲线曲折度描述方法,对于图7中7-a所示的曲线C,弯曲层次树的详细建立过程如下:

1)基于粘连变换进行曲线综合,得到弯曲多边形;

对原始曲线C实施粘连变换,得到曲线的粘连变换线(分为内变换线和外边换线,这里只选外变换线进行说明,内变换线与此类似),并与原始曲线C构建弯曲多边形。

具体地,对原始曲线C分别实施宽度为6海里、3.8海里、2海里、1海里和0.4海里的粘连变换,得到不同尺度下的变换线,将原始曲线与弯曲变换线的交点称为弯曲划分点,连接弯曲划分点得到图7所示的弯曲识别图。

将弯曲划分点连线分别与曲线C构建弯曲多边形,以变换宽度为6海里为例,可以得到如图8所示的18个弯曲多边形,对应18个弯曲单元(编号为1-18)。

2)叠置分析,判断弯曲多边形的归属;

对不同层次的弯曲多边形进行叠置分析,判断每一弯曲多边形的归属,建立每一弯曲的弯曲层次树。取粘连变换宽度L=3.8海里的弯曲多边形,将每一弯曲与上一相邻的大尺度粘连变换(L=6海里)的弯曲进行比较,如图9,通过观察可知:弯曲18分裂为三个弯曲,分别为弯曲18.1、18.2、18.3,同时弯曲8分裂为两个弯曲,分别为弯曲8.1和8.2,其他弯曲则不分裂。

上述确定曲线上不同层次之间弯曲关系的过程是通过人眼观察进行识别的,在具体实施过程中,可以通过判断不同层次中各个弯曲多边形的归属来实现。

具体过程如下,取粘连变换宽度为L1的弯曲多边形,与宽度为L2(L2<L1)的弯曲多边形进行叠置分析,循环判断宽度为L2时各个弯曲多边形的归属。假设多边形P2是粘连变换宽度为L2时的某一弯曲多边形,多边形P1是粘连变换宽度为L1时的某一弯曲多边形,若多边形P2归属于多边形P1,则说明在弯曲层次树中,弯曲多边形P2所对应的结点C2是弯曲多边形P1所对应结点C1的子结点。上述判断弯曲多边形归属的过程循环执行,直至所有弯曲均遍历完毕。

3)建立最大尺度下每一弯曲对应的层次树;

为了明确标明某一结点与其子结点之间的关系,假设标记一结点为1,若其只有一个子结点,一般标记为1.1;若其有多个子结点(设为n),则依次标记为1.1、1.2、1.3、……、1.n;若1.n也有多个子结点(设为m),则依次标记为1.n.1、1.n.2、1.n.3、……1.n.m。

根据2)中判断多边形归属的方法,对变换宽度L=6海里、3.8海里、2海里、1海里和0.4海里下的弯曲实施相同的处理过程,可以得到每一弯曲对应的层次树,如表3:

表3 不同变换宽度的弯曲层次树

在弯曲层次树中,各个结点双亲结点的确定,取决于该结点对应弯曲的归属。若结点18.1对应弯曲18.1,将弯曲18.1与上一层结点所对应弯曲进行叠加,显然弯曲18.1归属于弯曲18,则结点18.1的双亲结点为结点18,如图10中的9-a和9-b。此外,弯曲层次树中的每一结点的属性都对应弯曲单元的量化指标。

4)删除每一层中无兄弟的叶结点,建立整个曲线的弯曲层次树;

对每一弯曲的层次树,从下至上循环判断每一层有双亲结点的的叶结点是否有兄弟结点,若有兄弟结点,则该结点保留;若无兄弟结点,则删除该结点。继续向上一层搜索,判断该层叶结点是否有双亲结点,若无,则结束循环;若有,则继续判断其是否有兄弟结点……直至遍历完每一层的所有叶结点。

现以弯曲18为例说明删除弯曲层次树中每一层无兄弟的叶结点的过程。图11为删除每一层无兄弟的叶结点前,弯曲18所对应的弯曲层次树,从弯曲层次树第4层开始,从下至上遍历每一层的叶结点,判断其是否有兄弟结点。观察图11中弯曲层次树第4层的叶结点,其结点的编号均以阿拉伯数字“1”结尾,表明这一层的所有叶结点均无兄弟结点,需删除,得到的结果如图12中的11-a;继续向上循环搜索第3层中的叶结点,可知有两个结点的编号不是以阿拉伯数字“1”结尾,这两个结点分别为18.2.1.2和18.2.3.2,删除这两个结点编号的最后一位数,得到第2层的结点(即双亲结点)18.2.1和18.2.3,可以确定这两个结点下的子结点(即第3层上的结点18.2.1.1、18.2.1.2和18.2.3.1、18.2.3.2)有兄弟结点,不需删除;第3层上的其他叶结点无兄弟结点,实施删除结点操作,得到的结果如图12中的11-b;继续向上搜索遍历第2层的所有叶结点,采用相同的判断方法删除无兄弟的叶结点18.1.1和18.3.1,得到的结果如图12中的11-c;继续向上搜索遍历第1层的所有叶结点,叶结点18.1和18.3均有兄弟结点,不需删除;第0层中无叶结点,不需判断。至此,弯曲层次树中每一层的叶结点均遍历完成,说明删除每一层中无兄弟的叶结点的操作执行完毕,遍历完成后的弯曲18所对应的层次树如图12中的11-d所示。表4为循环遍历每一弯曲层次树,删除每一层无兄弟的叶结点后的结果。

最后,对编号为1-18的18个弯曲增加双亲结点C(即为根结点C),得到原始曲线C的弯曲层次树,如图16~17。当然,弯曲层次树中的每一结点都有共同的属性——弯曲单元的量化指标,以描述弯曲单元本身的大小形态特性。

事实上,任一尺度下的粘连变换都可以建立高度为1的弯曲层次树。如图8,对原始曲线C进行粘连变换,其宽度L=6海里,则产生18个弯曲,且这些弯曲在弯曲层次树的同一层,得到如图9-a所示高度为1的弯曲层次树。若继续对曲线C实施宽度小于6海里的一次或多次粘连变换,则可以建立高度不小于1的弯曲层次树,如图9-b和图15、图16和图17。粘连变换次数和变换宽度的选择,决定了弯曲层次树的高度和各个结点的度。弯曲层次树的高度决定了弯曲嵌套的次数;各个结点的度则说明了该结点所对应弯曲的破碎程度。这两个数值可以作为弯曲层次树描述曲线曲折度能力的表现之一。

表4 删除各个弯曲层次树中每一层无兄弟的叶结点后的层次树

弯曲层次树是基于弯曲层次结构的表达,基于粘连变换方法识别弯曲,可以完整的反映弯曲之间的邻近关系和层次特性。在结构树中,同一层相邻结点之间具有邻近关系;第N层的某一结点与第N-1层的双亲结点具有层次关系,描述了弯曲的嵌套结构。如图9-a,结点1与2相邻,其对应弯曲具有邻近关系;如图9-b,结点8.1、8.2与结点8,结点18.1、18.2、18.3与结点18之间具有层次关系,其对应的弯曲体现了弯曲之间的嵌套结构。

(1)同一层次的弯曲;

以结点8、结点12和结点18为例,说明弯曲层次树描述曲线曲折度的能力:

首先,从图16~17可以看出,结点8、结点12与结点18所对应的弯曲层次树的高度相等,均为4,为结点1-18中高度最大的三个树,表明这三个结点所对应的曲线段中弯曲嵌套的次数最多,为相对复杂弯曲。该结论与图8中人眼识别的结果相符。

其次,结点8、结点12和结点18的度分别为2、1和3,表明其子树棵树分别为2、1和3,也就是说弯曲8、弯曲12和弯曲18分别分裂为2个弯曲、1个弯曲和3个弯曲。当然,这是一个相对于综合尺度的值。

再次,曲线段8、曲线段12和曲线段18的曲折度的差异可由这三个结点所对应的子树的差异来衡量。例如,子树的棵树(即结点的度)、子树的深度(弯曲嵌套的次数)、树结点分裂的均衡性、结点的量化指标的差异等。我们可以初步判断,结点8与结点18相比结点12复杂,一方面是因为结点12总结点的个数(7)远小于结点8(16)和结点18(13),另一方面可从其子树的棵数进行判断,还可以比较其子树的差异等。

然后,可以根据树结点分裂的均衡性判断曲线曲折度的均衡性。对结点8和结点18,显然结点18分裂更均衡,这可用其每一层结点所对应的子树的度(或取平均值)来衡量。

另外,同一层的相邻结点之间具有邻近关系,如结点8.1和结点8.2。

(2)不同层次的弯曲;

首先,弯曲结点所在层次的不同表明弯曲单元在整条曲线的嵌套次数不同。例如,图16~17中,结点8.1和结点8.1.2.1所在层次分别为1和3,而结点8所对应层次树的高度为4,说明弯曲8.1在整条曲线的嵌套次数为3(树的高度与所在层次之差);弯曲8.1.2.1的嵌套次数为1。这与图16~17中的结果相符。

其次,不同层弯曲之前的嵌套关系可以通过判断其是否为父子结点来确定。例如,结点18的子结点有三个,分别为18.1、18.2、18.3,说明弯曲18嵌套了三个弯曲,分别为18.1、18.2和18.3。

总之,一棵弯曲层次树对应一段曲线的曲折度,它既可以描述弯曲单元本身的大小形态特征,也可以描述弯曲单元之间的拓扑特性。

实施例2:

以下结合附图6和实施例详细说明本发明技术方案,对于图18所示的曲线C,弯曲层次树的详细建立过程如下:

1)识别弯曲单元。

对图18的原始曲线C分别实施宽度为200km、50km、30km和15km的粘连变换,得到不同尺度下的变换线,将原始曲线与弯曲变换线的交点称为弯曲划分点,连接弯曲划分点得到图19中如19-a~19-d所示的弯曲识别图。

2)叠加确定不同尺度下的弯曲嵌套关系,建立弯曲层次树。

对不同层次的弯曲多边形进行叠置分析,判断每一弯曲多边形的归属,建立每一弯曲的弯曲层次树。如对上述曲线C,取粘连变换宽度L=50km的弯曲多边形,将每一弯曲与粘连变换L=200km的弯曲进行比较,如图20,通过观察可知:弯曲3分裂弯曲3.1和3.2,弯曲8分裂为弯曲8.1和8.2,弯曲9分裂为弯曲9.1和9.2,其他弯曲则不分裂。上述确定曲线上不同层次之间弯曲关系的过程是通过人眼观察进行识别的,在具体实施过程中,可以通过判断不同层次中各个弯曲多边形的归属来实现。具体过程如下:

取粘连变换宽度为L1的弯曲多边形,与宽度为L2(L2<L1)的弯曲多边形进行叠置分析,循环判断宽度为L2时各个弯曲多边形的归属。假设多边形P2是粘连变换宽度为L2时的某一弯曲多边形,多边形P1是粘连变换宽度为L1时的某一弯曲多边形,若多边形P2归属于多边形P1,则说明在弯曲层次树中,弯曲多边形P2所对应的结点C2是弯曲多边形P1所对应结点C1的子结点。

3)删除无效弯曲

无效弯曲是不经分裂而得到的弯曲,在弯曲层次树中的表现为没有兄弟节点的叶节点。对每一弯曲的层次树,从下至上循环判断每一层有双亲结点的叶结点是否有兄弟结点,若有兄弟结点,则该结点保留;若无兄弟结点,则删除该结点。继续向上一层搜索,判断该层叶结点是否有双亲结点,若无,则终止循环;若有,则继续判断其是否有兄弟结点……直至遍历完每一层的所有叶结点。

现以弯曲2为例说明删除弯曲层次树中每一层无兄弟的叶结点的过程。图21为删除每一层无兄弟的叶结点前弯曲2所对应的弯曲层次树,图22为删除每一层无兄弟节点后弯曲2的结果图。

删除无效弯曲后原始曲线C对应得弯曲层次树如图23所示。

弯曲层次树的高度决定了弯曲嵌套的次数,各个结点的度则说明了该结点所对应弯曲的破碎程度,这两个数值可以用来度量弯曲层次树曲线曲折度。

4)基于复杂度(信息熵)理论度量地理曲线的曲折度

曲线的曲折度,又称曲线复杂度,是指曲线上形态各异、大小不同的弯曲在不同层次上的相互嵌套。弯曲层次树可以有效描述描述曲线的形态特征,一颗弯曲层次树就是一条曲线。将曲线看作是一个广义集合,计算弯曲层次树的复杂度,以此来表示曲线的曲折度,实现定量的描述曲线的形态特征。复杂度计算的基础是将所有参与计算的弯曲单元分类。在本文的计算中,主要采用两种分类方式,一是根据弯曲单元的尺寸(量化指标表示)分类;二是基于弯曲层次树本身的层次分类。所以,用以描述曲线曲折度的弯曲层次树复杂度可以分为两种,分别是尺寸复杂度和层次复杂度。最终用综合复杂度来度量地理曲线的曲折度。

(1)尺寸复杂度

尺寸复杂度是基于弯曲单元的计算,将每个弯曲单元看作是组成曲线的基本元素即个体,用弯曲的量化指标作为个体的特征。

基于弯曲单元的计算方式是将弯曲单元为单位来考虑线的组成,主要利用每个特征值下所拥有的弯曲单元的个数来进行计算。这种计算方式主要说明的问题是不同尺寸的弯曲有多少。表4所示即为该计算方式的广义集合语言表示形式。由于弯曲单元的大小基本都不相同,所以严格的按照具体的数值来计算个数没有意义。这里采用分类的方法来统计个数:根据所有弯曲单元的某一属性值(面积、长度、宽度),按照某一特定原则划分不同的属性值区间,每一区间即为一个类别。

表4 广义集合表示曲线

广义集合个体名称标志名称分布函数要说明的问题曲线每个弯曲每个弯曲的面积不同面积的弯曲有多少曲线每个弯曲每个弯曲的长度不同长度的弯曲有多少曲线每个弯曲每个弯曲的高度不同高度的弯曲有多少曲线每个弯曲每个弯曲的宽度不同宽度的弯曲有多少

以面积这一度量指标为例,复杂度的计算公式为:

>C=-Σnnilog(ni/N),>

其中,n表示所分面积类别的个数,ni表示每个区间中的弯曲单元有多少,N是组成曲线的弯曲单元的总个数。

根据对数函数的性质,尺寸复杂度SC的计算公式为式七:

>SC=N>log(N)-Σnnilog(ni),>

其中,N弯曲层次树的有效弯曲单元的总数,ni为每一类中的有效弯曲的数量。同样,对数函数取不同的底,计算出的复杂度结果不同。以图7中的曲线C为例,计算尺寸复杂度,尺寸复杂度结果以10为底计算。曲线的弯曲单元的具体尺寸信息如表5所示:

表5 曲线C的弯曲单元属性

IdTreeNameAreaPerimeterBaselineLengthRadiusOlayR116135.29471.3175.34395.982000227304.83477.05132.67344.382000332323.95302.1588.83213.3320004430.4150.4324.9025.532000551867.01236.28101.10135.172000666500.34579.9774.82505.15200077988.07147.9043.77104.142000882787.62347.5586.38261.162000995219.08431.02126.85304.17200010102324.24242.8382.58160.252000113.2961.70150.8740.90109.9750200123.1601.65121.2237.4583.7750200139.21745.74182.8055.43127.3750200149.11838.18211.0061.16149.8450200158.11548.95192.7739.97152.8050200168.2788.26148.5945.56103.0350200172.2.21308.36184.1359.00125.133050182.2.11092.67156.9646.79110.173050191.1.1.1459.41112.4837.2775.211530201.1.1.2103.3076.0134.0142.001530211.1.1.3672.62116.4531.5084.951530226.1.1.1157.7671.4125.6645.741530236.1.1.2209.5872.3322.8349.501530246.1.1.3820.77113.1117.6895.431530256.1.1.4429.6389.2619.8269.451530266.1.1.5693.95119.7025.0694.641530276.1.1.6178.7778.2429.6548.581530

在尺寸复杂度的计算实验中,本文主要使用三种度量指标参与计算,分别为弯曲单元的面积、长度和基线长。将这三类指标按等间距分类的方式分为10类,分类间隔为最大值与最小值的差的十分之一。分类结果如表6所示:

表6 量化指标分类

类别面积范围个数长度范围个数宽度范围个数130.14—757.851025.53—73.49617.68——29.1862757.85—1485.29673.49—121.25929.18——40.68631485.29—2212.734121.25—169.14640.68——52.18442212.73—2940.173169.14—217.00152.18——63.68352940.17—3667.610217.00—264.86163.68——75.18163667.61—4395.050264.86—312.72175.18——86.68374395.05—5122.490312.72—360.58186.68——98.18185122.49—5849.931360.58—408.44198.18——109.68195849.93—6577.372408.44—456.300109.68——121.180106577.37—7304.831456.30—505.151121.18——132.672

根据公式七,以面积为度量指标计算得到的曲线C的尺寸复杂度为:

SCA=27*log(27)-10*log(10)-6*log(6)-4*log(4)-3*log(3)-2*log(2)

=19.536,

以长度为度量指标计算得到的曲线C的尺寸复杂度为:

SCL=27*log(27)-9*log(9)-6*log(1)=20.721,

以宽度为度量指标计算得到的曲线C的尺寸复杂度为:

SCW=27*log(27)-12*log(6)-9*log(9)-6*log(1)=23.436。

(2)层次复杂度

将层次树的每一层看作是一个基本组成单元即个体,而每个层次中所含的弯曲个数为标志值。

这种方式是以层次为单位考虑曲线的组成,主要利用每个层次中所包含的弯曲个数来进行计算。实质上这种计算方式就是利用层次来进行分类,关注每类的组成。计算的过程中主要说明的问题就是弯曲层次树有多少个层次,每个层次中有多少个弯曲,以此来反应曲线是否复杂。理论上来说,层次越多,曲线越复杂,层次中弯曲的数量越参差不齐越复杂。用广义集合语言来描述这种方式如表7所示:

表7 广义集合表示曲线

广义集合个体名称标志名称分布函数要说明的问题曲线每个层次每个层次中弯曲的数量不同层次有多少弯曲单元

其复杂度计算公式为:

>C=-Σnnilog(ni/N),>

其中,n表示该弯曲层次树共有多少个层次,ni表示每个层次中的弯曲单元有多少即每个结果图层中的弯曲单元的个数,N是组成曲线的弯曲单元的总个数。对数函数取不同的底,计算结果不同。

根据对数函数的性质,层次复杂度LC的计算公式为式八:

>LC=Nlog(N)-Σnnilog(ni),>

其中,N为弯曲层次树的有效弯曲单元的总数,ni为每层中的有效弯曲的个数。

由公式可知,对数函数取不同的底,计算出的层次复杂度结果不同。以图18中的曲线C为例,计算尺寸复杂度,尺寸复杂度结果以10为底计算。对于原始曲线C,该弯曲层次树共有五层,第一层中有一个有效弯曲,第二层中有10个有效弯曲,第三层中有6个有效弯曲,第四层中有2个有效弯曲,第五层中有9个有效弯曲,共有28个有效弯曲。

根据公式八,曲线C的层次复杂度为:

LC=28*log(28)-10*log(10)-6*log(6)-2*log(2)-9*log(9)=16.661。

(3)综合复杂度

采用综合复杂度从层次与尺寸两个方面来度量地理曲线的曲折度,综合复杂度ZC可以定义为式九:

ZC=P1SCA+P2SCL+P3SCW+P4LC,

其中,Pi(i=1,...,4)分别表示不同类型的复杂度所占的权重,权重之和为1。实际实验时可以设计多组权重值,分别得到不同曲线的综合复杂度,然后按照经验法确定较为合理的一组权值,因此可以得到度量地理曲线的复杂度表示方法。

综上,本发明实施例具有如下有益效果:依次完成识别弯曲单元、叠加确定不同尺度下的弯曲嵌套关系并建立弯曲层次树、删除无效弯曲和基于信息熵理论度量地理曲线的曲折度的工作,采用将尺寸复杂度和层次复杂度相结合的综合复杂度的进行曲折度的描述,完整地展现了曲线的部分与整体曲折度,同时较为全面地考虑了弯曲不同层次间的嵌套关系,克服了现有技术的缺陷,可以较好地描述曲线曲折度,全面地反映曲线的形态和结构特征,受曲线长度影响小,充分利用弯曲层次树完整反映弯曲之间的邻近关系与层次特性,并采用信息熵理论度量复杂度,易于操作实现,对地理特征的研究具有重要意义。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号