GIS 中矢量多边形网格化问题研究
GIS 中矢量多边形网格化问题研究 | |
2005-6-21 15:41:34 作者- 朱良峰,吴信才 ,刘修国 来源- 中国地质大学研究生 阅读768次 [大 中 小] | |
摘要:在实际的GIS 空间分析过程中,为了更加简便快捷的实现某些特定的空间分析功能,常常需要将不规则的矢 量多边形区域转化为规则的格网区域。该文介绍了矢量多边形网格化的四类算法:中心点归属法、面积占优法、重 要性法和面积内插法。其中面积内插法又可分为面积权重内插法、基于表面模型的面积内插法和基于统计模型的 面积内插法。同时介绍了各类算法的实现思想,并比较了其优劣及应用范围,认为基于表面模型的面积内插法是 一种比较理想且极具发展前景的矢量多边形网格化方法。 关键词:地理信息系统;矢量多边形;网格化;面积内插 中图分类号:P208 文献标识码:A 文章编号:1672 - 0504 (2004) 01 - 0012 - 04 地理信息系统( GIS) 是对与地理空间相关的信息进行有效管理与综合分析的计算机系统, GIS 把各种与空间信息相关的技术与学科有机的融合在一起,并与不同数据源的空间与非空间数据相结合,通过空间操作与模型分析,提供对规划、管理、决策有 用的信息产品[ 1 ,2 ] 。目前,GIS 已成为处理空间信息的标准方法。GIS 的核心功能是空间分析,它特有的对地理空间信息特别是隐含信息的提取、表现和传输功能[ 3 ] ,是GIS 区别于一般信息系统的主要功能特征。在进行GIS 空间分析时,所获取的空间数 据有相当大的一部分与一定的空间区域分布有关,对这些数据,多数GIS 系统采用分层存储的方式进行处理,即将空间信息划分为众多专题图层(由于大多数区域单元的边界是不规则的,这些专题图层在数据结构上表现为不规则的矢量多边形) ,然后对这 些专题图层进行相应的空间分析操作。但直接对这些不规则的矢量多边形区域进行各类空间分析操作并不容易,例如,区域叠加就是一类常见的空间分析操作,但由于矢量多边形的数据结构复杂,对矢量多边形区域进行叠加操作后常会出现“碎屑多边形”(Sliver polygon) ,虽然可采用一些算法(如设定一模糊容限) 来消除它,但这会明显降低空间分析的精度。另外,对多个矢量多边形区域叠加后的结果也 不易进行其它分析与量算。因此,在进行实际的空间分析时,常常需要将边界不规则的矢量多边形区域转换为边界较为规则的格网状区域(如正方形、三角形或矩形区域) ,再对这些格网状区域进行各种空间分析操作与属性运算。相比于不规则的矢量多边 形区域,格网区域的数据结构简单,易于在其上进行各种空间分析操作(特别是区域叠加操作) ,并可及时更新数据,从而使信息具有较强的现势性。本文介绍将不规则矢量多边形区域网格化为规则的格网区域时出现的问题及解决办法,在分析现有网格化算法的基础上,阐明各类算法的优缺点及应用领域,以期能对实际的GIS 空间分析起一定的指导作用。1 矢量多边形网格化算法从本质上来讲,矢量多边形区域网格化是一个 从源区域(不规则的矢量多边形区域) 到目标区域(规则的格网区域) 的转换过程,这种转换不仅包括区域边界形状的改变,更重要的是它还包括源区域所包含的属性信息到目标区域的属性信息的转换。按照属性信息转换规则的差异,矢量多边形网格化有四类算法[ 3 - 6 ] ,即中心点归属法、面积占优法、重要性法和面积内插法。在矢量多边形网格化时,应使生成的格网区域尽量保持区域属性的真实性,最 大限度保留或体现源区域所蕴含的属性信息。下面以一个简单的研究实例来说明各类算法的实现思想和应用范围。 如图1 所示,研究区域按照自然地理边界可划分为三个多边形区域A、B、C ,各区的属性信息见表1 。现在需要将研究区域网格化为50 ×50 m 的格网状区域(图2) 。不可避免地,网格化后得到的格网区域可能有落在多个源区域的情况(如图2 中含阴影 斜线的格网区域a 、b、c) 。那么,究竟该按照怎样的规则才能实现最大限度地合理推定这些格网区域上 的属性值呢? 此主题相关图片如下: (1) 中心点归属法是一种最为简单的属性判别方法,它将各个格网区域中心点所在的源区域的属性值作为整个格网区域(目标区域) 的属性值。按照中心点归属法的规则,在图2 中,网格a 的中心点落在源区域B 内,所以格网区域a 的属性值与B 同,即:面积为2 500 m2 ,人口密度为1 97414 人P km2 ,人口总数为4194 人;网格b 的中心点落在源区域C内,属性值与C 同,即:面积为2 500 m2 ,人口密度为 3 05711人P km2 ,人口总数为7164 人;网格c 的中心点落在源区域A 内,属性值与A 同,即:面积为2 500m2 ,人口密度为2 75511 人P km2 ,人口总数为6189人。一般而言,中心点归属法适用于具有连续分布特征的地理要素,如降水量分布、人口密度图等。在 实际应用时,可能会有格网区域的中心点落在多个源区域的边界上而无法判别中心点位置归属的情况,这需要结合其他方法(如面积占优法、重要性法 或者面积内插法) 来确定,或者直接由分析者根据经验和需要来指定其属性值。(2) 面积占优法是指由在格网区域的组成中占 面积比例最大的源区域的属性值来决定整个格网区域的属性值,它适用于分类较细、格网较小的情况。在图2 中,按照面积占优法的规则,格网区域a 和b的属性值不变;格网区域c 属性值应为:面积2 500m2 ,人口密度3 05711 人Pkm2 ,人口总数7164 人。 (3) 重要性法是指根据落在格网区域内不同源区域的重要性而选取最重要的源区域来决定该格网区域的属性值,它适用于具有特殊意义且面积较少的区域。如在图2 中,若源区域A 的社会经济发展水平远较源区域B、C 为高,且需要重点考察源区域A内的人口分布情况(或其他相关的空间信息分布) ,则可按照重要性法将图2 中的格网区域a 、b、c的属性值都赋为与源区域A 相同。 (4) 上面的三种方法都是以一个源区域的属性值来决定目标区域(格网区域) 的属性值,但事实上,目标区域往往是由多个源区域组成的,这就需要考虑它们的共同作用与影响。面积内插法可以有效的解决这个问题。所谓面积内插,是指按照源区域空间数据的分布特征与规律,采用一定的插值算法求取目标区域中的数据分布[ 7 ,8 ] 。面积内插算法有多种,总体上可分为三类:面积权重内插法、基于表面 模型的面积内插法、基于统计模型的面积内插法。 2 面积内插模型及相关算法 2. 1 面积权重内插法 面积权重内插法是一种比较简单且相对直观的算法,它根据规则格网区域内各源区域所占面积的百分比来确定格网区域的属性数值[ 6 ,7 ] 。应用面积权重内插法进行矢量多边形网格化的主要步骤如 下:1) 找出落在各个规则格网区域上的源区域;2) 确 定各个源区域与规则格网区域相交部分的面积,并 计算其占格网区域面积的百分比;3) 按照面积比例 的多少来分配属性值。 Goodchild 和Lam 在文献[8 ]中深入阐述了面积 权重内插的问题。认为数值型空间属性变量可分为 两种最基本的类型[ 8 ] :和值变量(extensive 变量) 和 均值变量(intensive 变量) 。在实际应用时,面积权 重内插法针对不同类型的属性变量有不同的表现形 式。某区域t 内和值变量X 的值Xt 等于组成该区 域各子区域属性变量值(Xi ) 的总和,即: Xt =Σ n i = 1 Xi 。 某区域t 内均值变量Y 的值Yt 等于组成该区域各 子区域属性变量值( Yi ) 按面积(Ai ) 比例的加权平均 值,即: Yt =Σ n i = 1 (Ai Yi )PΣ n i = 1 Ai 。显然,在图1 所示的例 子中“, 人口总数”是和值变量,而“人口密度”则是均 值变量。图3 是从图2 中抽取的局部区域的放大 图,按照面积权重内插法的规则进行计算,求得格网 区域a 、b、c 的属性值(表2) ;这显然与前文的中心点 归属法、面积占优法或者重要性法的计算结果都不 同。类似地,可以计算出图2 中其它格网区域的属 性值。 此主题相关图片如下: 2. 2 基于表面模型的面积内插法 数字表面模型(DTM) 是利用一个任意坐标场中 大量选择的X、Y、Z 的坐标点对连续表面的一个简 单的统计表示[ 9 ] 。DTM 是从DEM 的基础上发展起 来的,但它比DEM 的含义更为丰富,DTM 包含了地 形起伏和属性两个方面的含义,而且有时更主要的 是指“属性”方面的含义。因此,可以使用基于表面 模型的内插算法来进行矢量多边形网格化后属性值 的插值计算。当前,基于DTM 的内插已经有众多成 熟的算法,按照内插的性质可分为整体内插和局部 内插(又包括分块内插和逐点内插) 两类[ 9 ] ,相应地, 基于表面模型的面积内插也分为两类。 2. 2. 1 整体内插算法 整体内插算法又称全局光 滑算法,它的插值函数由研究区域内所有采样点的 属性值来确定,进而可利用这个插值函数进行全区 域的特征拟合。常用的整体插值算法有多项式趋势 面拟合、傅立叶分析、小波变换等[ 3 ,9 ] 。应用整体插 值算法计算矢量多边形网格化后区域属性值的基本 步骤如下:1) 对于属于和值变量的源区域的属性数 据,需先转换为均值变量(如“人口总数”需先转换为 “人口密度”) ;2) 找出源区域的中心点,将属性数据 连接到中心点上;3) 使用一种整体内插算法(如多项 式趋势面拟合等) ,将中心点的属性数据内插成网格 表面;4) 求出落在每个格网区域上的均值属性数据; 5) 如果需要求出和值变量属性数据,将均值变量数 据乘以格网区域的面积即可得出。 整体内插算法易于理解,处理属性分布变化简 单的区域时运算量小,采用低次多项式即可。但当 属性分布复杂时,随着采样点的增多,插值函数会变 得极不稳定,插值结果会出现难以控制的震荡现象。 另外,在这种情况下还需要解高次的线性方程组,源 区域中采样点位置或属性的微小变动都有可能导致 高次多项式参数的极大变化,从而使高次多项式插 值难以得到稳定解[ 9 ] 。该算法在实现时还存在一些 其他的问题,如源区域的中心点有可能落在区域之 外,从而导致插值的结果与实际的空间分布差别较 大。所以,整体内插算法虽然容易理解,却无法表达 短尺度的、局部的复杂变化,其解的不稳定性也决定 了该算法很少直接应用于空间插值,而是仅仅用于 检测整个区域中不同于总趋势的最大偏离部分。 2. 2. 2 局部内插算法 局部内插算法只使用邻近 的数据点来估计未知点的属性值,它可以保留局部 细节在空间区域上的变化,因而获得广泛应用。局 部内插的核心问题是邻近区域的确定。按照内插时 邻近区域的几何形态(包括形状、大小、位置) 是否可 变,局部内插可分为分块内插和逐点内插[ 9 ] 。分块 内插将整个插值空间区域分成若干分块,对各个分 块采用不同的函数,但分块范围在整个内插过程中 一经确定则不能改变;逐点内插则无此限制,它以待 插点为中心,定义一个局部函数来拟合周围的数据 点,邻近区域的范围随待插值点位置的变化而变化。 逐点内插虽然运算量较大,但灵活方便,且内插结果 精度较高,所以应用广泛。常用的分块内插算法有: 线性内插算法、双线性多项式内插算法、二元样条函 数内插、多面函数法、最小二乘配置法等[3 ] 。常用的 逐点内插算法有:最近邻点法(Voronoi 多边形法) 、移 动平均值法(距离倒数插值) 、空间自协方差最佳插值 法(克里金法) 等[9 ] 。基于局部内插算法进行矢量多 边形网格化的基本步骤与整体内插算法类似,只是在 第3) 步中使用一种局部内插算法,此处不再赘述。 各种内插算法在不同的属性分布区域和源区域 控制点不同的采样方式下会有不同的误差和精度。 分块内插的主要问题是分块大小的确定。分块的大 小应根据属性分布的复杂程度和源区域采样点的分 布密度来确定,一般要求两个邻近的分块间要有一 定的重叠,以保证两个分块间光滑连续的拼接。目 前,还没有一种智能化或自适应的分块内插方法来 确定分块的大小。逐点内插的计算量要比分块内插 大,其关键问题是内插窗口域的确定,采用不同的内 插窗口域将会严重影响内插的速度和精度。基于 Voronoi 多边形的逐点内插方法被认为是一种较好 的局部内插算法。 2. 3 基于统计模型的面积内插法 在现实世界中,很多空间属性信息的分布是遵 循一定规律的,可采用一定的数学分布模型(如泊松 分布、二项式分布或正态分布) 来表达其空间变化特 征[ 4 ,10 ] 。显然,面积权重内插法和基于表面模型的 面积内插算法都没有考虑这种数学分布模型的作 用,因此,其插值结果可能会与实际的空间分布出入 甚大。一种比较新的解决方案是将这些数学统计模 型应用于面积内插,得到一个覆盖全区的通用函数, 然后将这个函数应用于各个格网区域上,从而求得 各格网区域的属性值。基于统计模型的面积内插算 法利用附加的空间数据数学分布模型,采用随机的 概念来处理面积内插的不确定性问题,从理论上讲 应该具有更高的精度[ 5 ] 。但是该方法在实践中难度 较大,因为附加的空间数据数学分布模型的获取并 不容易,而又有许多的实际数据很难判断其究竟该 采用何种数学分布模型来描述,这大大限制了其应 用的范围与发展前景。因此,目前还很少见到该算 法在矢量多边形网格化中的实际应用。 3 结语 格网区域数据作为GIS 中一类重要的数据组织 方式,对GIS 各种分析功能的应用与实现有着极为 重要的意义。矢量多边形区域数据则是另一类被广 泛应用的实际数据表现形式,矢量多边形区域数据 到格网区域数据的转化方法决定了格网数据的精 度,并影响后续空间分析结果的精度。因此,将不规 则的矢量多边形区域转换为规则的格网区域时,应 根据属性数据的分布特征与应用要求选用适当的算 法。当前,在大多数GIS 软件上都能实现中心点归 属法、面积占优法、重要性法和面积权重内插法,ArcP Info 的Grid 模块更是实现了一些基于表面模型的面 积内插算法,而基于统计模型的面积内插算法则应用 较少,主要是因为该方法需要附加信息且非常复杂烦 琐。需要指出的是,面积内插并不仅仅应用于矢量多 边形区域网格化,它还有更为深广的应用。事实上, 一切由源区域到目标区域(可能也为不规则的矢量多 边形区域) 的转换(这在GIS 的空间分析中是极为常 见的) 都可以进行面积内插[11 ] 。因此,更为全面彻底 地研究各类面积内插算法的实现并评估其精度就无 可避免的成为当前一个极为迫切的任务。 参考文献: [1 ] 修文群,池天河. 城市地理信息系统[M] . 北京:希望电子出版 社,1999. [2 ] 吴信才. 地理信息系统的基本技术与发展动态[J ] . 地球科学— 中国地质大学学报,1998 ,23 (4) :329 - 333. [3 ] 邬伦, 刘瑜, 张晶, 等. 地理信息系统———原理、方法和应用 [M] . 北京:科学出版社,2000. [4 ] 吕安民,李成名,林宗坚. 面积内插算法初探[ J ] . 测绘通报, 2002 ,24 (1) :44 - 46. [ 5 ] 刘建军,李春来. 基于遥感和GIS 的巢湖流域人口信息提取 [J ] . 科学通报,2002 ,47 (23) :1835 - 1837. [6 ] 吕安民,李成名,林宗坚. 人口统计数据的空间转换[J ] . 干旱区 地理,2002 ,25 (2) :170 - 175. [ 7 ] 吕安民,李成名,林宗坚. 面积内插方法及其在GIS 中应用[J ] . 地球信息科学,2001 ,5 (4) :25 - 29. [ 8 ] GOODCHILD , LAM. Areal interpolation : a variant of the tradi2 tional spatial problem [J ] . Geo - Processing ,1980 , 27 (1) : 297 - 312. [9 ] 李志林,朱庆. 数字高程模型[M] . 武汉:武汉测绘科技大学出 版社,2000. [10 ] 吕安民,刘海启,李成名,等. 人口密度的面积内插算法研究 [J ] . 中国农业资源与区划,2002 ,23 (1) :35 - 40. [11 ] 郭仁忠. 空间分析[ M] . 武汉: 武汉测绘科技大学出版社, 2000. |
GIS 中矢量多边形网格化问题研究
GIS 中矢量多边形网格化问题研究 | |
2005-6-21 15:41:34 作者- 朱良峰,吴信才 ,刘修国 来源- 中国地质大学研究生 阅读768次 [大 中 小] | |
摘要:在实际的GIS 空间分析过程中,为了更加简便快捷的实现某些特定的空间分析功能,常常需要将不规则的矢 量多边形区域转化为规则的格网区域。该文介绍了矢量多边形网格化的四类算法:中心点归属法、面积占优法、重 要性法和面积内插法。其中面积内插法又可分为面积权重内插法、基于表面模型的面积内插法和基于统计模型的 面积内插法。同时介绍了各类算法的实现思想,并比较了其优劣及应用范围,认为基于表面模型的面积内插法是 一种比较理想且极具发展前景的矢量多边形网格化方法。 关键词:地理信息系统;矢量多边形;网格化;面积内插 中图分类号:P208 文献标识码:A 文章编号:1672 - 0504 (2004) 01 - 0012 - 04 地理信息系统( GIS) 是对与地理空间相关的信息进行有效管理与综合分析的计算机系统, GIS 把各种与空间信息相关的技术与学科有机的融合在一起,并与不同数据源的空间与非空间数据相结合,通过空间操作与模型分析,提供对规划、管理、决策有 用的信息产品[ 1 ,2 ] 。目前,GIS 已成为处理空间信息的标准方法。GIS 的核心功能是空间分析,它特有的对地理空间信息特别是隐含信息的提取、表现和传输功能[ 3 ] ,是GIS 区别于一般信息系统的主要功能特征。在进行GIS 空间分析时,所获取的空间数 据有相当大的一部分与一定的空间区域分布有关,对这些数据,多数GIS 系统采用分层存储的方式进行处理,即将空间信息划分为众多专题图层(由于大多数区域单元的边界是不规则的,这些专题图层在数据结构上表现为不规则的矢量多边形) ,然后对这 些专题图层进行相应的空间分析操作。但直接对这些不规则的矢量多边形区域进行各类空间分析操作并不容易,例如,区域叠加就是一类常见的空间分析操作,但由于矢量多边形的数据结构复杂,对矢量多边形区域进行叠加操作后常会出现“碎屑多边形”(Sliver polygon) ,虽然可采用一些算法(如设定一模糊容限) 来消除它,但这会明显降低空间分析的精度。另外,对多个矢量多边形区域叠加后的结果也 不易进行其它分析与量算。因此,在进行实际的空间分析时,常常需要将边界不规则的矢量多边形区域转换为边界较为规则的格网状区域(如正方形、三角形或矩形区域) ,再对这些格网状区域进行各种空间分析操作与属性运算。相比于不规则的矢量多边 形区域,格网区域的数据结构简单,易于在其上进行各种空间分析操作(特别是区域叠加操作) ,并可及时更新数据,从而使信息具有较强的现势性。本文介绍将不规则矢量多边形区域网格化为规则的格网区域时出现的问题及解决办法,在分析现有网格化算法的基础上,阐明各类算法的优缺点及应用领域,以期能对实际的GIS 空间分析起一定的指导作用。1 矢量多边形网格化算法从本质上来讲,矢量多边形区域网格化是一个 从源区域(不规则的矢量多边形区域) 到目标区域(规则的格网区域) 的转换过程,这种转换不仅包括区域边界形状的改变,更重要的是它还包括源区域所包含的属性信息到目标区域的属性信息的转换。按照属性信息转换规则的差异,矢量多边形网格化有四类算法[ 3 - 6 ] ,即中心点归属法、面积占优法、重要性法和面积内插法。在矢量多边形网格化时,应使生成的格网区域尽量保持区域属性的真实性,最 大限度保留或体现源区域所蕴含的属性信息。下面以一个简单的研究实例来说明各类算法的实现思想和应用范围。 如图1 所示,研究区域按照自然地理边界可划分为三个多边形区域A、B、C ,各区的属性信息见表1 。现在需要将研究区域网格化为50 ×50 m 的格网状区域(图2) 。不可避免地,网格化后得到的格网区域可能有落在多个源区域的情况(如图2 中含阴影 斜线的格网区域a 、b、c) 。那么,究竟该按照怎样的规则才能实现最大限度地合理推定这些格网区域上 的属性值呢? 此主题相关图片如下: (1) 中心点归属法是一种最为简单的属性判别方法,它将各个格网区域中心点所在的源区域的属性值作为整个格网区域(目标区域) 的属性值。按照中心点归属法的规则,在图2 中,网格a 的中心点落在源区域B 内,所以格网区域a 的属性值与B 同,即:面积为2 500 m2 ,人口密度为1 97414 人P km2 ,人口总数为4194 人;网格b 的中心点落在源区域C内,属性值与C 同,即:面积为2 500 m2 ,人口密度为 3 05711人P km2 ,人口总数为7164 人;网格c 的中心点落在源区域A 内,属性值与A 同,即:面积为2 500m2 ,人口密度为2 75511 人P km2 ,人口总数为6189人。一般而言,中心点归属法适用于具有连续分布特征的地理要素,如降水量分布、人口密度图等。在 实际应用时,可能会有格网区域的中心点落在多个源区域的边界上而无法判别中心点位置归属的情况,这需要结合其他方法(如面积占优法、重要性法 或者面积内插法) 来确定,或者直接由分析者根据经验和需要来指定其属性值。(2) 面积占优法是指由在格网区域的组成中占 面积比例最大的源区域的属性值来决定整个格网区域的属性值,它适用于分类较细、格网较小的情况。在图2 中,按照面积占优法的规则,格网区域a 和b的属性值不变;格网区域c 属性值应为:面积2 500m2 ,人口密度3 05711 人Pkm2 ,人口总数7164 人。 (3) 重要性法是指根据落在格网区域内不同源区域的重要性而选取最重要的源区域来决定该格网区域的属性值,它适用于具有特殊意义且面积较少的区域。如在图2 中,若源区域A 的社会经济发展水平远较源区域B、C 为高,且需要重点考察源区域A内的人口分布情况(或其他相关的空间信息分布) ,则可按照重要性法将图2 中的格网区域a 、b、c的属性值都赋为与源区域A 相同。 (4) 上面的三种方法都是以一个源区域的属性值来决定目标区域(格网区域) 的属性值,但事实上,目标区域往往是由多个源区域组成的,这就需要考虑它们的共同作用与影响。面积内插法可以有效的解决这个问题。所谓面积内插,是指按照源区域空间数据的分布特征与规律,采用一定的插值算法求取目标区域中的数据分布[ 7 ,8 ] 。面积内插算法有多种,总体上可分为三类:面积权重内插法、基于表面 模型的面积内插法、基于统计模型的面积内插法。 2 面积内插模型及相关算法 2. 1 面积权重内插法 面积权重内插法是一种比较简单且相对直观的算法,它根据规则格网区域内各源区域所占面积的百分比来确定格网区域的属性数值[ 6 ,7 ] 。应用面积权重内插法进行矢量多边形网格化的主要步骤如 下:1) 找出落在各个规则格网区域上的源区域;2) 确 定各个源区域与规则格网区域相交部分的面积,并 计算其占格网区域面积的百分比;3) 按照面积比例 的多少来分配属性值。 Goodchild 和Lam 在文献[8 ]中深入阐述了面积 权重内插的问题。认为数值型空间属性变量可分为 两种最基本的类型[ 8 ] :和值变量(extensive 变量) 和 均值变量(intensive 变量) 。在实际应用时,面积权 重内插法针对不同类型的属性变量有不同的表现形 式。某区域t 内和值变量X 的值Xt 等于组成该区 域各子区域属性变量值(Xi ) 的总和,即: Xt =Σ n i = 1 Xi 。 某区域t 内均值变量Y 的值Yt 等于组成该区域各 子区域属性变量值( Yi ) 按面积(Ai ) 比例的加权平均 值,即: Yt =Σ n i = 1 (Ai Yi )PΣ n i = 1 Ai 。显然,在图1 所示的例 子中“, 人口总数”是和值变量,而“人口密度”则是均 值变量。图3 是从图2 中抽取的局部区域的放大 图,按照面积权重内插法的规则进行计算,求得格网 区域a 、b、c 的属性值(表2) ;这显然与前文的中心点 归属法、面积占优法或者重要性法的计算结果都不 同。类似地,可以计算出图2 中其它格网区域的属 性值。 此主题相关图片如下: 2. 2 基于表面模型的面积内插法 数字表面模型(DTM) 是利用一个任意坐标场中 大量选择的X、Y、Z 的坐标点对连续表面的一个简 单的统计表示[ 9 ] 。DTM 是从DEM 的基础上发展起 来的,但它比DEM 的含义更为丰富,DTM 包含了地 形起伏和属性两个方面的含义,而且有时更主要的 是指“属性”方面的含义。因此,可以使用基于表面 模型的内插算法来进行矢量多边形网格化后属性值 的插值计算。当前,基于DTM 的内插已经有众多成 熟的算法,按照内插的性质可分为整体内插和局部 内插(又包括分块内插和逐点内插) 两类[ 9 ] ,相应地, 基于表面模型的面积内插也分为两类。 2. 2. 1 整体内插算法 整体内插算法又称全局光 滑算法,它的插值函数由研究区域内所有采样点的 属性值来确定,进而可利用这个插值函数进行全区 域的特征拟合。常用的整体插值算法有多项式趋势 面拟合、傅立叶分析、小波变换等[ 3 ,9 ] 。应用整体插 值算法计算矢量多边形网格化后区域属性值的基本 步骤如下:1) 对于属于和值变量的源区域的属性数 据,需先转换为均值变量(如“人口总数”需先转换为 “人口密度”) ;2) 找出源区域的中心点,将属性数据 连接到中心点上;3) 使用一种整体内插算法(如多项 式趋势面拟合等) ,将中心点的属性数据内插成网格 表面;4) 求出落在每个格网区域上的均值属性数据; 5) 如果需要求出和值变量属性数据,将均值变量数 据乘以格网区域的面积即可得出。 整体内插算法易于理解,处理属性分布变化简 单的区域时运算量小,采用低次多项式即可。但当 属性分布复杂时,随着采样点的增多,插值函数会变 得极不稳定,插值结果会出现难以控制的震荡现象。 另外,在这种情况下还需要解高次的线性方程组,源 区域中采样点位置或属性的微小变动都有可能导致 高次多项式参数的极大变化,从而使高次多项式插 值难以得到稳定解[ 9 ] 。该算法在实现时还存在一些 其他的问题,如源区域的中心点有可能落在区域之 外,从而导致插值的结果与实际的空间分布差别较 大。所以,整体内插算法虽然容易理解,却无法表达 短尺度的、局部的复杂变化,其解的不稳定性也决定 了该算法很少直接应用于空间插值,而是仅仅用于 检测整个区域中不同于总趋势的最大偏离部分。 2. 2. 2 局部内插算法 局部内插算法只使用邻近 的数据点来估计未知点的属性值,它可以保留局部 细节在空间区域上的变化,因而获得广泛应用。局 部内插的核心问题是邻近区域的确定。按照内插时 邻近区域的几何形态(包括形状、大小、位置) 是否可 变,局部内插可分为分块内插和逐点内插[ 9 ] 。分块 内插将整个插值空间区域分成若干分块,对各个分 块采用不同的函数,但分块范围在整个内插过程中 一经确定则不能改变;逐点内插则无此限制,它以待 插点为中心,定义一个局部函数来拟合周围的数据 点,邻近区域的范围随待插值点位置的变化而变化。 逐点内插虽然运算量较大,但灵活方便,且内插结果 精度较高,所以应用广泛。常用的分块内插算法有: 线性内插算法、双线性多项式内插算法、二元样条函 数内插、多面函数法、最小二乘配置法等[3 ] 。常用的 逐点内插算法有:最近邻点法(Voronoi 多边形法) 、移 动平均值法(距离倒数插值) 、空间自协方差最佳插值 法(克里金法) 等[9 ] 。基于局部内插算法进行矢量多 边形网格化的基本步骤与整体内插算法类似,只是在 第3) 步中使用一种局部内插算法,此处不再赘述。 各种内插算法在不同的属性分布区域和源区域 控制点不同的采样方式下会有不同的误差和精度。 分块内插的主要问题是分块大小的确定。分块的大 小应根据属性分布的复杂程度和源区域采样点的分 布密度来确定,一般要求两个邻近的分块间要有一 定的重叠,以保证两个分块间光滑连续的拼接。目 前,还没有一种智能化或自适应的分块内插方法来 确定分块的大小。逐点内插的计算量要比分块内插 大,其关键问题是内插窗口域的确定,采用不同的内 插窗口域将会严重影响内插的速度和精度。基于 Voronoi 多边形的逐点内插方法被认为是一种较好 的局部内插算法。 2. 3 基于统计模型的面积内插法 在现实世界中,很多空间属性信息的分布是遵 循一定规律的,可采用一定的数学分布模型(如泊松 分布、二项式分布或正态分布) 来表达其空间变化特 征[ 4 ,10 ] 。显然,面积权重内插法和基于表面模型的 面积内插算法都没有考虑这种数学分布模型的作 用,因此,其插值结果可能会与实际的空间分布出入 甚大。一种比较新的解决方案是将这些数学统计模 型应用于面积内插,得到一个覆盖全区的通用函数, 然后将这个函数应用于各个格网区域上,从而求得 各格网区域的属性值。基于统计模型的面积内插算 法利用附加的空间数据数学分布模型,采用随机的 概念来处理面积内插的不确定性问题,从理论上讲 应该具有更高的精度[ 5 ] 。但是该方法在实践中难度 较大,因为附加的空间数据数学分布模型的获取并 不容易,而又有许多的实际数据很难判断其究竟该 采用何种数学分布模型来描述,这大大限制了其应 用的范围与发展前景。因此,目前还很少见到该算 法在矢量多边形网格化中的实际应用。 3 结语 格网区域数据作为GIS 中一类重要的数据组织 方式,对GIS 各种分析功能的应用与实现有着极为 重要的意义。矢量多边形区域数据则是另一类被广 泛应用的实际数据表现形式,矢量多边形区域数据 到格网区域数据的转化方法决定了格网数据的精 度,并影响后续空间分析结果的精度。因此,将不规 则的矢量多边形区域转换为规则的格网区域时,应 根据属性数据的分布特征与应用要求选用适当的算 法。当前,在大多数GIS 软件上都能实现中心点归 属法、面积占优法、重要性法和面积权重内插法,ArcP Info 的Grid 模块更是实现了一些基于表面模型的面 积内插算法,而基于统计模型的面积内插算法则应用 较少,主要是因为该方法需要附加信息且非常复杂烦 琐。需要指出的是,面积内插并不仅仅应用于矢量多 边形区域网格化,它还有更为深广的应用。事实上, 一切由源区域到目标区域(可能也为不规则的矢量多 边形区域) 的转换(这在GIS 的空间分析中是极为常 见的) 都可以进行面积内插[11 ] 。因此,更为全面彻底 地研究各类面积内插算法的实现并评估其精度就无 可避免的成为当前一个极为迫切的任务。 参考文献: [1 ] 修文群,池天河. 城市地理信息系统[M] . 北京:希望电子出版 社,1999. [2 ] 吴信才. 地理信息系统的基本技术与发展动态[J ] . 地球科学— 中国地质大学学报,1998 ,23 (4) :329 - 333. [3 ] 邬伦, 刘瑜, 张晶, 等. 地理信息系统———原理、方法和应用 [M] . 北京:科学出版社,2000. [4 ] 吕安民,李成名,林宗坚. 面积内插算法初探[ J ] . 测绘通报, 2002 ,24 (1) :44 - 46. [ 5 ] 刘建军,李春来. 基于遥感和GIS 的巢湖流域人口信息提取 [J ] . 科学通报,2002 ,47 (23) :1835 - 1837. [6 ] 吕安民,李成名,林宗坚. 人口统计数据的空间转换[J ] . 干旱区 地理,2002 ,25 (2) :170 - 175. [ 7 ] 吕安民,李成名,林宗坚. 面积内插方法及其在GIS 中应用[J ] . 地球信息科学,2001 ,5 (4) :25 - 29. [ 8 ] GOODCHILD , LAM. Areal interpolation : a variant of the tradi2 tional spatial problem [J ] . Geo - Processing ,1980 , 27 (1) : 297 - 312. [9 ] 李志林,朱庆. 数字高程模型[M] . 武汉:武汉测绘科技大学出 版社,2000. [10 ] 吕安民,刘海启,李成名,等. 人口密度的面积内插算法研究 [J ] . 中国农业资源与区划,2002 ,23 (1) :35 - 40. [11 ] 郭仁忠. 空间分析[ M] . 武汉: 武汉测绘科技大学出版社, 2000. |