基于多方位DEM地形晕渲的黄土地貌正负地形提取

  • 陈永刚 , 1, 2 ,
  • 汤国安 1 ,
  • 周毅 1 ,
  • 李发源 1 ,
  • 宴实江 1 ,
  • 张磊 1
展开
  • 1.南京师范大学虚拟地理环境教育部重点实验室, 江苏 南京 210046
  • 2.浙江农林大学浙江省森林生态系统碳循环与固碳减排重点实验室, 浙江 临安 311300

作者简介: 陈永刚(1980-),男,内蒙兴和人,博士研究生,从事DEM信息提取研究及GIS在林业中应用开发工作。E-mail:

收稿日期: 2011-02-20

  要求修回日期: 2011-04-11

  网络出版日期: 2012-01-20

基金资助

国家自然科学基金项目(40930531、40801148)、浙江省教育厅项目(Y201017891)资助

The Positive and Negative Terrain of Loess Plateau Extraction Based on the Multi-azimuth DEM Shaded Relief

  • CHEN Yong-gang , 1, 2 ,
  • TANG Guo-an 1 ,
  • ZHOU Yi 1 ,
  • LI Fa-yuan 1 ,
  • YAN Shi-jiang 1 ,
  • ZHANG Lei 1
Expand
  • 1.Key Laboratory of Virtual Geogrpahic Environment of Ministry of Education,Nanjing Normal University,Nanjing, Jiangsu 210046,China
  • 2. Zhejiang Provincial Key Laboratory of Carbon Cycling in Forest Ecosystems and Carbon Sequestration, Zhejiang Agriculture and Forestry University, Lin’an, Zhejiang 311300, China

Received date: 2011-02-20

  Request revised date: 2011-04-11

  Online published: 2012-01-20

Copyright

本文是开放获取期刊文献,在以下情况下可以自由使用:学术研究、学术交流、科研教学等,但不允许用于商业目的.

摘要

以陕北绥德县韭园沟流域5 m分辨率DEM数据为基础,在数字地形分析、多元统计和数据挖掘方法的基础上,提出利用多方位DEM地形晕渲、坡度等多元指标,以主成分分析消除多重共线性和约减维数,并以Logistic回归模型提取黄土高原正、负地形的方法。研究结果表明:模型提取精度为82.1%,Kappa统计量为0.629;模型在6个不同流域测试样本上正、负地形的平均精度分别为77.6%,84.9%,加权平均精度为81.3%,模型具有较好的一致性和泛化能力,正、负地形提取效果良好。

本文引用格式

陈永刚 , 汤国安 , 周毅 , 李发源 , 宴实江 , 张磊 . 基于多方位DEM地形晕渲的黄土地貌正负地形提取[J]. 地理科学, 2012 , 32(1) : 105 -109 . DOI: 10.13249/j.cnki.sgs.2012.01.105

Abstract

Based on the DEM data of Jiuyuangou wateshed in Suide County, Shaanxi of China, with a spatial resolution of 5 m, employing the digital terrain analysis, multivariate statistics and data mining methods, multiple indexes of multi-azimuth DEM shaded relief and slope are established. The solutions of extraction positive and negative terrain of loess plateau by Principle Components Analysis, and Logistic regression model is proposed. The result indicates that: the extracting model has better consistency and accuracy, of which the accuracy is 82.1% and Kappa statistics is 0.6298. Tested on 6 samples of different valley by this model, the mean accuracy of positive and negative terrain are at 77.6% and 84.9%, and weighed mean accuracy is 81.3%. It is suitable to extract positive and negative terrain of loess plateau by PCA and Logistic regression model.

黄土高原丘陵沟壑区正、负地形单元及其组合形态特征是构建区域空间分布式机理—过程模型的基础地理参数,也是衡量地表侵蚀和地貌发育的重要指标[1~3]。闾国年等提出基于DEM和地貌形态学特征的沟沿线提取技术方法[2];朱红春等利用坡度变异信息,实现沟沿线的提取[4];刘鹏举等利用栅格单元间八流向算法构建水流路径,提出了一种基于汇流路径坡度变化特征确定沟坡段,进一步形成封闭沟沿线的方法[5]。周毅等利用坡度信息和汇水模型提取沟沿线点约束的上游汇水区域,实现正、负地形的自动分割[1,6]。然而,由于黄土地形的复杂性及沟沿线的局部断续性,正、负地形的自动提取技术上还存在较多问题。本文在总结前人研究的基础上,利用数字地形分析、多元统计和数据挖掘的方法,提出了利用多方位DEM地形晕渲、坡度等多元指标自动提取正负地形的新思路和方法。

1 研究区概况和研究方法

1.1 研究区概况与黄土地貌正负地形

研究区位于陕西省榆林地区绥德县韭园沟流域,流域面积约25 km2。该区域是典型的黄土丘陵地区,地表形态复杂,沟谷纵横,以充分发育的梁峁地形为主,海拔在851.30 ~1 103.50 m之间,平均海拔高程980.06 m,地表平均坡度为28.7°[4]。在黄土丘陵区,沟沿线将地面划分成其上部的沟间地与下部的沟坡地、沟底地,同时沟沿线也是明显的土壤侵蚀类型和土地利用分界线[1,3,6]。沟沿线将黄土地貌划分为两大基本地貌单元,即以沟间地为主的正地形区域和以沟谷地为主的负地形区域。正、负地形在黄土高原地区物质与能量输移过程中扮演着重要的角色,它是衡量地表侵蚀和地貌发育的重要指标[1,3,7]

1.2 数据来源与处理

在绥德县韭园沟流域,任意选择1个流域作为提取模型学习样区,任选6个小流域作为模型测试样区。为保证所建立模型具有一定的可靠性和稳定性,在流域的上、中和下游的不同位置选取样区(图1)。
Fig.1 Sketch of tudy area

图1 研究区

数据使用的是西安测绘局在2006年生产的1:10 000比例尺、5 m分辨率 DEM作为基本数据源,进行正负地形的提取,以从航空正射影像图上手工勾绘的正负地形作为提取模型精度评价的参照资料。利用ArcGIS软件,分别以太阳方位角0、45°、90°、135°、180°、225°、270°、315°,太阳高度角60°、75°,以及太阳方位角0和太阳高度角90°提取研究样区的地形晕渲(HillShade)值。利用研究样区不同太阳高度角和方位角的17个地形晕渲值,以及坡度和高程作为正负地形提取模型的解释变量(合计19个),以手工在正射影像勾绘的正负地形作为模型的响应变量,共20个数据整合成一个数据立方体。

1.3 研究方法

1) DEM地形晕渲计算方法。地形晕渲法是通过光照使地貌各部位产生不同的受光量来表现地貌的明暗变化[8~10]。地形晕渲法是通过模拟太阳光对地面照射所产生的明暗程度,得到随光度近似连续变化的色调,达到地形的明暗对比,使地貌的分布、起伏和形态特征显示具有一定的立体感,能较好地反映区域地理特征和地面起伏变化[8,11]。计算公式如下:
G=Gmax [cos (af-as) sinHf cosHs+cosHf sinHs] (1)
G=Gmax [cosHf +cos (af -as) sinHf cosHs] (2)
式中,Gmax是最大灰度级,一般取255;af是格网单元的坡向,取值范围为0~360°;as是太阳方位角,取值范围为0~360°;Hf是格网单元的坡度,取值范围为0~90°;Hs是太阳高度角,取值范围为0~90°[11]
2) 主成分分析与Logistic回归。主成分分析方法可去除原始样本数据间的相关性,删除其中的冗余信息,以达到降低数据维数和消除数据多重共线性的目的[12,13]。由于变量间存在着一定的相关关系,其基本思想就是将若干个彼此相关的变量转为彼此独立的新变量,使得较少的几个新变量就能综合反映原变量中所包含的主要信息[12]
Logistic回归模型已广泛应用于土地利用动态模拟[14,15]、退耕还林[16]等方面的研究。二值Logistic回归模型是针对二值响应变量建立的回归模型,其自变量可为定性或定量数据,其回归模型值是条件概率P,其值介于0~1之间, 值越大则发生的可能性越大。

2 试验与分析

2.1 以流域为单元的DEM地形晕渲、高程、坡度和正负地形多维数据整合

针对研究样区1个学习样本和6个测试样本数据,将不同太阳高度角和方位角的17个Dem地形晕渲值、高程、坡度及手工勾绘的正负地形共20层栅格数据,利用Python脚本根据空间对应关系将其转换成一个二维数据表,一行即为一个栅格对应的多个侧面多维数据。流域学习样本数据和流域测试样本数据结构完全相同,0表示正地形,1表示负地形。

2.2 基于主成分分析的特征提取

利用Minitab中的主成分分析功能对学习样区数据进行主成分分析(图2表1)。
Fig. 2 Principal component screeplot (a) and loading (b)

图2 主成分碎石(a)、载荷(b)

表1所示为各成分贡献率及累计贡献率。从表1可知:前4个主成分的累计贡献率达99.8%,因此可以只取前面4个主成分,它们就能够很好地概括原始变量。图2可看出:主成分1、2、3和 4 的特征值比较大,相对而言,其他因子的特征值较小,可以初步得出,提取前4个主成分就能概括绝大部分信息。表1图2主成分碎石图显示的信息结论一致。
Table 1 Eigenvalue and contribution rate

表1 特征值与贡献率

项目 1 2 3 4 5 17 18 19
特征值 7.6459 6.5736 3.8480 0.8922 0.0395 0.0000 0.0000 0.0000
贡献率 0.4020 0.3460 0.2030 0.0470 0.0020 0.0000 0.0000 0.0000
累计贡献率 0.4020 0.7480 0.9510 0.9980 1.0000 1.0000 1.0000 1.0000
载荷图中的主成分载荷,表示主成分和原先变量的相关系数。相关系数(绝对值)越大,主成分对该变量的代表性也越大。相聚越近的变量,正相关程度越高;距离原点越远,说明该变量被主成分解释得越充分。图2b是第一和第二主成分的载荷图,从主成分载荷图可以看出:多方位的DEM地形晕渲值、坡度和高程均对主成分信息有贡献,其中坡度和地形晕渲贡献较大,而高程则贡献较小。这也反映了利用地形晕渲值、坡度等提取正负地形是有理论依据的,同时,也表明仅使用单因素坡度方法提取正负地形,利用的信息不够充分。

2.3 基于Logistic回归的正负地形提取及模型精度评价

利用R语言中的glm函数,对经主成分分析变换后的数据做logistic回归(表2)。
Table 2 Logistic regression coefficients and significance test

表2 Logistic回归系数及显著性检验

变量名 系数 标准差 Z 概率P
常数项 0.5471 0.0136 40.240 0.000
Y1 0.5950 0.0063 94.300 0.000
Y2 0.0802 0.0051 15.680 0.000
Y3 0.0842 0.0066 12.680 0.000
Y4 1.6539 0.0178 92.920 0.000
通过表2可知,提取正负地形的Logistic模型为下式(1)所示。
p = exp ( 0.5471 + 0.5950 Y 1 + 0.0802 Y 2 + 0.0842 Y 3 + 1.6539 Y 4 ) 1 + exp ( 0.5471 + 0.5950 Y 1 + 0.0802 Y 2 + 0.0842 Y 3 + 1.6539 Y 4 )
(1)
式中,Y1Y2Y3Y4为经主成分分析变换后的4个主分量,因变量为正地形预测条件概率P。通过表2的概率P可知,Logistic回归方程各系数回归极为显著。
模型精度评估是正负地形提取模型选择及模型是否具有可用性的重要评价检验指标。利用10-折交叉检验方法,对式(1)回归模型进行精度检验。模型的Kappa统计量为0.629 8,模型精度为82.1%,模型具有较好的一致性和精度(表3)。
Table 3 Model accuracy evaluation

表3 模型精度评价

项 目 TP FP Precision Recall F-Measure ROC
正地形 0.868 0.244 0.832 0.868 0.85 0.897
负地形 0.756 0.132 0.805 0.756 0.78 0.897
加权平均值 0.821 0.197 0.821 0.821 0.82 0.897

2.4 以测试样本检验正负地形提取精度

在实际应用之前,不能仅从学习样本评价模型精度,还必须经过测试样本测试以确认其分类精度。测试是以学习得到的模型对“测试样本”进行分类,并将分类结果和该样本的实际类别归属相对照,以此评价分类器的性能。根据式(1)对6个样区进行测试,且对生成结果利用邻域分析进行去噪处理。在每组对比图中,前图为人工勾绘结果,后图为模型生成结果(图3)。模型检验精度结果如表4所示。
Table 4 Accuracy of testing samples

表4 测试样区精度

测试样区 正地形精度 负地形精度 加权平均精度
1 0.788 0.855 0.820
2 0.809 0.809 0.809
3 0.703 0.725 0.713
4 0.748 0.951 0.862
5 0.819 0.882 0.848
6 0.787 0.872 0.826
平均值 0.776 0.849 0.813
图3发现,提取模型基本上对正负地形的主干提取效果较好,但边缘部分存在“碎屑”和“空洞”,其有待改进。从表4也可以看出,提取模型在6个不同流域的测试样本上,提取正地形、负地形的平均精度分别为77.6%,84.9%,加权平均提取精度为81.3%。Logistic回归模型在测试样本上的精度接近于模型的评估精度。结果证明,整合多方位DEM地形晕渲、坡度和高程数据,利用主成分分析和Logistic回归模型提取黄土地貌正负地形的方法是可行的、有效的。以此为基础,完全可以实现无人工干预的、以Logistic回归判别概率P为基础的,全自动化正负地形计算机提取。
Fig.3 Comparison of study area

图3 研究样区对比

3 结论与讨论

1) 以多方位DEM地形晕渲提取黄土地貌正、负地形的方法改变了以往仅局限于地貌形态学、坡面形态和坡面汇水机理等单指标单因素的方法,综合考虑多方位太阳光照、坡面形态、高程等多元因素,具有更好的正、负地形提取效果。
2) 利用主成分分析对多元解释变量个数进行有效的约减,降低数据的维数;同时,利用主成分分析有效的消除了解释变量间多重共线性的问题,使回归模型更为稳健。
3) 提出以流域作为判别和提取正、负地形的基本单元的思路。利用Logistic回归模型提取判别黄土高原的正、负地形具有较好的应用适宜性。利用Logistic回归既建立解释变量与因变量的严密数学关系,也利用判别条件概率P度量了沟沿线的断续性和不确定性。
4) 在本文中还存在很多的不足,由于计算机性能的限制,本文仅选用一个流域作为训练样区,样本的代表性和样本量存在选取不足的问题;模型基本上对正负地形的主干提取效果较好,但边缘部分提取效果较差,提取精度还有待提高。此外如何更好的保留边缘细部特征和如何进一步提高提取精度仍有待研究。

The authors have declared that no competing interests exist.

[1]
周毅,汤国安,王春,等.基于高分辨率DEM的黄土地貌正负地形自动分割技术研究[J].地理科学,2010,30(2): 261~266.

[2]
闾国年,钱亚东,陈钟明.基于栅格数字高程模型自动提取黄土地貌沟沿线技术研究[J].地理科学,1998,18(6): 567~573.

[3]
杨勤科. 小流域土壤侵蚀评价与水土保持规划研究[D].西北农林科技大学,2001.

[4]
朱红春,汤国安,张友顺,等.基于DEM提取黄土丘陵区沟沿线[J].水土保持通报,2003,23(5): 43~45.

[5]
刘鹏举,朱清科,吴东亮,等.基于栅格DEM与水流路径的黄土区沟缘线自动提取技术研究[J].北京林业大学学报,2006,28(4):72~76.

[6]
Zhou Y,Tang G,Yang X,et al.Positive and negative terrains on northern Shaanxi Loess Plateau[J].Journal of Geographical Sciences,2010,20(1):64-76.

[7]
罗来兴. 划分晋西、陕北、陇东黄土区域沟间地与沟谷的地貌类型[J].地理学报,1956,22(3):201~222.

[8]
郭庆胜,王晓延.地貌晕渲中光源使用方法与用色规则的研究[J].武汉大学学报(信息科学版),2004,29(1):20~23.

[9]
Yoeli P.The mechanisation of analytical hill shading[J].Cartographic Journal,1967,4(2):82~88.

[10]
姜文亮,李霖,应申.计算机地貌晕渲效果增强方法研究[J].武汉大学学报(信息科学版),2007,32(12):1176~1179.

[11]
周启鸣,刘学军.数字地形分析[M].北京:科学出版社,2006.

[12]
Moore B.Principal component analysis in linear systems: Controllability, observability, and model reduction[J]. Automatic Control,IEEE Transactions on,2002,26(1):17-32.

[13]
王富喜,孙海燕,孙峰华.山东省城乡发展协调性空间差异分析[J].地理科学,2009,29(3): 323~328.

[14]
陆汝成,黄贤金,左天惠,等.基于CLUE—S 和 Markov 复合模型的土地利用情景模拟研究——以江苏省环太湖地区为例[J].地理科学,2009,29(4):577~581.

[15]
邵一希,李满春,陈振杰,等.地理加权回归在区域土地利用格局模拟中的应用——以常州市孟河镇为例[J].地理科学,2010,30(1):92~97.

[16]
马岩,陈利顶,虎陈霞.黄土高原地区退耕还林工程的农户响应与影响因素——以甘肃定西大牛流域为例[J].地理科学,2008,28(1):34~39.

文章导航

/