收稿日期: 2016-04-25
修回日期: 2016-11-1
网络出版日期: 2017-04-20
版权声明: 2017 《地球信息科学学报》编辑部 《地球信息科学学报》编辑部 所有
作者简介:周 勋(1991-),男,安徽宁国人,硕士生,研究方向为气候变化与生态系统响应、生态模型与系统模拟。E-mail:zhoux@lreis.ac.cn
According to the vertical zonality characteristic of vegetation type in Heihe River Basin, we established an analysis model of the vegetation distribution of Heihe River Basin at large scale based on Support Vector Machine algorithm. Kappa coefficient and the confusion matrix were used to validate the accuracy and performance of the model. The Overall Accuracy (OA) is 75.54% and Kappa coefficient is 0.66, indicating that this method was qualified to simulate vegetation distribution at regional scale. The results show that, semi-shrub, dwarf semi-shrub desert and temperate grasses-forbs meadow steppe have the highest simulation accuracy with OA of 90.20% and 90.02%, respectively. Vegetation types with large area such as semi-shrub and dwarf semi-shrub desert, shrub desert and Kobresia spp-forb high-cold meadows have much better accuracy than other vegetation types with small area. Artificial economic crops, desert vegetation types, and grassland and meadow are more sensitive to the chosen environmental factors. For shrub and arbor, simulation results differ among vegetation types. In the aspect of spatial distribution, upstream area with obvious distinctions in both vegetation types and environmental factors, has a better simulation results than middle and downstream area of Heihe River Basin, which are flat in terrain and have a small climate variation. Also, the simulation results of the upstream area have a higher degree of fragmentation in the landscape pattern.
植被分类系统是复杂的、多层次的非线性系统,探究环境要素和植被分布相互关系的机制,建立模型是一种有效的手段[6]。支持向量机(Support Vector Machine,SVM)理论是基于结构风险最小化理论的一种机器学习算法,通过低维到高维内积空间的映射构造线性分类器。在利用SVM算法对ASTER遥感数据的分类研究中发现,SVM方法在解决小样本、非线性及高维模式识别问题中训练速度和收敛速度快,而且具有有较好的泛化能力和较高的分类精度[7-8]。另外,SVM方法在决策级多源遥感影像的融合研究中同样能取得很好的模拟精度[9-11],而且SVM方法在城市植被类型分类过程中的分类精度也明显高于传统的分类方法[12],尤其是在基于高光谱、高分辨率遥感影像进行植被分类方面[13]。但是,如何针对实地大量采样数据、结合气候、地形、人口等生境因子,对植被类型空间分布研究则涉及很少。因此,以黑河流域为研究对象,选择气候、地形、人口因子等环境因子,在对每种类型的样本进行训练确定核函数的最优参数的基础上,基于SVM方法构建植被类型分布的空间分布模型实现黑河流域植被类型空间分布的定量模拟分析。
黑河发源于青藏高原东北部,干流长度超过820 km,流域总面积超过14万km2,是中国第二大内陆河。黑河流域是典型的大陆性干旱气候,从上游至下游,全流域的生物温度逐渐升高,降雨量则逐渐减少。其中,上游区段植被具有明显的垂直分布的规律性。中下游流域的蒸发率极其强烈,主要分布地带性的半灌木荒漠植被和温带小灌木植被等,而部分绿洲地区则主要以人工栽培作物和林网分布,下游的三角洲地带则主要稀疏分布有胡杨、沙枣、柽柳、白刺等荒漠植被。
图1 1980s和2000s黑河流域植被类型的空间分布对比
Fig, 1 Comparison of spatial distribution of vegetation in Heihe river Basin in 1980s and 2000s
基于上述分析,运用黑河流域气象常规观测站点21个,周边全国站点13个的气象观测数据,提取1980-1989年,2000-2009年2个时段内记录的每日降水、气温值,整理得到各站点位置2个时段分别的10年平均值,使用高速度高精度曲面建模方法(HASM)方法模拟得到黑河流域的空间分辨率为500 m的年平均降水、平均生物温度的空间分布数据[14-15],其中平均生物温度和降水量的平均误差仅为0.45 ℃和5.20 mm。另外,利用HASM方法模拟获得的500 m分辨率的DEM、坡度坡向数据、人口分布数据、交通可达性数据、土壤质地和土壤有机质分布数据,并根据DEM数据提取了黑河流域的坡度、坡向数据。
由于黑河流域DEM数据(889~5393 m)、多年平均降水数据(8.61~854.38 mm)、多年平均生物温度数据(0.21~13.32 ℃)、人口数据(0~18 722人/km),交通可达性数据(1636~29 733 m)等生态环境参数数据的数值范围具有很大的差异性,为避免部分因子在模型构建过程中占据过多的权重,影响模型性能。因此,对基础数据机进行数据归一化处理,从而解决数据指标之间的可比性。
核函数是一个函数K,对于所有的x,z,满足(是从输入空间X到特征空间F的映射),常用核函数的类型主要有4个:① 线性核函数:
运用网格搜索法进行最优核参数的选择,首 先设定SVM参数σ和惩罚系数C的范围,在
在对数据集进行归一化的基础上,以每个栅格格点所包含的各环境要素数据值构成向量作为样本数据,采用不放回的随机采样方法,按照固定的采样比例获得训练样本数据集,用于确定模型中的参数并构建模型,剩余数据集用于测试分类效果。每组植被类型使用的训练数据集和测试数据集都采用了统一映射函数来进行处理,保证训练模型和测试模型都使用同样的标准。样本的选择对于植被分布模拟结果至关重要,故要具备全面性与典型性。研究中以新完成的黑河流域2000 s植被分布数据为基础数据,分别提取出每种植被类型的分布栅格数据,共具有514 450个栅格点,在训练样本获取时,分别对包含植被分布的斑块和空白区域采用随机采样方法取5%的样点,共得到25 722个向 量单元作为模型的训练数据集。使用训练数据集使用SVM方法进行训练,使用网格搜索方法确定模型中的最优[C,σ]参数,并使用K-折交叉验证法(K-fold Cross Validation)计算该参数下模拟的准确率,挑选出最优的参数对,测试模型的性能。数据中其他未作为训练样本的数据栅格单元作为模拟数据集完成模型的构建,运用总体精度(OA)、Kappa系数方法对模拟结果的精度进行了验证分析。由于不同植被类型对于环境因子敏感性的差异显著,因此根据不同的植被类型得到不同的模型最优化参数,如表1所示。
表1 最优参数列表及测试结果
Tab. 1 The optimal parameters and testing results
编号 | 植被类型 | C | gamma | 准确率 | kappa | 植被总面积/hm2 |
1 | 一年一熟粮食作物及耐寒经济作物田、落叶果树园 | 32 | 16 | 0.97 | 0.76 | 84.03 |
2 | 亚热带、热带常绿阔叶、落叶阔叶灌丛 | 128 | 256 | 0.99 | 0.27 | 0.09 |
3 | 亚高山落叶阔叶灌丛 | 4 | 128 | 0.98 | 0.35 | 28.58 |
4 | 温带针叶林 | 128 | 32 | 0.99 | 0.15 | 0.26 |
5 | 温带落叶小叶林 | 32 | 10 | 0.99 | 0.15 | 7.79 |
6 | 温带落叶阔叶林 | 16 | 10 | 0.99 | 0.08 | 0.11 |
7 | 温带落叶灌丛 | 64 | 256 | 0.99 | 0.61 | 25.18 |
8 | 温带禾草、杂类草草甸草原 | 64 | 1 | 0.99 | 0.00 | 0.34 |
9 | 温带丛生禾草草原 | 64 | 4 | 0.98 | 0.67 | 52.19 |
10 | 温带丛生矮禾草、矮半灌木荒漠草原 | 8 | 128 | 0.99 | 0.64 | 25.80 |
11 | 嵩草、杂类草高寒草甸 | 1 | 32 | 0.95 | 0.69 | 107.96 |
12 | 禾草、杂类草盐生草甸 | 16 | 256 | 0.99 | 0.55 | 11.12 |
13 | 禾草、杂类草草甸 | 8 | 100 | 0.99 | 0.41 | 1.82 |
14 | 禾草、薹草高寒草原 | 8 | 64 | 0.98 | 0.39 | 21.53 |
15 | 寒温带和温带山地针叶林 | 8 | 64 | 0.98 | 0.45 | 21.77 |
16 | 灌木荒漠 | 4 | 256 | 0.91 | 0.60 | 186.47 |
17 | 高山稀疏植被 | 32 | 10 | 0.98 | 0.39 | 27.09 |
18 | 高山垫状植被 | 16 | 256 | 0.99 | 0.18 | 3.24 |
19 | 多汁盐生矮半灌木荒漠 | 8 | 128 | 0.98 | 0.59 | 33.74 |
20 | 草原化灌木荒漠 | 128 | 256 | 0.99 | 0.36 | 0.90 |
21 | 草原 | 32 | 64 | 0.99 | 0.79 | 3.54 |
22 | 半灌木、矮半灌木荒漠 | 4 | 128 | 0.88 | 0.71 | 570.79 |
23 | 矮半乔木荒漠 | 8 | 256 | 0.97 | 0.55 | 60.49 |
24 | 湖泊水体等无植被地段 | 16 | 1 | 0.99 | 0.28 | 7.82 |
图2 植被分布数据与模拟结果对比
Fig. 2 Comparison of the original vegetation distribution and the simulation results
表2 植被分布模拟结果的混淆矩阵(km2)
Tab.2 Confusion matrix of the simulation results of vegetation distribution (km2)
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | 合计 | |
A | 62.54 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.11 | 0.00 | 0.60 | 2.36 | 0.04 | 0.69 | 0.12 | 0.04 | 0.04 | 1.13 | 0.00 | 0.00 | 0.97 | 0.00 | 0.23 | 3.84 | 0.00 | 0.71 | 73.39 |
B | 0.00 | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.25 | 0.02 | 0.00 | 0.32 |
C | 0.00 | 0.00 | 9.18 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 1.64 | 0.03 | 3.75 | 0.01 | 0.01 | 1.99 | 0.85 | 0.05 | 1.42 | 0.00 | 0.04 | 0.00 | 0.00 | 0.62 | 0.00 | 0.01 | 19.59 |
D | 0.01 | 0.00 | 0.00 | 0.21 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.01 | 0.00 | 0.30 |
E | 0.12 | 0.00 | 0.00 | 0.00 | 6.45 | 0.00 | 0.21 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.01 | 0.00 | 8.14 |
F | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 |
G | 0.82 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 14.49 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 2.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 4.09 | 0.09 | 0.03 | 21.57 |
H | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.28 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.34 |
I | 1.30 | 0.00 | 1.22 | 0.00 | 0.57 | 0.01 | 0.00 | 0.00 | 35.38 | 1.60 | 2.15 | 0.47 | 0.06 | 0.85 | 2.06 | 0.05 | 0.10 | 0.00 | 1.18 | 0.00 | 0.02 | 2.35 | 0.00 | 0.00 | 48.77 |
J | 3.65 | 0.00 | 0.06 | 0.00 | 0.00 | 0.03 | 0.00 | 0.00 | 1.81 | 17.86 | 0.22 | 0.02 | 0.05 | 0.84 | 0.04 | 0.07 | 0.00 | 0.00 | 0.54 | 0.00 | 0.29 | 2.24 | 0.00 | 0.00 | 27.70 |
K | 0.04 | 0.00 | 12.12 | 0.00 | 0.00 | 0.02 | 0.10 | 0.00 | 4.03 | 0.20 | 85.23 | 0.08 | 0.32 | 5.30 | 1.77 | 0.52 | 11.24 | 0.00 | 0.00 | 0.00 | 0.00 | 0.58 | 0.00 | 0.49 | 122.02 |
L | 1.07 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.04 | 0.15 | 0.05 | 0.00 | 5.46 | 0.01 | 0.00 | 0.02 | 0.08 | 0.00 | 0.00 | 0.32 | 0.00 | 0.00 | 1.75 | 0.00 | 0.00 | 8.90 |
M | 0.07 | 0.00 | 0.04 | 0.00 | 0.54 | 0.04 | 0.00 | 0.00 | 0.02 | 0.01 | 0.20 | 0.01 | 0.71 | 0.05 | 0.21 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.11 | 0.00 | 0.00 | 1.48 |
N | 0.04 | 0.00 | 2.36 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 1.32 | 0.64 | 4.04 | 0.00 | 0.06 | 10.06 | 1.40 | 0.01 | 1.13 | 0.00 | 0.05 | 0.00 | 0.01 | 0.83 | 0.00 | 0.02 | 21.96 |
O | 0.02 | 0.00 | 1.35 | 0.02 | 0.00 | 0.01 | 0.01 | 0.02 | 3.76 | 0.25 | 2.31 | 0.13 | 0.31 | 0.76 | 14.97 | 0.00 | 0.21 | 0.00 | 0.17 | 0.00 | 0.05 | 0.54 | 0.00 | 0.00 | 24.82 |
P | 2.16 | 0.00 | 0.02 | 0.00 | 0.20 | 0.00 | 0.17 | 0.00 | 0.05 | 0.16 | 0.10 | 0.84 | 0.00 | 0.01 | 0.00 | 106.30 | 0.02 | 0.00 | 5.35 | 0.00 | 0.00 | 24.70 | 5.71 | 1.45 | 147.04 |
Q | 0.00 | 0.00 | 1.62 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.26 | 0.00 | 8.59 | 0.00 | 0.03 | 0.77 | 0.10 | 0.05 | 12.09 | 0.00 | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 | 1.31 | 24.85 |
R | 0.00 | 0.00 | 0.10 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.19 | 0.00 | 0.64 | 0.00 | 0.00 | 0.07 | 0.00 | 0.01 | 0.08 | 3.24 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 4.33 |
S | 1.58 | 0.00 | 0.03 | 0.00 | 0.24 | 0.00 | 0.00 | 0.00 | 1.26 | 0.80 | 0.00 | 0.04 | 0.00 | 0.15 | 0.06 | 2.20 | 0.00 | 0.00 | 18.47 | 0.00 | 0.00 | 3.05 | 0.22 | 0.01 | 27.85 |
T | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.04 | 0.00 | 0.07 | 0.02 | 0.00 | 0.13 |
U | 0.46 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.21 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 2.93 | 0.00 | 0.00 | 0.06 | 3.66 |
V | 10.18 | 0.03 | 0.48 | 0.00 | 0.00 | 0.01 | 10.08 | 0.00 | 1.73 | 1.62 | 0.41 | 2.99 | 0.14 | 0.63 | 0.27 | 66.31 | 0.03 | 0.00 | 6.16 | 0.61 | 0.01 | 514.35 | 22.76 | 1.68 | 640.47 |
W | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.37 | 0.00 | 0.00 | 0.00 | 6.95 | 0.00 | 0.00 | 0.53 | 0.25 | 0.00 | 10.81 | 31.47 | 0.00 | 50.38 |
X | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.28 | 0.00 | 0.00 | 0.04 | 0.00 | 0.18 | 0.77 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.01 | 2.05 | 3.35 |
合计 | 84.03 | 0.09 | 28.58 | 0.26 | 7.79 | 0.11 | 25.18 | 0.34 | 52.18 | 25.80 | 107.95 | 11.12 | 1.82 | 21.53 | 21.77 | 185.97 | 27.09 | 3.24 | 33.74 | 0.90 | 3.54 | 570.26 | 60.31 | 7.82 | 1281.38 |
总体精度(OA)= 75.54% Kappa系数=0.66 |
表3 混淆矩阵中的植被类型对应表
Tab.3 Vegetation types in confusion matrix
编号 | 植被类型 | 植被总面积/万hm2 | 模拟结果面积/万hm2 | 精度/% |
A | 一年一熟粮食作物及耐寒经济作物田、落叶果树园 | 84.03 | 73.39 | 74.42 |
B | 亚热带、热带常绿阔叶、落叶阔叶灌丛 | 0.09 | 0.32 | 62.86 |
C | 亚高山落叶阔叶灌丛 | 28.58 | 19.59 | 32.13 |
D | 温带针叶林 | 0.26 | 0.30 | 83.00 |
E | 温带落叶小叶林 | 7.79 | 8.14 | 78.00 |
F | 温带落叶阔叶林 | 0.11 | 0.02 | 4.55 |
G | 温带落叶灌丛 | 25.18 | 21.57 | 57.55 |
H | 温带禾草、杂类草草甸草原 | 0.34 | 0.34 | 90.02 |
I | 温带丛生禾草草原 | 52.19 | 48.77 | 67.80 |
J | 温带丛生矮禾草、矮半灌木荒漠草原 | 25.80 | 27.70 | 69.22 |
K | 嵩草、杂类草高寒草甸 | 107.96 | 122.02 | 78.95 |
L | 禾草、杂类草盐生草甸 | 11.12 | 8.90 | 49.13 |
M | 禾草、杂类草草甸 | 1.82 | 1.48 | 39.12 |
N | 禾草、薹草高寒草原 | 21.53 | 21.96 | 46.73 |
O | 寒温带和温带山地针叶林 | 21.77 | 24.82 | 68.78 |
P | 灌木荒漠 | 186.47 | 147.04 | 57.16 |
Q | 高山稀疏植被 | 27.09 | 24.85 | 44.63 |
R | 高山垫状植被 | 3.24 | 4.33 | 89.32 |
S | 多汁盐生矮半灌木荒漠 | 33.74 | 27.85 | 54.72 |
T | 草原化灌木荒漠 | 0.90 | 0.13 | 4.75 |
U | 草原 | 3.54 | 3.66 | 82.70 |
V | 半灌木、矮半灌木荒漠 | 570.79 | 640.47 | 90.20 |
W | 矮半乔木荒漠 | 60.49 | 50.38 | 52.18 |
X | 湖泊水体等无植被地段 | 7.82 | 3.35 | 26.21 |
模拟结果与原植被分布数据对比,面积上出现了不同程度的增减。模拟后面积增加率最高的是亚热带-热带常绿阔叶-落叶阔叶灌丛类型,达到了258.33%,其模拟前总面积为0.09万hm2,对应的原植被类型应为半灌木-矮半灌木荒漠,错误模拟 面积为0.25万hm2。其依是高山垫状植被和温带针叶林,模拟前面积和增加率分别为3.24万hm2、33.64%和0.26万hm2、16.35%。错误模拟为高山垫状植被区域原对应的正确植被类型主要为嵩草-杂类草高寒草甸(0.64万hm2)和温带丛生禾草草原 (0.19万hm2);错误模拟为温带针叶林类型区域对应的正确植被类型中,面积最多的为半灌木-矮半灌木荒漠的0.02万hm2。模拟后面积减少率最高的是温带落叶阔叶林(-86.36%)和草原化灌木荒漠 (-85.28%),原分布数据中的面积分别为0.11万hm2和0.90万hm2。主要分别错误模拟为禾草-杂类草草甸(0.035万hm2)、温带丛生矮禾草-矮半灌木荒漠草原(0.028万hm2)和嵩草-杂类草高寒草甸(0.03万hm2);草原化灌木荒漠的优势种为半日花-矮禾草和锦刺-矮禾草,主要错分类型为半灌木-矮半灌木荒漠(0.61万hm2)和矮半乔木荒漠(0.25万hm2)。
