基于Landsat 8 OLI数据与面向对象分类的昆嵛山地区土地覆盖信息提取

张春华1, 李修楠12, 吴孟泉1, 秦伟山1, 张筠1

1.鲁东大学资源与环境工程学院,山东 烟台 264025
2.国家海洋局第二海洋研究所卫星海洋环境动力学国家重点实验室,浙江 杭州 310012

Object-oriented Classification of Land Cover Based on Landsat 8 OLI Image Data in the Kunyu Mountain

Zhang Chunhua1, Li Xiunan12, Wu Mengquan1, Qin Weishan1, Zhang Jun1

1.School of Resources and Environmental Engineering, Ludong University, Yantai 264025, Shandong, China
2.State Key Laboratory of Satellite Ocean Environment Dynamics, Second Institute of Oceanography, State Oceanic Administration, Hangzhou 310012, Zhejiang, China

利用2015年Landsat 8 OLI遥感影像和DEM作为分类数据源,结合野外调查数据,采用面向对象的分类方法对昆嵛山地区土地覆盖信息进行提取,并对分类结果进行精度评价与比较分析。研究表明:面向对象分类方法提取的各地类连续且边界清晰,分类效果与实际情况基本吻合。昆嵛山地区占主导地位的土地覆盖类型是针叶林,面积为1 546.81 km2。研究区土地覆盖分类的总体精度和Kappa系数分别为91.5%和0.88,其中针叶林、草地、水体和建设用地的生产者精度均达到87%以上。相对于监督分类方法,本研究提出的土地覆盖信息提取方法的总体分类精度和Kappa系数分别提高14.7%和0.17。基于面向对象的中分辨率遥感影像,能够获取较高精度的土地覆盖信息,为大范围土地覆盖分类研究提供方法参考。

关键词: 土地覆盖分类 ; 面向对象方法 ; Landsat 8 OLI ; DEM ; 昆嵛山


Land cover classification is the basis for geoscience and global change studies. It can provide essential information for modelling and understanding the complex interactions between human activities and global change. Remote sensing has been widely recognized as the most economic and feasible approach to derive land cover information on a large regional scale. Landsat satellite data are commonly used remote sensing data for land cover classification. The object-oriented classification method, which takes full advantage of the spectral, geometrical and textural information of remote sensing images and considers the spatial distribution characteristics and correlations of geographical objects, can mitigate the deficiency associated with the pixel-based approach. The purpose of this study is to deepen the application of object-oriented classification method that is utilized to extract land cover information automatically and quickly from the satellite imagery. Taking the Kunyu Mountain of Jiaodong peninsula in Shandong province as the study area, land cover classification was conducted by using the object-oriented classification method on eCognition software platform, with Landsat 8 OLI satellite image in 2015 and digital elevation model (DEM) as data sources. Firstly, Landsat 8 OLI data of high quality was selected, and preprocessed by radiometric calibration, atmospheric correction, accurate geometric correction, image registration and fusion. Feature parameters including spectral (normalized difference vegetation index (NDVI), band brightness), shape (area, roundness, rectangular fit), and topographic (DEM, slope) characteristics were calculated. Then, the land cover information was classified into cropland, grassland, needleleaf forest, broadleaf forest, built-up land, water bodies, and barren land by the object-oriented method following the steps of multi-resolution image segmentation, object feature extraction, and classification rule set construction. Finally, the accuracy of this method was evaluated and compared with that of the pixel-based supervised classification method and ground validation sampling points. The results indicate that land cover information extracted by the object-oriented classification method using Landsat 8 OLI data is well consistent with the true condition on distribution and range of each land cover type in the Kunyu Mountain. The dominant type of land cover is needleleaf forests, with the area of 1546.81 km2. The overall accuracy and Kappa coefficient of the method are 91.5% and 0.88, respectively. The production accuracy is higher than 87% for needleleaf forests, grassland, water bodies, and built-up land. By comparison with the maximum likelihood supervised classification method, the overall classification accuracy and Kappa coefficient of the proposed method in this study are increased by 14.7% and 0.17, respectively. This means the moderate resolution Landsat 8 OLI image, combined with the object-oriented classification method can effectively improve the accuracy of land cover information extraction in the typical vegetation areas. This study will provide a credible approach and valuable example for extracting and monitoring regional land cover type, and broaden the application vision and the scope of ecological remote sensing investigation in terrestrial ecosystem.

Keywords: land cover classification ; object-oriented method ; Landsat 8 OLI ; DEM ; the Kunyu Mountain


常用的遥感信息提取方法有人工目视解译和计算机自动分类两种[11]。人工目视解译精度高,但费时费力、速度慢、周期长。计算机自动分类速度快,但由于遥感影像存在的“同物异谱,异物同谱”现象,以及不同地类几何特征和分类方法的差异,制约了其分类精度。近年来,有不少学者提出很多方法以改善遥感影像的分类精度,如基于光谱指数信息提取[6,12,13]、基于多维特征信息提取[3,14,15]、融合多源数据的分类方法[16,17,18]、基于知识的分层分类方法[19, 20]、面向对象的分类方法[21,22]等。这些方法都有自己的针对性和适用性,随着遥感数据的多元化、遥感平台的多样化和影像分辨率的提高,如何对所需的遥感数据选择合适的分类方法成为相关学者的研究热点[9]。面向对象的分类方法,通过结合多种影像特征(光谱、几何、纹理和上下文特征)综合分析,它针对性强、精度高、效率高,是目前遥感信息提取方法的发展趋势[23]

Landsat系列卫星已获取了45 a的对地连续观测数据,具有显著表达地表覆盖特征的能力[24],在中等和大尺度的土地覆盖分类研究中应用最为广泛[3, 7, 25~28]。最新的Landsat 8 OLI(Operational Land Image)传感器在波段的设置及对植被的敏感性上比之前的TM、ETM+等传感器均有较大提升[29,30],主要包括收窄近红外和全色波段的光谱范围,扩大全色影像中植被和非植被信息的反差,避免极亮/极暗区的灰度过饱和现象,这些新增特征对地表覆盖细节信息的表达具有重要作用[22, 31]。目前,Landsat 8 OLI遥感影像逐渐发展成为土地覆盖类型监测的主要数据源[11, 24, 32, 33]。Li等[33]以全球30 m土地覆盖数据集(FROM-GLC)为基础,通过获取4个季相的Landsat 8遥感数据,并结合Google Earth影像和MODIS时间序列数据,更新了全球土地覆盖数据。采用面向对象的分类方法,Goodin等[34]基于Landsat 8 OLI数据探讨了波兰和乌克兰交界处复杂农业景观的土地覆盖和土地利用分类结果。在国内,Landsat 8遥感影像的土地覆盖分类研究已在省[25]、市[30]、县[31,35]等中等尺度上广泛开展,而对中小尺度如具有典型植被特征保护区的研究相对不足。加强中小尺度土地覆盖信息的提取,有助于解释中国土地覆盖制图的不确定性问题,为中国区域尺度碳循环研究提供基础数据。

昆嵛山保护区是山东省第一个森林生态系统类型的国家级自然保护区,蕴藏着丰富的植物种类并保存有良好的天然植被[36]。目前,对该区的研究主要集中于植被群落特征[37, 38]和生物多样性[39]方面,而对土地覆盖遥感分类的研究尚未见报道。本文以昆嵛山地区(包括保护区及其周边地区)为研究对象,利用Landsat 8 OLI多光谱遥感影像,并辅以地形信息,采用面向对象的分类方法,研究昆嵛山地区的土地覆盖分类。该研究旨在了解昆嵛山土地覆盖现状及其空间分布规律,为区域植被碳循环研究提供基础数据,为持续的土地经营和保护提供科学参考。

1 数据与方法

1.1 研究区概况

昆嵛山位于山东半岛东部(121.5°~122°E,37°~37.5°N),包括昆嵛山国家级自然保护区及其周边地区(图1),土地总面积2 503 km2。暖温带季风性气候,四季分明,雨热同期,空气湿润,温差较小,光照充足。年均气温11.9℃,年降水量984.4 mm,全年≥10℃积温3 700~4 400℃,无霜期200 d左右。昆嵛山地区地貌类型以低山丘陵为主,土壤以棕壤为主,局部有少量山顶草甸土,质地多为砂壤至中壤。该地区土地肥沃而人口密集,主要土地覆盖类型包括林地、耕地、草地、水体、裸地和建设用地等。保护区森林植被较好,森林覆盖率为82%[36],植被分布具有明显的垂直地带性,在海拔600 m以下发育着大片的天然落叶阔叶林(如麻栎Quercus acutissima、刺槐Robinia pseudoacacia)和针叶林(如赤松Pinus densiflora、黑松Pinus thunbergii),海拔600 m以上主要为草甸和灌丛。

图1   研究区位置(a)及Landsat 8 OLI影像(b)

Fig.1   Location of the Kunyu Mountain (a) and Landsat 8 OLI image of the study area (b)

1.2 数据来源及处理

1.2.1 Landsat 8 OLI遥感影像

本研究采用2015年9月27日的Landsat 8 OLI影像(http://earthexplorer.usgs.gov/)中的1~8波段,轨道号为119/34,研究区域无云层覆盖。Landsat 8卫星携带有OLI和TIRS(Thermal Infrared Sensor)推扫式成像仪,其中OLI包括9个波段,除全色波段为15 m分辨率外,其余波段空间分辨率为30 m。TIRS包括2个热红外波段,空间分辨率为100 m。首先借助OLI传感器的辐射定标参数对原始影像进行辐射定标,将原始影像DN值转化为像元辐射亮度值。再以FLAASH模型对影像进行大气校正,从而将辐射亮度值转化为地表真实反射率。然后对影像进行几何精校正,校正误差控制在0.1个像元以内。最后采用Gram-Schmidt算法将校正后影像的全色波段与1~7波段的影像进行融合,得到融合后的7个波段图像的分辨率提高到15 m(图1b),这有助于土地覆盖分类信息的提取。

1.2.2 DEM数据

本研究所用DEM数据是NASA提供的ASTER GDEMV2 30 m全球数字高程数据产品,源自中国科学院计算机网络信息中心地理空间数据云平台(http://www/gsclound.cn)。该数据采用一种先进算法对V1版GDEM产品进行了改进,提高了数据的空间分辨率精度和高程精度。为保持DEM与Landsat 8 OLI遥感影像的空间分辨率一致,利用最近邻方法将研究区DEM数据重采样为15 m分辨率。同时,根据DEM数据提取研究区坡度(Slope)信息,以辅助遥感影像的土地覆盖分类。

1.2.3 地面验证数据

野外验证数据包括2015年9月开展的野外调查样点数据(56个)和应用Google Earth高空间分辨率(0.61 m)遥感影像获取的同期不同地物类型样点数据(250个)(图1b),其中水体33个、建设用地69个、针叶林110个、耕地47个、裸地27个、阔叶林12个、草地8个。地面调查样点选择面积≥15 m × 15 m(约合Landsat 8 OLI影像1个像元),地表覆盖类型均匀单一的样方。Google Earth样点选取时遵循在研究区均匀分布的原则,样本面积≥0.61 m × 0.61 m,地表覆盖类型均匀单一。利用这两套数据构建土地覆盖精度评价样点库,用于昆嵛山地区土地覆盖分类的精度评价。

1.3 研究方法

本研究总体思路如图2所示:首先,对覆盖研究区的Landsat 8 OLI影像进行预处理;其次,利用面向对象的分类方法提取土地覆盖信息,并与传统监督分类结果、地面验证数据进行对比,评价分类精度,最终获得昆嵛山地区土地覆盖分类图。

图2   昆嵛山地区土地覆盖分类技术路线

Fig.2   Flow chart of land cover classification in the Kunyu Mountation

1.3.1 土地覆盖分类方案

参考国际地表覆盖分类系统(Land Cover Classification System, LCCS)和张增祥[40]中国土地覆盖分类体系,结合所用数据及研究区的土地覆盖实际情况,制定以下分类方案,包括耕地、草地、裸地、建设用地、水体、针叶林和阔叶林7类。根据野外调查数据以及不同地物类型对应Landsat遥感影像波段的分析,并结合目视解译经验,获得土地覆盖类型的影像特征(表1)。

表1   研究区不同土地覆盖类型解译标志

Table 1   Interpretation signs of different land cover types in the Kunyu Mountain


1.3.2 面向对象分类


1) 多尺度影像分割。多尺度影像分割是基于像元的从下至上的逐级区域合并,实现分割对象的异质性最小化,主要参数包括分割尺度、光谱异质性和形状异质性,其中形状异质性用光滑度和紧致度描述。异质性F定义为[41]



式中,ω为光谱信息权重;hcolor为光谱异质性;hshape为形状异质性; hcompact为紧致度;ωcompact为紧致度权重;hsmooth为光滑度。

本研究以eCognition软件为操作平台,利用ESP(Estimation of Scale Parameter)算法[42]确定昆嵛山地区影像的最佳分割尺度。首先结合ESP得到最优分割尺度的范围,并综合考虑不同土地覆盖类型的分布特点,然后通过逐次调整分割尺度大小进行反复试验,最终建立两层次分割结构。在第一次分割中,分割尺度选为35,用以区分影像植被与非植被。在第二次分割中,分割尺度选为50,用以区分非植被中水体、裸地和建设用地。多尺度分割参数见表2

表2   昆嵛山地区Landsat 8 OLI影像多尺度分割参数

Table 2   Scales and parameters setting of multi-resolution segmentation for the Kunyu Mountain based on Landsat 8 OLI image



2) 特征选取。面向对象的分类方法通过分割使影像对象成为信息载体,由此可提取每个对象所包含像元的特征信息。特征参数主要包括光谱(植被指数、灰度值、亮度值等)、形状(面积、长宽比、形状指数等)、纹理(同质性、异质性、熵等)和类相关(拓扑关系、上下文关系)特征等[22]。根据以往研究成果[35],本研究综合选取影像对象的多种特征信息,如波段亮度值、归一化植被指数(NDVI)、面积(Area)、圆度(Roundness)、矩形拟合度(Rectangular Fit)、高程(DEM)和Slope,以期提高分类结果的精度。

3) 分类规则建立。模糊分类方法是利用对象的特征信息构建规则集,采用人机交互的方式对每个规则的阈值进行判定,该方法能够构建多重规则集,全面刻画地物信息,适用于包含多种土地覆盖类型的分类对象。本研究根据昆嵛山地区土地覆盖分类方案,通过自动训练方式确定提取特征为NDVI≥0.42,第一次对整个影像进行全局分割(分割阈值设为35),提取植被和非植被信息(图3)。在相同的分割尺度下,使用模糊分类方法进一步提取植被内的各种地物。草地和阔叶林具有相似的光谱特征,但是草地主要分布于海拔600 m以上的地区,经自动训练后发现利用NDVI≥0.86且DEM≥100 m,以及DEM≥600 m,可以很好地提取阔叶林和草地。对于耕地的提取,经常把亮度值、形状和地形特征相结合,试验后确定当B1≤274且Roundness≤1且Rectangular Fit≥0.7且DEM≥70 m且Slope≤10°时,耕地能提取的更细更完整。在植被中,除了阔叶林、草地和耕地,其他都归为针叶林类别。

图3   Landsat 8 OLI影像土地覆盖分类规则
Level 1和Level 2分别表示多尺度影像分割的2个层次,B1和B7分别表示Landsat 8 OLI影像的第1和第7波段的亮度值

Fig.3   Rules of land cover classification based on Landsat 8 OLI image

非植被内包含的类型相对较少、同质斑块较大、结构相对简单,第一次分割时地物明显“过分割”,将提取出来的非植被信息合并。由于第一次分割得到的矢量图层中,植被内的各地类已被全部提取完毕,因此,第二次分割只针对非植被,分割尺度为50。水体影像结构单一、深蓝色调,利用亮度值B1≤40且B7≤792,能很好地区分水体和非水体。裸地和建设用地光谱特征相似,普遍亮色调、反射率较高,但裸地主要分布在山地,且分割后面积较小,经自动训练后确定Area≤100像元数且DEM≥210 m时,裸地可以较好的提取出来。在非植被中,除水体和裸地外,其他都归为建设用地。

1.3.3 监督分类

监督分类是以先验知识为基础,选择样本进行训练,以此建立统计识别函数,按照概率规则进行类别的划分。为保证结果的可靠性及代表性,本研究采用当前应用最广泛的最大似然监督分类法,与面向对象方法的分类结果进行比较。首先根据土地覆盖分类方案及样本特征描述选取训练样本,样本选择时遵循在整个研究区均匀分布的原则,通过目视判读在Landsat OLI影像上建立兴趣区,结合Google Earth高分影像对样本优化,去除非典型的兴趣区,不同土地覆盖类型之间的分离度均大于1.9,分离度良好,获得具有代表性的分类训练样本。然后,利用监督分类的最大似然分类方法,对昆嵛山地区的土地覆盖进行自动分类。

1.3.4 分类精度评估

利用野外调查获取的56个样本点和由Google Earth影像随机获取的250个验证点作为精度评价数据库,分别计算基于面向对象方法和监督分类方法进行土地覆盖分类的混淆矩阵,并计算生产者精度、用户精度、总体精度和Kappa系数。

2 结果与分析

2.1 分类结果

基于Landsat 8 OLI多光谱遥感数据,并辅以地形信息,利用面向对象分类和最大似然监督分类两种方法,获得昆嵛山地区土地覆盖分类结果(图4)。将面向对象的分类结果(图4a)与研究区2015年9月Landsat 8 OLI影像(图1b)进行对比与定性分析表明:分类结果与各地类的范围以及分布区域基本一致,斑点噪声较少。为进一步探究该方法的有效性,将面向对象分类方法与监督分类方法的分类结果(图4b)进行对比分析。监督分类结果较为破碎,“椒盐”噪声严重,对于光谱特征相似或相同的针叶林、阔叶林与草地、耕地与草地、裸地与建设用地等错分较多(图4b);面向对象分类结果各地类较为连续且边界清晰,错分现象较少,全图“椒盐”噪声极少,分类效果与实际情况基本吻合(图4a)。研究区域内占主导地位的土地覆盖类型是针叶林,面积为1 546.81 km2,占研究区土地总面积的61.8%;阔叶林面积很小为29.33 km2(1.2%),分布在沟谷或较高海拔的陡峭山坡[38]。草地面积占0.1%,主要分布在海拔600 m以上的山地。耕地和建设用地面积分别为74.85 km2(3.0%)和593.04 km2(23.7%),分布于昆嵛山自然保护区周围地区。裸地主要是高山上裸露的基岩,面积较小(0.3%)。水体包括研究区的河流、湖泊和临近海域,占总面积的9.9%。

图4   面向对象分类结果(a)与监督分类结果(b)对比

Fig.4   Comparisons of land cover classification based on (a) the object-oriented method with (b) the supervised classification method

2.2 精度评价

地面验证数据各地类的样本数量基本符合分类结果中各土地覆盖类型的面积比重。表3表4是利用地面验证数据对面向对象分类方法和监督分类方法的分类结果验证的混淆矩阵。从两种方法的混淆矩阵统计结果可看出,面向对象分类方法的总体精度以及各地类的生产者精度和用户精度普遍高于监督分类,前者总体精度为91.5%,Kappa系数为0.88(表3);后者总体精度为76.8%,Kappa系数为0.71(表4)。对于单一地类精度,面向对象分类提取的水体、建设用地、针叶林和草地的生产者精度非常高,分别为87.9%、100.0%、98.2%和100.0%;裸地、耕地和阔叶林次之,分别为77.8%、76.6%和75.0%。监督分类提取的建设用地、裸地、耕地和水体的生产者精度较高,分别为89.9%、88.9%、85.1%和78.8%;阔叶林次之,为75.0%;针叶林和草地较低,分别为63.6%和50.0%。除草地外,面向对象分类的各类用户精度均超过88.0%,表明其中错分的现象较少;监督分类结果的阔叶林和草地中混分了大量的针叶林,分别占针叶林总样本数的9.1%(10个)和24.5%(27个),裸地与建设用地存在大量混分现象。以上分析表明,使用Landsat 8 OLI中等空间分辨率遥感影像,结合面向对象分类方法能够达到较高的土地覆盖分类精度,这主要是因为多尺度影像分割算法可有效提取地物边界,使得分类处理的是均匀对象,而非单个像元;同时综合利用地物的光谱、几何及上下文等特征,充分挖掘邻域像元的相关性,空间异质性小,有较强的抗噪能力,有效地克服了“同物异谱”和“异物同谱”现象。

表3   面向对象分类方法分类结果混淆矩阵

Table 3   The confusion matrix of land cover classification based on the object-oriented method



表4   监督分类方法分类结果混淆矩阵

Table 4   The confusion matrix of land cover classification based on the supervised classification method



3 结语

本研究探讨基于Landsat 8 OLI中等空间分辨率遥感数据,利用面向对象分类提取中小尺度土地覆盖信息的方法,并对昆嵛山地区2015年土地覆盖进行分类,取得了较好的分类精度与准确度。总体精度和Kappa系数分别为91.5%和0.88,除耕地、裸地和阔叶林外,主要的土地覆盖类型生产者精度均达到87%以上。昆嵛山地区的主要土地覆盖类型为针叶林,面积为1 546.81 km2,占研究区土地总面积的61.8%。通过与监督分类方法进行比较,基于Landsat 8 OLI数据的面向对象分类方法的各地类较为连续且边界清晰,错分、混分现象较少,总体分类精度和Kappa系数分别较前者提高14.7%和0.17,有效消除了“椒盐”噪声的影响,提高了信息提取精度。

在本研究中,面向对象分类方法能够有效地应用于Landsat 8 OLI中等分辨率遥感影像的土地覆盖信息提取,得到较高的分类精度,该结果可用于评价昆嵛山地区土地覆盖现状,并为大区域尺度土地覆盖分类研究提供方法参考。但仍有以下问题需继续研究: 阔叶林和裸地分布破碎且复杂,由于中等分辨率遥感影像地物边界模糊,分割尺度太大难以准确反映它们的分布状况和边界,分割尺度过小不利于对象信息区分,致使阔叶林和裸地分类精度相对较低。如何选取遥感影像和分割尺度克服阔叶林和裸地提取精度较低问题。面向对象方法的分类规则多是根据经验值和人机交互试验获得,对于每类规则的精度和阈值未评估其准确性。如耕地和针叶林、草地和阔叶林两者间的阈值取值范围存在不同程度的重叠,由此造成了耕地和针叶林、草地和阔叶林间的错分、混分现象。如何采用有效方法确定其阈值以达到最佳分类效果是下步的研究方向。

