Scientia Geographica Sinica  2013 , 33 (1): 69-74 https://doi.org/10.13249/j.cnki.sgs.2013.01.69

Orginal Article

基于RBF神经网络的土壤铬含量空间预测

陈飞香123, 程家昌23, 胡月明23, 周永章1, 赵元23, 蚁佳纯4

1.中山大学地球环境与地球资源研究中心, 广东 广州 510275
2.华南农业大学信息学院, 广东 广州 510642
3.广东省土地利用与整治重点实验室, 广东 广州 510642
4.华南农业大学公共管理学院, 广东 广州 510642

Spatial Prediction of Soil Properties by RBF Neural Network

CHEN Fei-xiang123, CHENG Jia-chang23, HU Yue-ming23, ZHOU Yong-zhang1, ZHAO Yuan23, YI Jia-chun4

1.Center for Earth Environment and Resources, Sun Yat-Sen University, Guangzhou,Guangdong 510275,China
2.College of Informatics, South China Agricultural University, Guangzhou,Guangdong 510642,China
3.Guangdong Province Land Use and Remediation of the Key Laboratory, Guangzhou, Guangdong 510642,China
4.College of Public Management, South China Agricultural University, Guangzhou, Guangdong 510642, China

中图分类号:  S153.61/TP183

文献标识码:  A

文章编号:  1000-0690(2013)01-0069-06

收稿日期: 2012-03-26

修回日期:  2012-07-1

网络出版日期:  2013-01-20

版权声明:  2013 《地理科学》编辑部 本文是开放获取期刊文献,在以下情况下可以自由使用:学术研究、学术交流、科研教学等,但不允许用于商业目的.

基金资助:  国家自然科学基金项目(40971125)、广东省科技计划项目(2011B020313020)资助

作者简介:

作者简介:陈飞香(1978-),女,讲师,博士研究生,研究方向为地理信息系统应用与土地资源。E-mail:chfx@scau.edu.cn

展开

摘要

以广东省增城市为实验基地,采用随机采样的方法采集土壤铬含量样点,并将其分为训练数据集和检验数据集。设计4种样点布局方案,对前三组数据用RBF神经网络方法进行土壤铬含量插值,分析预测误差。研究发现,当样点较少时,RBF神经网络方法的插值结果较精确。而当样点数据为50时,误差较大,不能满足插值要求。通过插值结果的对比发现,较传统的统计学插值方法,RBF神经网络方法克服了平滑效应,特别是在数据较少的情况下,进行空间预测效果较好,是一种适用范围更广的插值方法。

关键词: RBF神经网络 ; 土壤属性 ; 空间预测 ; 克里格插值

Abstract

The key problem in precision agriculture research is how to use fewer samples to reflect the distribution regular pattern of farmland information and to use scientific interpolation method to interpolate and estimate farmland. Based on the soil chromium (Cr) content areas with large differences in Zengcheng City as an experimental base, 200 soil samples were collected by random sampling method. According to GB/T17137-1997 in China, the flame atomic absorption spectrometric method was used for the determination of a variety of chromium in soil. By Create subsets function in ArcGIS 9.3, four kinds of layout program were set,which were 200 sample points, 150 samples points , 100 samples points and 50 samples points . In accordance with the ratio of 4:1, the four of sample sets were divided into training dataset and test dataset, which were used to train the neural network, testing the accuracy of the interpolation results. Then RBF neural network method were used in soil Cr content interpolatin in the previous three date sets, and their error were analyzed and forecasted using the variance of the RMS (root mean square) error. In order to highlight the contrast, the previous corresponding Kriging interpolation maps and Kriging interpolation results of RMS error were gotten when Kriging interpolation method for data of the corresponding treatment was used. The results show that, in the case of fewer sample points, the interpolation result of RBF neural network was smaller than the root mean square error of traditional Kriging interpolation method, which are 0.003, 0.009 and 0.008, respectively. It was found that RBF neural network method was more accurate. However, when it was applied to the date set which were only 50 samples, whether the RBF neural network or Kriging interpolation method, numerical root mean square error of the prediction results was great, which were 0.179 and 0.128, respectively. Hence, it is hard to obtain the right result. Compared to the traditional method of statistical interpolation, RBF neural network method could overcome the smoothing effect with good self-learning features and strong non-linear computing power. Especially in the case of fewer sample points, the effect of spatial prediction was relatively good. Then, it can be concluded that RBF neural network method is applied more broadly and it is enough when it is used for the interpolation of the data sampling points.

Keywords: RBF neural network ; soil properties ; spatial prediction ; Kriging interpolation method

0

PDF (523KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

陈飞香, 程家昌, 胡月明, 周永章, 赵元, 蚁佳纯. 基于RBF神经网络的土壤铬含量空间预测[J]. , 2013, 33(1): 69-74 https://doi.org/10.13249/j.cnki.sgs.2013.01.69

CHEN Fei-xiang, CHENG Jia-chang, HU Yue-ming, ZHOU Yong-zhang, ZHAO Yuan, YI Jia-chun. Spatial Prediction of Soil Properties by RBF Neural Network[J]. Scientia Geographica Sinica, 2013, 33(1): 69-74 https://doi.org/10.13249/j.cnki.sgs.2013.01.69

对土壤性质的充分了解, 是土壤养分管理和认识土壤污染程度的基础。20世纪90年代以来,随着精细农业的发展,对土壤属性的空间插值技术的研究也受到众多农学家和土壤科学工作者的关注[1~7]。当前,空间插值的方法有两类[8,9],一类是确定性方法,另一类是地质统计学方法。其中常用的克里格插值对数据有三个要求:① 区域变量可表述为与均值有关的结构成分、与空间有关的随机成分和随机噪声3部分之和;② 所研究区域是均质的;③ 对景观的不同部分应使用不同的半方差图[10]。这些传统的地统计学方法主要是基于几何特征或线性加权的方式进行研究的,这些方法的基本假设是地理空间具有平稳性,是空间均质的,这与地理研究者研究的地理系统的复杂性相背[11,12]。同时这些方法在当前也遇到一些障碍:一方面是将这些方法移植到计算机,在计算机特定的条件下运用这些方法解决问题存在一定困难,如非线性函数求导和积分问题,另一方面是随着地学、社会科学等学科领域的发展,这些学科相互渗透与综合,插值问题已经越出纯数学的范畴[13]。传统的地统计学方法在部分研究领域已经不能满足要求,而神经网络作为空间插值的一种新技术得到了广泛应用。

神经网络能建立一个非线性隐层的前馈网络,能以任意精度逼近任意复杂度的函数。所以,神经网络也完全可以用于研究像土壤属性空间预测这类面插值问题,并且它对训练样本数据没有任何要求和限制。与传统的方法比较,神经网络方法更有利于地理位置和土壤属性相互关系的确定以及土壤属性准确的插值,有利于信息空间分布特性准确、直观的表达[14]

近年来,神经网络在土壤空间预测方面的应用取得一定成果。径向基函数神经网络(radial basis function neural network,RBF网络)是一种具有隐层函数的前馈网络,能以任意精度逼近任意连续函数,其算法原理在一定程度上也克服了BP网络学习速度较慢、需要调节的参数多等缺点[15,16],是一种较理想的非线性计算工具(图1)。RBF网络在日照率的空间分布、地质曲面重建[17~19]等方面均有应用。本研究以土壤重金属铬为例,研究在增加邻近样点信息作为网络输入和在不同样点密度下RBF神经网络对土壤性质空间变异的描述能力,为更准确快速获取土壤性质空间异质性信息提供一种新的思路。

图1   RBF神经网络结构

Fig.1   RBF neural network structure

1 研究区概况

本研究以广东省增城市作为研究区域。增城市位于广东省广州市东部、珠江三角洲东北部,属亚热带季风气候,土壤自然条件较好,是广州地区和珠江三角洲粮食、水果、蔬菜、禽畜和鲜活商品的主要生产基地。近年来,增城市作为广州“东进”城市战略布局的重要角色,经济发展迅猛,增城工业园区在2010年晋升为国家级经济技术开发区。2011年增城市的经济综合发展力位居广东县域经济第一位。

从耕地分等定级成果看,增城市耕地质量差异较大,全市耕地分6个级别,高等别耕地(1、2级)占6.48%、中等别耕地(3、4级)占38.85%、低等别耕地(5、6级)占47.57%。根据《增城市耕地地力调查与质量评价技术报告》,增城市菜地土壤铬含量范围在14.41~55.49 mg/kg,水田土壤铬含量范围在19.45~90.69 mg/kg,土壤铬含量的地区差异较大。

2 RBF神经网络进行空间预测

2.1 土壤采样和数据处理

增城市土壤采样利用分层采样和随机采样相结合的方法。以农用地利用现状为分层依据,同时兼顾均匀性,土壤采样深度为0~20 cm。根据布点的原则,首先对1∶5万的土地利用现状图、基本农田保护区图和土壤分布图进行叠加,在叠加形成的工作图上进行采样点布设,然后将样点逐一转绘到1∶1万的土地利用现状图上,供野外调查取样时使用。根据调查样点的点位图(图2),用GPS定位仪进行定位采样。土壤铬含量的测定依据GB/T17137-1997,采用火焰原子吸收光谱法。

图2   样本数据分布

Fig. 2   Sample data distribution

将所采集的数据汇总分析,去掉明显有误数据点,得到200个有效的样本数据。在200个样本数据基础上,随机选取150个数据点,100个数据点和50个数据点。分成4组实验数据进行研究对比。

根据神经网络函数的特点,为了将不同参量去量纲化和缩小数值差别,同时使网络快速收敛,提高预测的准确性[20],对土壤属性数据进行线性函数转换的归一化的处理。包括对XY坐标以及属性值都做相应处理,利用如下公式:

XY坐标的处理:

X′=(X-Xmin)/(Xmax-Xmin) (1)

Y′=(Y-Ymin)/(Ymax-Ymin) (2)

式中,XY分别代表点的实际坐标值,XmaxYmaxXminYmin分别是XY坐标的最大值和最小值,X′Y′分别为归一后的值。

对点的属性值进行归一化处理:

Z′=(Z-Zmin)/(Zmax-Zmin) (3)

式中,Z代表点的实际点的铬含量值,ZmaxZmin分别是铬含量的最大值和最小值,Z′为归一后的铬含量值。

为验证神经网络方法的准确性,利用ArcGIS软件Geostatistical Analyst模块的Create Subsets命令,在随机抽取的原则下,将全部数据提取其4/5作为训练数据集,1/5作为检验数据集(表1)。

表1   样本统计特征

Table 1   Statistical characteristic of samples

样本量平均值(mg/kg)范围(mg/kg)峰度(mg/kg)变异系数偏度分布类型
20034.90314.95~109.85.0620.4071.761对数正态
15034.88514.95~109.85.1820.4301.858对数正态
10033.71215.28~84.971.8030.3701.085对数正态
5035.14514.95~87.453.2860.4721.758对数正态

新窗口打开

2.2 克里格插值

利用Arcgis软件数据分析模块中的空间预测实现数据的插值。将训练数据集数据进行克里格插值后,记录检验数据集位置插值结果及与实际值之间的误差,并进行分析。

2.3 神经网络的设置

Martin J A R和Nicholson F A等人的研究指出,土壤中铬的浓度和空间变化主要受成土母质的影响[21,22]。根据地理学中的相近相似原理,土壤铬的含量与地理位置之间存在映射关系,所以神经网络预测的输入因子选取点位置,也就是地理坐标。RBF神经网络包括输入层,隐含层和输出层。输入层神经元设置为2个,分别为实验数据的XY坐标,输出层的神经元是1个,即土壤属性值。对于隐含层,为了能够高效的得到结果,同时又保证预测值的准确性,隐含层设置为5层,训练误差目标值设定为满足条件的0.015,训练次数为2 000次。利用Matlab软件进行RBF神经网络的训练(图3),可以看出,前三组数据训练误差很逼近目标误差值,但是当训练数据减少到50个时,预测误差很大,不能够满足预测要求。

图3   RBF网络训练结果

Fig.3   RBF network training results

3 结果与分析

3.1 误差分析

本研究中用误差均方根(Root Mean Square Error, RMSE,下式值为RRMSE)作为插值精度的衡量指标,其计算公式如下:

RRMSE= 1Ni=1NZ^i-Zi2(4)

式中, Z^i为用克里格法或集成RBF网络法预测的值; Zi为实际测定的值;N为检验数据集的样本数。显然RMSE的值越小,则插值的精度越高,误差越小。

利用训练数据集经过训练得到的BRF神经网络。如前所述,前三组数据的网络本身误差已达到预测的要求标准。为将不同的预测方法进行比较和分析,将4组数据同时在ArcGIS软件中的进行克里格插值,得到各样点的铬含量,将预测值与实际值对比分析,得到其平均误差和误差均方根。同样得到BRF方法预测的误差值,将其进行对比(表2)。

表2   误差分析

Table 2   Error analysis

方法样本数据平均误差(mg/kg)RMSE
克里格2000.0360.036
1500.0530.037
1000.0430.031
500.9220.179
RBF2000.0450.033
1500.4450.028
1000.0350.023
500.8280.128

新窗口打开

表3看出,在200个数据点时,两种方法的空间预测误差相差不大,说明RBF神经网络方法同克里格方法一样可以进行土壤属性数据的空间预测插值。当数据减少为150和100个时,RBF神经网络方法的误差比克里格插值的误差要小,体现了土壤空间属性预测的优势。但是当样点的间距太大、样点太稀疏时,特别是当样点数据为50个的时候,由于样点的代表性下降,因此插值精度较差,空间预测不能预测出有效数据。

3.2 图形分析

通过两种插值方法得到了图4。在200个样点时,两插值结果相似,但是从线条上看,RBF方法的插值克服了克里格插值的平滑效应,预测的数据更贴近土壤属性含量分布不规则实际情况。在样点数据减少150个和100个时,两种方法的插值结果有较大差距。RBF方法克服平滑效应,并且通过与200个样点的图形相比,RBF方法的插值结果较为贴近200个样点的结果,具有较好的预测结果。但是当数据减少为50个时,RBF插值中出现较多的“牛眼”,并且与200个样点数据的插值进行比较,此时的插值结果与实际结果差距较大,不能反映真实的土壤重金属铬的空间分布。

图4   不同样本点空间插值

Fig.4   Spatial interpolation of different sample points

4 结 论

通过对增城市不同密度采样数据的克里格插值和神经网络法插值比较,以及对两种插值方法的数据误差分析可以看出,神经网络对空间数据具有较好的预测能力,特别是在数据较少的情况下,用神经网络方法进行空间预测效果较好,能够减小克里格插值的平滑效应。RBF神经网络方法对样本数据的分布没有特别要求,具有更广泛的应用范围,对土壤属性的空间预测是一种可以替代的方法;其模型的性能不但依赖于输入层信息的数量, 还取决于信息的质量,所以充分地利用已知知识或信息、有效地提取数据特征是提高插值精度的关键。通过本研究发现,即使是神经网络方法进行空间属性的预测,也要有一定数量的样本数据才能训练得到较为准确的网络。本研究通过RBF神经网络建立起来的基于地理位置坐标的信息插值方法, 亦可用于其它田间信息的空间插值。

然而,这种神经网络的输入神经元只考虑了XY坐标,没有考虑其它可能的因素对土壤铬含量的影响,如时间因素,工厂布局因素,地形坡度和耕种植物等。在方法上,神经网络方法建立的关系是一种暗箱关系,具体的地理坐标和铬含量间的非线性关系特征没有办法明确表述,不能像传统的地统计学方法那样定量的描述土壤性质的空间相关性。此外训练样本数据的代表性也是非常重要的,关于训练样本数据中的误差对神经网络预测精度的影响及如何减少其影响,需作进一步

的研究。

The authors have declared that no competing interests exist.


参考文献

[1] 胡月明,万洪富,吴志峰,.

基于GIS的土壤质量模糊变权评价

[J].土壤学报,2001,38(3):266~274.

[本文引用: 1]     

[2] 罗锡文,臧英,周志艳.

精细农业中农情信息采集技术的研究进展

[J].农业工程学报,2006,22(1):167~173.

[3] 徐剑波,宋立生,彭磊,.

土壤养分空间估测方法研究综述

[J].生态环境学报,2011,20(8):1379~1386.

[4] 李晓晖,袁峰,贾蔡,.

基于地统计学插值方法的局部奇异性指数计算比较研究

[J].地理科学,2012,32(02): 136~142.

[5] 李建辉,李晓秀,张汪寿,.

基于地统计学的北运河下游土壤养分空间分布

[J].地理科学,2011,31(08): 1001~1006.

[6] 白军红,丁秋档,高海峰,.

向海湿地不同植被群落下土壤氮素的分布特征

[J].地理科学,2009,29(3): 381~384.

[7] 程先富,谢勇.

基于GIS的安徽省土壤有机碳密度的空间分布特征

[J].地理科学,2009,29(4):540~544.

[本文引用: 1]     

[8] Shizhou J,

S Bailey. Sampling Strategies for Soil Available K and P at Field Scale

[J].Pedosphere, 2000,10(4):309-315.

[本文引用: 1]     

[9] 刘雪,王兴润,张增强.

pH和有机质对铬渣污染土壤中Cr赋存形态的影响

[J].环境工程学报,2010,4(6):1436~1440.

[本文引用: 1]     

[10] 胡健颖,孙山泽.抽样调查的理论方法和应用[M].北京:北京大学出版社,2000.

[本文引用: 1]     

[11] 陈述彭.

地球科学的复杂性与系统性

[J].地理科学,1991,11(4):297~305.

[本文引用: 1]     

[12] 钱学森,于景元,戴汝为.

一个科学新领域——开放的复杂系统及其方法论

[J].自然杂志,1990,13(1):3~10.

[本文引用: 1]     

[13] 尤淑撑,严秦来.

基于人工神经网络面插值的方法研究

[J].测绘学报,2000,29(1):30~34.

[本文引用: 1]     

[14] 吴信才. 地理信息系统原理与方法[M].北京:电子工业出版社,2002.

[本文引用: 1]     

[15] Simon Haykin.Neural Networks: A Comprehensive Foundation [M].New York:McMillan Press,1994.

[本文引用: 1]     

[16] 柴杰,江青茵,曹志凯.

RBF神经网络的函数逼近能力及其算法

[J].模式识别与人工智能,2002,15(3):310~316.

[本文引用: 1]     

[17] 屈永华,曾勇,杨永国,.

径向基函数神经网络地质曲面重建及应用

[J].中国矿业大学学报,2000,29(3):318~321.

[本文引用: 1]     

[18] Jervase A J,

LawatiA A,Dorvlo A S.Contour maps for sunshine ratio for Oman using radial basis function generated data

[J].Renewable Energy,2003,28(3):487-497.

[19] 苏安玉,李衡,濮励杰,.

基于RAGA-BP神经网络模型的三江平原地下水资源预测研究

[J]. 地理科学,2009,29(2): 283~287.

[本文引用: 1]     

[20] 柳小桐.

BP神经网络输入层数据归一化研究

[J].机械工程与自动化,2010,6(3):122~126.

[本文引用: 1]     

[21] Martin J A R,Arias M L,Corbi J M G.

Heavy metals contents in agricultural topsoils in the Ebro basin(Spain).Application of the multivariate geostatistical methods to study spatial variations

[J]. Environmental Pollution,2006,144(3):1001-1021.

[本文引用: 1]     

[22] Nicholson F A,Smith S R,Alloway B J,et al.

An inventory of heavy metals inputs to agricultural soils in England and Wales

[J].The Science of the Total Environment,2003,311(1-3):205-219.

[本文引用: 1]     

/