基于径流分类的流域降雨—径流过程动态神经网络建模

  • 邵月红 , 1 ,
  • 林柄章 1 ,
  • 刘永和 2
展开
  • 1.南京信息工程大学应用水文气象研究院, 江苏 南京 210044
  • 2.河南理工大学资源环境学院, 河南 焦作 454000

作者简介: 邵月红(1977-),女,山西侯马人,博士,主要从事水文、水资源、GIS与RS的研究。E-mail:

收稿日期: 2011-01-17

  要求修回日期: 2011-06-02

  网络出版日期: 2012-01-20

基金资助

水利部公益性行业专项(201001047)、校科研基金项目(20100402)、国家青年科学基金项目(41105074)资助

Rainfall-runoff Simulation Based on Runoff Classification Using Dynamic Artificial Neural Networks

  • SHAO Yue-hong , 1 ,
  • LIN Bing-zhang 1 ,
  • LIU Yong-he 2
Expand
  • 1. Applied Hydrometeorological Research Institute, Nanjing University of Information Science and Technology, Nanjing, Jiangsu 210044, China
  • 2. Institute of Resources and Environment, Henan Porytechnic university, Jiaozuo, Henan 454000, China

Received date: 2011-01-17

  Request revised date: 2011-06-02

  Online published: 2012-01-20

Copyright

本文是开放获取期刊文献,在以下情况下可以自由使用:学术研究、学术交流、科研教学等,但不允许用于商业目的.

摘要

利用聚类分析,将径流序列分为不同类型的子径流序列,对这些子序列建立神经网络模型,采用Elman动态神经网络对沂沭河流域上游临沂子流域日径流量进行预测分析,通过与不加分类的总体神经网络的模拟结果进行对比分析。确定性系数、相关系数、平均相对误差和平均相对均方根误差4个统计指数及流域径流过程线和次洪误差分析结果都表明:Elman动态神经网络能够对日径流量进行较好模拟,但基于径流分类的降雨—径流模型表现出更优良性能,能较大程度提高径流模拟精度。

本文引用格式

邵月红 , 林柄章 , 刘永和 . 基于径流分类的流域降雨—径流过程动态神经网络建模[J]. 地理科学, 2012 , 32(1) : 74 -80 . DOI: 10.13249/j.cnki.sgs.2012.01.74

Abstract

A runoff sequence is classified into several sub-runoff sequences with cluster analysis and practical application, and local dynamic neural network for each sub-runoff sequence is performed separately. An Elman recurrent neural network model (ENN) is constructed and applied for the daily runoff forecast in the Linyi sub-catchment of the upper Yishu river basin in this paper. In order to further evaluate the performance of local Elman neural network (LENN), global Elman neural network (GENN) is applied as a comparison at the same time in the study region. Based on analysis indexes such as Nash-Sutcliffe coefficient, correlation coefficient, mean relative error and root mean relative square error, the results of daily runoff and flooding processes are attained. It suggested that Elman recurrent neural network model has a high accuracy of forecast on the rainfall-runoff dynamic process and the maximum peak flow and peak occurrence time, whether it is configuration samples or evaluation samples. However, local Elman neural network based on runoff classification is more suitable and efficient to daily runoff forecasting than global Elman neural network, especially during the period of arid season and semi-humid season. The simulation precision of different periods decreases in the order of arid season, semi-humid season and humid season. Elman recurrent neural network model is feasible to effectively simulate the hydrological dynamic characteristic of the daily runoff and to reflect the complex nonlinear runoff regular pattern in the basin as a promising and efficient method. In order to further evaluate superiority of this method, longer series of data, more regions and hydrology model are need to study and analysis because of the highly nonlinear, spatial and temporal heterogeneity and dynamic uncertainty of rainfall-runoff process.

降雨—径流预报直接为防汛抢险、水资源合理利用与保护等服务。由于降雨径流形成机理及影响因素复杂多变,对其进行模拟预测是较困难问题。流域水文模型是水文科学研究的重要手段和,能对水文动态和流量过程做出准确预报,但水文模型的模拟需要精确了解流域内部的水文结构、较多的输入变量和参数及时空地域等客观条件,难以普遍应用。因此,寻求一种适宜、简单快速的模型是提高降雨径流预报的有效途径。
20世纪90年代以来,人工神经网络模型(Artificial Neural Network, ANN)在许多复杂的非线性领域中得到成功应用。ANN非常适用复杂多变、非线性系统[1,2]。降雨径流过程是一个高度非线性、时变、空间分布不均匀、动态不确定过程,ANN 在水文水科学领域得到广泛成功应用[3~6]
目前,ANN在水文中的应用主要采用静态的BP神经网络进行系统模拟和预测[7,8]。将静态网络用于动态、高度非线性水文模拟中使预测精度较差。动态回归神经网络(Recurrent Neural Network, RNN)提供一种极具潜力的选择,能更生动、更直接反映系统的动态特性,代表神经网络建模、辨识与控制发展方向[9]。Elman神经网络(Elman Neural Network, ENN)是一种典型的动态回归神经网络,它在前馈网络的基础上,通过存储内部状态使其具备映射动态特征,使系统具有适应时变特性能力[10,11]。利用ENN可对径流进行较好模拟和预报,由于不同雨洪其径流生成机制差异较大,将所有径流数据混在一起进行训练,只能较好模拟一般状况的径流,对极值情况的模拟精度不太高。因此,本文以临沂子流域作为研究对象,将整个径流序列分成若干个小组,对不同时段径流采用相应的模块化神经网络进行模拟,通过基于径流分类的若干局部神经网络,试图进一步提高径流预报精度。

1 研究区域及模型介绍

1.1 流域概括及资料情况

研究区域为沂沭河流域上游的临沂子流域,117.35°~118.74°E,34.98°~36.30°N,其流域面积为
10 152 km2。典型的暖温带大陆性季风气候,冬季寒冷多风,降水稀少,夏季炎热多雨,春秋两季气候温和。地形起伏较大,海拔跨度57~1 125 m。据多年的资料统计,流域内多年平均气温为11.8~13.3℃,蒸发量839 mm,降水量830 mm,年降水量主要集中在夏季,暴雨多而强度大,是山东省的暴雨中心之一,年际变化也较大,流域出口位于临沂水文站(图1)。本研究收集临沂流域2001~2008年的6个气象站点的日降雨量和蒸散量及临沂出口站日径流量数据,用来建立ENN模拟日径流量。其中,2001~2005年的数据作为训练样本,2006~2008年数据作为检验样本来验证模型的模拟能力和可扩展性能。
Fig. 1 Digital elevation model, the river net and meteorological stations of the Linyi sub-catchment

图1 临沂流域DEM、数字河网及站点

1.2 径流分类

在对径流进行分类时,考虑到应用方便,采用月统计指数来进行判断其归属于哪一类。统计指数主要有月平均流量、月流量序列的最大流量(最大月洪峰)、最小流量,月流量标准差,分别计算2001~2008年的各个月份流量序列的统计量,经过聚类分析后得到若干小组的径流分类,但是考虑到实际应用的方便可行,最终将不同类型的径流分为3组[12]表1)。对这些经过聚类分析后得到的径流分组分别建立局部Elman神经网络(Local Elman Neural Network, LENN),为更好检验LENN预测径流的模拟性能,同时采用不分组的径流数据建立总体Elman神经网络(Global Elman Neural Network, GENN)来预测径流进行对比分析。
Table 1 The runoff classification based on cluster analysis

表1 聚类分析得到的径流分组

组别 第1组 第2组 第3组
时间 11、12、1、2月 3、4、5、10月 6、7、8、9月
季节 枯水期 半湿润期 丰水期
代号 LENN1 LENN2 LENN3

1.3 Elman动态神经网络模型

ENN是Elman于1990年提出的一种局部递归的神经网络[13],其基本思想是利用最小二乘法,采用梯度搜索技术实现网络的实际输出与期望输出的均方差最小化[14]。主要结构包括4层:输入层、隐含层、承接层和输出层。输入层单元起信号传输作用,输出层单元起线性加权作用,隐含层单元的传递函数可采用线性或非线性函数,承接层用来记忆隐含层单元前一时刻的输出值,可以认为是一个一步延时算子。因此,ENN最大优点是有记忆能力,隐含层的输出通过承接层的延迟与存储,自联到隐含层输入,使其对历史状态数据有敏感性,内部反馈网络的加入增加网络本身处理动态信息的能力,达到动态建模目的,使系统直接反映动态过程系统特性(图2)。
Fig.2 The Elman neural network architecture of rainfall-runoff simulation

图2 降雨径流模拟的Elman神经网络结构

图2中,I(t) = [Q(t-1), , Q(t-3), P(t-1), , P(t-5), E(t-1), , E(t-5)]为输入向量,O(t) =[Q(t)]为输出向量,X(t) = [x1(t), x2(t),, xL(t)]为隐含层的输出向量,C(t) = [c1(t), c2(t),, cL(t)]为承接层输出向量,Wa,Wb,Wc分别为输入层到隐含层、承接层到隐含层和隐含层到输出层的权重矩阵。其学习过程如下:
X(t) = f[W a I(t-1)+ W b C(t)] (1)
C(t) = X(t-1) (2)
O(t) = g[W cX(t)] (3)
其中隐含层的传递函数f (·)为某种非线性函数,本文采用“tansig”函数。输出层传递函数g(·)采用S型对数函数“logsig”函数。
ENN也采用BP算法进行权值修正, 使修改后的最终输出接近希望输出。学习指标函数采用误差平方和函数:
e t = 1 2 t = 1 m ( D t - O t ) 2 (4)
其中,Dt为目标输出向量,Ot为神经网络的实际输出。

2 结果分析

2.1 基于Elman神经网络的降雨径流模拟

ENN建立的过程主要包括:数据的前处理、模型训练样本的选择、输入模式的确定、选择合适的网络拓扑结构、参数估计和模型检验等。
1) 数据前处理。初始数据的检查和预处理主要包括:无效数据的剔除、缺失数据补充、数据的归一化处理和训练样本尺寸大小确定。由于降雨、蒸发和径流数据的变幅相差极大,在神经网络训练中,这样的输入输出不利于模型收敛,同时考虑到预测阶段洪峰可能超过历史洪峰,采用下式对建模数据进行归一化处理,规范范围[0.1,0.9]间。
x ̅ i = 0.1 ( x i - x max ) + 0.9 ( x min - x i ) x min - x max (5)
式中, x ̅ i 为归一化后的数据,xi为实测值序列,xmax为实测最大值,xmin为实测最小值,利用(5)式分别将日降雨量、日蒸散量和日径流量数据进行归一化处理,处理后的数据分成两组,2001~2005年的一组数据作为训练样本,2006~2008年的另一组数据作为检验样本。
2) 输入层模式的确定。输入层模式的确定是决定ENN训练的精度及成功的关键因素。输入模式分量过多,神经网络模型结构就会过于复杂,容易形成过适应,使得训练周期长;分量过少,难以捕捉复杂的非线性关系。由于径流形成的时滞性,Tday的径流不仅受到Tday外部环境和内部因素的影响,还要受到T-1、T-2、…T-nday等诸多因素影响,其中,径流主要与前期净降雨及流量有直接的关系。综合考虑各方面的影响,本文的输入模式分量为径流前5 d日降雨量和蒸散量、前3 d径流量,输入层节点数为13个。
3) 隐含层及其节点的确定。正确选择隐含层节点数是网络成功的关键。实践证明,隐含层节点数太少时,易陷入局部最小,容错性较差;节点太多时又会使得训练时间过长。目前对于如何选择隐含层单元的多少并没有一套确切的理论依据,多是通过经验数值和公式比较确定的。本文训练样本1 826个,参考下式进行估算 [15]
H=[M×n2/nx+nz] (6)
式中,H为隐含层节点数目;M为训练样本数目;nxnz分别为输入和输出层节点数;[ ]为取整运算符。因此,本文输入层选定为13个,输出层为1个节点,计算出隐含层节点数 59个。同时,以试错法按照模型既收敛同时误差又较小的原则来确定隐含层的最佳节点数。综合判断,隐含层的节点数为32个,最终选择[13,32,1]网络结构来研究日径流量的预报。
4) 学习效率和训练次数确定。通过试错法,初始学习速率定为0.05,根据流域的面积和实际情况,计算目标误差采用1.5×10-4,利用上述训练样本对ENN进行训练,训练5 000次后,学习误差达到1.1×10-4

2.2 模型估测值与径流观测值的精度评估

在检验模型模拟的径流精度高低时,通常采用Nash and Sutcliffe [16]提出的模型效率系数(确定性系数)来对模拟的径流量进行分析和评价。为了更好的检验LENN估测径流的精度,同时采用GENN进行对比分析,本文通过确定性系数DC、相关系数R、平均相对误差Wabs和平均相对均方根差RMSE 4个统计指数来定量评估,其表达式见式(7~10)。其中,2001~2005年日降雨—径流量作为训练样本,2006~2008年日降雨—径流量作为检验样本(表2)。
DC = 1 - i = 1 n [ R obs ( i ) - R est ( i ) ] 2 i = 1 n [ R obs ( i ) - R ̅ obs ( i ) ] 2 (7)
R = i = 1 n [ R obs ( i ) - R ̅ obs ( i ) ] [ R est ( i ) - R ̅ est ( i ) ] i = 1 n [ R obs ( i ) - R ̅ obs ( i ) ] 2 i = 1 n [ R est ( i ) - R ̅ est ( i ) ] 2 (8)
W abs = 1 n i = 1 n R est ( i ) - R o bs ( i ) 1 n i = 1 n R obs ( i ) (9)
R MSE = i = 1 n [ R est ( i ) - R obs ( i ) ] 2 n 1 2 1 n i = 1 n R obs ( i ) (10)
其中,n表示总样本数,i表示序数,Robs(i)、 Rest(i)、 R ̅ obs ( i ) R ̅ est ( i ) 分别为实测径流量(m3/s)、神经网络模拟的径流量(m3/s)、实测平均径流量(m3/s)和模拟的平均径流量(m3/s)。
表2中,DC表示模拟值和观测值间的拟合程度,其值反映模型模拟效率,系数越接近于1,表明模型效率越高。相关系数R反映模拟值与观测值间相关性,其值越接近于1,相关性越好;Wabs反映估测值相对于观测值的偏离程度,能客观地反映测量结果准确性;RMSE反映估测值相对观测值的接近程度。表2可知:无论是训练样本还是检验样本,4个统计指数表明,LENN模拟精度要高于GENN,不同时期精度高低为:枯水期>半湿润期>丰水期,尤其是枯水期和半湿润期LENN的模拟精度明显高于GENN。主要原因是不同雨洪,其径流形成机制不同,GENN对不同径流机制不加区分、同等对待,性能必然受影响,最终训练出来的模型只能对问题提供权衡各方利益“最佳”解,使一些特性信息当噪声过滤掉,通过径流分组的LENN充分考虑径流形成机制,得到成因相近、信息相对均质样本,训练出的神经网络可表现较高性能,模拟精度会比GENN在不同时期有不同程度提高。
Table 2 Comparison of the simulation results from LENN and GENN of the runoff classification

表2 基于径流分组的LENN和GENN模拟性能比较


分组 LENN GENN
DC R Wabs RMSE DC R Wabs RMSE
训练样本 枯水期 0.962 0.981 0.104 0.208 0.447 0.670 0.498 0.885
半湿润期 0.941 0.970 0.310 0.597 0.860 0.930 0.517 0.931
丰水期 0.865 0.930 0.340 0.670 0.841 0.917 0.360 0.730
全年 0.886 0.941 0.309 0.874 0.857 0.926 0.396 0.979
检验样本 枯水期 0.856 0.925 0.161 0.261 0.481 0.693 0.348 0.524
半湿润期 0.719 0.845 0.261 0.441 0.175 0.418 0.555 0.985
丰水期 0.781 0.884 0.363 0.549 0.757 0.870 0.373 0.583
全年 0.820 0.905 0.332 0.972 0.792 0.890 0.393 1.050
图3、4中的子图分别为训练样本和检验样本中最大径流年丰水期的径流过程线模拟图。可见,无论是训练样本还是检验样本,LENN和GENN模拟的日径流量与观测的径流量在整个过程吻合非常好,整体趋势一致性很强,说明模型能够对日径流量进行很好的模拟,能很好捕捉洪峰出现时间,只在洪峰流量上略有差异。从过程线看出LENN模拟精度稍高GENN。2001~2005年最大训练样本中,不同年份洪水特征差异较大,有降雨非常少的枯水年(2002),降雨丰沛且集中的径流年(2005),还有降水相对均匀、径流量在1 500 m3/s左右的2001、2003和2004年,总体来说,训练样本较多,包括洪水场次类型较多,因此,模拟径流精度较高,当训练好的样本模型用于2006~2008年检验时,模型模拟效果较好。综上可知:LENN和GENN模型能够较准确反映流域复杂的非线性产汇流规律和动力过程,有效模拟该流域的水文与水力特征,是一种较好的模拟流域水文动态过程的神经网络模型,用它来进行降雨—径流预报可行。
Fig.3 The simulated results for daily rainfall-runoff from configuration samples in the Linyi sub-catchment in 2001-2005

图3 临沂流域训练样本日径流量模拟结果(2001~2005)

Fig.4 The simulated results for daily rainfall-runoff from evaluation samples in the Linyi sub-catchment in 2006-2008

图4 临沂流域检验样本日径流量模拟结果 (2006~2008)

在水资源评估和洪水预报中,需要对模型模拟的次洪过程最大洪峰流量(Qmax)和峰现时间(Tpeak)误差进一步分析。表3可知:训练样本中,LENN模拟的QmaxTpeak精度要高于GENN,其中LENN在2002、2003和2005年的模拟误差较小,在-5%左右,Tpeak误差为0 d,2001和2004的模拟误差较大,在-30%左右,Tpeak误差为1 d ,模拟精度较低,但能满足预报要求。GENN的模拟结果与LENN相似,只是精度稍低。检验样本中,LENN和GENN模拟结果与训练样本相似,精度稍低于训练样本,说明模型可扩展性很好。表3分析可知:LENN和GENN能够较好的模拟丰水期次洪过程的QmaxTpeak,模拟比较准确,说明模型能够有效的模拟水文系统的动力特性,能够满足人们的需求,为人们提供决策依据。
Table 3 Relative error analysis for flooding process simulation in the Linyi sub-catchme

表3 临沂流域次洪过程误差分析

样 本 次洪
编号
Qmax (m3/s) LENN GENN
模拟Qmax(m3/s) 误差 (%) Tpeak误差 (d) 模拟Qmax(m3/s) 误差 (%) Tpeak 误差(d)
训练样本 2001-7-31 2030.0 1504.4 -25.89 +1 1369.8 -32.52 +1
2002-7-25 138.0 134.4 -2.61 0 143.2 3.77 0
2003-9-7 1150.0 1044.2 -9.20 0 934.9 -18.70 +1
2004-8-5 1200.0 800.1 -33.33 +1 773.9 -35.51 +1
2005-9-21 3760.0 3496.6 -7.01 0 3364.1 -10.53 0
文本检验 2006-8-29 827.0 755.7 -8.62 +1 1155.8 39.76 +1
2007-8-19 1334.6 858.8 -35.65 0 1021.3 -23.48 0
2008-7-24 1814.4 1776.6 -2.08 0 1547.0 -14.74 0

3 结 论

对上述LENN和GENN模型模拟的径流量的结果进行比较分析,主要结论如下:
1) DC、R、WabsRMSE这4个统计指数结果表明:无论是训练样本还是检验样本,LENN估测的径流量精度要要高于GENN,尤其是枯水期和半湿润期的模拟精度明显高于GENN。不同时期的精度高低为:枯水期>半湿润期>丰水期。
2) 流域的径流过程线和次洪过程误差分析表明:LENN和GENN模型在训练期和验证期能够对日径流量和次洪过程的最大洪峰流量和峰现时间进行很好的模拟, LENN的模拟精度要稍高与GENN的,训练样本的精度高于检验样本。
3) ENN模型能够有效的模拟水文系统的动力特性,反映流域复杂的非线性产汇流规律和动力过程,模拟精度较高,具有良好的发展前景。由于降雨径流过程的高度非线性、时空不均匀性、动态不确定性,训练的网络结构要经过多方面的检验和论证。本研究由于收集的资料有限,难免带来一些误差,使其代表性和说服力也不是很强。但从目前的模拟结果还是比较满意的,为更好说明该方法的优越性,还要更长时间的资料、更多区域和水文模型来验证,以及更深层次的研究和分析。

The authors have declared that no competing interests exist.

[1]
Ju Q,Yu Z B,Hao Z C,et al.Hydrologic Simulations with Artificial Neural Networks[C]//Angela Burgess. Third International Conference on Natural Computation. Los Alamitos:IEEE Computer Society Publications,2007,2:22-27.

[2]
王芳,卓莉,黎夏,等.基于高光谱特征选择和RBFNN的城市植被胁迫程度监测[J].地理科学,2008,28(1):77~82.

[3]
Carcano E C,Bartolini P,Muselli M,et al.Jordan recurrent neural network versus IHACRES in modeling daily stream flows[J].Journal of Hydrology,2008,362(3-4):291-307.

[4]
Kin C L,Ball J E,Sharma A.An Application of Artificial Neural Networks for Rainfall Forecasting[J].Mathematical and Computer Modelling,2001,33(6):883-699.

[5]
苏安玉,李衡,濮励杰,等.基于RAGA-BP神经网络模型的三江平原地下水资源预测研究[J].地理科学,2009,29(2):283~287.

[6]
王钧,蒙吉军.黑河流域近60年来径流量变化及影响因素[J].地理科学,2008,28(1):83~88.

[7]
Tang W M.The study of the optimal structure of BP neural network[J].Systems Engineering Theory and Practice,2005,25(10):95-100.

[8]
Yu S W,Zhu K J,Diao F Q.A dynamic all parameters adaptive BP neural networks model and its application on oil reservoir prediction[J].Applied Mathematics and Computation,2008,195(1): 66-75.

[9]
张翀,李晶,任志远.基于Hopfield 神经网络的中国近40年气候要素时空变化分析[J].地理科学,2011,31(2):211~217.

[10]
Srinivasn B,Prasad U R,Rao N J.Back propagation through adjoins for the identification of nonlinear dynamic systems using recurrent neural models[J].IEEE Transactions on Neural Networks,1994,5(2):213-227.

[11]
Tommy W S,Chow Y F.A recurrent neural network based real time learning control strategy applying to nonlinear system with unknown dynamics[J].IEEE Transactions on Industrial Electronics,1998,45(1):151-161.

[12]
王玲,黄国如.基于径流分类的日径流量预测神经网络模型[J].灌溉排水,2002,21(4):45~48.

[13]
Elman J L.Finding structure in time[J].Cognitive Science,1990,14(2):179-211.

[14]
Shi X H,Liang Y C,Lee H P.Improved Elman networks and applications for controlling ultrasonic motors[J].Applied Artificial Intelligence,2004,18(7):603-629.

[15]
飞思科技产品研发中心.神经网络理论与MATLAB7实现[M]. 北京: 电子工业出版社, 2005.

[16]
Nash J E,Sutcliffe J V,River flow forecasting through conceptual model: a discussion of principles[J]. Journal of Hydrology,1970,10(3): 282-290.

文章导航

/