Scientia Geographica Sinica  2015 , 35 (11): 1460-1467

Orginal Article

不同概率分布函数降雨极值的适用性分析

张玉虎1, 王琛茜12, 刘凯利3, 陈秋华3

1.首都师范大学资源环境与旅游学院, 北京 100048
2. 北京建筑大学测绘与城市空间信息学院, 北京 100044
3. 首都师范大学数学科学学院, 北京 100048

Applicability of Different Probability Distributions to Estimated Extreme Rainfall

ZHANG Yu-hu1, WANG Chen-xi12, LIU Kai-li3, CHEN Qiu-hua3

1. College of Resources Environment and Tourism, Capital Normal University, Beijing, 100048, China
2. Institute of Surveying and City Spatial Information, Beijing University of Civil Engineering and Architecture, Beijing 100044, China
3. Institute of Math Science, Beijing University of Civil Engineering and Architecture, Beijing 100044, China

中图分类号:  P426.615

文献标识码:  A

文章编号:  1000-0690(2015)11-1460-08

收稿日期: 2014-09-17

修回日期:  2014-11-20

网络出版日期:  2015-11-20

版权声明:  2015 《地理科学》编辑部 本文是开放获取期刊文献,在以下情况下可以自由使用:学术研究、学术交流、科研教学等,但不允许用于商业目的.

基金资助:  国家十二五科技支撑计划课题 (No.2013BAC10B01、2012BAC19B03-05)资助

作者简介:

作者简介:张玉虎(1975-),男,江苏省徐州市人,博士,讲师,主要从事水资源、水环境分析评价与灾害风险应对研究。E-mail:zhang_yuhu@163.com

展开

摘要

极端降雨极值发生的重现期是流域与城市防洪设施规划设计标准需要参考的最重要参数之一。利用常用的5种水文统计学分布函数,选取中国十大流域内10个站点不同时段的最大降雨极值序列进行拟合,并检验筛选不同站点的适用性分布函数。结果表明:10个站点拟合优度检验拟合效果较好,曲线差异度较小的分布依次为广义极值分布、对数正态分布、皮尔逊III分布;不同站点适宜性曲线的差异程度不同。研究结果可为区域降雨极值序列的拟合提供参考,即不同的区域、不同的季节、不同时长的降雨极值序列都应寻找其较适宜的分布函数并采用多种检验方法来拟合,以降低不确定性。

关键词: 极端降雨 ; 概率分布 ; 重现期 ; K-S检验 ; A-D检验

Abstract

Heavy precipitation is a crucial nature factor of flood. The return period of the extreme value of precipitation depth is the most significant reference of the design standard of flood prevention facilities in an urban or a basin. In this article, the series of annual, summer and winter maxima of precipitation depths for 1-day, 2-day and 3-day durations measured at ten selected stations in China are analyzed, using five commonly used hydrological statistical distribution functions. The distribution functions applicable for these stations were measured using the Kolmogorov Smirnov (K-S) and the Anderson Darling (A-D) tests. The results show that: 1) The summer maxima series shows higher standard deviation and larger differences between distributions than other maxima series and the annual maxima occur mostly in summer; 2) The Generalized Extreme Value (GEV) distribution, the lognormal (LN) distribution and the Pearson III distribution perform were better in the imitative effect test of goodness of fit, and the degree of curve difference is smaller; 3) Differences between estimates of rainfall with return periods were shorter than 25 years are smaller; 4) Estimates of precipitation can change significantly depending on the probability distribution being used, particularly for the summer series; 5) Suitability curves present seasonal difference. By statistical analysis of precipitation maxima, the precipitation is concentrated in summer; due to the disperse and skewness of precipitation series, and the appropriate distribution functions are quite different in different season periods; 6) In some extreme rainfall sequences, two curves of linear fitting are almost the same. Even if the return period extending to 100 years, the difference quantity of two curves is only a few millimeters. In this situation, the results of small probability rainfall events are more reliable; 7) There are differences among 1-day, 2-day and 3-day durations of precipitation depths, the probability distribution of 1-day maximum precipitation fits better. When carrying out statistical analysis of hydro-meteorological extremes, various probability distribution function and test methods should be taken for calculating, to reduce the uncertainty of single calculation. In this study, experimental analysis of 10 sites demonstrated that the Pearson III is not suitable for all sites. It is suggested here that the estimation of extreme precipitation should take into consideration the range of extreme values estimated by the best-fit distributions identified by more than one test as an approach to assess uncertainties related to extreme rainfall analysis.

Keywords: extreme precipitation ; probability distribution ; return periods ; Kolmogorov-Smirnov test ; Anderson-Darling test

0

PDF (845KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

张玉虎, 王琛茜, 刘凯利, 陈秋华. 不同概率分布函数降雨极值的适用性分析[J]. , 2015, 35(11): 1460-1467 https://doi.org/

ZHANG Yu-hu, WANG Chen-xi, LIU Kai-li, CHEN Qiu-hua. Applicability of Different Probability Distributions to Estimated Extreme Rainfall[J]. Scientia Geographica Sinica, 2015, 35(11): 1460-1467 https://doi.org/

IPCC(2012)第5次评估报告中阐述“在未来气候变暖背景下,极端暖事件将进一步增多,中纬度大部分陆地区域和湿润的热带区域降水强度、降水发生频率可能增多[1]。中国地处中纬度地区,不同地区不同季节极端降水发生的概率及强度蕴含不确定性[2]。极端强降水频率和强度的变化,直接导致洪涝灾害的发生[3]。水文统计方法能够客观反映水文现象的不确定性[4~6],降雨量重现期的准确计算是洪水风险评估及防洪设施工程设计中最重要的参数。

水文气象统计学常用分析方法有:广义极值分布(GEV, Generalized Extreme Value)[7~9]、对数正态分布[10]、韦伯分布(Weibull)[11]、皮尔逊Ⅲ(Pearson-Ⅲ)分布[12,13]、耿贝尔分布[14,15]、指数分布(Exponetial)、韦克比分布(Wakeby,简称WAK)[16,17]等。自1980年以来,中国在水利水电工程水文领域及洪水设计等方面通常采用皮尔逊Ⅲ型分布函数进行降雨极值的拟合计算。计算过程中经验点数据与频率曲线拟合不好时,经过论证有时也采用其他线型[18]。未来气候变化下,探讨有效、准确评估全国洪水风险及可能灾害,需要加强降雨量重现期拟合的准确计算。同时降雨极值方法学探讨也有助于水电工程及防洪设施标准的制定。尽管全国尺度的洪水风险已经有少数学者开展了评估,诱发洪水发生的降雨极值通常都用皮尔逊III型拟合。为探讨不同区域降雨极值序列不同概率分布函数适宜性,特从全国十大流域选取10个站点(10个站点不能代表10个流域)进行拟合。

本文选取中国范围内10个站点的日降雨量数据,建立年最大降雨量序列(AMS, annual maxima series)、夏季最大降雨量序列(SMS, summer maxima series)和冬季最大降雨量序列(WMS, winter maxima series),尝试运用不同分布函数对最大1、2、3 d降雨量进行拟合,通过K-S(Kolmogorov-Smirnov)与A-D(Anderson-Darling)方法检验产生不同站点的最优拟合函数,对降水极值序列分布函数的重现期曲线做出比较,探索不同线型对站点的适用性。

1 数据与方法

研究采用的气象观测数据由中国气象局国家气象信息中心提供,考虑到数据的质量、数据的连续性与统计样本的最短年限,选取降雨统计数据的年限为1960年1月1日至2010年12月31日。在十大一级流域选取10个站点(表1)。

表1   逐日降水站点信息

Table 1   Summary of daily rainfall at meteorological site

站台编号站名省名经度纬度海拔高度(m)起始年月终止年月所属一级流域
50745齐齐哈尔黑龙江123°55'47°23'147.11960.12010.12松花江
54342沈阳辽宁123°27'41°44'44.71960.12010.12辽河
57051三门峡河南111°12'34°48'409.91960.12010.12黄河
58203阜阳安徽115°44'32°52'32.71960.12010.12淮河
53798邢台河北114°30'37°04'77.31960.12010.12海河
57461宜昌湖北111°18'30°42'133.11960.12010.12长江
59265梧州广西111°18'23°29'114.81960.12010.12珠江
58737建瓯福建118°19'27°03'154.91960.12010.12东南诸河
56227波密西藏95°46'29°52'2736.01960.12010.12西南诸河
52679武威甘肃102°40'37°55'1531.51960.12010.12西北诸河

新窗口打开

从季节分布上划分,每个站点的日降雨量数据分为全年,夏季(6~8月)以及冬季(12月至次年2月);从降水时长上划分,从每个站点的逐日降水数据中统计每年(夏季、冬季)最大1 d降雨量、最大2 d降雨量以及最大3 d降雨量。对各个站点全年、夏季、冬季的最大降雨量序列进行5种概率分布拟合,包括广义极值分布(GEV, Generalized Extreme Value)、对数正态分布(LN, Lognormal)、韦伯分布(Weibull)、皮尔逊III分布(Pearson-III)、耿贝尔分布(Gumbell)。

K-S(Kolmogorov-Smirnov)检验[19]是一种基于经验累积分布函数(ECDF)的算法,它的特性是具有分布无关性,所以适用于任何连续分布,很适合小样本。A-D(Anderson-Darling)检验[20,21]是对K-S检验的一种修正,相比K-S检验它加重了对尾部数据的考量,K-S检验具有分布无关性,它的临界值并不依赖被测的特定分布,而A-D检验使用特定分布去计算临界值,这使得A-D检验具有更灵敏的优势。根据K-S与A-D拟合优度检验对几种分布函数的拟合效果进行检验。数据统计、分布拟合以及优度检验通过MATLAB软件实现。

1.1 Kolmogorov-Smirnov检验

K-S检验的检验方法是以样本数据的累计频数分布与特定理论分布比较,若两者间的差距很小,则推论该样本取自某特定分布族。设y1,y2,…,yi,,yn是样本量为N的样本且已按升序进行了排序,则ECDF的表达式为:

EN=n(i)/N (1)

式中,n(i)是小于yi的点的数量。K-S检验的构造如下:H0为样本数据,来自于某个特定分布的总体;H1为样本数据,不是来自于某个特定分布的总体。K-S检验的统计量定义为:

D=max1iNFyi-1-iN,iN-Fyi(2)

其中,F是被检验的分布的理论CDF,它必须被完全定义,即其位置、比例和形状参数不能由样本来估计。我们通过将D与若干已被算出的临界值相比较来得出检验的结论。

1.2 Anderson-Darling检验

A-D检验所用的统计量一般用A2来表示,其表达式是:

A2=-n-1ni=1n2i-1){lnF(yi)+ln[1-F(yn-i+1)]}(3)

其中,n是样本量,F是特定分布的概率分布函数(CDF)。另外注意yi是按大小顺序排列的。A-D检验的构造如下:H0为样本数据,来自于某个特定分布的总体;H1为 样本数据,不是来自于某个特定分布的总体。

Stephens给出的正态分布的临界值如下:α=0.10时,A=0.656;α=0.05时,A=0.787;α=0.025时,A=0.918;α=0.01时,A=1.092。

对于被检验的分布,在确定检验的置信度α后,计算统计量A并将其和相应置信度下的临界值进行比较,得出拒绝或接收原假设的结论。

2 结果与讨论

2.1 降水极值统计分析

站点降雨极值统计信息如表2。10个站点中全年1 d最大降雨量最高值位于珠江流域,广西省梧州站点,1966年6月12日记录降雨量达到334.5 mm,同样为夏季1 d降雨量最高值;全年2 d最大降雨量最高值为431.5 mm,位于海河流域,河北省邢台站点,同样为夏季2 d最大降雨量最高值;全年3 d最大降雨量与夏季3 d最大降雨量的最高值也发生在此点,降雨量值达到570.2 mm。冬季1、2、3 d最大降雨量最高值均位于珠江流域,广西省梧州站点,1969年1月30日记录降雨量为100.1 mm。

表2   站点降雨极值统计信息

Table 2   Maximum precipitation for 1-, 2- and 3-day duration at meteorological sites

降雨极值序列连续降雨
日数(d)
站台
编号
最小值
(mm)
最大值
(mm)
均值
(mm)
标准差
(mm)
站台
编号
最小值
(mm)
最大值
(mm)
均值
(mm)
标准差
(mm)
150745
齐齐哈尔
25.60135.5053.7522.1257051
三门峡
30.80115.8059.2922.47
全年234.00159.7066.6226.5732.70153.1070.2724.42
337.40165.1071.7227.5940.00213.7078.4028.89
120.50135.5053.0022.6818.40112.8054.1623.88
夏季222.00159.7065.3027.7718.80153.1062.9326.36
326.80165.1070.3228.8218.80213.7069.2031.59
10.207.902.311.560.6014.405.933.28
冬季20.208.202.721.790.6017.007.024.06
30.208.302.821.870.6021.407.594.63
152679
武威
8.3062.7022.1211.6757461
宜昌
32.10229.1096.3739.53
全年211.5079.1026.7813.5539.60229.10113.5039.80
311.7087.8029.9815.2552.40229.10126.5740.25
14.5062.7020.2112.7032.10229.1089.7238.20
夏季24.5079.1024.3015.1837.10229.10107.2739.19
34.5087.8026.7416.7451.50229.10119.9140.56
10.105.302.111.333.9036.9015.957.97
冬季20.106.902.361.524.0053.1021.2310.90
30.108.502.651.924.5073.4024.3514.12
153798
邢台
25.40304.3080.4647.5058203
阜阳
38.20226.1095.1643.56
全年229.20431.50104.5866.9056.30249.80120.7549.50
330.00570.20116.6686.1457.10334.30133.2252.95
125.40304.3077.1648.0836.00226.1089.4546.28
夏季229.20431.50100.1667.6538.40249.80115.6752.74
330.00570.20111.5287.4744.20334.30127.4757.05
10.1016.205.543.854.8053.9017.919.17
冬季20.1018.906.594.664.8054.2023.7711.90
30.1021.307.175.364.8065.6027.1514.24
154342
沈阳
32.50215.5075.2833.7858737
建瓯
52.40183.4096.0329.19
全年244.10216.4091.6836.8875.60331.70132.6748.62
344.40216.40100.1537.9384.30398.50160.4169.67
128.10215.5074.8934.2533.00183.4083.7433.77
夏季234.00216.4091.0537.7141.90331.70116.9255.22
341.70216.4099.6438.5543.60398.50139.4075.59
12.0026.809.056.0014.3097.8032.8114.00
冬季22.0027.5010.496.8216.50125.3046.1319.55
32.0027.5011.046.9016.90135.0053.9822.34
156227
波密
22.10111.7043.4117.4059265
梧州
48.60334.50108.9550.34
全年228.30146.5063.4923.1071.80353.60133.9053.40
333.90174.2076.1128.5381.90368.60149.3055.54
110.5075.2034.0415.5633.80334.5092.4255.74
夏季219.50107.5051.1223.3049.40353.60113.8961.02
320.50137.4061.7726.9050.50368.60127.4563.06
11.1029.909.576.315.60100.1031.6220.32
冬季21.4046.2013.769.895.90139.4042.2825.43
31.4060.1015.9411.928.60182.1048.9531.68

新窗口打开

从最大降雨量统计值最大值看,站点的年最大降雨量(1、2、3 d)大多发生在夏季,除波密站点(位于西北诸河流域,西藏)年最大1 d降雨量于1998年10月20日达到最大值111.7 mm,夏季最大1 d降雨量于1982年6月10日达到最大值75.2 mm,相应年最大2、3 d降雨量与夏季最大值时间点也不重合;三门峡站点(黄河流域,河南)年最大1 d降雨量为1972年9月1日,达到115.8 mm,夏季最大1 d降雨量记录时间点为1960年7月15日,降雨量为112.8 mm。

从最大降雨量统计值标准差比较,一般情况为夏季略高于全年,远高于冬季,这与中国地理位置与季风气候密切相关。但波密站点(位于西北诸河流域,西藏)与宜昌站点(长江流域,湖北)全年标准差略高于夏季,说明其最大降雨量统计值离散程度全年略高于夏季。

从降雨量最大值差异度来看,全年与夏季最大值差异较小(0~32.7%),全年(夏季)与冬季最大值差异较大(46.7%~96.3%);全年与冬季最大1 d降雨量差异度在邢台站点(海河流域,河北)为最大值点,达到94.7%,但全年与冬季最大1 d降雨量在梧州站点(珠江流域,广西)达最大值,分别为334.5与100.1 mm。最大2 d降雨量和最大3 d降雨量其差异度最大值与雨量最大值重合于同一站点。

2.2 拟合优度检验

采用5种分布函数与2种检验方法对10个站点最大降雨量序列进行拟合并做优度检验。

1) 从10个站点拟合检验结果可以看出,拟合效果较好的为广义极值分布(GEV, Generalized Extreme Value)、对数正态分布(LN, Lognormal)和皮尔逊III分布(Pearson-III)。其中,广义极值分布(GEV, Generalized Extreme Value)拟合效果最佳,在通过一种以上检验的降水序列中,全年最大降雨量序列为23个,占60%,夏季最大降雨量序列为14个,占35%,冬季最大降雨量序列为18个,占46%。其次为对数正态分布(LN, Lognormal),全年最大降雨量序列为9个(24%),夏季为15个(38%),冬季为6个(15%)。再次为皮尔逊III分布(Pearson-III)全年最大降雨量序列为5个(13%),夏季为9个(23%),冬季为7个(18%)。

2) 全年与夏季的降水序列中,通过两种拟合优度检验分布函数仍是广义极值分布(GEV)、对数正态分布(LN)与皮尔逊III分布(Pearson-III);冬季最大降水序列中拟合较好的依次为广义极值分布(GEV, Generalized Extreme Value)(52%)、皮尔逊III分布(Pearson-III)(19%)和韦伯分布(Weibull)(14%)。

3) 同时适用于最大1、2和3 d降雨量序列且通过两种检验的概率分布函数有广义极值分布(GEV)(3个最大降雨量序列)和皮尔逊III分布(Pearson-III)(1个最大降雨量序列)。其中,武威站(西北诸河流域,甘肃,52679)年降雨量序列、建瓯站(东南诸河流域,福建,58737)冬季降雨量序列与梧州站(珠江流域,广西,59265)年降雨量序列,均以GEV拟合全年最大降雨量序列效果最优,邢台站(海河流域,河北,53798)以皮尔逊III分布拟合冬季最大降雨量序列效果最优。

4) 从10个站点分析结果可以看出,同一个站点其全年、夏季、冬季适宜性曲线不尽相同。由降雨量极大值统计分析已知,所选站点降雨量均集中于夏季,降雨量序列的离散程度与偏度导致这3个时期所适宜的分布函数有所差异。仅有一个站点建瓯站(东南诸河流域,福建,58737)的最大2、3 d降雨量在全年,夏季与冬季均以GEV拟合最佳,且满足两种检验。

2.3 重现期比较分析

以每个站点通过检验的概率函数拟合不同重现期下降雨极值的线型,图1~3展示重现期为1~100 a时部分站点的降雨量曲线。通过K-S与A-D两种优度检验的最大值降雨量序列用最优线型拟合,仅通过一种检验的序列尝试两种线型的拟合并对比差异性。结果表明:

1) 在所有的季节序列(AMS、SMS、WMS)中,曲线之间的差异度在重现期25 a以内均小于7.8%,且大多数拟合曲线在重现期25 a以内几乎重合(差异度小于4%)。仅站点53798(海河流域,的河北,邢台站)以广义极值分布(GEV)、对数正态分布(LN)两种曲线拟合夏季最大3 d降雨量差异度为7.8%;站点56227(西南诸河流域,西藏,波密站点)夏季最大3 d降雨量以广义极值分布(GEV)、对数正态分布(LN)拟合差异度为6%,冬季最大3 d降雨量以对数正态分布(LN)、皮尔逊III分布(Pearson-III)拟合差异度为6%;另外,站点57 461(长江流域,湖北,宜昌站)冬季最大2 d降雨量拟合曲线以广义极值分布(GEV)、对数正态分布(LN)拟合在重现期为25 a时差异度为6.4%(见图1)。

图1   拟合差异度大于6%的站点

Fig.1   The best-fit distributions of site with differences more than 6%

图2   GEV与LN拟合贴合度高的站点

Fig.2   High similarity curves estimated by GEV and LN

图3   GEV与Pearson-III拟合贴合度高的站点

Fig.3   High similarity curves estimated by GEV and Pearson-III

2) 在一个降雨量极值序列的两种线型拟合中,一些站点表现出较好的贴合效果,即使重现期延伸到100年一遇,其曲线差异量仅为几毫米,这种线型相似度使得小概率降雨事件的计算结果更为可靠。在站点54342、56227年最大3 d降雨量序列,52679夏季最大3 d降雨量序列与57461、59265冬季最大3 d降水序列中广义极值分布(GEV)与对数正态分布(LN)曲线贴合效果较好(图2);在站点57461年最大3 d降雨量序列、58737年最大1 d降雨量序列与57051冬季最大2 d降雨量序列中,广义极值分布(GEV)与皮尔逊III分布(Pearson-III)线型分布几乎一致(图3);站点57461夏季最大1 d降雨量序列用对数正态分布(LN)与皮尔逊III分布(Pearson-III)分别拟合,线型重合度较高,重现期23 a时出现略微分歧,但重现期为100 a时拟合降雨量差异为3 mm;站点57051冬季最大1 d降雨量序列用皮尔逊III分布(Pearson-III)与韦伯分布(Weibull)拟合相差最大0.3 mm;站点58203冬季最大2 d降雨量序列用广义极值分布(GEV)与耿贝尔分布(Gumbell)拟合,两种线型基本重合。在11组贴合度较高的曲线中不难看出:广义极值分布(GEV),对数正态分布(LN), 皮尔逊III分布(Pearson-III)三者之间组合的降雨量序列占82%,其中广义极值分布(GEV)参与组合的比例占73%,对数正态分布(LN)参与组合的比例占55%,皮尔逊III分布(Pearson-III)参与组合的比例占27%,这与前文10个站点拟合检验结果相吻合。

3) 个别站点降雨量序列以不同函数进行拟合呈现较大分歧。全年与夏季降水极值序列拟合曲线差异度最大值均在站点53798(海河流域,河北,邢台站),全年最大2 d降雨量以GEV、LN最大差异度为10.7%,夏季最大3 d降雨量以GEV、LN拟合,最大差异度为28.8%;另外在站点57461(长江流域,湖北,宜昌站),最大1、3 d拟合曲线贴合度较好,最大2 d拟合曲线以不同分布函数频率计算结果大多存在偏差,全年最大2 d降雨量LN 、P3 拟合差异度最大为7%,夏季最大2 d降雨量LN 、P3 拟合差异度最大为8.8%,冬季最大2 d降雨量GEV、LN拟合差异度最大为9.4%。

4) 拟合曲线分歧呈现季节差异,夏季差异较高。对于拟合降雨量值的最大差异度,当拟合频率为0.01(重现期为100年一遇)时,夏季最大1、2、3 d降雨量差异度最大值(28.8%)大于年最大1、2、3 d降雨量差异度最大值(10.7%),冬季差异度最小(9.4%),与前文不同季节最大降雨量序列方差大小一致,即所选站点所代表的降雨量在夏季离散程度较大,夏季不同拟合曲线易呈现不同的结果。

5) 不同日数最大降雨量拟合效果不同。在1、2、3 d最大降雨量序列的拟合比较中,1 d拟合效果相对较好,除站点50745(夏季曲线最大差异度为8.7%)之外,数据序列中仅6个未一致通过两类检验,但两种线型都比较贴近。最大3 d降雨量序列的拟合效果次之,仅站点56227与站点53798的100年一遇夏季最大3 d降雨量相差13.8%与28.8%。最大2 d降雨量有10个数据序列未一致通过两种检验,站点53798与站点57461的全年、夏季与冬季拟合曲线中,100年一遇降雨量值拟合差异范围为7%~17.9%。

3 结 论

应用5种概率分布函数对全国范围内10个站点进行降雨极值拟合,通过K-S、A-D检验做出适宜函数的筛选,分析比较了降雨极值的分布规律,对站点的适宜曲线做拟合优度检验并比较不同重现期的曲线间差异,得出以下初步结论:

1) 通过10个站点的降雨量最大值统计,得出年最大降雨量多发生于夏季。各站点降雨量极值的标准差(离散程度)说明降雨量存在季节性差异(分析了冬、夏季差异),尤其是夏季降雨量的波动比较。

2) 两种方法(K-S、A-D)检验后,拟合优度检验结果说明10个站点广义极值分布(GEV, Generalized Extreme Value)拟合效果最佳,其次为对数正态分布(LN, Lognormal),再次为皮尔逊III分布(Pearson-III)。

3) 此次计算分析得出皮尔逊III分布不是最优拟合曲线,分析结果进一步说明降雨极值拟合时应采用多种概率分布函数及检验方法,提高降雨极值计算结果的可靠性。

4) 以两种分布拟合且差异度较小的组合中,广义极值分布(GEV), 对数正态分布(LN), 皮尔逊III分布(Pearson-III)三者之间的组合占82%,这种线型相似度使得小概率降雨事件的计算结果更为可靠。

研究进一步证明,在进行水文气象极值统计分析时,应采取多种概率分布函数及检验方法进行计算,降低单一计算方法的不确定性,本研究随机10个站点的试验分析就说明皮尔逊III分布并非适宜所有站点。不同季节不同站点的适宜性曲线存在差异。由此建议防洪规划设计部门在防洪基础设施设计时应寻找最优极值分析特征方法计算极端极值。

The authors have declared that no competing interests exist.


参考文献

[1] IPCC.Climate change 2013:the physical science basis[M/OL].Cambridge:Cambridge University Press,in press.2013-09-30..

URL      [本文引用: 1]     

[2] 王庆,马倩倩,夏艳玲,.

最近50年来山东地区夏季降水的时空变化及其影响因素研究

[J].地理科学,2014,34(2):220~228.

URL      Magsci      [本文引用: 1]      摘要

<p>利用山东地区16 个气象站1961~2012 年逐月降水资料以及同期大气环流指数资料,采用Mann-Kendall 非参数检验法、累积距平法、有序聚类分析法以及Mann-Whitney-Pettitt(MWP)法等方法,对最近50 a 来山东地区夏季降水及其占全年降水比例的时空变化及影响因素进行了研究。结果表明,最近50 a 来,山东地区夏季降水呈现总体下降趋势,但有显著的阶段性。其中,沿海地区变化幅度小于内陆,其阶段转换和突变也早于内陆,内陆中山区又早于平原。沿海地区夏季降水占年降水比例呈现总体上升趋势,但无明显的阶段性和突变现象;而内陆地区呈现总体下降趋势,但存在阶段性和突变现象,其中山地与平原间又有差异。分析表明,山东地区夏季降水变化与同期东亚夏季风、南方涛动和北极涛动之间有显著的响应关系,但在沿海与内陆、山地与平原之间存在差异。</p>
[3] 张婷,魏凤英.

华南地区汛期极端降水的概率分布特征

[J].气象学报,2009,67(3):442~451.

https://doi.org/10.3321/j.issn:0577-6619.2009.03.011      URL      Magsci      [本文引用: 1]      摘要

利用1960—2005年华南地区71个测站的逐日降水量资料和NCEP/NCAR南半球月平均海平面气压场再分析资料,采用LePage检验、广义极值分布等统计诊断方法,研究了华南地区近46a前汛期(4—6月)和后汛期(7—9月)极端降水的时空变化及概率分布特征。并讨论了南半球澳大利亚高压和马斯克林高压强度指数与华南汛期暴雨日数间年代际变化的关系。结果表明:(1)1992年华南地区降水发生了由减少趋势到增多趋势的突变,降水趋势发生突变后前汛期极端降水量和日极端降水强度有所下降,而后汛期则是显著增强。(2)华南汛期年平均日最大降水量、50a一遇日最大降水量极值和暴雨日数的空间分布特征相似,即前汛期的空间分布自南向北呈现"低—高—低"的分布趋势,后汛期呈现由沿海到内陆的"高—低"的分布趋势。(3)1992年发生突变后,前、后汛期年平均日最大降水量和年平均暴雨日数显著增加和减少的空间分布基本一致。(4)就年代际变化而言,南半球澳大利亚高压和马斯克林高压的强度变化是华南汛期降水异常的重要气候背景,即当两高压处在同时增强时期时,华南前汛期极端降水处于偏少阶段,后汛期则处于偏多阶段。
[4] 张强,孙鹏,白云岗,.

塔河流域枯水流量概率特征及成因与影响研究

[J].地理科学,2013,33(4):465~472.

URL      Magsci      [本文引用: 1]      摘要

选用11种概率分布函数和单参数二维阿基米德族Copula函数,系统分析了塔里木河流域(简称塔河流域)8个水文站最小连续7日平均流量。研究结果表明:①韦克比函数最适合描述塔河流域枯水径流的概率特征;②1987年以后重现期较短的干旱发生频率降低,而重现期较长的干旱事件发生概率增加,主要是由于气候的季节变化及各河流流量的补给类型不同,从而对塔河枯水流量有一定影响;一般来讲,春季气温对枯水的影响要大于降水变化对枯水的影响;③叶尔羌河、阿克苏河等流域水文干旱联合重现期和同现期变化基本一致;开都河流域发生干旱概率要小于叶尔羌河和阿克苏两流域,而开都河流域同时发生干旱的概率大于叶尔羌河和阿克苏河,3个流域重现期短的干旱遭遇概率较大。研究表明,气候变化并没有从根本上改变新疆旱灾情况,同时,由于耕地面积、人口等的增长,水资源需求量增加,在水资源供需方面仍存在非常尖锐的矛盾。
[5] 王国庆,王兴泽,张建云,.

中国东北地区典型流域水文变化特性及其对气候变化的响应

[J].地理科学,2011,31(6):641~646.

URL      摘要

以辽河的主要水源区太子河流域为对象,分析近50 a来流域的降水径流变化特性,采用水文模拟方法,研究了河川径流量及土壤含水量对气候变化的响应。结果表明:近50 a来实测径流量总体呈现减少趋势;20世纪80年代以来,气候因素对河川径流量的绝对影响量呈现增加趋势;降水增加比减少对河川径流量的影响明显,土壤含 水量对降水减少的响应更加敏感,气候暖干化趋势将非常不利于东北地区的水资源利用和农业生产。
[6] 周玉良,袁潇晨,金菊良,.

基于Copula的区域水文干旱频率分析

[J].地理科学,2011,31(11):1383~1388.

URL      Magsci      [本文引用: 1]      摘要

以径流量为水文干旱指标,通过径流量距平百分率和径流量累积频率两种方法识别水文干旱特征变量,并以适线法确定单个干旱特征变量的分布曲线,在此基础上利用Archimedean Copula函数构建了干旱历时与干旱烈度间的联合分布,并计算干旱重现期。应用研究结果表明:用Copula函数,得以上两种识别法提取的干旱历时和干旱烈度的联合概率分布,其重现期计算结果与区域实际受旱状况相符,其中径流量距平百分率法相对更优、更直观;适线法避免了基于样本数据估计分布函数参数的不合理性,使基于Copula函数的频率分析结果更可靠。
[7] 李建,宇如聪,孙蟩.

从小时尺度考察中国中东部极端降水的持续性和季节特征

[J].气象学报,2013,71(4):652~659.

https://doi.org/10.11676/qxxb2013.052      URL      Magsci      [本文引用: 1]      摘要

相对于日降水量,小时尺度降水资料可以更准确地反映降水强度并描 述降水过程,因而更适用于极端降水阈值确定及其特性研究.利用广义极值分布估计中国321个站最大小时降水量的分布函数,确定了5 a重现期的小时降水强度阈值.阈值的空间分布呈现出明显的地域差异,西北地区阈值偏低,华北地区、长江中下游地区、华南沿海地区和四川盆地西部地区为高阈 值中心.取各站5 a一遇极端降水事件对其持续性特征和季节特征进行分析,发现在沿海地区、长江流域和青藏高原东坡极端降水事件的平均持续时间较长(超过12 h);中国北部地区持续时间较短.在具有较大海拔落差的复杂地形区,极端降水事件较平原地区更快地发展到峰值.华南地区4月就可有极端降水事件出现,而中 国北方地区要到6月底才出现极端降水;全中国大部分地区的年最晚极端降水在8-9月,但沿海地区、大陆南端和西南地区南部的少数站点在10月以后仍有极端 降水发生.
[8] Sevruk B,

Geigerh.Selection of distribution types for extremes of precipitation

[M].World Meteorological Organization,Operational Hydrology Report,1982:15.

[9] Viatcheslav V K,Francis W Z.

Estimating extremes in transient climate change simulations

[J].Journal of Climate,2005,18:1156-1172.

URL      [本文引用: 1]     

[10] 屠其璞,丁裕国.气象应用概率统计学[M].北京:气象出版社,1984:32.

[本文引用: 1]     

[11] Wiks D S.

Raifall intensity,the Weibull distribution and estimation of daily surface runoff

[J].Journal of ApplMeteor,1989,28(1):52-58.

https://doi.org/10.1175/1520-0450(1989)028<0052:RITWDA>2.0.CO;2      URL      [本文引用: 1]      摘要

ABSTRACT A new method for estimating absorption and runoff at a point on the basis of total daily precipitation and the absorption capacity of the soil is proposed. The method is based on a statistical characterization of the variation of precipitation rates over the course of a day. Short-duration precipitation rates are modeled as Weibull random variates. Distribution parameters are estimated using maximum likehood methods by regarding precipitation from `dry' intervals as censored data.
[12] 马开玉. 气候统计原理与方法[M].北京:气象出版社,1993:69~76.

[本文引用: 1]     

[13] 张耀存,张录军.

东北气候和生态过渡区近50年来降水和温度概率分布特征变化

[J].地理科学,2005,25(5):561~566.

https://doi.org/10.3969/j.issn.1000-0690.2005.05.008      URL      [本文引用: 1]      摘要

文章从中国160个站的观测资料中选取位于东北气候和生态过渡区内9个测站的冬、夏季降水和温度资料,分析该地区近50年来冬夏季降水和温度的年际变化及其概率分布特征,结果表明,东北气候和生态过渡区的冬夏季降水和温度有明显的年代际变化特征,在不同的年代际变化阶段,降水和温度的总体概率分布特征差异较大,这种概率分布形式的差异与高温、干旱等极端天气气候事件的频繁发生具有密切关系。20世纪80年代以来降水处于平均值减小的总体分布中,温度则处于平均值增加的总体分布中,因此该地区冬季发生暖冬和少雨(雪)的机会增大,夏季出现严重干旱和高温的可能性增大。
[14] 冯平,王仲珏.

基于二维Gumbel分布的降雨径流频率分析模型及其应用

[J].干旱区资源与环境,2007,21(10):68~72.

https://doi.org/10.3969/j.issn.1003-7578.2007.10.014      URL      [本文引用: 1]      摘要

本文探讨了二维Gumbel分布模型,给出了其经验频率和理论频率的计算方法,并建立了其联合重现期和条件重现期的分布模型。它可以给出不同程度暴雨和径流遭遇组合的频率,也可以在一定的降雨量条件下给出不同径流量的发生频率,或一定的径流量条件下给出不同降雨量的发生频率。这对于解决与风险有关的多因素影响下的水文计算问题是非常有用的。并以滹沱河流域岗南水库的入库年径流和年降雨量为例,分析了该模型的实用性,结果表明采用二维Gumbel分布模型来描述水文随机变量的联合分布是有效的。
[15] 蔡敏,丁裕国,江志红.

我国东部极端降水时空分布及其概率特征

[J].高原气象,2007,26(2):309~318.

https://doi.org/10.3321/j.issn:1000-0534.2007.02.013      URL      Magsci      [本文引用: 1]      摘要

利用我国105°E以东地区 210个测站近50年(1953—2002年)逐日降水资料,在REOF客观分区的基础上,确定各分区的极端降水最佳采样期为1~2日。进而研究了日极端 降水量的气候特征。采用具有优良特性的L-矩参数估计方法对我国东部极端降水拟合Gumbel分布。结果表明,L-矩参数估计方法的拟合优度比其它方法有 进一步提高,近50年来,极端降水趋势虽无明显变化,但其时空差异较大。符合Gumbel分布的极端降水重现期的地理空间分布,大致特征是,东南大、西北 小,两湖盆地、黄海海湾及辽东半岛也有高值区。
[16] Park J S,Jung H S,

Kim R S et al.Modelling summer extreme rainfall over the Korean Peninsula using Wakebydistribution

[J].International Journal of Climatology, 2002,21:1371-1384.

https://doi.org/10.1002/joc.701      URL      [本文引用: 1]      摘要

Abstract Top of page Abstract References Attempts to use the Wakeby distribution (WAD) with the method of L-moments estimates (L-ME), on the summer extreme rainfall data (time series of annual maximum of daily and 2-day precipitation) at 61 gauging stations over South Korea have been made to obtain reliable quantile estimates for several return periods. The 90% confidence intervals for the quantiles determined by WAD have been obtained by the bootstrap resampling technique. The isopluvial maps of estimated design values corresponding to selected return periods have been presented. Copyright 漏 2001 Royal Meteorological Society
[17] 苏布达,姜彤,董文杰.

长江流域极端强降水分布特征的统计拟合

[J].气象科学,2008,28(6):625~629.

https://doi.org/10.3969/j.issn.1009-0827.2008.06.006      URL      [本文引用: 1]      摘要

分布函数; 极端降水; 长江流域
[18] 黄振平,陈元芳.水文统计学[M].北京:中国水利水电出版社,2011:159.

[本文引用: 1]     

[19] Justel A,Peña D,Zamar R.

A multivariate Kolmogorov-Smirnov test of goodness of fit

[J].Statistics & Probability Letters,1997,35(3):251-259.

https://doi.org/10.1016/S0167-7152(97)00020-5      URL      [本文引用: 1]      摘要

This paper presents a distribution-free multivariate Kolmogorov-Smirnov goodness-of-fit test. The test uses a statistic which is built using Rosenblatt's transformation and an algorithm is developed to compute it in the bivariate case. An approximate test, that can be easily computed in any dimension, is also presented. The power of these multivariate tests is studied in a simulation study.
[20] Anderson K,Darling D A.

Asymptotic theory of certain “goodness-of-fit”criteria based on stochastic processes

[J]. Ann. Math. Stat.,1952,23:193-212.

[本文引用: 1]     

[21] Anderson T W,Darling D A.

A test of goodness-of-fit.J

[J].Am.Stat.Assoc.,1954,49:765-769.

https://doi.org/10.1080/01621459.1954.10501232      URL      [本文引用: 1]      摘要

Some (large sample) significance points are tabulated for a distribution-free test of goodness of fit which was introduced earlier by the authors. The test, which uses the actual observations without grouping, is sensitive to discrepancies at the tails of the distribution rather than near the median. An illustration is given, using a numerical example used previously by Birnbaum in illustrating the Kolmogorov test.

/