《水利水电技术(中英文)》官网网址https:sjwj。cbpt。cnki。net 摘要: 根据水文时间序列多尺度、非平稳特性,基于分解预测重构思想,提出小波包分解(WPD)爬行动物搜索算法(RSA)极限学习机(ELM)组合多步预测模型,并应用于云南省革雷站月径流、月降水预测。首先介绍RSA原理,选取6个标准函数在不同维度条件下对RSA进行仿真测试,并与哈里斯鹰优化(HHO)、旗鱼优化(SFO)等4种算法的仿真结果进行比较;其次利用WPD对实例水文时序数据进行3层小波包分解,以降低水文序列数据的复杂度;并在延迟时间为1的情况下,采用改进的虚假邻近点法(Cao方法)确定各子序列分量的输入维度;最后通过各分量训练样本构建ELM适应度函数,采用RSA对适应度函数进行寻优,利用寻优获得的最佳ELM输入层权值和隐含层偏值,建立WPDRSAELM模型,对各子序列分量进行超前一步至超前五步预测,将预测结果加和重构得到最终多步预测结果。结果表明:RSA具有较好的寻优精度和全局搜索能力,寻优精度优于HHO、GWO、SFO、PSO算法。WPDRSAELM模型对实例月径流、月降水超前一步至超前五步预测的平均绝对百分比误差分别在0。233。46和0。609。63之间,具有较高的预测精度。WPDRSAELM模型预测误差随着预测步数的增加而增大,超前预测步数越多,预测精度越低,预测效果越不理想。 关键词: 水文预测;小波包分解;爬行动物搜索算法;极限学习机;仿真测试;多步预测; 作者简介: 李新华(1971),男,高级工程师,硕士,主要从事水利水电工程建设、运营、管理等工作。 崔东文(1978),男,正高级工程师,学士,主要从事水资源管理保护及智能算法在水文水资源系统中的应用研究等工作。 基金: 国家自然科学基金项目澜沧江非一致性径流演变规律及驱动机制研究(91547205); 引用: 李新华,崔东文。基于WPDRSAELM模型的水文时间序列多步预测〔J〕。水利水电技术(中英文),2022,53(11):6977。 LIXinhua,CUIDongwen。MultisteppredictionofhydrologicaltimeseriesbasedonWPDRSAELMmodel〔J〕。WaterResourcesandHydropowerEngineering,2022,53(11):6977。0引言 水文时间序列预测是依据已有的历史监测数据,通过科学的方法推测将来的水文变化趋势,以期达到掌握水文现状及发展趋势的目的。由于受气候变化、人类活动、土地利用及植被覆盖等多重因素的影响,水文时间序列往往表现出多尺度、非平稳等特性,传统单一预测方法难以获得理想的预测效果。当前,基于分解预测重构思想的多种方法组合预测模型广泛用于水文时间序列预测,桑宇婷等利用互补集合经验模态分解(CEEMD)方法和BP神经网络建立组合预测模型,将其应用于汾河上游月径流预测;刘祖发等利用小波分解(WD)方法和秩次集对模型建立组合预测模型,将其应用于马口站年总径流量以及深圳市年总降雨量预测;王丽丽等融合奇异谱分析(SSA)方法、灰狼优化算法、回归支持向量机模型,提出SSAGWOSVR月径流组合预测模型;张以晨等建立奇异谱分解支持向量回归机耦合模型,将其应用于吉林省西部某气象站月降水量预测;吕晗芳等建立变分模态分解(VMD)最小二乘支持向量回归机(LSSVM)耦合模型,将其应用于上静游站等多个水文站月径流预测;徐冬梅等融合小波包分解(WPD)方法、LSSVM、ARIMA模型,提出WPDLSSVMARIMA降水量组合预测模型;李继清等将极点对称模态分解(ESMD)方法与Elman神经网络相结合,建立ESMDElman模型对长江干、支流8站的年、月径流进行预报;杨琼波等基于小波包分解(WPD)和奇异谱分解(SSA)方法,提出鼠群优化(RSO)算法回声状态网络(ESN)时间序列预测模型,并将其应用于云南省江边街水文站月径流预报,获得较好的预报效果。 然而,在实际应用中,单步预测往往无法满足水文预测预报实际需求,往往需要根据历史数据实现更多尺度的超前多步预测,实现未来更为长远的水文时间点预测,多步预测的重要性和实用性往往超过单步预测。鉴于此,为提高水文时间序列多步预测精度,本文基于分解预测重构思想,研究提出小波包分解(WaveletPacketDecomposition,WPD)爬行动物搜索算法(ReptileSsearchAlgorithm,RSA)极限学习机(ExtremeLearningMachine,ELM)水文多步组合预测方法。模型主要按照以下3个方面进行构建:(1)介绍一种新型元启发式优化算法爬行动物搜索算法(RSA),通过6个标准测试函数在不同维度条件下对RSA寻优能力进行仿真验证,并与旗鱼优化(SFO)算法等4种群体智能算法的仿真结果进行比较,旨在验证RSA寻优能力;(2)以云南省革雷站月径流、月降水超前一步至超前五步预测为例,采用3层WPD将水文时序数据分解为8个子序列分量,有效降低时间序列数据的复杂性,并在延迟时间为1条件下,采用Cao方法确定各子序列分量的输入维度;(3)采用各分解分量训练样本构建ELM适应度函数,利用RSA优化适应度函数获得的最佳ELM输入层权值和隐含层偏置,建立WPDRSAELM水文时间序列模型对各子序列分量进行多步预测,将预测结果叠加重构即得到水文最终多步预测结果。1研究方法 1。1爬行动物搜索算法(RSA) 1。1。1RSA数字描述 RSA是LAITHAbualigah等人于2021年提出一种新型元启发式优化算法〔9〕。该算法灵感来自于鳄鱼觅食过程中的包围和狩猎策略,即通过模拟鳄鱼高位步行、腹部爬行、狩猎协调、狩猎合作4种位置更新策略进行最优化问题求解,目前已在函数优化及工程设计中得到应用。与其他比较算法相比,RSA具有更好的优化性能。RSA数学描述简述如下。 (1)初始化。 设置鳄鱼种群规模N,初始化鳄鱼个体位置xi,j的计算公式为 式中,xi,j表示第i条鳄鱼第j维空间位置;N表示种群规模;n表示问题维度;UB、LB分别表示搜索空间上、下限值;rand表示介于0和1之间均匀分布的随机数。 (2)包围机制(探索阶段)。 RSA通过将迭代次总数T分成四部分来实现鳄鱼包围(探索)和狩猎(开发)机制间的转换。包围机制主要执行高位步行、腹部爬行策略,以探索更广阔的搜索区域和寻找更优解。包围机制位置更新算子具体为 式中,xi,j(t1)表示第t1次迭代第i条鳄鱼第j个位置;Bestj(t)表示迄今为止获得的最佳解的第j个位置;t表示当前迭代次数,T表示最大迭代次数;i,j表示第i条鳄鱼第j个位置的狩猎算子,描述为i,jBestj(t)Pi,j,其中,Pi,jxi,j1nj1nxi,jBestj(t)(UBjLBj),UBji,jxi,j1nj1nxi,jBestj(t)(UBjLBj),UBj、LBj分别表示第j个位置的上下边界;表示控制狩猎机制探索精度的敏感参数,取0。1,表示极小常数;表示控制包围机制探索精度的敏感参数,取0。1;Ri,j(Bestj(t)xr2,j)(Bestj(t)),用于缩少搜索区域,r2表示〔1,N〕之间的随机数;r1表示第i条鳄鱼的随机位置;ES(t)表示概率比,描述为ES(t)2r3(11T),r3表示1和1之间的随机整数;其他参数意义同上。 (3)狩猎机制(开发阶段)。 鳄鱼在狩猎过程中主要通过狩猎协调和狩猎合作策略进行开发搜索。与包围机制不同,鳄鱼狩猎机制使它们能够轻松接近目标猎物,即算法最优解。狩猎机制位置更新算子描述如下 式中参数意义同上。 1。1。2RSA仿真验证 选取Sphere等6个标准测试函数在不同维度条件下对RSA进行仿真验证,并与哈里斯鹰优化(HHO)算法、旗鱼优化(SFO)算法、灰狼优化(GWO)算法、粒子群优化(PSO)算法的仿真结果进行比较,20次寻优平均值如表1所列。为在相同条件下验证RSA寻优能力,本文设置5种算法种群规模N50,最大迭代次数T100。其他参数设置采用各算法默认值。 对于上述6个单峰函数和多峰函数,RSA在不同维度条件寻优均获得理论最优值,寻优效果优于HHO、GWO、SFO、PSO算法,具有理想的寻优精度和全局搜索能力,且寻优效精度基本不受维影响。 1。2小波包分解(WPD) 小波包分解(WPD)衍生于小波分解(WD),与之不同的是,WD只对低频信号再次分解,不分解高频信号,而WPD同时将低频、高频信号再次分解,并能根据信号特性和分析要求自适应地选择相应频带与信号频谱相匹配。对于波动信号,采用WPD能够凸出信号的细节特征。小波包分解算法公式为 式中,dlj,2n、dlj,2n1为小波包系数;j为尺度参数,j{i,i1,,1};l、k为平移参数;n为频率参数,n{2j1,2j2,,0};hk2l、gk2l分别为小波包分解中的低通、高通滤波器组。 重构算法为 式中,dlj,n为小波包重构后小波包系数;hl2k、gl2k分别为小波包重构的低通、高通滤波器组。 1。3改进的虚假邻近点法(Cao方法) Cao方法是虚假邻近点法(FalseNearestNeighbors,FNN)的改进算法,其优点在于:计算时只需要延迟时间一个参数,能够有效区分随机系统和确定性系统,使用较少的数据就可以求得嵌入维数用。Cao方法主要通过公式(6)计算相空间中的点在不同嵌入维数下的最邻近点的距离变化(i,m);再利用式(7)计算(i,m)的均值E(m),并通过式(8)计算E1(m)的变化情况;最后通过绘制E1(m)m曲线,当E1(m)的变化逐渐达到稳定时,由稳定处的m即为所求 式中,(i,m)为不同嵌入维数下的最邻近点的距离;(m1)、m分别为m1、m空间的范数;Yn为距离Y最近的向量。 式中,E(m)为(i,m)的均值;E1(m)为E(m)的变化情况;为延迟时间,本文取1。 1。4极限学习机(ELM) 极限学习机(ELM)是一种广义的单隐层前馈神经网络,具有较快的学习速度和良好的泛化能力。给定M个样本Xk{xk,yk},k1,2,,M,其中xk为输入数据,yk为真实值,f()为激活函数,隐层节点为m个,ELM输出可表示为 式中,oj为输出值;Wi{i1,i2,,im}为输入层节点与第i个隐含层节点的连接权值;bi为第i个输入节点和隐含层节点的偏值;i为第i个隐含层节点与输出节点的连接权值。 1。5建模流程 WPDRSAELM模型多步预测步骤如下。 步骤一:利用WPD对实例革雷站1971年1月2005年12月共420个月的月径流和月降水时序数据进行3层小波包分解,得到8个子序列分量〔3,1〕〔3,8〕,如图1、图2所示。 图1革雷站月径流WPD分解3D效果 图2革雷站月降水WPD分解3D效果 从图1、图2可以看出,〔3,1〕主要为低频部分,聚集了原始径流或降水时间序列的大部分能量,描述了径流或降水序列的趋势;〔3,8〕为所有分解分量中的最高频成分,也是幅值最低的分量,描述了径流或降水序列的波动情况。 步骤二:本文采用递归策略进行水文多步预测,即利用长度为M的历史数据点作为预测模型输入,模型输出为单输出,进行超前一步预测;然后将预测结果作为历史数据,输入模型得到超前两步预测结果;以此类推得到超前五步预测结果。递归策略预测过程如图3所示。 图3递归策略预测过程 步骤三:为便于各分量预测结果重构,在延迟时间为1的条件下,采用Cao方法确定各子序列分量的嵌入维度l,即模型输入向量维度。经计算,实例月径流各子序列分量〔3,0〕〔3,7〕的l值分别为9、26、20、20、9、15、12、14;月降水量各子序列分量〔3,0〕〔3,7〕的l值分别为11、8、13、16、13、19、14、13。选取1300组样本为训练样本,301420组样本为预测样本。 步骤四:利用训练样本均方误差(MSE)作为RSA优化ELM输入层权值和隐含层偏值的适应度函数 式中,QQi表示第tt1个月径流月降水实测值;Qi表示第xbest个月径流月降水预测值;l表示训练样本数;w表示ELM输入层权值;b表示隐含层偏值。 步骤五:设置鳄鱼种群规模N、最大迭代次数T。利用式(1)随机初始化鳄鱼个体位置xi,j,i1,2,,N。令当前迭代次数t1。 步骤六:基于式(7)计算鳄鱼种适应度值;保存当前最优鳄鱼个体位置xBest。 步骤七:利用式(2)执行包围机制。若tT4,执行高位步行策略更新鳄鱼个体位置;若14Tt12T14t12,执行腹部爬行策略更新鳄鱼个体位置。 步骤八:利用式(3)执行狩猎机制。若12t34,执行狩猎协调策略更新鳄鱼个体位置;若34t,执行狩猎合作策略更新鳄鱼个体位置。 步骤九:利用更新后的鳄鱼位置计算适应度值。比较并保存当前最优鳄鱼个体位置xBest。 步骤十:令tt1。判断是否满足终止条件,若是,输出xBest,算法结束;否则转至步骤七。 步骤十一:输出minf和最优鳄鱼个体位置xBest,xBest即为ELM输入层权值和隐含层偏值矩阵。利用最优ELM输入层权值和隐含层偏值矩阵,建立WPDRSAELM模型对各分量进行超前一步至超前五步预测,将预测结果叠加重构得到最终多步预测结果。 步骤十二:选取平均绝对百分比误差(MAPE)、平均绝对误差(MAE)、均方根误差(RMSE)、纳什系数(NSE)和合格率(PR)对各模型进行评估,即 式中,Qu表示第u个月径流月降水实测值;Qu表示第u个月径流月降水预测值;Qu表示实测月径流月降水平均值;R表示预测样本数量;m表示绝对百分比误差20的样本数量。2实例应用 革雷站位于丘北县平寨乡革雷村,建于1970年4月,于2006年1月撤销,系珠江流域西江水系清水江干流控制站,控制径流面积3186km2,为国家基本水文站。清水江发源于砚山县者腊乡老毛山北麓,于广南县者兔乡出境进入罗平县汇入南盘江。清水江河长193。1km,流域面积5628km2,河道平均坡降4。9。主要支流有南丘河、清水河、石葵河。革雷站1971年1月2005年12月实测月径流和月降水序列数据如图4所示。从图4可以看出革雷站月径流和月降水数据为非平稳序列,波动较大。 图4革雷站19712005年月径流月降水变化曲线 2。1参数设置 RSA参数设置同上述RSA仿真验证;ELM网络激活函数选择sigmoid,隐层节点数为2input1(input为输入维数),输入层权值和隐含层偏值搜索空间设置为〔1,1〕,数据采用〔1,1〕进行归一化处理。 2。2预测结果及分析 利用所构建的WPDRSAELM模型对实例月径流和月降水进行训练及多步预测,结果如表2所列。并利用上述平均绝对百分比误差(MAPE)、平均绝对误差(MAE)、均方根误差(RMSE)、纳什系数(NSE)和合格率(PR)对模型性能进行评估。预测相对误差效果图如图5、图6所示,预测值与实测值对比效果图如图7、图8所示。 图5革雷站月径流时间序列预测效果对比 图6革雷站月降水时间序列预测效果对比 图7革雷站月径流时间序列预测相对误差3D 图8革雷站月降水时间序列预测相对误差3D 依据表2及图5图8可以得出以下结论: (1)WPDRSAELM模型对实例月径流超前一步至超前五步预测的MAPE、MAE、RMSE分别在0。173。46、0。0450。737m3s1、0。0580。941m3s1之间,PR均为100,除超前四步预测外,NSE均在0。9994以上,具有较高的预测精度和较小的预测误差,尤其是前一步至超前三步预测的MAPE均在1以内,表现出理想的预测效果。WPDRSAELM模型用月径流多步预测是可行的,模型预测误差总体上随着预测步数的增加而增大。 (2)WPDRSAELM模型对实例月降水超前一步至超前五步预测的MAPE、MAE、RMSE分别在0。609。63、0。0561。442mm、0。0721。864mm之间,NSE、PR分别在0。9994、89。2以上,具有较高的预测精度和较小的预测误差。WPDRSAELM模型用月降水多步预测是可行和可靠的,模型预测精度随着预测步数的增加而降低。 (3)从图5、图6可以看出,WPDRSAELM模型对月径流、月降水时间序列超前一步至超前五步的预测值与实测值几乎完全重合,尤其是径流与降水的峰值预测效果更佳;从图7、图8来看,在超前一步至超前三步预测中,99。2的径流样本和85。0的降水样本预测的相对误差在55区间波动,具有更高的预测精度。其中,月径流预测效果要优于月降水预测。3结论 为提高水文时间序列多步预测精度,基于多种方法研究提出WPDRSAELM水文时间序列多步预测模型,通过云南省革雷站月径流和月降水多步预测实例对模型进行验证,得到如下结论: (1)在不同维条件下,RSA对Sphere等6个标准函数的寻优效果优于HHO、GWO、SFO、PSO算法,具有较好的寻优效果。将RSA用于ELM输入层权值和隐含层偏值优化是可靠的。 (2)利用WPD将原始水文序列分解为不同的子序列后再进行预测,可以减小不同特征值序列数据之间的相互影响,将复杂的水文序列分解为多个平稳、集中的子序列,使得WPDRSAELM能够更好地预测每一个子序列,进而得到精准的预测结果。 (3)WPDRSAELM模型对实例月径流、月降水时间序列超前一步至超前五步均具有较好的预测效果,尤其是超前一步至超前三步的预测误差更小、效果更好。WPDRSAELM模型用月径流、月降水多步预测是可行的。WPDRSAELM模型预测误差总体上随着预测步数的增加而增大,超前预测步数越多,预测精度受到的影响越大,预测结果越会偏离实际值,预测效果越不理想。 水利水电技术(中英文) 水利部《水利水电技术(中英文)》杂志是中国水利水电行业的综合性技术期刊(月刊),为全国中文核心期刊,面向国内外公开发行。本刊以介绍我国水资源的开发、利用、治理、配置、节约和保护,以及水利水电工程的勘测、设计、施工、运行管理和科学研究等方面的技术经验为主,同时也报道国外的先进技术。期刊主要栏目有:水文水资源、水工建筑、工程施工、工程基础、水力学、机电技术、泥沙研究、水环境与水生态、运行管理、试验研究、工程地质、金属结构、水利经济、水利规划、防汛抗旱、建设管理、新能源、城市水利、农村水利、水土保持、水库移民、水利现代化、国际水利等。