文章信息
- 王际朝, 王玥, 臧绍东, 杨俊钢, 纪艳菊, 阮宗利. 2021.
- WANG Ji-chao, WANG Yue, ZANG Shao-dong, YANG Jun-gang, JI Yan-ju, RUAN Zong-li. 2021.
- 集合变换卡尔曼滤波数据同化方法中的协方差局地化
- Covariance localization in the ensemble transform Kalman filter data assimilation method
- 海洋科学, 45(6): 34-43
- Marina Sciences, 45(6): 34-43.
- http://dx.doi.org/10.11759/hykx20200321001
-
文章历史
- 收稿日期:2020-03-21
- 修回日期:2020-06-11
2. 自然资源部第一海洋研究所, 山东 青岛 266061
2. First Institute of Oceanography, Ministry of Natural Resources, Qingdao 266061, China
数据同化是通过对观测数据与预测值进行分析, 寻找一个当前物理状态的最优估计值(分析值), 作为数值预测模型初始条件的方法。作为连接数值模式和观测数据的技术手段, 数据同化在海洋科学领域得到了广泛关注。当前, 集合数据同化方法得以快速发展, 已经成为业务化数值预测的一个可行选择。集合卡尔曼滤波(ensemble Kalman filter, EnKF)[1], 可以将卡尔曼滤波应用到强非线性模型, 扩展了卡尔曼滤波的适用性, 是数据同化领域的研究热点之一。EnKF中的预测误差协方差矩阵通过对预测集合成员进行统计计算得到, 预测误差对于集合数据同化方法而言至关重要。然而, 产生足够大的预测集合的计算成本令人望而却步。当使用的集合数目过小时, 则不能在统计意义上充分表示模型的变化, 从而会引起欠采样(under-sampling)。通常, 欠采样会导致滤波发散、预测误差协方差低估和虚假相关等负面问题。由于这些问题的影响, EnKF可能会产生一个次优的分析结果。
在进行数据同化时, 为了克服欠采样带来的负面影响, 有关学者已经提出了很多解决方法。当前基于集合的数据同化研究中, 最著名的解决方法是协方差膨胀(covariance inflation, CI)[2]、协方差局地化(covariance localization, CL)[3-4]和局地化分析(local analysis, LA)[5-6]。CI方法通过一个膨胀因子校正预测误差协方差的低估问题, 主要思想是通过膨胀集合均值和集合成员之间的误差来增大预测误差协方差。CI方法用于分析过程之前, 具体表示为:
当前, 越来越多的学者[9-11]关注的是CL方法和LA方法。相比于CL方法, LA方法是一种独立的方法, 它可以用于任何数据同化的框架, 但是它的实际同化效果并不如CL方法。Miyoshi等[12]指出LA方法的同化效果和CL方法类似, 但是LA方法通常会导致弱局地化影响。之后, Janjić等[9]通过对Lorenz96模型进行实验发现: 如果观测误差方差小于初始状态的预测误差方差, CL方法将会导致比较小的估计误差; 如果观测误差方差大于初始状态的预测误差方差, CL方法和LA方法有相同的局地化影响。因此, 从之前的研究和实验可以得出, CL方法可能是相对较好的一个局地化方法。由于CL方法中的舒尔积运算仅仅用于预测误差协方差矩阵, 而集合转换卡尔曼滤波(ensemble transform Kalman filter, ETKF)方法中的预测误差协方差矩阵并没有显式计算, 而是传递预测集合扰动矩阵, 这导致ETKF方法中进行舒尔积运算的矩阵维度不一致, 所以CL方法不能用于ETKF方法[13]。Janjić等[9]的文章给出了CL方法不适用于ETKF方法的具体讨论。
为了克服CL方法不能用于ETKF方法的限制, 在一元模型中, 通过对局地化函数的平方根矩阵和预测集合扰动矩阵进行舒尔积运算, Petrie[14]提出了一种用于ETKF方法的CL近似方法。对于矩阵维度不一致的问题, 通过在预测集合扰动矩阵中添加n-N列零向量(n表示状态变量个数, N表示集合个数), 对矩阵进行扩展来修正。然而, 韩培等[15]对此方法进行探究, 表明这种近似的CL方法是一种弱近似并产生了较差的同化效果。
基于集合样本相关性和矩阵因式分解, 近几年提出了动态计算局地化函数的方法, 使得CL方法可以应用到ETKF方法中。Bishop等[16]提出了一种生成局地化函数的新方法, 该函数能够随真实误差相关函数移动并且还适应真实误差相关函数的宽度。但是此方法的计算代价比较大, 鉴于此, Bishop等[17]提出了一种新的协方差自适应局地化方法(CALECO)的具体实施方案, 成功地将CL方法应用到ETKF方法, 但是此方法仍然具有较高的计算复杂度。基于上述的研究基础, Bishop等[18]在ETKF方法中提出了较为可行的CL方法的实施方案, 并命名为增益集合转换卡尔曼滤波(gain form of ensemble transform Kalman filter, GETKF)。GETKF中使用的是Gaspari等[19]提出的基于距离相关的一个局地裁剪函数作为局地化函数(GC局地化函数), 此方法解决了在一元数值预测模型中CL方法不能用于ETKF方法的问题。
当前, 由于CL方法的实现存在限制, 国内外对于CL方法在ETKF等平方根滤波中的研究较少。本文将基于GETKF方法进行研究, 提出一种局地化效果较好的局地化方法, 并通过数值模拟实验比较本文基于GETKF修改的方法与GETKF方法的同化效果。
1 理论背景与方法改进Campbell等[20]比较了EnKF方法中分别使用模型空间CL方法和观测空间CL方法的同化效果, 认为模型空间CL方法通常优于观测空间CL方法。因此, 本文以下的研究基于模型空间CL方法。本节首先介绍GETKF方法, 然后对该方法进行改进。
1.1 增益集合转换卡尔曼滤波在ETKF方法中, 应用CL方法的难点在于预测误差协方差矩阵并没有显式表示, 而是通过预测集合扰动矩阵隐式表达, 因而在预测集合扰动矩阵和局地化函数之间无法进行舒尔积运算, 当前主要的目的是在预测集合扰动矩阵和局地化函数的平方根矩阵中进行舒尔积运算来近似预测误差协方差矩阵和局地化函数之间的舒尔积运算。假定预测集合扰动矩阵表示为
$ \begin{array}{c} {{{\boldsymbol{X}}'}^{\boldsymbol{f}}} = \frac{1}{{\sqrt {N - 1} }}\left( {x_1^f - {{\bar x}^f}, x_2^f - {{\bar x}^f}, \cdots , x_N^f - {{\bar x}^f}} \right)\\ = \left( {{u_1}, {u_2}, \cdots , {u_N}} \right), \end{array} $ | (1) |
预测误差协方差矩阵为
局地化函数ρ的平方根矩阵表示为W, 即
$\rho = {\boldsymbol{W{W}}^{\rm{T}}} = \left( {{w_1}, {w_2}, \cdots , {w_L}} \right){\left( {{w_1}, {w_2}, \cdots , {w_L}} \right)^{\rm{T}}}$ | (2) |
其中, 平方根矩阵W通过对局地化函数ρ进行特征值分解得到, 并且按特征值大小降序排列, 取前10个特征值和特征向量对构成, 即
$ {\boldsymbol{W}}{\rm{ = }}{\rho _{{\rm{eigenvectors}}}}{\left( {{\rho _{{\rm{eigenvalue}}}}} \right)^{1/2}} $ | (3) |
一般情况, CL方法需要进行如下形式舒尔积运算,
${\boldsymbol{P_{{\rm{loc}}}^f = {P}}^f} \circ \rho .$ | (4) |
由于之前讨论的ETKF方法的局限性, GETKF方法中采用了集合扩展技术定义一个n× (N × L)维度的矩阵Zf,
${\boldsymbol{{Z^f} = W\Delta {X'^f}}} = \left[ {\left( {{w_1} \circ {u_1}, {w_1} \circ {u_2}, \cdots , {w_1} \circ {u_N}} \right), \cdots , \left( {{w_L} \circ {u_1}, {w_L} \circ {u_2}, \cdots , {w_L} \circ {u_N}} \right)} \right].$ | (5) |
定义矩阵Zf表示局地化后的预测误差协方差矩阵Plocf的平方根矩阵, 即
${\boldsymbol{P_{{\rm{loc}}}^f = {P^f}}} \circ \rho {\rm{ = }}{{\boldsymbol{Z^f}}}{\left( {{{\boldsymbol{Z^f}}}} \right)^{\rm{T}}}.$ | (6) |
Bishop等[18]已经证明式(6)是成立的。因此成功地在预测集合扰动矩阵X'f实现了CL方法。现在使用Zf代替X'f作为当前的预测集合扰动矩阵, 即局地化后的预测误差协方差矩阵Plocf的平方根矩阵, 重新构造集合扩展后的预测集合和预测误差协方差矩阵。
令M = N × L, 则扩展预测集合表示为Vf=v1f, v2f, …, vMf其中每个列向量vkf如下定义:
$ v_k^f = \frac{1}{N}\sum\limits_{j = 1}^N {x_j^f} + \sqrt M {z_k}, {\rm{ }}k = 1, 2, \cdots , M, $ | (7) |
其中,
$ {\boldsymbol{P_{{\rm{loc}}}^f}} = \frac{1}{M}\sum\limits_{i = 1}^M {\left( {v_i^f - {{\bar v}^f}} \right)} {\left( {v_i^f - {{\bar v}^f}} \right)^{\rm{T}}}. $ | (8) |
GETKF方法的分析过程与标准的ETKF方法的分析过程类似, 区别是GETKF方法使用扩展预测集合
定义标准化的预测-观测集合扰动矩阵
$ {\boldsymbol{{\hat Y^f}}} = {R^{ - \frac{1}{2}}}{Y'^f}, $ | (9) |
其中,
$ {\boldsymbol{{Y'^f} }}= {\boldsymbol{H{Z^f}}}{\rm{ = }}{\left( M \right)^{ - 1/2}}\left[ {{\boldsymbol{H}}\left( {v_1^f} \right) - {\boldsymbol{H}}\left( {{{\bar v}^f}} \right), {\boldsymbol{H}}\left( {v_2^f} \right) - {\boldsymbol{H}}\left( {{{\bar v}^f}} \right), \cdots , {\boldsymbol{H}}\left( {v_M^f} \right) - {\boldsymbol{H}}\left( {{{\bar v}^f}} \right)} \right], $ | (10) |
$ {\boldsymbol{H}}\left( {{{\bar v}^f}} \right) = \frac{1}{M}\sum\limits_{i = 1}^M {{\boldsymbol{H}}\left( {v_i^f} \right)} . $ | (11) |
矩阵H表示观测算子。为了提高ETKF方法同化的计算效率, 对标准化的预测-观测集合扰动矩阵
$ {\boldsymbol{{\hat Y^f}}} = {\boldsymbol{U\Sigma {V}}^{\rm{T}}}, $ | (12) |
其中, 矩阵U和V是正交矩阵,
$ {\boldsymbol{{Z^a}}} = {\boldsymbol{{Z^f}U{\left( {\Sigma {\Sigma ^{\rm{T}}} + I} \right)}}^{ - \frac{1}{2}}}{{\boldsymbol{U}}^{\rm{T}}}. $ | (13) |
分析集合均值
$ {\bar v^a} = {\bar v^f} + {\boldsymbol{{Z^f}U\Sigma {\left( {{\Sigma ^{\rm{T}}}\Sigma + I} \right)}}^{ - 1}}{{\boldsymbol{V}}^{\rm{T}}}{R^{ - \frac{1}{2}}}\left[ {y - {\boldsymbol{H}}\left( {{{\bar v}^f}} \right)} \right], $ | (14) |
$ {V^a} = {\bar v^a}1_{\boldsymbol{M^{\rm{T}}}} + \sqrt M {Z^a}. $ | (15) |
其中,
$ X^{a}=\bar{v}^{a} 1^{\mathrm{T}}+\alpha X_{\mathrm{raw}}^{a}, $ | (16) |
其中,
$ X_{\text {raw }}^{\prime a}=\sqrt{N-1} \boldsymbol{X}^{\prime f}-\boldsymbol{Z}^{f} \boldsymbol{U}\left[I-\left(S S^{\mathrm{T}}+I\right)^{-\frac{1}{2}}\right]\left(S S^{\mathrm{T}}\right)^{-1} \boldsymbol{U}^{\mathrm{T}}\left(\hat{\boldsymbol{Y}}^{f}\right)^{\mathrm{T}} R^{-\frac{1}{2}} \boldsymbol{H} \sqrt{N-1} \boldsymbol{X}^{\prime \boldsymbol{f}}, $ | (17) |
$ \alpha=\left\{\frac{\operatorname{trace}\left[\mathrm{Z}^{a}\left(\mathrm{Z}^{a}\right)^{\mathrm{T}}\right]}{\operatorname{trace}\left[X_{\mathrm{raw}}^{\prime a}\left(X_{\mathrm{raw}}^{\prime a}\right)^{\mathrm{T}} / \sqrt{N-1}\right]}\right\}^{1 / 2}. $ | (18) |
这样, 便得到了与原始预测集合大小一致的分析集合
以上展示了GETKF方法的主要计算过程, 可以看出此方法存在改进的空间: 首先, GETKF方法利用集合扩展技术在分析过程中产生M个集合(N < M), 然后使用集合扩展之后的分析误差协方差矩阵计算N个集合的方法较为复杂, 如何更加简便地将M个集合转换为N个集合进行预测过程是值得商榷的; 其次, GETKF方法中计算扩展后的集合误差协方差矩阵采用有偏形式, 本文对此做出了修改, 采用无偏形式的矩阵进行计算; 此外, GETKF方法中使用的GC局地化函数是一个基于距离相关的局地裁剪函数, 该函数是一元局地化函数, 所以扩展到多元模型存在限制; 最后, 由于GETKF方法将参数L固定为10, 所以在系统状态变量个数较大的情况下, 扩展后的预测集合扰动矩阵不能很好地表示误差变化。可以看出GETKF方法确实存在的不足之处, 对于GETKF方法的具体改进将在下一节进行说明。
1.2 增益集合转换卡尔曼滤波的改进基于GETKF方法, 本节从局地化函数平方根矩阵的选取、预测误差协方差的无偏估计、随机子采样方法和GC局地化函数的限制4个方面对原方法进行改进, 以提高同化方法的效果。
1.2.1 局地化函数平方根的选取对于公式(3)中局地化函数平方根矩阵列数L的选取, GETKF方法按照特征值降序排列, 取前十个特征值和对应的特征向量构成平方根矩阵W, 即固定地取L为10。很显然, 在应对状态变量个数n很大时, 前10个特征值和特征向量不能完全表示系统变量的误差变化, 所以本文重新定义了L的选取:
$ L{\rm{ = }}\left[ {{\rm{min}}\left( {10, {E_{10\% }}} \right), {\rm{max}}\left( {10, {E_{10\% }}} \right)} \right], $ | (19) |
其中,
通常, 我们假定卡尔曼滤波中的误差协方差矩阵是无偏的。在统计学上, 通过对集合成员与集合均值的偏差除以集合自由度(样本个数减一)来实现。但是GETKF方法中的公式(5)~(7)采用的是有偏形式的误差协方差矩阵, 这导致误差的产生, 造成对误差协方差的低估, 所以本文通过将公式(5)~(7)中的
由于扩展后的分析集合数量M大于原始预测集合数量N, 导致集合数量不能在预测模型中进行传递。GETKF方法中利用一个膨胀因子[式(12)]来克服此问题, 该方法需要计算扩展后的分析误差协方差矩阵以及原始预测误差协方差矩阵, 如果变量的个数n很大, 计算难度大大增加。本文使用随机子采样方法进行N列分析集合的选取, 计算简便。随机子采样方法如下:
$ X^{a}=\bar{v}^{a} 1_{N}^{\mathrm{T}}+\sqrt{N-1} Z^{a} \operatorname{randn}(\boldsymbol{M}, \boldsymbol{N}), $ | (20) |
其中,
GETKF方法中使用GC函数作为局地化函数, 但是GC函数仅仅是一个一元变量的局地化函数, 多元模型中不同变量之间的相关性应该是有区别的, GC函数并没有体现这一性质, 所以在多元模型中使用GETKF方法存在限制。本文选用一个基于距离的多元函数Askey函数[21]作为局地化函数, 当前此函数已经用于EnKF方法, 并且在多元模型中进行了实验验证, 得到了较好的同化效果。利用Askey函数将本文修改的方法扩展到多元模型变量中, 探究方法在多元情况下的适用性。
2 实验方案 2.1 模型 2.1.1 KS模型KS模型的表达式为,
$ \frac{{\partial u}}{{\partial t}} = - u\frac{{\partial u}}{{\partial x}} - \frac{{\partial {u^2}}}{{{\partial ^2}x}} - \frac{{{\partial ^4}u}}{{{\partial ^4}x}}. $ | (21) |
KS模型是一个一元无量纲的非线性偏微分方程模型, 方程中二阶项和四阶项会增加模型的复杂性并导致混沌行为。在本文中, KS模型的偏微分方程通过一个指数时间的四阶龙格库塔数值格式进行离散, 时间步为Δt = 0.25, 终止时间T为250。
2.1.2 浅水模型浅水模型作为一个多元模型, 在当前的数据同化研究中广泛使用。其忽略摩擦效应、科氏力以及非线性项的方程表示为:
$\frac{{\partial h}}{{\partial t}} = - \frac{{\partial u}}{{\partial x}} - \frac{{\partial v}}{{\partial y}}, $ | (22) |
$\frac{{\partial u}}{{\partial t}} = - \frac{{\partial \left( {{u^2}h + \frac{1}{2}g{h^2}} \right)}}{{\partial x}} - \frac{{\partial \left( {uvh} \right)}}{{\partial y}}, $ | (23) |
$\frac{{\partial v}}{{\partial t}} = - \frac{{\partial \left( {uvh} \right)}}{{\partial x}} - \frac{{\partial \left( {{v^2}h + \frac{1}{2}g{h^2}} \right)}}{{\partial y}}.$ | (24) |
其中, u和v分别表示水平和垂直速度, 水面高度由h表示, g为取值为9.8 m/s2的重力加速度。模型区域选择矩形区域
对于KS方程等一元模型, 我们可以使用GC函数作为CL方法中的局地化函数ρ, 其表达式如下:
$ \rho {\rm{ = }}\left\{ \begin{array}{l} 1 - \frac{5}{3}{\left( {\frac{{\left| z \right|}}{c}} \right)^2} + \frac{5}{8}{\left( {\frac{{\left| z \right|}}{c}} \right)^3} + \frac{1}{2}{\left( {\frac{{\left| z \right|}}{c}} \right)^4} - \frac{1}{4}{\left( {\frac{{\left| z \right|}}{c}} \right)^5}, 0 \le \left| z \right| \le c\\ 4 - \frac{2}{3}{\left( {\frac{{\left| z \right|}}{c}} \right)^{ - 1}} - 5\left( {\frac{{\left| z \right|}}{c}} \right) + \frac{5}{3}{\left( {\frac{{\left| z \right|}}{c}} \right)^2} + \frac{5}{8}{\left( {\frac{{\left| z \right|}}{c}} \right)^3} - \frac{1}{2}{\left( {\frac{{\left| z \right|}}{c}} \right)^4} + \frac{1}{{12}}{\left( {\frac{{\left| z \right|}}{c}} \right)^5}, c \le \left| z \right| \le 2c\\ 0, 2c \le \left| z \right| \end{array} \right.. $ | (25) |
式中, z表示网格点之间或网格点与观测点之间的距离。由于本文使用模型空间CL方法, 所以z表示物理空间中网格点之间的距离。局地化长度尺度c定义为
相反, 多元模型中使用Askey函数的一个多元扩展[21]作为局地化函数
${\rho _{i, j}}\left( {z;v, c} \right){\rm{ = }}\left\{ \begin{array}{l} {c^{v + 1}}B\left( {{u_{ij}} + 1, v + 1} \right){\left( {1 - \frac{{\left| z \right|}}{c}} \right)^{v + {u_{ij}} + 1}}, {\rm{ }}\left| z \right|{\rm{ < c}}{\rm{ }}i, j = 1, 2, \cdots , m\\ 0, {\rm{ }}\left| z \right| \ge c \end{array} \right., $ | (26) |
其中, m表示不同的状态变量的总数。例如本文使用的浅水方程中m取3, 则Askey函数表示为:
${\boldsymbol{\rho }} = \left( {\begin{array}{*{20}{c}} {{\rho _{11}}}&{{\rho _{12}}}&{{\rho _{13}}}\\ {{\rho _{21}}}&{{\rho _{22}}}&{{\rho _{23}}}\\ {{\rho _{31}}}&{{\rho _{32}}}&{{\rho _{33}}} \end{array}} \right)$ | (27) |
即ρ的每个元素
$ u_{i j}=\left(u_{i}+u_{j}\right) / 2, \quad u_{i}>0, \quad i=1, \cdots, m, $ | (28) |
Askey函数中的参数z和c与GC函数中定义相同, 分别表示网格点之间的距离和局地化长度尺度。B是一个Beta函数, s表示状态变量所在的欧式空间的维度, 而且要满足条件v≥(s + 1)/2。
2.3 实验设计本文中假定数值模型完美, 忽略模型误差。真实值轨迹
$y=\boldsymbol{H} x^{t}+v, \quad v \sim N(0, R)$ | (29) |
其中, 矩阵H是观测算子, 将真实状态变量映射到观测空间。假定观测误差之间不相关, 则矩阵R为对角观测误差协方差矩阵, 且对角元素取值为1。初始集合通过对真实值
KS模型具有一维周期性, 设定状态向量u的维度n为256, 初始真实值可以通过定义在周期域0≤x≤32π上的函数
对于多元浅水模型, 假定模型定义在矩形网格区域, 每个网格点定义3个变量: 水面高度h, 水平速度u和垂直速度v。假定水平速度u和垂直速度v的初始真实状态为零, 即u = v = 0, 水面高度h的初始真实状态由如下方式构造,
$h = \sqrt {{x^2} + {y^2}} , $ | (30) |
$h=\sin (h) / h,$ | (31) |
$h = \max \left( {h, 0} \right).$ | (32) |
类似于KS模型中的参数设置, 在浅水方程中, 集合数分别取N是5或N是10, 观测数p为300或p为240, 每5或10个时间步长存在可用的观测值。表 1中给出了上述具体实验参数的配置, 分别在两个模型中进行8组不同的实验, 其中对于KS方程全观测p为256, 部分观测p为235; 对于浅水模型全观测p为300, 部分观测p是240。
实验编号 | 集合数(N) | 观测数(p) | 同化间隔 |
1 | 5 | 全观测 | 5 |
2 | 5 | 部分观测 | 5 |
3 | 5 | 全观测 | 10 |
4 | 5 | 部分观测 | 10 |
5 | 10 | 全观测 | 5 |
6 | 10 | 部分观测 | 5 |
7 | 10 | 全观测 | 10 |
8 | 10 | 部分观测 | 10 |
首先, 分析GETKF方法和本文修改的方法(简称GCL方法)在一元KS模型中的实验结果。为了研究两种方法对预测误差协方差矩阵Pf的影响, 以实验1为例, 取前两个同化时刻(存在观测数据的时刻), 比较同化过程中两种方法对于预测误差协方差矩阵Pf的影响。在图 1至图 4的每一幅图中, 从左到右, 从上到下, 依次展示了GC局地化函数、预测误差协方差矩阵、局地化函数和预测误差协方差矩阵做舒尔积运算得到的矩阵、使用局地化函数平方根矩阵与预测集合扰动矩阵做舒尔积运算得到的预测误差协方差矩阵。
由于KS模型具有一维周期性, 所以GC局地化函数ρ是一个对称矩阵, 且仅在主对角线附近和矩阵边缘存在较强的相关性。很显然, 对于GETKF和GCL这两种方法, 图 1至图 4中的第4幅子图均显示了使用局地化函数之后协方差矩阵远距离的伪相关得到消除, 并且和第3幅子图相比效果类似, 说明两种方法对于虚假相关性的消除是有效果的。但是, 比较图 2和图 4, 可以看出第2个时刻两种方法的局地化效果是存在偏差的(图例中数值区间不同), 这可能是源于两种方法的具体实施不同。但是总体上两者对于处理伪相关的效果较好, 即截断距离以外的相关性被消除, 邻近状态变量和边界上的相关性得到了保留。
以实验3和实验7为例, 分别对GETKF方法和GCL两种方法的同化效果进行评估。如图 5和图 6中不同方法的曲线轨迹所示, 大体上可以看出相比于GETKF方法的同化效果, 本文修改的GCL方法更加接近于真实值的轨迹曲线, 并且减少了滤波发散的发生, 展示了良好的同化效果, 说明在一元数值预测模型下, GCL方法的局地化效果优于GETKF方法。
均方根误差(root mean square error, RMSE)可以量化不同局地化方法的效果, 直观表示不同方法的优劣程度。模型状态变量的整体均方根误差表示为,
$ {\rm{RMSE}} = \sum\limits_{j = 1}^n {\left( {\sqrt {\frac{1}{l}\sum\limits_{i = 1}^l {{{\left( {x_{ij}^a - x_{ij}^t} \right)}^2}} } } \right)} $ | (33) |
其中, l表示同化时间的长度,
编号 | RMSE(无CL) | RMSE(GETKF) | RMSE(GCL) | 秩(无CL) | 秩(GETKF) | 秩(GCL) |
1 | 424.35 | 308.53 | 93.21 | 4 | 40 | 100 |
2 | 422.03 | 366.54 | 112.53 | 4 | 40 | 60 |
3 | 411.02 | 366.13 | 116.78 | 4 | 40 | 100 |
4 | 409.91 | 350.85 | 133.00 | 4 | 40 | 100 |
5 | 406.93 | 363.58 | 116.37 | 9 | 90 | 184 |
6 | 387.79 | 35.59 | 126.93 | 9 | 90 | 176 |
7 | 412.54 | 336.49 | 148.92 | 9 | 90 | 182 |
8 | 387.97 | 320.72 | 157.46 | 9 | 90 | 189 |
表 3中展示了主流的数据同化方法(EnKF)的RMSE, 采用实验1中的观测数和同化间隔, 同时使用变化的集合数进行数值实验。EnKF方法在集合数N是5的情况下, RMSE的数值远远大于GCL方法(实验1), 随着集合数N增大到100, RMSE的数值在降低, 与GCL方法(实验1)的RMSE相当, 但是程序的运行时间也在不断增加。当集合数为N取200时, EnKF方法的RMSE数值低于GCL方法(实验1), 表现出了良好的数据同化效果, 但是程序运行时间是GCL方法使用集合数N为5时的数倍(实验1条件下, GCL方法运行时间为4.83 s)。EnKF通过使用大集合数, 牺牲程序计算时间来获取低RMSE, 并不是一种很好的处理方式, 并且在真实的数据同化方法应用中, 选取超过100个集合是不合适的。上述实验结果表明两种数据同化方法各有优劣, 但是可以看出在集合数较小的情况下, 选择GCL方法进行数据同化的效果较好。
集合数(N) | RMSE | 运行时间/s |
5 | 417.23 | 6.01 |
10 | 429.88 | 8.15 |
30 | 399.54 | 15.79 |
50 | 380.61 | 23.76 |
70 | 346.17 | 31.93 |
100 | 165.90 | 44.97 |
200 | 56.33 | 85.30 |
最后, 我们将本文提出的GCL方法中的GC函数替换为Askey函数, 扩展方法的适用范围, 在多元浅水模型中检验该方法。表 4展示了在不同实验条件下, GCL方法与未使用局地化方法的RMSE以及预测误差协方差矩阵的秩的对比。类似于一元数值模型中的实验结果, 使用GCL方法后的预测误差协方差矩阵的秩与未使用局地化方法相比, 有了明显的提升, 保证了误差矩阵传递的可靠性, 从而GCL方法的RMSE与未使用局地化方法相比也有了明显的降低, 说明利用Askey函数将GCL方法扩展到多元模型是成功的, 克服了GETKF方法只能用于一元模型的局限性。
编号 | RMSE(无CL) | RMSE(GCL) | 秩(无CL) | 秩(GCL) |
1 | 151.29 | 132.18 | 4 | 60 |
2 | 151.73 | 129.33 | 4 | 60 |
3 | 152.30 | 128.62 | 4 | 60 |
4 | 151.91 | 130.86 | 4 | 120 |
5 | 108.13 | 78.81 | 9 | 270 |
6 | 108.12 | 87.80 | 9 | 270 |
7 | 108.88 | 76.69 | 9 | 225 |
8 | 108.36 | 77.55 | 9 | 180 |
为解决基于集合的卡尔曼滤波中集合数目过少导致的欠采样问题, 以及CL方法对于ETKF等平方根卡尔曼滤波方法的不适用, 本文对GETKF方法进行了改进, 提出GCL方法, 并与GETKF方法在相同实验条件下进行了实验对比。结果表明, GCL方法改善了在一元模型情况中的同化效果, 明显提高了预测误差协方差矩阵的秩, 降低了分析值的均方根误差。此外, 利用一个Askey函数实现局地化方法在多元模型中的扩展, 使得提出的GCL方法可以用于多元模型中, 克服当前多元模型中局地化方法的欠缺。总体来说, 虽然GCL方法在处理欠采样问题以及对于多元模型局地化具有一定的效果, 但是GCL方法应用到多元模型时, 为设计多元变量之间的相互作用关系及相关性, Askey函数需要预先指定的参数较多。在下一步的研究中应找到合适的参数确定依据, 使得提出的新方法具有更广泛的适用性。
[1] |
EVENSEN G. Sequential data assimilation with a nonlinear quasi-geostrophic model using Monte Carlo methods to forecast error statistics[J]. Journal of Geophysical Research: Oceans, 1994, 99(C5): 10143-10162. DOI:10.1029/94JC00572 |
[2] |
ANDERSON J L, ANDERSON S L. A Monte Carlo implementation of the nonlinear filtering problem to produce ensemble assimilations and forecasts[J]. Monthly Weather Review, 1999, 127(12): 2741-2758. DOI:10.1175/1520-0493(1999)127<2741:AMCIOT>2.0.CO;2 |
[3] |
HOUTEKAMER P, MITCHELL H. A sequential ensemble Kalman filter for atmospheric data assimilation[J]. Monthly Weather Review, 2001, 129(1): 123-137. DOI:10.1175/1520-0493(2001)129<0123:ASEKFF>2.0.CO;2 |
[4] |
WHITAKER J, HAMILL T. Ensemble data assimilation without perturbed observations[J]. Monthly Weather Review, 2002, 130(7): 1913-1924. DOI:10.1175/1520-0493(2002)130<1913:EDAWPO>2.0.CO;2 |
[5] |
HUNT B R, KOSTELICH E J, SZUNYOGH I. Efficient data assimilation for spatiotemporal chaos: A local ensemble transform Kalman filter[J]. Physica D-Nonlinear Phenomena, 2007, 230(1-2): 112-126. DOI:10.1016/j.physd.2006.11.008 |
[6] |
OTT E, HUNT B, SZUNYOGH I, et al. A local ensemble Kalman filter for atmospheric data assimilation[J]. Tellus Series A-Dynamic Meteorology and Oceanography, 2004, 56(5): 415-428. DOI:10.3402/tellusa.v56i5.14462 |
[7] |
SCHUR J. Bemerkungen zur Theorie der beschränkten Bilinearformen mit unendlich vielen Veränderlichen[J]. Journal Für Die Reine Und Angewandte Mathematik, 1911, 1911(140): 1-28. DOI:10.1515/crll.1911.140.1 |
[8] |
OKE P R, SAKOV P, CORNEY S P. Impacts of localisation in the EnKF and EnOI: experiments with a small model[J]. Ocean Dynamics, 2007, 57(1): 32-45. DOI:10.1007/s10236-006-0088-8 |
[9] |
JANJIC T, NERGER L, ALBERTELLA A, et al. On domain localization in Ensemble-Based Kalman filter algorithms[J]. Monthly Weather Review, 2011, 139(7): 2046-2060. DOI:10.1175/2011MWR3552.1 |
[10] |
GREYBUSH S J, KALNAY E, MIYOSHI T, et al. Balance and ensemble kalman filter localization techniques[J]. Monthly Weather Review, 2011, 139(2): 511-522. DOI:10.1175/2010MWR3328.1 |
[11] |
SAKOV P, BERTINO L. Relation between two common localisation methods for the EnKF[J]. Computational Geosciences, 2011, 15(2): 225-237. DOI:10.1007/s10596-010-9202-6 |
[12] |
MIYOSHI T, YAMANE S. Local ensemble transform Kalman filtering with an AGCM at a T159/L48 resolution[J]. Monthly Weather Review, 2007, 135(11): 3841-3861. DOI:10.1175/2007MWR1873.1 |
[13] |
BISHOP C, ETHERTON B, MAJUMDAR S. Adaptive sampling with the ensemble transform Kalman filter.Part Ⅰ: Theoretical aspects[J]. Monthly Weather Review, 2001, 129(3): 420-436. DOI:10.1175/1520-0493(2001)129<0420:ASWTET>2.0.CO;2 |
[14] |
PETRIE R E. Localization in the ensemble Kalman filter[D]. Reading: University of Reading, 2008.
|
[15] |
韩培, 舒红, 许剑辉, 等. 局地化方法在集合转换卡尔曼滤波同化的适用性研究[J]. 地球信息科学学报, 2016, 18(9): 1184-1190. HAN Pei, SHU Hong, XU Jianhui, et al. An applicability study of covariance localization method in ETKF data assimilation[J]. Journal of Geo-information Science, 2016, 18(9): 1184-1190. |
[16] |
BISHOP C H, HODYSS D. Ensemble covariances adaptively localized with ECO-RAP. Part 1: tests on simple error models[J]. Tellus Series A: Dynamic Meteorology and Oceanography, 2009, 61(1): 84-96. DOI:10.1111/j.1600-0870.2008.00371.x |
[17] |
BISHOP C H, HODYSS D. Ensemble covariances adaptively localized with ECO-RAP. Part 2: a strategy for the atmosphere[J]. Tellus Series A: Dynamic Meteorology and Oceanography, 2009, 61(1): 97-111. DOI:10.1111/j.1600-0870.2008.00372.x |
[18] |
BISHOP C H, WHITAKER J S, LEI L. Gain form of the ensemble transform Kalman filter and its relevance to satellite data assimilation with model space ensemble covariance localization[J]. Monthly Weather Review, 2017, 145(11): 4575-4592. DOI:10.1175/MWR-D-17-0102.1 |
[19] |
GASPARI G, COHN S E. Construction of correlation functions in two and three dimensions[J]. Quarterly Journal of the Royal Meteorological Society, 1999, 125(554): 723-757. DOI:10.1002/qj.49712555417 |
[20] |
CAMPBELL W F, BISHOP C H, HODYSS D. Vertical covariance localization for satellite radiances in ensemble Kalman filters[J]. Monthly Weather Review, 2010, 138(1): 282-290. DOI:10.1175/2009MWR3017.1 |
[21] |
ROH S, JUN M, SZUNYOGH I, et al. Multivariate localization methods for ensemble Kalman filtering[J]. Nonlinear Processes in Geophysics, 2015, 22(6): 723-735. DOI:10.5194/npg-22-723-2015 |
[22] |
LORENC A. The potential of the ensemble Kalman filter for NWP-a comparison with 4D-Var[J]. Quarterly Journal of the Royal Meteorological Society, 2003, 129(595): 3183-3203. DOI:10.1256/qj.02.132 |