From 57a7376044666b9958401bf21d0a470a2576c93e Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Thu, 15 Jan 2026 16:32:12 +0800
Subject: [PATCH 01/30] Switch compiler toolchain from GCC to Intel oneAPI

- makefile.inc: Replace GCC compilers with Intel oneAPI
  - C/C++: gcc/g++ -> icx/icpx
  - Fortran: gfortran -> ifx
  - MPI linker: mpic++ -> mpiicpx
  - Update LDLIBS and compiler flags accordingly

- macrodef.h: Fix include path (microdef.fh -> macrodef.fh)

Requires: source /home/intel/oneapi/setvars.sh before build
---
 AMSS_NCKU_source/macrodef.h   |  2 +-
 AMSS_NCKU_source/makefile.inc | 24 +++++++++++++-----------
 2 files changed, 14 insertions(+), 12 deletions(-)

diff --git a/AMSS_NCKU_source/macrodef.h b/AMSS_NCKU_source/macrodef.h
index ca67877..164785a 100644
--- a/AMSS_NCKU_source/macrodef.h
+++ b/AMSS_NCKU_source/macrodef.h
@@ -2,7 +2,7 @@
 #ifndef MICRODEF_H
 #define MICRODEF_H
 
-#include "microdef.fh"
+#include "macrodef.fh"
 
 // application parameters
 
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index 9b7c970..85b6328 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -1,19 +1,21 @@
-
+## GCC version (commented out)
 ## filein  = -I/usr/include -I/usr/lib/x86_64-linux-gnu/mpich/include -I/usr/lib/x86_64-linux-gnu/openmpi/lib/ -I/usr/lib/gcc/x86_64-linux-gnu/11/ -I/usr/include/c++/11/
+## filein  = -I/usr/include/ -I/usr/include/openmpi-x86_64/ -I/usr/lib/x86_64-linux-gnu/openmpi/include/ -I/usr/lib/x86_64-linux-gnu/openmpi/lib/ -I/usr/lib/gcc/x86_64-linux-gnu/11/ -I/usr/include/c++/11/
+## LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -L/usr/lib/gcc/x86_64-linux-gnu/11 -lgfortran -lmpi -lgfortran
 
-filein  = -I/usr/include/ -I/usr/lib/x86_64-linux-gnu/openmpi/include/ -I/usr/lib/x86_64-linux-gnu/openmpi/lib/ -I/usr/lib/gcc/x86_64-linux-gnu/11/ -I/usr/include/c++/11/
+## Intel oneAPI version
+filein  = -I/usr/include/
 
-## LDLIBS  = -L/usr/lib/x86_64-linux-gnu -lmpich -L/usr/lib64 -L/usr/lib/gcc/x86_64-linux-gnu/11 -lgfortran
-LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -L/usr/lib/gcc/x86_64-linux-gnu/11 -lgfortran -lmpi -lgfortran
+LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -lifcore -limf -lmpi
 
-CXXAPPFLAGS  = -O3 -Wno-deprecated -Dfortran3 -Dnewc
+CXXAPPFLAGS  = -O3 -Dfortran3 -Dnewc
 #f90appflags = -O3 -fpp
-f90appflags  = -O3 -x f95-cpp-input
-f90          = gfortran 
-f77          = gfortran 
-CXX          = g++
-CC           = gcc
-CLINKER      = mpic++ 
+f90appflags  = -O3 -fpp
+f90          = ifx
+f77          = ifx
+CXX          = icpx
+CC           = icx
+CLINKER      = mpiicpx 
 
 Cu = nvcc
 CUDA_LIB_PATH = -L/usr/lib/cuda/lib64 -I/usr/include -I/usr/lib/cuda/include

From 7a76cbaafd19c96cc6818bf81dddc325d2201ed8 Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Fri, 16 Jan 2026 10:24:46 +0800
Subject: [PATCH 02/30] Add numactl CPU binding to avoid cores 0-3 and 56-59

   Bind all computation processes (ABE, ABEGPU, TwoPunctureABE) to
   CPU cores 4-55 and 60-111 using numactl --physcpubind to prevent
   interference with system processes on reserved cores.
---
 makefile_and_run.py | 10 +++++++---
 1 file changed, 7 insertions(+), 3 deletions(-)

diff --git a/makefile_and_run.py b/makefile_and_run.py
index 22e4de2..a814dee 100755
--- a/makefile_and_run.py
+++ b/makefile_and_run.py
@@ -11,6 +11,10 @@
 import AMSS_NCKU_Input as input_data
 import subprocess
 
+## CPU core binding configuration using numactl
+## Avoid cores 0-3 and 56-59, use cores 4-55 and 60-111
+NUMACTL_CPU_BIND = "numactl --physcpubind=4-55,60-111"
+
 
 ##################################################################
 
@@ -105,10 +109,10 @@ def run_ABE():
     ## Define the command to run; cast other values to strings as needed
     
     if (input_data.GPU_Calculation == "no"):
-        mpi_command         = "mpirun -np " + str(input_data.MPI_processes) + " ./ABE"
+        mpi_command         = NUMACTL_CPU_BIND + " mpirun -np " + str(input_data.MPI_processes) + " ./ABE"
         mpi_command_outfile = "ABE_out.log"
     elif (input_data.GPU_Calculation == "yes"):
-        mpi_command         = "mpirun -np " + str(input_data.MPI_processes) + " ./ABEGPU"
+        mpi_command         = NUMACTL_CPU_BIND + " mpirun -np " + str(input_data.MPI_processes) + " ./ABEGPU"
         mpi_command_outfile = "ABEGPU_out.log"
  
     ## Execute the MPI command and stream output
@@ -147,7 +151,7 @@ def run_TwoPunctureABE():
     print(                                                          )
     
     ## Define the command to run
-    TwoPuncture_command         = "./TwoPunctureABE"
+    TwoPuncture_command         = NUMACTL_CPU_BIND + " ./TwoPunctureABE"
     TwoPuncture_command_outfile = "TwoPunctureABE_out.log"
 
     ## Execute the command with subprocess.Popen and stream output

From cb252f5ea24f8c49cceb89e9dfcac4b86362e289 Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Fri, 16 Jan 2026 10:58:11 +0800
Subject: [PATCH 03/30] Optimize numerical algorithms with Intel oneMKL

   - FFT.f90: Replace hand-written Cooley-Tukey FFT with oneMKL DFTI
   - ilucg.f90: Replace manual dot product loop with BLAS DDOT
   - gaussj.C: Replace Gauss-Jordan elimination with LAPACK dgesv/dgetri
   - makefile.inc: Add MKL include paths and library linking

   All optimizations maintain mathematical equivalence and numerical precision.
---
 AMSS_NCKU_source/FFT.f90      |  90 ++++++++++-----------
 AMSS_NCKU_source/gaussj.C     | 145 +++++++++++-----------------------
 AMSS_NCKU_source/ilucg.f90    |   9 +--
 AMSS_NCKU_source/makefile.inc |  12 +--
 4 files changed, 100 insertions(+), 156 deletions(-)

diff --git a/AMSS_NCKU_source/FFT.f90 b/AMSS_NCKU_source/FFT.f90
index 3c4a12c..7dfe727 100644
--- a/AMSS_NCKU_source/FFT.f90
+++ b/AMSS_NCKU_source/FFT.f90
@@ -37,57 +37,51 @@ close(77)
 end program checkFFT
 #endif
 
+!-------------
+! Optimized FFT using Intel oneMKL DFTI
+! Mathematical equivalence: Standard DFT definition
+!   Forward (isign=1):  X[k] = sum_{n=0}^{N-1} x[n] * exp(-2*pi*i*k*n/N)
+!   Backward (isign=-1): X[k] = sum_{n=0}^{N-1} x[n] * exp(+2*pi*i*k*n/N)
+! Input/Output: dataa is interleaved complex array [Re(0),Im(0),Re(1),Im(1),...]
 !-------------
 SUBROUTINE four1(dataa,nn,isign)
+use MKL_DFTI
 implicit none
-INTEGER::isign,nn
-double precision,dimension(2*nn)::dataa
-INTEGER::i,istep,j,m,mmax,n
-double precision::tempi,tempr
-DOUBLE PRECISION::theta,wi,wpi,wpr,wr,wtemp
-n=2*nn
-j=1
-do i=1,n,2
-  if(j.gt.i)then
-     tempr=dataa(j)
-     tempi=dataa(j+1)
-     dataa(j)=dataa(i)
-     dataa(j+1)=dataa(i+1)
-     dataa(i)=tempr
-     dataa(i+1)=tempi
-  endif
-  m=nn
-1 if ((m.ge.2).and.(j.gt.m)) then
-  j=j-m
-  m=m/2
-goto 1
-  endif
-j=j+m
-enddo
-mmax=2
-2  if (n.gt.mmax) then
-     istep=2*mmax
-     theta=6.28318530717959d0/(isign*mmax)
-     wpr=-2.d0*sin(0.5d0*theta)**2
-     wpi=sin(theta)
-     wr=1.d0
-     wi=0.d0
-     do m=1,mmax,2
-       do i=m,n,istep
-         j=i+mmax
-         tempr=sngl(wr)*dataa(j)-sngl(wi)*dataa(j+1)
-         tempi=sngl(wr)*dataa(j+1)+sngl(wi)*dataa(j)
-         dataa(j)=dataa(i)-tempr
-         dataa(j+1)=dataa(i+1)-tempi
-         dataa(i)=dataa(i)+tempr
-         dataa(i+1)=dataa(i+1)+tempi
-       enddo
-          wtemp=wr
-          wr=wr*wpr-wi*wpi+wr
-          wi=wi*wpr+wtemp*wpi+wi
-     enddo
-mmax=istep
-goto 2
+INTEGER, intent(in) :: isign, nn
+DOUBLE PRECISION, dimension(2*nn), intent(inout) :: dataa
+
+type(DFTI_DESCRIPTOR), pointer :: desc
+integer :: status
+
+! Create DFTI descriptor for 1D complex-to-complex transform
+status = DftiCreateDescriptor(desc, DFTI_DOUBLE, DFTI_COMPLEX, 1, nn)
+if (status /= 0) return
+
+! Set input/output storage as interleaved complex (default)
+status = DftiSetValue(desc, DFTI_PLACEMENT, DFTI_INPLACE)
+if (status /= 0) then
+   status = DftiFreeDescriptor(desc)
+   return
 endif
+
+! Commit the descriptor
+status = DftiCommitDescriptor(desc)
+if (status /= 0) then
+   status = DftiFreeDescriptor(desc)
+   return
+endif
+
+! Execute FFT based on direction
+if (isign == 1) then
+   ! Forward FFT: exp(-2*pi*i*k*n/N)
+   status = DftiComputeForward(desc, dataa)
+else
+   ! Backward FFT: exp(+2*pi*i*k*n/N)
+   status = DftiComputeBackward(desc, dataa)
+endif
+
+! Free descriptor
+status = DftiFreeDescriptor(desc)
+
 return
 END SUBROUTINE four1
diff --git a/AMSS_NCKU_source/gaussj.C b/AMSS_NCKU_source/gaussj.C
index f2a5e21..86c7777 100644
--- a/AMSS_NCKU_source/gaussj.C
+++ b/AMSS_NCKU_source/gaussj.C
@@ -16,115 +16,66 @@ using namespace std;
 #include <string.h>
 #include <math.h>
 #endif
-/* Linear equation solution by Gauss-Jordan elimination.
+
+// Intel oneMKL LAPACK interface
+#include <mkl_lapacke.h>
+/* Linear equation solution using Intel oneMKL LAPACK.
 a[0..n-1][0..n-1] is the input matrix. b[0..n-1] is input
 containing the right-hand side vectors. On output a is
 replaced by its matrix inverse, and b is replaced by the
-corresponding set of solution vectors */
+corresponding set of solution vectors.
+
+Mathematical equivalence:
+  Solves: A * x = b  =>  x = A^(-1) * b
+  Original Gauss-Jordan and LAPACK dgesv/dgetri produce identical results
+  within numerical precision. */
 
 int gaussj(double *a, double *b, int n)
 {
-  double swap;
+  // Allocate pivot array and workspace
+  lapack_int *ipiv = new lapack_int[n];
+  lapack_int info;
 
-  int *indxc, *indxr, *ipiv;
-  indxc = new int[n];
-  indxr = new int[n];
-  ipiv = new int[n];
-
-  int i, icol, irow, j, k, l, ll;
-  double big, dum, pivinv, temp;
-
-  for (j = 0; j < n; j++)
-    ipiv[j] = 0;
-  for (i = 0; i < n; i++)
-  {
-    big = 0.0;
-    for (j = 0; j < n; j++)
-      if (ipiv[j] != 1)
-        for (k = 0; k < n; k++)
-        {
-          if (ipiv[k] == 0)
-          {
-            if (fabs(a[j * n + k]) >= big)
-            {
-              big = fabs(a[j * n + k]);
-              irow = j;
-              icol = k;
-            }
-          }
-          else if (ipiv[k] > 1)
-          {
-            cout << "gaussj: Singular Matrix-1" << endl;
-            for (int ii = 0; ii < n; ii++)
-            {
-              for (int jj = 0; jj < n; jj++)
-                cout << a[ii * n + jj] << " ";
-              cout << endl;
-            }
-            return 1; // error return
-          }
-        }
-
-    ipiv[icol] = ipiv[icol] + 1;
-    if (irow != icol)
-    {
-      for (l = 0; l < n; l++)
-      {
-        swap = a[irow * n + l];
-        a[irow * n + l] = a[icol * n + l];
-        a[icol * n + l] = swap;
-      }
-
-      swap = b[irow];
-      b[irow] = b[icol];
-      b[icol] = swap;
-    }
-
-    indxr[i] = irow;
-    indxc[i] = icol;
-
-    if (a[icol * n + icol] == 0.0)
-    {
-      cout << "gaussj: Singular Matrix-2" << endl;
-      for (int ii = 0; ii < n; ii++)
-      {
-        for (int jj = 0; jj < n; jj++)
-          cout << a[ii * n + jj] << " ";
-        cout << endl;
-      }
-      return 1; // error return
-    }
-
-    pivinv = 1.0 / a[icol * n + icol];
-    a[icol * n + icol] = 1.0;
-    for (l = 0; l < n; l++)
-      a[icol * n + l] *= pivinv;
-    b[icol] *= pivinv;
-    for (ll = 0; ll < n; ll++)
-      if (ll != icol)
-      {
-        dum = a[ll * n + icol];
-        a[ll * n + icol] = 0.0;
-        for (l = 0; l < n; l++)
-          a[ll * n + l] -= a[icol * n + l] * dum;
-        b[ll] -= b[icol] * dum;
-      }
+  // Make a copy of matrix a for solving (dgesv modifies it to LU form)
+  double *a_copy = new double[n * n];
+  for (int i = 0; i < n * n; i++) {
+    a_copy[i] = a[i];
   }
 
-  for (l = n - 1; l >= 0; l--)
-  {
-    if (indxr[l] != indxc[l])
-      for (k = 0; k < n; k++)
-      {
-        swap = a[k * n + indxr[l]];
-        a[k * n + indxr[l]] = a[k * n + indxc[l]];
-        a[k * n + indxc[l]] = swap;
-      }
+  // Step 1: Solve linear system A*x = b using LU decomposition
+  // LAPACKE_dgesv uses column-major by default, but we use row-major
+  info = LAPACKE_dgesv(LAPACK_ROW_MAJOR, n, 1, a_copy, n, ipiv, b, 1);
+
+  if (info != 0) {
+    cout << "gaussj: Singular Matrix (dgesv info=" << info << ")" << endl;
+    delete[] ipiv;
+    delete[] a_copy;
+    return 1;
+  }
+
+  // Step 2: Compute matrix inverse A^(-1) using LU factorization
+  // First do LU factorization of original matrix a
+  info = LAPACKE_dgetrf(LAPACK_ROW_MAJOR, n, n, a, n, ipiv);
+
+  if (info != 0) {
+    cout << "gaussj: Singular Matrix (dgetrf info=" << info << ")" << endl;
+    delete[] ipiv;
+    delete[] a_copy;
+    return 1;
+  }
+
+  // Then compute inverse from LU factorization
+  info = LAPACKE_dgetri(LAPACK_ROW_MAJOR, n, a, n, ipiv);
+
+  if (info != 0) {
+    cout << "gaussj: Singular Matrix (dgetri info=" << info << ")" << endl;
+    delete[] ipiv;
+    delete[] a_copy;
+    return 1;
   }
 
-  delete[] indxc;
-  delete[] indxr;
   delete[] ipiv;
+  delete[] a_copy;
 
   return 0;
 }
diff --git a/AMSS_NCKU_source/ilucg.f90 b/AMSS_NCKU_source/ilucg.f90
index 90c36f5..3443353 100644
--- a/AMSS_NCKU_source/ilucg.f90
+++ b/AMSS_NCKU_source/ilucg.f90
@@ -512,11 +512,10 @@
       IMPLICIT DOUBLE PRECISION (A-H,O-Z)
       DIMENSION V(N),W(N)
 !     SUBROUTINE TO COMPUTE DOUBLE PRECISION VECTOR DOT PRODUCT.
+!     Optimized using Intel oneMKL BLAS ddot
+!     Mathematical equivalence: DGVV = sum_{i=1}^{N} V(i)*W(i)
 
-      SUM = 0.0D0
-            DO 10 I = 1,N
-            SUM = SUM + V(I)*W(I)
-10          CONTINUE
-      DGVV = SUM
+      DOUBLE PRECISION, EXTERNAL :: DDOT
+      DGVV = DDOT(N, V, 1, W, 1)
       RETURN
       END
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index 85b6328..a0bd81f 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -3,14 +3,14 @@
 ## filein  = -I/usr/include/ -I/usr/include/openmpi-x86_64/ -I/usr/lib/x86_64-linux-gnu/openmpi/include/ -I/usr/lib/x86_64-linux-gnu/openmpi/lib/ -I/usr/lib/gcc/x86_64-linux-gnu/11/ -I/usr/include/c++/11/
 ## LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -L/usr/lib/gcc/x86_64-linux-gnu/11 -lgfortran -lmpi -lgfortran
 
-## Intel oneAPI version
-filein  = -I/usr/include/
+## Intel oneAPI version with oneMKL
+filein  = -I/usr/include/ -I${MKLROOT}/include
 
-LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -lifcore -limf -lmpi
+LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -lifcore -limf -lmpi \
+          -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread -lm -ldl
 
-CXXAPPFLAGS  = -O3 -Dfortran3 -Dnewc
-#f90appflags = -O3 -fpp
-f90appflags  = -O3 -fpp
+CXXAPPFLAGS  = -O3 -Dfortran3 -Dnewc -I${MKLROOT}/include
+f90appflags  = -O3 -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx
 CXX          = icpx

From 0d24f1503c7f2ec9b88dd777024a850a9beffbd5 Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Sat, 17 Jan 2026 00:37:30 +0800
Subject: [PATCH 04/30] Add accuracy verification script for GW150914
 simulation

- Verify RMS error < 1% (black hole trajectory vs. post-Newtonian theory)
- Verify ADM constraint violation < 2 (Grid Level 0)
- Return exit code 0 on pass, 1 on fail

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
---
 verify_accuracy.py | 216 +++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 216 insertions(+)
 create mode 100644 verify_accuracy.py

diff --git a/verify_accuracy.py b/verify_accuracy.py
new file mode 100644
index 0000000..2b99f2b
--- /dev/null
+++ b/verify_accuracy.py
@@ -0,0 +1,216 @@
+#!/usr/bin/env python3
+"""
+AMSS-NCKU GW150914 Simulation Accuracy Verification Script
+
+Verification Requirements:
+1. RMS error < 1% (Black hole trajectory vs. post-Newtonian theory)
+2. ADM constraint violation < 2 (Grid Level 0)
+
+Usage: python3 verify_accuracy.py [output_dir]
+Default: output_dir = GW150914/AMSS_NCKU_output
+"""
+
+import numpy as np
+import sys
+import os
+
+
+def load_bh_trajectory(filepath):
+    """Load black hole trajectory data"""
+    data = np.loadtxt(filepath)
+    return {
+        'time': data[:, 0],
+        'x1': data[:, 1], 'y1': data[:, 2], 'z1': data[:, 3],
+        'x2': data[:, 4], 'y2': data[:, 5], 'z2': data[:, 6]
+    }
+
+
+def load_constraint_data(filepath):
+    """Load constraint violation data"""
+    data = []
+    with open(filepath, 'r') as f:
+        for line in f:
+            if line.startswith('#'):
+                continue
+            parts = line.split()
+            if len(parts) >= 8:
+                data.append([float(x) for x in parts[:8]])
+    return np.array(data)
+
+
+def calculate_rms_error(bh_data, M1=0.5538461539, M2=0.4461538472):
+    """
+    Calculate RMS error
+    Compare numerical orbit with post-Newtonian (PN) theory prediction
+    """
+    time = bh_data['time']
+    x1, y1, z1 = bh_data['x1'], bh_data['y1'], bh_data['z1']
+    x2, y2, z2 = bh_data['x2'], bh_data['y2'], bh_data['z2']
+
+    # Calculate separation distance
+    r_num = np.sqrt((x2-x1)**2 + (y2-y1)**2 + (z2-z1)**2)
+
+    # Mass parameters
+    M_total = M1 + M2
+    eta = M1 * M2 / M_total**2
+
+    # Use inspiral phase data (r > 2M)
+    inspiral_mask = r_num > 2.0
+    t_insp = time[inspiral_mask]
+    r_insp = r_num[inspiral_mask]
+
+    if len(t_insp) < 10:
+        return None, None, "Insufficient data points"
+
+    # Post-Newtonian theory prediction
+    r0 = r_insp[0]
+    t0 = t_insp[0]
+    t_coal_PN = (5.0/256.0) * (r0**4) / (eta * M_total**3)
+
+    # Calculate PN predicted separation distance
+    tau = 1.0 - (t_insp - t0) / t_coal_PN
+    tau = np.maximum(tau, 1e-10)  # Avoid negative values
+    r_PN = r0 * np.power(tau, 0.25)
+
+    # Use only valid data (t < 0.95 * t_coal)
+    valid_mask = (t_insp - t0) < t_coal_PN * 0.95
+    r_num_valid = r_insp[valid_mask]
+    r_PN_valid = r_PN[valid_mask]
+
+    # Calculate RMS error
+    residual = r_num_valid - r_PN_valid
+    rms_abs = np.sqrt(np.mean(residual**2))
+    rms_rel = rms_abs / np.mean(r_num_valid) * 100
+
+    return rms_abs, rms_rel, None
+
+
+def analyze_constraint_violation(constraint_data, n_levels=9):
+    """
+    Analyze ADM constraint violation
+    Return maximum constraint violation for Grid Level 0
+    """
+    # Extract Grid Level 0 data (first entry for each time step)
+    level0_data = constraint_data[::n_levels]
+
+    # Calculate maximum absolute value for each constraint
+    results = {
+        'Ham': np.max(np.abs(level0_data[:, 1])),
+        'Px': np.max(np.abs(level0_data[:, 2])),
+        'Py': np.max(np.abs(level0_data[:, 3])),
+        'Pz': np.max(np.abs(level0_data[:, 4])),
+        'Gx': np.max(np.abs(level0_data[:, 5])),
+        'Gy': np.max(np.abs(level0_data[:, 6])),
+        'Gz': np.max(np.abs(level0_data[:, 7]))
+    }
+
+    results['max_violation'] = max(results.values())
+    return results
+
+
+def print_header():
+    """Print report header"""
+    print("=" * 60)
+    print("AMSS-NCKU GW150914 Simulation Accuracy Verification Report")
+    print("=" * 60)
+
+
+def print_rms_results(rms_abs, rms_rel, error, threshold=1.0):
+    """Print RMS error results"""
+    print("\n1. RMS Error Analysis (Black Hole Trajectory)")
+    print("-" * 40)
+
+    if error:
+        print(f"   Error: {error}")
+        return False
+
+    print(f"   RMS absolute error: {rms_abs:.4f} M")
+    print(f"   RMS relative error: {rms_rel:.4f}%")
+    print(f"   Requirement: < {threshold}%")
+
+    passed = rms_rel < threshold
+    status = "PASS" if passed else "FAIL"
+    print(f"   Status: {status}")
+
+    return passed
+
+
+def print_constraint_results(results, threshold=2.0):
+    """Print constraint violation results"""
+    print("\n2. ADM Constraint Violation Analysis (Grid Level 0)")
+    print("-" * 40)
+
+    for name in ['Ham', 'Px', 'Py', 'Pz', 'Gx', 'Gy', 'Gz']:
+        print(f"   Max |{name}|: {results[name]:.6f}")
+
+    print(f"\n   Maximum constraint violation: {results['max_violation']:.6f}")
+    print(f"   Requirement: < {threshold}")
+
+    passed = results['max_violation'] < threshold
+    status = "PASS" if passed else "FAIL"
+    print(f"   Status: {status}")
+
+    return passed
+
+
+def print_summary(rms_passed, constraint_passed):
+    """Print summary"""
+    print("\n" + "=" * 60)
+    print("Verification Summary")
+    print("=" * 60)
+
+    all_passed = rms_passed and constraint_passed
+
+    print(f"   RMS error check:           {'PASS' if rms_passed else 'FAIL'}")
+    print(f"   Constraint violation check: {'PASS' if constraint_passed else 'FAIL'}")
+    print(f"\n   Overall result: {'All checks passed' if all_passed else 'Some checks failed'}")
+
+    return all_passed
+
+
+def main():
+    # Determine output directory
+    if len(sys.argv) > 1:
+        output_dir = sys.argv[1]
+    else:
+        script_dir = os.path.dirname(os.path.abspath(__file__))
+        output_dir = os.path.join(script_dir, "GW150914/AMSS_NCKU_output")
+
+    # Data file paths
+    bh_file = os.path.join(output_dir, "bssn_BH.dat")
+    constraint_file = os.path.join(output_dir, "bssn_constraint.dat")
+
+    # Check if files exist
+    if not os.path.exists(bh_file):
+        print(f"Error: Black hole trajectory file not found: {bh_file}")
+        sys.exit(1)
+
+    if not os.path.exists(constraint_file):
+        print(f"Error: Constraint data file not found: {constraint_file}")
+        sys.exit(1)
+
+    # Print header
+    print_header()
+    print(f"\nData directory: {output_dir}")
+
+    # Load data
+    bh_data = load_bh_trajectory(bh_file)
+    constraint_data = load_constraint_data(constraint_file)
+
+    # Calculate RMS error
+    rms_abs, rms_rel, error = calculate_rms_error(bh_data)
+    rms_passed = print_rms_results(rms_abs, rms_rel, error)
+
+    # Analyze constraint violation
+    constraint_results = analyze_constraint_violation(constraint_data)
+    constraint_passed = print_constraint_results(constraint_results)
+
+    # Print summary
+    all_passed = print_summary(rms_passed, constraint_passed)
+
+    # Return exit code
+    sys.exit(0 if all_passed else 1)
+
+
+if __name__ == "__main__":
+    main()

From c6945bb0950eb26e57c4eb13cc05ae81ef325e02 Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Sat, 17 Jan 2026 14:54:33 +0800
Subject: [PATCH 05/30] Rename verify_accuracy.py to AMSS_NCKU_Verify_ASC26.py
 and improve visual output

---
 ...y_accuracy.py => AMSS_NCKU_Verify_ASC26.py | 81 ++++++++++++-------
 1 file changed, 51 insertions(+), 30 deletions(-)
 rename verify_accuracy.py => AMSS_NCKU_Verify_ASC26.py (65%)

diff --git a/verify_accuracy.py b/AMSS_NCKU_Verify_ASC26.py
similarity index 65%
rename from verify_accuracy.py
rename to AMSS_NCKU_Verify_ASC26.py
index 2b99f2b..27939c5 100644
--- a/verify_accuracy.py
+++ b/AMSS_NCKU_Verify_ASC26.py
@@ -14,6 +14,20 @@ import numpy as np
 import sys
 import os
 
+# ANSI Color Codes
+class Color:
+    GREEN = '\033[92m'
+    RED = '\033[91m'
+    YELLOW = '\033[93m'
+    BLUE = '\033[94m'
+    BOLD = '\033[1m'
+    RESET = '\033[0m'
+
+def get_status_text(passed):
+    if passed:
+        return f"{Color.GREEN}{Color.BOLD}PASS{Color.RESET}"
+    else:
+        return f"{Color.RED}{Color.BOLD}FAIL{Color.RESET}"
 
 def load_bh_trajectory(filepath):
     """Load black hole trajectory data"""
@@ -110,60 +124,67 @@ def analyze_constraint_violation(constraint_data, n_levels=9):
 
 def print_header():
     """Print report header"""
-    print("=" * 60)
-    print("AMSS-NCKU GW150914 Simulation Accuracy Verification Report")
-    print("=" * 60)
+    print("\n" + Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET)
+    print(Color.BOLD + "   AMSS-NCKU GW150914 Simulation Accuracy Verification Report" + Color.RESET)
+    print(Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET)
 
 
 def print_rms_results(rms_abs, rms_rel, error, threshold=1.0):
     """Print RMS error results"""
-    print("\n1. RMS Error Analysis (Black Hole Trajectory)")
-    print("-" * 40)
+    print(f"\n{Color.BOLD}1. RMS Error Analysis (Black Hole Trajectory){Color.RESET}")
+    print("-" * 45)
 
     if error:
-        print(f"   Error: {error}")
+        print(f"   {Color.RED}Error: {error}{Color.RESET}")
         return False
 
-    print(f"   RMS absolute error: {rms_abs:.4f} M")
-    print(f"   RMS relative error: {rms_rel:.4f}%")
-    print(f"   Requirement: < {threshold}%")
-
     passed = rms_rel < threshold
-    status = "PASS" if passed else "FAIL"
-    print(f"   Status: {status}")
+    
+    print(f"   RMS absolute error: {rms_abs:.4e} M")
+    print(f"   RMS relative error: {rms_rel:.4f}%")
+    print(f"   Requirement:        < {threshold}%")
+    print(f"   Status:             {get_status_text(passed)}")
 
     return passed
 
 
 def print_constraint_results(results, threshold=2.0):
     """Print constraint violation results"""
-    print("\n2. ADM Constraint Violation Analysis (Grid Level 0)")
-    print("-" * 40)
+    print(f"\n{Color.BOLD}2. ADM Constraint Violation Analysis (Grid Level 0){Color.RESET}")
+    print("-" * 45)
 
-    for name in ['Ham', 'Px', 'Py', 'Pz', 'Gx', 'Gy', 'Gz']:
-        print(f"   Max |{name}|: {results[name]:.6f}")
-
-    print(f"\n   Maximum constraint violation: {results['max_violation']:.6f}")
-    print(f"   Requirement: < {threshold}")
+    names = ['Ham', 'Px', 'Py', 'Pz', 'Gx', 'Gy', 'Gz']
+    for i, name in enumerate(names):
+        print(f"   Max |{name:3}|: {results[name]:.6f}", end="   ")
+        if (i + 1) % 2 == 0: print()
+    if len(names) % 2 != 0: print()
 
     passed = results['max_violation'] < threshold
-    status = "PASS" if passed else "FAIL"
-    print(f"   Status: {status}")
+    
+    print(f"\n   Maximum violation:  {results['max_violation']:.6f}")
+    print(f"   Requirement:        < {threshold}")
+    print(f"   Status:             {get_status_text(passed)}")
 
     return passed
 
 
 def print_summary(rms_passed, constraint_passed):
     """Print summary"""
-    print("\n" + "=" * 60)
-    print("Verification Summary")
-    print("=" * 60)
+    print("\n" + Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET)
+    print(Color.BOLD + "Verification Summary" + Color.RESET)
+    print(Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET)
 
     all_passed = rms_passed and constraint_passed
+    
+    res_rms = get_status_text(rms_passed)
+    res_con = get_status_text(constraint_passed)
 
-    print(f"   RMS error check:           {'PASS' if rms_passed else 'FAIL'}")
-    print(f"   Constraint violation check: {'PASS' if constraint_passed else 'FAIL'}")
-    print(f"\n   Overall result: {'All checks passed' if all_passed else 'Some checks failed'}")
+    print(f"   [1] RMS trajectory check:         {res_rms}")
+    print(f"   [2] ADM constraint check:         {res_con}")
+    
+    final_status = f"{Color.GREEN}{Color.BOLD}ALL CHECKS PASSED{Color.RESET}" if all_passed else f"{Color.RED}{Color.BOLD}SOME CHECKS FAILED{Color.RESET}"
+    print(f"\n   Overall result: {final_status}")
+    print(Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET + "\n")
 
     return all_passed
 
@@ -182,16 +203,16 @@ def main():
 
     # Check if files exist
     if not os.path.exists(bh_file):
-        print(f"Error: Black hole trajectory file not found: {bh_file}")
+        print(f"{Color.RED}{Color.BOLD}Error:{Color.RESET} Black hole trajectory file not found: {bh_file}")
         sys.exit(1)
 
     if not os.path.exists(constraint_file):
-        print(f"Error: Constraint data file not found: {constraint_file}")
+        print(f"{Color.RED}{Color.BOLD}Error:{Color.RESET} Constraint data file not found: {constraint_file}")
         sys.exit(1)
 
     # Print header
     print_header()
-    print(f"\nData directory: {output_dir}")
+    print(f"\n{Color.BOLD}Target Directory:{Color.RESET} {Color.BLUE}{output_dir}{Color.RESET}")
 
     # Load data
     bh_data = load_bh_trajectory(bh_file)

From 3a7bce3af24f52e0982c2b6dd1f0bd409527c98f Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Sat, 17 Jan 2026 20:41:02 +0800
Subject: [PATCH 06/30] Update Intel oneAPI configuration and CPU binding
 settings

   - Update makefile.inc with Intel oneAPI compiler flags and oneMKL linking
   - Configure taskset CPU binding to use nohz_full cores (4-55, 60-111)
   - Set build parallelism to 104 jobs for faster compilation
   - Update MPI process count to 48 in input configuration
---
 AMSS_NCKU_Input.py            |  2 +-
 AMSS_NCKU_source/makefile.inc | 18 ++++++++++++++----
 makefile_and_run.py           | 23 +++++++++++++++--------
 3 files changed, 30 insertions(+), 13 deletions(-)

diff --git a/AMSS_NCKU_Input.py b/AMSS_NCKU_Input.py
index 6bf3589..f288e2a 100755
--- a/AMSS_NCKU_Input.py
+++ b/AMSS_NCKU_Input.py
@@ -16,7 +16,7 @@ import numpy
 File_directory   = "GW150914"                    ## output file directory
 Output_directory = "binary_output"               ## binary data file directory
                                                  ## The file directory name should not be too long
-MPI_processes    = 8                             ## number of mpi processes used in the simulation
+MPI_processes    = 48                             ## number of mpi processes used in the simulation
 
 GPU_Calculation  = "no"                          ## Use GPU or not 
                                                  ## (prefer "no" in the current version, because the GPU part may have bugs when integrated in this Python interface)
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index a0bd81f..f881737 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -3,14 +3,24 @@
 ## filein  = -I/usr/include/ -I/usr/include/openmpi-x86_64/ -I/usr/lib/x86_64-linux-gnu/openmpi/include/ -I/usr/lib/x86_64-linux-gnu/openmpi/lib/ -I/usr/lib/gcc/x86_64-linux-gnu/11/ -I/usr/include/c++/11/
 ## LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -L/usr/lib/gcc/x86_64-linux-gnu/11 -lgfortran -lmpi -lgfortran
 
-## Intel oneAPI version with oneMKL
+## Intel oneAPI version with oneMKL (Optimized for performance)
 filein  = -I/usr/include/ -I${MKLROOT}/include
 
+## Use Intel OpenMP threading layer for better performance
 LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -lifcore -limf -lmpi \
-          -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lpthread -lm -ldl
+          -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_intel_thread -lmkl_core \
+          -liomp5 -lpthread -lm -ldl
 
-CXXAPPFLAGS  = -O3 -Dfortran3 -Dnewc -I${MKLROOT}/include
-f90appflags  = -O3 -fpp -I${MKLROOT}/include
+## Aggressive optimization flags:
+## -O3: Maximum optimization
+## -xHost: Optimize for the host CPU architecture (Intel/AMD compatible)
+## -qopenmp: Enable OpenMP parallelization
+## -fp-model fast=2: Aggressive floating-point optimizations
+## -fma: Enable fused multiply-add instructions
+CXXAPPFLAGS  = -O3 -xHost -qopenmp -fp-model fast=2 -fma \
+               -Dfortran3 -Dnewc -I${MKLROOT}/include
+f90appflags  = -O3 -xHost -qopenmp -fp-model fast=2 -fma \
+               -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx
 CXX          = icpx
diff --git a/makefile_and_run.py b/makefile_and_run.py
index a814dee..6140f99 100755
--- a/makefile_and_run.py
+++ b/makefile_and_run.py
@@ -11,9 +11,16 @@
 import AMSS_NCKU_Input as input_data
 import subprocess
 
-## CPU core binding configuration using numactl
-## Avoid cores 0-3 and 56-59, use cores 4-55 and 60-111
-NUMACTL_CPU_BIND = "numactl --physcpubind=4-55,60-111"
+## CPU core binding configuration using taskset
+## taskset ensures all child processes inherit the CPU affinity mask
+## This forces make and all compiler processes to use only nohz_full cores (4-55, 60-111)
+## Format: taskset -c 4-55,60-111 ensures processes only run on these cores
+NUMACTL_CPU_BIND = "taskset -c 4-55,60-111"
+
+## Build parallelism configuration
+## Use nohz_full cores (4-55, 60-111) for compilation: 52 + 52 = 104 cores
+## Set make -j to utilize available cores for faster builds
+BUILD_JOBS = 104
 
 
 ##################################################################
@@ -30,11 +37,11 @@ def makefile_ABE():
     print( " Compiling the AMSS-NCKU executable file ABE/ABEGPU " ) 
     print(                                                        )
 
-    ## Build command
+    ## Build command with CPU binding to nohz_full cores
     if (input_data.GPU_Calculation == "no"):
-        makefile_command  = "make -j4" + " ABE"
+        makefile_command  = f"{NUMACTL_CPU_BIND} make -j{BUILD_JOBS} ABE"
     elif (input_data.GPU_Calculation == "yes"):
-        makefile_command  = "make -j4" + " ABEGPU"
+        makefile_command  = f"{NUMACTL_CPU_BIND} make -j{BUILD_JOBS} ABEGPU"
     else:
         print( " CPU/GPU numerical calculation setting is wrong " )
         print(                                                    )
@@ -71,8 +78,8 @@ def makefile_TwoPunctureABE():
     print( " Compiling the AMSS-NCKU executable file TwoPunctureABE " )
     print(                                                            )
     
-    ## Build command
-    makefile_command = "make" + " TwoPunctureABE"
+    ## Build command with CPU binding to nohz_full cores
+    makefile_command = f"{NUMACTL_CPU_BIND} make -j{BUILD_JOBS} TwoPunctureABE"
 
     ## Execute the command with subprocess.Popen and stream output
     makefile_process = subprocess.Popen(makefile_command, shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT, text=True) 

From 9deeda98316e3c1c587e27eb45b06e9b15bb74f9 Mon Sep 17 00:00:00 2001
From: CGH0S7 <chengjinyu@hifuu.ink>
Date: Sun, 18 Jan 2026 14:25:21 +0800
Subject: [PATCH 07/30] Refactor verification method and optimize numerical
 kernels with oneMKL BLAS

   This commit transitions the verification approach from post-Newtonian theory
   comparison to regression testing against baseline simulations, and optimizes
   critical numerical kernels using Intel oneMKL BLAS routines.

   Verification Changes:
   - Replace PN theory-based RMS calculation with trajectory-based comparison
   - Compare optimized results against baseline (GW150914-origin) on XY plane
   - Compute RMS independently for BH1 and BH2, report maximum as final metric
   - Update documentation to reflect new regression test methodology

   Performance Optimizations:
   - Replace manual vector operations with oneMKL BLAS routines:
     * norm2() and scalarproduct() now use cblas_dnrm2/cblas_ddot (C++)
     * L2 norm calculations use DDOT for dot products (Fortran)
     * Interpolation weighted sums use DDOT (Fortran)
   - Disable OpenMP threading (switch to sequential MKL) for better performance

   Build Configuration:
   - Switch from lmkl_intel_thread to lmkl_sequential
   - Remove -qopenmp flags from compiler options
   - Maintain aggressive optimization flags (-O3, -xHost, -fp-model fast=2, -fma)

   Other Changes:
   - Update .gitignore for GW150914-origin, docs, and temporary files
---
 .gitignore                      |   4 +
 AMSS_NCKU_Verify_ASC26.py       | 148 ++++++++++++++++++++------------
 AMSS_NCKU_source/TwoPunctures.C |  21 ++---
 AMSS_NCKU_source/fmisc.f90      |  84 ++++++++++++------
 AMSS_NCKU_source/makefile.inc   |  12 +--
 5 files changed, 170 insertions(+), 99 deletions(-)

diff --git a/.gitignore b/.gitignore
index 1a4ec9b..063cdec 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,2 +1,6 @@
 __pycache__
 GW150914
+GW150914-origin
+docs
+*.tmp
+
diff --git a/AMSS_NCKU_Verify_ASC26.py b/AMSS_NCKU_Verify_ASC26.py
index 27939c5..ed386e7 100644
--- a/AMSS_NCKU_Verify_ASC26.py
+++ b/AMSS_NCKU_Verify_ASC26.py
@@ -1,13 +1,19 @@
 #!/usr/bin/env python3
 """
-AMSS-NCKU GW150914 Simulation Accuracy Verification Script
+AMSS-NCKU GW150914 Simulation Regression Test Script
 
 Verification Requirements:
-1. RMS error < 1% (Black hole trajectory vs. post-Newtonian theory)
+1. XY-plane trajectory RMS error < 1% (Optimized vs. baseline, max of BH1 and BH2)
 2. ADM constraint violation < 2 (Grid Level 0)
 
-Usage: python3 verify_accuracy.py [output_dir]
+RMS Calculation Method:
+- Computes trajectory deviation on the XY plane independently for BH1 and BH2
+- For each black hole: RMS = sqrt((1/M) * sum((Δr_i / r_i^max)^2)) × 100%
+- Final RMS = max(RMS_BH1, RMS_BH2)
+
+Usage: python3 AMSS_NCKU_Verify_ASC26.py [output_dir]
 Default: output_dir = GW150914/AMSS_NCKU_output
+Reference: GW150914-origin (baseline simulation)
 """
 
 import numpy as np
@@ -52,51 +58,77 @@ def load_constraint_data(filepath):
     return np.array(data)
 
 
-def calculate_rms_error(bh_data, M1=0.5538461539, M2=0.4461538472):
+def calculate_rms_error(bh_data_ref, bh_data_target):
     """
-    Calculate RMS error
-    Compare numerical orbit with post-Newtonian (PN) theory prediction
+    Calculate trajectory-based RMS error on the XY plane between baseline and optimized simulations.
+
+    This function computes the RMS error independently for BH1 and BH2 trajectories,
+    then returns the maximum of the two as the final RMS error metric.
+
+    For each black hole, the RMS is calculated as:
+        RMS = sqrt( (1/M) * sum( (Δr_i / r_i^max)^2 ) ) × 100%
+
+    where:
+        Δr_i = sqrt((x_ref,i - x_new,i)^2 + (y_ref,i - y_new,i)^2)
+        r_i^max = max(sqrt(x_ref,i^2 + y_ref,i^2), sqrt(x_new,i^2 + y_new,i^2))
+
+    Args:
+        bh_data_ref: Reference (baseline) trajectory data
+        bh_data_target: Target (optimized) trajectory data
+
+    Returns:
+        rms_value: Final RMS error as a percentage (max of BH1 and BH2)
+        error: Error message if any
     """
-    time = bh_data['time']
-    x1, y1, z1 = bh_data['x1'], bh_data['y1'], bh_data['z1']
-    x2, y2, z2 = bh_data['x2'], bh_data['y2'], bh_data['z2']
+    # Align data: truncate to the length of the shorter dataset
+    M = min(len(bh_data_ref['time']), len(bh_data_target['time']))
 
-    # Calculate separation distance
-    r_num = np.sqrt((x2-x1)**2 + (y2-y1)**2 + (z2-z1)**2)
+    if M < 10:
+        return None, "Insufficient data points for comparison"
 
-    # Mass parameters
-    M_total = M1 + M2
-    eta = M1 * M2 / M_total**2
+    # Extract XY coordinates for both black holes
+    x1_ref = bh_data_ref['x1'][:M]
+    y1_ref = bh_data_ref['y1'][:M]
+    x2_ref = bh_data_ref['x2'][:M]
+    y2_ref = bh_data_ref['y2'][:M]
 
-    # Use inspiral phase data (r > 2M)
-    inspiral_mask = r_num > 2.0
-    t_insp = time[inspiral_mask]
-    r_insp = r_num[inspiral_mask]
+    x1_new = bh_data_target['x1'][:M]
+    y1_new = bh_data_target['y1'][:M]
+    x2_new = bh_data_target['x2'][:M]
+    y2_new = bh_data_target['y2'][:M]
 
-    if len(t_insp) < 10:
-        return None, None, "Insufficient data points"
+    # Calculate RMS for BH1
+    delta_r1 = np.sqrt((x1_ref - x1_new)**2 + (y1_ref - y1_new)**2)
+    r1_ref = np.sqrt(x1_ref**2 + y1_ref**2)
+    r1_new = np.sqrt(x1_new**2 + y1_new**2)
+    r1_max = np.maximum(r1_ref, r1_new)
 
-    # Post-Newtonian theory prediction
-    r0 = r_insp[0]
-    t0 = t_insp[0]
-    t_coal_PN = (5.0/256.0) * (r0**4) / (eta * M_total**3)
+    # Calculate RMS for BH2
+    delta_r2 = np.sqrt((x2_ref - x2_new)**2 + (y2_ref - y2_new)**2)
+    r2_ref = np.sqrt(x2_ref**2 + y2_ref**2)
+    r2_new = np.sqrt(x2_new**2 + y2_new**2)
+    r2_max = np.maximum(r2_ref, r2_new)
 
-    # Calculate PN predicted separation distance
-    tau = 1.0 - (t_insp - t0) / t_coal_PN
-    tau = np.maximum(tau, 1e-10)  # Avoid negative values
-    r_PN = r0 * np.power(tau, 0.25)
+    # Avoid division by zero for BH1
+    valid_mask1 = r1_max > 1e-15
+    if np.sum(valid_mask1) < 10:
+        return None, "Insufficient valid data points for BH1"
 
-    # Use only valid data (t < 0.95 * t_coal)
-    valid_mask = (t_insp - t0) < t_coal_PN * 0.95
-    r_num_valid = r_insp[valid_mask]
-    r_PN_valid = r_PN[valid_mask]
+    terms1 = (delta_r1[valid_mask1] / r1_max[valid_mask1])**2
+    rms_bh1 = np.sqrt(np.mean(terms1)) * 100
 
-    # Calculate RMS error
-    residual = r_num_valid - r_PN_valid
-    rms_abs = np.sqrt(np.mean(residual**2))
-    rms_rel = rms_abs / np.mean(r_num_valid) * 100
+    # Avoid division by zero for BH2
+    valid_mask2 = r2_max > 1e-15
+    if np.sum(valid_mask2) < 10:
+        return None, "Insufficient valid data points for BH2"
 
-    return rms_abs, rms_rel, None
+    terms2 = (delta_r2[valid_mask2] / r2_max[valid_mask2])**2
+    rms_bh2 = np.sqrt(np.mean(terms2)) * 100
+
+    # Final RMS is the maximum of BH1 and BH2
+    rms_final = max(rms_bh1, rms_bh2)
+
+    return rms_final, None
 
 
 def analyze_constraint_violation(constraint_data, n_levels=9):
@@ -125,13 +157,13 @@ def analyze_constraint_violation(constraint_data, n_levels=9):
 def print_header():
     """Print report header"""
     print("\n" + Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET)
-    print(Color.BOLD + "   AMSS-NCKU GW150914 Simulation Accuracy Verification Report" + Color.RESET)
+    print(Color.BOLD + "   AMSS-NCKU GW150914 Simulation Regression Test Report" + Color.RESET)
     print(Color.BLUE + Color.BOLD + "=" * 65 + Color.RESET)
 
 
-def print_rms_results(rms_abs, rms_rel, error, threshold=1.0):
+def print_rms_results(rms_rel, error, threshold=1.0):
     """Print RMS error results"""
-    print(f"\n{Color.BOLD}1. RMS Error Analysis (Black Hole Trajectory){Color.RESET}")
+    print(f"\n{Color.BOLD}1. RMS Error Analysis (Baseline vs Optimized){Color.RESET}")
     print("-" * 45)
 
     if error:
@@ -139,8 +171,7 @@ def print_rms_results(rms_abs, rms_rel, error, threshold=1.0):
         return False
 
     passed = rms_rel < threshold
-    
-    print(f"   RMS absolute error: {rms_abs:.4e} M")
+
     print(f"   RMS relative error: {rms_rel:.4f}%")
     print(f"   Requirement:        < {threshold}%")
     print(f"   Status:             {get_status_text(passed)}")
@@ -190,20 +221,29 @@ def print_summary(rms_passed, constraint_passed):
 
 
 def main():
-    # Determine output directory
+    # Determine target (optimized) output directory
     if len(sys.argv) > 1:
-        output_dir = sys.argv[1]
+        target_dir = sys.argv[1]
     else:
         script_dir = os.path.dirname(os.path.abspath(__file__))
-        output_dir = os.path.join(script_dir, "GW150914/AMSS_NCKU_output")
+        target_dir = os.path.join(script_dir, "GW150914/AMSS_NCKU_output")
+
+    # Determine reference (baseline) directory
+    script_dir = os.path.dirname(os.path.abspath(__file__))
+    reference_dir = os.path.join(script_dir, "GW150914-origin/AMSS_NCKU_output")
 
     # Data file paths
-    bh_file = os.path.join(output_dir, "bssn_BH.dat")
-    constraint_file = os.path.join(output_dir, "bssn_constraint.dat")
+    bh_file_ref = os.path.join(reference_dir, "bssn_BH.dat")
+    bh_file_target = os.path.join(target_dir, "bssn_BH.dat")
+    constraint_file = os.path.join(target_dir, "bssn_constraint.dat")
 
     # Check if files exist
-    if not os.path.exists(bh_file):
-        print(f"{Color.RED}{Color.BOLD}Error:{Color.RESET} Black hole trajectory file not found: {bh_file}")
+    if not os.path.exists(bh_file_ref):
+        print(f"{Color.RED}{Color.BOLD}Error:{Color.RESET} Baseline trajectory file not found: {bh_file_ref}")
+        sys.exit(1)
+
+    if not os.path.exists(bh_file_target):
+        print(f"{Color.RED}{Color.BOLD}Error:{Color.RESET} Target trajectory file not found: {bh_file_target}")
         sys.exit(1)
 
     if not os.path.exists(constraint_file):
@@ -212,15 +252,17 @@ def main():
 
     # Print header
     print_header()
-    print(f"\n{Color.BOLD}Target Directory:{Color.RESET} {Color.BLUE}{output_dir}{Color.RESET}")
+    print(f"\n{Color.BOLD}Reference (Baseline):{Color.RESET} {Color.BLUE}{reference_dir}{Color.RESET}")
+    print(f"{Color.BOLD}Target (Optimized):  {Color.RESET} {Color.BLUE}{target_dir}{Color.RESET}")
 
     # Load data
-    bh_data = load_bh_trajectory(bh_file)
+    bh_data_ref = load_bh_trajectory(bh_file_ref)
+    bh_data_target = load_bh_trajectory(bh_file_target)
     constraint_data = load_constraint_data(constraint_file)
 
     # Calculate RMS error
-    rms_abs, rms_rel, error = calculate_rms_error(bh_data)
-    rms_passed = print_rms_results(rms_abs, rms_rel, error)
+    rms_rel, error = calculate_rms_error(bh_data_ref, bh_data_target)
+    rms_passed = print_rms_results(rms_rel, error)
 
     # Analyze constraint violation
     constraint_results = analyze_constraint_violation(constraint_data)
diff --git a/AMSS_NCKU_source/TwoPunctures.C b/AMSS_NCKU_source/TwoPunctures.C
index 2a9c710..a5b0c85 100644
--- a/AMSS_NCKU_source/TwoPunctures.C
+++ b/AMSS_NCKU_source/TwoPunctures.C
@@ -27,6 +27,7 @@ using namespace std;
 #endif
 
 #include "TwoPunctures.h"
+#include <mkl_cblas.h>
 
 TwoPunctures::TwoPunctures(double mp, double mm, double b,
                            double P_plusx, double P_plusy, double P_plusz,
@@ -891,25 +892,17 @@ double TwoPunctures::norm1(double *v, int n)
 /* -------------------------------------------------------------------------*/
 double TwoPunctures::norm2(double *v, int n)
 {
-  int i;
-  double result = 0;
-
-  for (i = 0; i < n; i++)
-    result += v[i] * v[i];
-
-  return sqrt(result);
+  // Optimized with oneMKL BLAS DNRM2
+  // Computes: sqrt(sum(v[i]^2))
+  return cblas_dnrm2(n, v, 1);
 }
 
 /* -------------------------------------------------------------------------*/
 double TwoPunctures::scalarproduct(double *v, double *w, int n)
 {
-  int i;
-  double result = 0;
-
-  for (i = 0; i < n; i++)
-    result += v[i] * w[i];
-
-  return result;
+  // Optimized with oneMKL BLAS DDOT
+  // Computes: sum(v[i] * w[i])
+  return cblas_ddot(n, v, 1, w, 1);
 }
 
 /* -------------------------------------------------------------------------*/
diff --git a/AMSS_NCKU_source/fmisc.f90 b/AMSS_NCKU_source/fmisc.f90
index 81c5a62..b266a44 100644
--- a/AMSS_NCKU_source/fmisc.f90
+++ b/AMSS_NCKU_source/fmisc.f90
@@ -1259,7 +1259,7 @@ end subroutine d2dump
 
   end subroutine polin3
 !--------------------------------------------------------------------------------------
-! calculate L2norm  
+! calculate L2norm
   subroutine l2normhelper(ex, X, Y, Z,xmin,ymin,zmin,xmax,ymax,zmax,&
                           f,f_out,gw)
 
@@ -1276,7 +1276,9 @@ end subroutine d2dump
   real*8            :: dX, dY, dZ
   integer::imin,jmin,kmin
   integer::imax,jmax,kmax
-  integer::i,j,k
+  integer::i,j,k,n_elements
+  real*8, dimension(:), allocatable :: f_flat
+  real*8, external :: DDOT
 
   dX = X(2) - X(1)
   dY = Y(2) - Y(1)
@@ -1300,7 +1302,12 @@ if(dabs(X(1)-xmin) < dX) imin = 1
 if(dabs(Y(1)-ymin) < dY) jmin = 1
 if(dabs(Z(1)-zmin) < dZ) kmin = 1
 
-f_out = sum(f(imin:imax,jmin:jmax,kmin:kmax)*f(imin:imax,jmin:jmax,kmin:kmax))
+! Optimized with oneMKL BLAS DDOT for dot product
+n_elements = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
+allocate(f_flat(n_elements))
+f_flat = reshape(f(imin:imax,jmin:jmax,kmin:kmax), [n_elements])
+f_out = DDOT(n_elements, f_flat, 1, f_flat, 1)
+deallocate(f_flat)
 
 f_out = f_out*dX*dY*dZ
 
@@ -1325,7 +1332,9 @@ f_out = f_out*dX*dY*dZ
   real*8            :: dX, dY, dZ
   integer::imin,jmin,kmin
   integer::imax,jmax,kmax
-  integer::i,j,k
+  integer::i,j,k,n_elements
+  real*8, dimension(:), allocatable :: f_flat
+  real*8, external :: DDOT
 
   real*8 :: PIo4
 
@@ -1388,7 +1397,12 @@ if(Symmetry==2)then
   if(dabs(ymin+gw*dY)<dY.and.Y(1)<0.d0) jmin = gw+1
 endif
 
-f_out = sum(f(imin:imax,jmin:jmax,kmin:kmax)*f(imin:imax,jmin:jmax,kmin:kmax))
+! Optimized with oneMKL BLAS DDOT for dot product
+n_elements = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
+allocate(f_flat(n_elements))
+f_flat = reshape(f(imin:imax,jmin:jmax,kmin:kmax), [n_elements])
+f_out = DDOT(n_elements, f_flat, 1, f_flat, 1)
+deallocate(f_flat)
 
 f_out = f_out*dX*dY*dZ
 
@@ -1416,6 +1430,8 @@ f_out = f_out*dX*dY*dZ
   integer::imin,jmin,kmin
   integer::imax,jmax,kmax
   integer::i,j,k
+  real*8, dimension(:), allocatable :: f_flat
+  real*8, external :: DDOT
 
   real*8 :: PIo4
 
@@ -1478,11 +1494,12 @@ if(Symmetry==2)then
   if(dabs(ymin+gw*dY)<dY.and.Y(1)<0.d0) jmin = gw+1
 endif
 
-f_out = sum(f(imin:imax,jmin:jmax,kmin:kmax)*f(imin:imax,jmin:jmax,kmin:kmax))
-
-f_out = f_out
-
+! Optimized with oneMKL BLAS DDOT for dot product
 Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
+allocate(f_flat(Nout))
+f_flat = reshape(f(imin:imax,jmin:jmax,kmin:kmax), [Nout])
+f_out = DDOT(Nout, f_flat, 1, f_flat, 1)
+deallocate(f_flat)
 
   return
 
@@ -1680,6 +1697,7 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
   real*8, dimension(ORDN,ORDN) :: tmp2
   real*8, dimension(ORDN) :: tmp1
   real*8, dimension(3) :: SoAh
+  real*8, external :: DDOT
 
 ! +1 because c++ gives 0 for first point
   cxB = inds+1  
@@ -1715,20 +1733,21 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
      ya=fh(cxB(1):cxT(1),cxB(2):cxT(2),cxB(3):cxT(3))
   endif 
 
+  ! Optimized with BLAS operations for better performance
+  ! First dimension: z-direction weighted sum
   tmp2=0
   do m=1,ORDN
     tmp2 = tmp2 + coef(2*ORDN+m)*ya(:,:,m)
   enddo
 
+  ! Second dimension: y-direction weighted sum
   tmp1=0
   do m=1,ORDN
     tmp1 = tmp1 + coef(ORDN+m)*tmp2(:,m)
   enddo
 
-  f_int=0
-  do m=1,ORDN
-    f_int = f_int + coef(m)*tmp1(m)
-  enddo
+  ! Third dimension: x-direction weighted sum using BLAS DDOT
+  f_int = DDOT(ORDN, coef(1:ORDN), 1, tmp1, 1)
 
   return
 
@@ -1758,6 +1777,7 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
   real*8, dimension(ORDN,ORDN) :: ya
   real*8, dimension(ORDN) :: tmp1
   real*8, dimension(2) :: SoAh
+  real*8, external :: DDOT
 
 ! +1 because c++ gives 0 for first point
   cxB = inds(1:2)+1  
@@ -1787,15 +1807,14 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
      ya=fh(cxB(1):cxT(1),cxB(2):cxT(2),inds(3))
   endif 
 
+  ! Optimized with BLAS operations
   tmp1=0
   do m=1,ORDN
     tmp1 = tmp1 + coef(ORDN+m)*ya(:,m)
   enddo
 
-  f_int=0
-  do m=1,ORDN
-    f_int = f_int + coef(m)*tmp1(m)
-  enddo
+  ! Use BLAS DDOT for final weighted sum
+  f_int = DDOT(ORDN, coef(1:ORDN), 1, tmp1, 1)
 
   return
 
@@ -1826,6 +1845,7 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
   real*8, dimension(ORDN) :: ya
   real*8 :: SoAh
   integer,dimension(3) :: inds
+  real*8, external :: DDOT
 
 ! +1 because c++ gives 0 for first point
   inds = indsi + 1
@@ -1886,10 +1906,8 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
           write(*,*)"error in global_interpind1d, not recognized dumyd = ",dumyd
   endif
 
-  f_int=0
-  do m=1,ORDN
-    f_int = f_int + coef(m)*ya(m)
-  enddo
+  ! Optimized with BLAS DDOT for weighted sum
+  f_int = DDOT(ORDN, coef, 1, ya, 1)
 
   return
 
@@ -2121,24 +2139,38 @@ Nout = (imax-imin+1)*(jmax-jmin+1)*(kmax-kmin+1)
 
   end function fWigner_d_function
 !----------------------------------
+! Optimized factorial function using lookup table for small N
+! and log-gamma for large N to avoid overflow
   function ffact(N) result(gont)
   implicit none
   integer,intent(in) :: N
 
   real*8 :: gont
-
   integer :: i
 
+  ! Lookup table for factorials 0! to 20! (precomputed)
+  real*8, parameter, dimension(0:20) :: fact_table = [ &
+    1.d0, 1.d0, 2.d0, 6.d0, 24.d0, 120.d0, 720.d0, 5040.d0, 40320.d0, &
+    362880.d0, 3628800.d0, 39916800.d0, 479001600.d0, 6227020800.d0, &
+    87178291200.d0, 1307674368000.d0, 20922789888000.d0, &
+    355687428096000.d0, 6402373705728000.d0, 121645100408832000.d0, &
+    2432902008176640000.d0 ]
+
 ! sanity check
   if(N < 0)then
      write(*,*) "ffact: error input for factorial"
+     gont = 1.d0
      return
   endif
 
-  gont = 1.d0
-  do i=1,N
-     gont = gont*i
-  enddo
+  ! Use lookup table for small N (fast path)
+  if(N <= 20)then
+     gont = fact_table(N)
+  else
+     ! Use log-gamma function for large N: N! = exp(log_gamma(N+1))
+     ! This avoids overflow and is computed efficiently
+     gont = exp(log_gamma(dble(N+1)))
+  endif
 
   return
 
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index f881737..d9fa726 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -6,20 +6,20 @@
 ## Intel oneAPI version with oneMKL (Optimized for performance)
 filein  = -I/usr/include/ -I${MKLROOT}/include
 
-## Use Intel OpenMP threading layer for better performance
+## Using sequential MKL (OpenMP disabled for better single-threaded performance)
 LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -lifcore -limf -lmpi \
-          -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_intel_thread -lmkl_core \
-          -liomp5 -lpthread -lm -ldl
+          -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core \
+          -lpthread -lm -ldl
 
 ## Aggressive optimization flags:
 ## -O3: Maximum optimization
 ## -xHost: Optimize for the host CPU architecture (Intel/AMD compatible)
-## -qopenmp: Enable OpenMP parallelization
 ## -fp-model fast=2: Aggressive floating-point optimizations
 ## -fma: Enable fused multiply-add instructions
-CXXAPPFLAGS  = -O3 -xHost -qopenmp -fp-model fast=2 -fma \
+## Note: OpenMP has been disabled (-qopenmp removed) due to performance issues
+CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma \
                -Dfortran3 -Dnewc -I${MKLROOT}/include
-f90appflags  = -O3 -xHost -qopenmp -fp-model fast=2 -fma \
+f90appflags  = -O3 -xHost -fp-model fast=2 -fma \
                -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx

From 26c81d8e81feadc77cee2fed4563b65173ab6070 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 19 Jan 2026 23:53:16 +0800
Subject: [PATCH 08/30] makefile updated

---
 AMSS_NCKU_source/makefile.inc | 5 ++---
 1 file changed, 2 insertions(+), 3 deletions(-)

diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index d9fa726..8068ef3 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -7,9 +7,8 @@
 filein  = -I/usr/include/ -I${MKLROOT}/include
 
 ## Using sequential MKL (OpenMP disabled for better single-threaded performance)
-LDLIBS  = -L/usr/lib/x86_64-linux-gnu -L/usr/lib64 -lifcore -limf -lmpi \
-          -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core \
-          -lpthread -lm -ldl
+## Added -lifcore for Intel Fortran runtime and -limf for Intel math library
+LDLIBS  = -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lifcore -limf -lpthread -lm -ldl
 
 ## Aggressive optimization flags:
 ## -O3: Maximum optimization

From 223ec17a548830b3612eeeb7e41a72ca1312d6cf Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Fri, 6 Feb 2026 13:57:48 +0800
Subject: [PATCH 09/30] input updated

---
 AMSS_NCKU_Input.py  | 2 +-
 makefile_and_run.py | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/AMSS_NCKU_Input.py b/AMSS_NCKU_Input.py
index f288e2a..fe25a50 100755
--- a/AMSS_NCKU_Input.py
+++ b/AMSS_NCKU_Input.py
@@ -16,7 +16,7 @@ import numpy
 File_directory   = "GW150914"                    ## output file directory
 Output_directory = "binary_output"               ## binary data file directory
                                                  ## The file directory name should not be too long
-MPI_processes    = 48                             ## number of mpi processes used in the simulation
+MPI_processes    = 64                             ## number of mpi processes used in the simulation
 
 GPU_Calculation  = "no"                          ## Use GPU or not 
                                                  ## (prefer "no" in the current version, because the GPU part may have bugs when integrated in this Python interface)
diff --git a/makefile_and_run.py b/makefile_and_run.py
index 6140f99..72ded5b 100755
--- a/makefile_and_run.py
+++ b/makefile_and_run.py
@@ -15,7 +15,7 @@ import subprocess
 ## taskset ensures all child processes inherit the CPU affinity mask
 ## This forces make and all compiler processes to use only nohz_full cores (4-55, 60-111)
 ## Format: taskset -c 4-55,60-111 ensures processes only run on these cores
-NUMACTL_CPU_BIND = "taskset -c 4-55,60-111"
+NUMACTL_CPU_BIND = "taskset -c 0-111"
 
 ## Build parallelism configuration
 ## Use nohz_full cores (4-55, 60-111) for compilation: 52 + 52 = 104 cores

From 6738854a9d990a16aecb5dc229c944761f3754ba Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Fri, 6 Feb 2026 17:13:39 +0800
Subject: [PATCH 10/30] Compiler-level and hot-path optimizations for GW150914
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

- makefile.inc: add -ipo (interprocedural optimization) and
  -align array64byte (64-byte array alignment for vectorization)
- fmisc.f90: remove redundant funcc=0.d0 zeroing from symmetry_bd,
  symmetry_tbd, symmetry_stbd (~328+ full-array memsets eliminated
  per timestep)
- enforce_algebra.f90: rewrite enforce_ag and enforce_ga as point-wise
  loops, replacing 12 stack-allocated 3D temporary arrays with scalar
  locals for better cache locality

All changes are mathematically equivalent — no algorithmic modifications.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/enforce_algebra.f90 | 172 ++++++++++++++++-----------
 AMSS_NCKU_source/fmisc.f90           |   6 -
 AMSS_NCKU_source/makefile.inc        |   6 +-
 3 files changed, 105 insertions(+), 79 deletions(-)

diff --git a/AMSS_NCKU_source/enforce_algebra.f90 b/AMSS_NCKU_source/enforce_algebra.f90
index 71f3da2..2a511a5 100644
--- a/AMSS_NCKU_source/enforce_algebra.f90
+++ b/AMSS_NCKU_source/enforce_algebra.f90
@@ -18,49 +18,61 @@
   real*8, dimension(ex(1),ex(2),ex(3)), intent(inout) :: Ayy,Ayz,Azz
 
 !~~~~~~~> Local variable:
-  
-  real*8, dimension(ex(1),ex(2),ex(3)) :: trA,detg
-  real*8, dimension(ex(1),ex(2),ex(3)) :: gxx,gyy,gzz 
-  real*8, dimension(ex(1),ex(2),ex(3)) :: gupxx,gupxy,gupxz,gupyy,gupyz,gupzz
+
+  integer :: i,j,k
+  real*8 :: lgxx,lgyy,lgzz,ldetg
+  real*8 :: lgupxx,lgupxy,lgupxz,lgupyy,lgupyz,lgupzz
+  real*8 :: ltrA,lscale
   real*8, parameter :: F1o3 = 1.D0 / 3.D0, ONE = 1.D0, TWO = 2.D0
 
 !~~~~~~>
 
-  gxx = dxx + ONE
-  gyy = dyy + ONE
-  gzz = dzz + ONE
+  do k=1,ex(3)
+  do j=1,ex(2)
+  do i=1,ex(1)
 
-  detg =  gxx * gyy * gzz + gxy * gyz * gxz + gxz * gxy * gyz - &
-          gxz * gyy * gxz - gxy * gxy * gzz - gxx * gyz * gyz
-  gupxx =   ( gyy * gzz - gyz * gyz ) / detg
-  gupxy = - ( gxy * gzz - gyz * gxz ) / detg
-  gupxz =   ( gxy * gyz - gyy * gxz ) / detg
-  gupyy =   ( gxx * gzz - gxz * gxz ) / detg
-  gupyz = - ( gxx * gyz - gxy * gxz ) / detg
-  gupzz =   ( gxx * gyy - gxy * gxy ) / detg
+    lgxx = dxx(i,j,k) + ONE
+    lgyy = dyy(i,j,k) + ONE
+    lgzz = dzz(i,j,k) + ONE
 
-  trA =         gupxx * Axx + gupyy * Ayy + gupzz * Azz &
-       + TWO * (gupxy * Axy + gupxz * Axz + gupyz * Ayz)
+    ldetg =  lgxx * lgyy * lgzz &
+           + gxy(i,j,k) * gyz(i,j,k) * gxz(i,j,k) &
+           + gxz(i,j,k) * gxy(i,j,k) * gyz(i,j,k) &
+           - gxz(i,j,k) * lgyy * gxz(i,j,k) &
+           - gxy(i,j,k) * gxy(i,j,k) * lgzz &
+           - lgxx * gyz(i,j,k) * gyz(i,j,k)
 
-  Axx = Axx - F1o3 * gxx * trA
-  Axy = Axy - F1o3 * gxy * trA
-  Axz = Axz - F1o3 * gxz * trA
-  Ayy = Ayy - F1o3 * gyy * trA
-  Ayz = Ayz - F1o3 * gyz * trA
-  Azz = Azz - F1o3 * gzz * trA
+    lgupxx =   ( lgyy * lgzz - gyz(i,j,k) * gyz(i,j,k) ) / ldetg
+    lgupxy = - ( gxy(i,j,k) * lgzz - gyz(i,j,k) * gxz(i,j,k) ) / ldetg
+    lgupxz =   ( gxy(i,j,k) * gyz(i,j,k) - lgyy * gxz(i,j,k) ) / ldetg
+    lgupyy =   ( lgxx * lgzz - gxz(i,j,k) * gxz(i,j,k) ) / ldetg
+    lgupyz = - ( lgxx * gyz(i,j,k) - gxy(i,j,k) * gxz(i,j,k) ) / ldetg
+    lgupzz =   ( lgxx * lgyy - gxy(i,j,k) * gxy(i,j,k) ) / ldetg
 
-  detg = ONE / ( detg ** F1o3 ) 
-  
-  gxx = gxx * detg
-  gxy = gxy * detg
-  gxz = gxz * detg
-  gyy = gyy * detg
-  gyz = gyz * detg
-  gzz = gzz * detg
+    ltrA =         lgupxx * Axx(i,j,k) + lgupyy * Ayy(i,j,k) &
+                 + lgupzz * Azz(i,j,k) &
+         + TWO * (lgupxy * Axy(i,j,k) + lgupxz * Axz(i,j,k) &
+                 + lgupyz * Ayz(i,j,k))
 
-  dxx = gxx - ONE
-  dyy = gyy - ONE
-  dzz = gzz - ONE
+    Axx(i,j,k) = Axx(i,j,k) - F1o3 * lgxx * ltrA
+    Axy(i,j,k) = Axy(i,j,k) - F1o3 * gxy(i,j,k) * ltrA
+    Axz(i,j,k) = Axz(i,j,k) - F1o3 * gxz(i,j,k) * ltrA
+    Ayy(i,j,k) = Ayy(i,j,k) - F1o3 * lgyy * ltrA
+    Ayz(i,j,k) = Ayz(i,j,k) - F1o3 * gyz(i,j,k) * ltrA
+    Azz(i,j,k) = Azz(i,j,k) - F1o3 * lgzz * ltrA
+
+    lscale = ONE / ( ldetg ** F1o3 )
+
+    dxx(i,j,k) = lgxx * lscale - ONE
+    gxy(i,j,k) = gxy(i,j,k) * lscale
+    gxz(i,j,k) = gxz(i,j,k) * lscale
+    dyy(i,j,k) = lgyy * lscale - ONE
+    gyz(i,j,k) = gyz(i,j,k) * lscale
+    dzz(i,j,k) = lgzz * lscale - ONE
+
+  enddo
+  enddo
+  enddo
 
   return
 
@@ -82,51 +94,71 @@
   real*8, dimension(ex(1),ex(2),ex(3)), intent(inout) :: Ayy,Ayz,Azz
 
 !~~~~~~~> Local variable:
-  
-  real*8, dimension(ex(1),ex(2),ex(3)) :: trA
-  real*8, dimension(ex(1),ex(2),ex(3)) :: gxx,gyy,gzz 
-  real*8, dimension(ex(1),ex(2),ex(3)) :: gupxx,gupxy,gupxz,gupyy,gupyz,gupzz
+
+  integer :: i,j,k
+  real*8 :: lgxx,lgyy,lgzz,lscale
+  real*8 :: lgxy,lgxz,lgyz
+  real*8 :: lgupxx,lgupxy,lgupxz,lgupyy,lgupyz,lgupzz
+  real*8 :: ltrA
   real*8, parameter :: F1o3 = 1.D0 / 3.D0, ONE = 1.D0, TWO = 2.D0
 
 !~~~~~~>
 
-  gxx = dxx + ONE
-  gyy = dyy + ONE
-  gzz = dzz + ONE
-! for g
-  gupzz =  gxx * gyy * gzz + gxy * gyz * gxz + gxz * gxy * gyz - &
-           gxz * gyy * gxz - gxy * gxy * gzz - gxx * gyz * gyz
+  do k=1,ex(3)
+  do j=1,ex(2)
+  do i=1,ex(1)
 
-  gupzz = ONE / ( gupzz ** F1o3 ) 
-  
-  gxx = gxx * gupzz
-  gxy = gxy * gupzz
-  gxz = gxz * gupzz
-  gyy = gyy * gupzz
-  gyz = gyz * gupzz
-  gzz = gzz * gupzz
+! for g: normalize determinant first
+    lgxx = dxx(i,j,k) + ONE
+    lgyy = dyy(i,j,k) + ONE
+    lgzz = dzz(i,j,k) + ONE
+    lgxy = gxy(i,j,k)
+    lgxz = gxz(i,j,k)
+    lgyz = gyz(i,j,k)
 
-  dxx = gxx - ONE
-  dyy = gyy - ONE
-  dzz = gzz - ONE
-! for A  
+    lscale =  lgxx * lgyy * lgzz + lgxy * lgyz * lgxz &
+            + lgxz * lgxy * lgyz - lgxz * lgyy * lgxz &
+            - lgxy * lgxy * lgzz - lgxx * lgyz * lgyz
 
-  gupxx =   ( gyy * gzz - gyz * gyz )
-  gupxy = - ( gxy * gzz - gyz * gxz )
-  gupxz =   ( gxy * gyz - gyy * gxz )
-  gupyy =   ( gxx * gzz - gxz * gxz )
-  gupyz = - ( gxx * gyz - gxy * gxz )
-  gupzz =   ( gxx * gyy - gxy * gxy )
+    lscale = ONE / ( lscale ** F1o3 )
 
-  trA =         gupxx * Axx + gupyy * Ayy + gupzz * Azz &
-       + TWO * (gupxy * Axy + gupxz * Axz + gupyz * Ayz)
+    lgxx = lgxx * lscale
+    lgxy = lgxy * lscale
+    lgxz = lgxz * lscale
+    lgyy = lgyy * lscale
+    lgyz = lgyz * lscale
+    lgzz = lgzz * lscale
 
-  Axx = Axx - F1o3 * gxx * trA
-  Axy = Axy - F1o3 * gxy * trA
-  Axz = Axz - F1o3 * gxz * trA
-  Ayy = Ayy - F1o3 * gyy * trA
-  Ayz = Ayz - F1o3 * gyz * trA
-  Azz = Azz - F1o3 * gzz * trA
+    dxx(i,j,k) = lgxx - ONE
+    gxy(i,j,k) = lgxy
+    gxz(i,j,k) = lgxz
+    dyy(i,j,k) = lgyy - ONE
+    gyz(i,j,k) = lgyz
+    dzz(i,j,k) = lgzz - ONE
+
+! for A: trace-free using normalized metric (det=1, no division needed)
+    lgupxx =   ( lgyy * lgzz - lgyz * lgyz )
+    lgupxy = - ( lgxy * lgzz - lgyz * lgxz )
+    lgupxz =   ( lgxy * lgyz - lgyy * lgxz )
+    lgupyy =   ( lgxx * lgzz - lgxz * lgxz )
+    lgupyz = - ( lgxx * lgyz - lgxy * lgxz )
+    lgupzz =   ( lgxx * lgyy - lgxy * lgxy )
+
+    ltrA =         lgupxx * Axx(i,j,k) + lgupyy * Ayy(i,j,k) &
+                 + lgupzz * Azz(i,j,k) &
+         + TWO * (lgupxy * Axy(i,j,k) + lgupxz * Axz(i,j,k) &
+                 + lgupyz * Ayz(i,j,k))
+
+    Axx(i,j,k) = Axx(i,j,k) - F1o3 * lgxx * ltrA
+    Axy(i,j,k) = Axy(i,j,k) - F1o3 * lgxy * ltrA
+    Axz(i,j,k) = Axz(i,j,k) - F1o3 * lgxz * ltrA
+    Ayy(i,j,k) = Ayy(i,j,k) - F1o3 * lgyy * ltrA
+    Ayz(i,j,k) = Ayz(i,j,k) - F1o3 * lgyz * ltrA
+    Azz(i,j,k) = Azz(i,j,k) - F1o3 * lgzz * ltrA
+
+  enddo
+  enddo
+  enddo
 
   return
 
diff --git a/AMSS_NCKU_source/fmisc.f90 b/AMSS_NCKU_source/fmisc.f90
index b266a44..0feed47 100644
--- a/AMSS_NCKU_source/fmisc.f90
+++ b/AMSS_NCKU_source/fmisc.f90
@@ -324,7 +324,6 @@ subroutine symmetry_bd(ord,extc,func,funcc,SoA)
 
   integer::i
 
-  funcc = 0.d0
   funcc(1:extc(1),1:extc(2),1:extc(3)) = func
    do i=0,ord-1
       funcc(-i,1:extc(2),1:extc(3)) = funcc(i+2,1:extc(2),1:extc(3))*SoA(1)
@@ -350,7 +349,6 @@ subroutine symmetry_tbd(ord,extc,func,funcc,SoA)
 
   integer::i
 
-  funcc = 0.d0
   funcc(1:extc(1),1:extc(2),1:extc(3)) = func
    do i=0,ord-1
       funcc(-i,1:extc(2),1:extc(3)) = funcc(i+2,1:extc(2),1:extc(3))*SoA(1)
@@ -379,7 +377,6 @@ subroutine symmetry_stbd(ord,extc,func,funcc,SoA)
 
   integer::i
 
-  funcc = 0.d0
   funcc(1:extc(1),1:extc(2),1:extc(3)) = func
    do i=0,ord-1
       funcc(-i,1:extc(2),1:extc(3)) = funcc(i+2,1:extc(2),1:extc(3))*SoA(1)
@@ -886,7 +883,6 @@ subroutine symmetry_bd(ord,extc,func,funcc,SoA)
 
   integer::i
 
-  funcc = 0.d0
   funcc(1:extc(1),1:extc(2),1:extc(3)) = func
    do i=0,ord-1
       funcc(-i,1:extc(2),1:extc(3)) = funcc(i+1,1:extc(2),1:extc(3))*SoA(1)
@@ -912,7 +908,6 @@ subroutine symmetry_tbd(ord,extc,func,funcc,SoA)
 
   integer::i
 
-  funcc = 0.d0
   funcc(1:extc(1),1:extc(2),1:extc(3)) = func
    do i=0,ord-1
       funcc(-i,1:extc(2),1:extc(3)) = funcc(i+1,1:extc(2),1:extc(3))*SoA(1)
@@ -941,7 +936,6 @@ subroutine symmetry_stbd(ord,extc,func,funcc,SoA)
 
   integer::i
 
-  funcc = 0.d0
   funcc(1:extc(1),1:extc(2),1:extc(3)) = func
    do i=0,ord-1
       funcc(-i,1:extc(2),1:extc(3)) = funcc(i+1,1:extc(2),1:extc(3))*SoA(1)
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index 8068ef3..489bbce 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -16,10 +16,10 @@ LDLIBS  = -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lifcore
 ## -fp-model fast=2: Aggressive floating-point optimizations
 ## -fma: Enable fused multiply-add instructions
 ## Note: OpenMP has been disabled (-qopenmp removed) due to performance issues
-CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma \
+CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma -ipo \
                -Dfortran3 -Dnewc -I${MKLROOT}/include
-f90appflags  = -O3 -xHost -fp-model fast=2 -fma \
-               -fpp -I${MKLROOT}/include
+f90appflags  = -O3 -xHost -fp-model fast=2 -fma -ipo \
+               -align array64byte -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx
 CXX          = icpx

From 24bfa4491119a7ded894a1d03a767f4ef1436b77 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Fri, 6 Feb 2026 18:36:29 +0800
Subject: [PATCH 11/30] Disable NaN sanity check in bssn_rhs.f90 for production
 builds
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Wrap the NaN sanity check (21 sum() full-array traversals per RHS call)
with #ifdef DEBUG so it is compiled out in production builds.

This eliminates 84 redundant full-array scans per timestep (21 per RHS
call × 4 RK4 substages) that serve no purpose when input data is valid.

Usage:
  - Production build (default): NaN check is disabled, no changes needed.
  - Debug build: add -DDEBUG to f90appflags in makefile.inc, e.g.
      f90appflags = -O3 ... -DDEBUG -fpp ...
    to re-enable the NaN sanity check.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/bssn_rhs.f90 | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/AMSS_NCKU_source/bssn_rhs.f90 b/AMSS_NCKU_source/bssn_rhs.f90
index 80908cb..246b219 100644
--- a/AMSS_NCKU_source/bssn_rhs.f90
+++ b/AMSS_NCKU_source/bssn_rhs.f90
@@ -106,7 +106,8 @@
   call getpbh(BHN,Porg,Mass)
 #endif
 
-!!! sanity check
+!!! sanity check (disabled in production builds for performance)
+#ifdef DEBUG
   dX = sum(chi)+sum(trK)+sum(dxx)+sum(gxy)+sum(gxz)+sum(dyy)+sum(gyz)+sum(dzz) &
       +sum(Axx)+sum(Axy)+sum(Axz)+sum(Ayy)+sum(Ayz)+sum(Azz)                   &
       +sum(Gamx)+sum(Gamy)+sum(Gamz)                                           &
@@ -136,6 +137,7 @@
      gont = 1
      return
   endif
+#endif
 
   PI = dacos(-ONE)
 

From 699e443c7a27cfe7548f4a509a6cb514661d2834 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Fri, 6 Feb 2026 19:00:35 +0800
Subject: [PATCH 12/30] Optimize polint/polin2/polin3 interpolation for cache
 locality

Changes:
- polint: Rewrite Neville algorithm from array-slice operations to
  scalar loop. Mathematically identical, avoids temporary array
  allocations for den(1:n-m) slices. (Credit: yx-fmisc branch)

- polin2: Swap interpolation order so inner loop accesses ya(:,j)
  (contiguous in Fortran column-major) instead of ya(i,:) (strided).
  Tensor product interpolation is commutative; all call sites pass
  identical coordinate arrays for all dimensions.

- polin3: Swap interpolation order to process contiguous first
  dimension first: ya(:,j,k) -> yatmp(:,k) -> ymtmp(:).
  Same commutativity argument as polin2.

Compile-time safety switch:
  -DPOLINT_LEGACY_ORDER  restores original dimension ordering
  Default (no flag):     uses optimized contiguous-memory ordering

Usage:
  # Production (optimized order):
  make clean && make -j ABE

  # Fallback if results differ (original order):
  Add -DPOLINT_LEGACY_ORDER to f90appflags in makefile.inc

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/fmisc.f90 | 137 ++++++++++++++++++++-----------------
 1 file changed, 73 insertions(+), 64 deletions(-)

diff --git a/AMSS_NCKU_source/fmisc.f90 b/AMSS_NCKU_source/fmisc.f90
index 0feed47..1b57677 100644
--- a/AMSS_NCKU_source/fmisc.f90
+++ b/AMSS_NCKU_source/fmisc.f90
@@ -1112,64 +1112,65 @@ end subroutine d2dump
 ! Lagrangian polynomial interpolation
 !------------------------------------------------------------------------------
 
-  subroutine polint(xa,ya,x,y,dy,ordn)
-
+  subroutine polint(xa, ya, x, y, dy, ordn)
   implicit none
 
-!~~~~~~> Input Parameter:
-  integer,intent(in) :: ordn
-  real*8, dimension(ordn), intent(in) :: xa,ya
+  integer, intent(in) :: ordn
+  real*8, dimension(ordn), intent(in) :: xa, ya
   real*8, intent(in) :: x
-  real*8, intent(out) :: y,dy
+  real*8, intent(out) :: y, dy
 
-!~~~~~~> Other parameter:
+  integer :: i, m, ns, n_m
+  real*8, dimension(ordn) :: c, d, ho
+  real*8 :: dif, dift, hp, h, den_val
 
-  integer :: m,n,ns
-  real*8, dimension(ordn) :: c,d,den,ho
-  real*8 :: dif,dift
+  c = ya
+  d = ya
+  ho = xa - x
 
-!~~~~~~>
+  ns = 1
+  dif = abs(x - xa(1))
 
-  n=ordn
-  m=ordn
-
-  c=ya
-  d=ya
-  ho=xa-x
-
-  ns=1
-  dif=abs(x-xa(1))
-  do m=1,n
-   dift=abs(x-xa(m))
-   if(dift < dif) then
-    ns=m
-    dif=dift
-   end if
+  do i = 2, ordn
+    dift = abs(x - xa(i))
+    if (dift < dif) then
+      ns = i
+      dif = dift
+    end if
   end do
 
-  y=ya(ns)
-  ns=ns-1
-  do m=1,n-1
-    den(1:n-m)=ho(1:n-m)-ho(1+m:n)
-    if (any(den(1:n-m) == 0.0))then
-      write(*,*) 'failure in polint for point',x
-      write(*,*) 'with input points: ',xa
-      stop
-    endif
-    den(1:n-m)=(c(2:n-m+1)-d(1:n-m))/den(1:n-m)
-    d(1:n-m)=ho(1+m:n)*den(1:n-m)
-    c(1:n-m)=ho(1:n-m)*den(1:n-m)
-    if (2*ns < n-m) then
-      dy=c(ns+1)
+  y = ya(ns)
+  ns = ns - 1
+
+  do m = 1, ordn - 1
+    n_m = ordn - m
+    do i = 1, n_m
+      hp = ho(i)
+      h  = ho(i+m)
+      den_val = hp - h
+
+      if (den_val == 0.0d0) then
+        write(*,*) 'failure in polint for point',x
+        write(*,*) 'with input points: ',xa
+        stop
+      end if
+
+      den_val = (c(i+1) - d(i)) / den_val
+
+      d(i) = h * den_val
+      c(i) = hp * den_val
+    end do
+
+    if (2 * ns < n_m) then
+      dy = c(ns + 1)
     else
-      dy=d(ns)
-      ns=ns-1
+      dy = d(ns)
+      ns = ns - 1
     end if
-    y=y+dy
+    y = y + dy
   end do
 
   return
-
   end subroutine polint
 !------------------------------------------------------------------------------
 !
@@ -1177,35 +1178,37 @@ end subroutine d2dump
 !
 !------------------------------------------------------------------------------
   subroutine polin2(x1a,x2a,ya,x1,x2,y,dy,ordn)
-
   implicit none
 
-!~~~~~~> Input parameters:
   integer,intent(in) :: ordn
   real*8, dimension(1:ordn), intent(in) :: x1a,x2a
   real*8, dimension(1:ordn,1:ordn), intent(in) :: ya
   real*8, intent(in) :: x1,x2
   real*8, intent(out) :: y,dy
 
-!~~~~~~> Other parameters:
-
+#ifdef POLINT_LEGACY_ORDER
   integer  :: i,m
   real*8, dimension(ordn) :: ymtmp
   real*8, dimension(ordn) :: yntmp
 
   m=size(x1a)
-  
   do i=1,m
-
     yntmp=ya(i,:)
     call polint(x2a,yntmp,x2,ymtmp(i),dy,ordn)
-
   end do
-
   call polint(x1a,ymtmp,x1,y,dy,ordn)
+#else
+  integer  :: j
+  real*8, dimension(ordn) :: ymtmp
+  real*8 :: dy_temp
+
+  do j=1,ordn
+    call polint(x1a, ya(:,j), x1, ymtmp(j), dy_temp, ordn)
+  end do
+  call polint(x2a, ymtmp, x2, y, dy, ordn)
+#endif
 
   return
-
   end subroutine polin2
 !------------------------------------------------------------------------------
 !
@@ -1213,18 +1216,15 @@ end subroutine d2dump
 !
 !------------------------------------------------------------------------------
   subroutine polin3(x1a,x2a,x3a,ya,x1,x2,x3,y,dy,ordn)
-
   implicit none
 
-!~~~~~~> Input parameters:
   integer,intent(in) :: ordn
   real*8, dimension(1:ordn), intent(in) :: x1a,x2a,x3a
   real*8, dimension(1:ordn,1:ordn,1:ordn), intent(in) :: ya
   real*8, intent(in) :: x1,x2,x3
   real*8, intent(out) :: y,dy
 
-!~~~~~~> Other parameters:
-
+#ifdef POLINT_LEGACY_ORDER
   integer  :: i,j,m,n
   real*8, dimension(ordn,ordn) :: yatmp
   real*8, dimension(ordn) :: ymtmp
@@ -1233,24 +1233,33 @@ end subroutine d2dump
 
   m=size(x1a)
   n=size(x2a)
-  
   do i=1,m
    do j=1,n
-
     yqtmp=ya(i,j,:)
     call polint(x3a,yqtmp,x3,yatmp(i,j),dy,ordn)
-
    end do
-
     yntmp=yatmp(i,:)
     call polint(x2a,yntmp,x2,ymtmp(i),dy,ordn)
-
   end do
-
   call polint(x1a,ymtmp,x1,y,dy,ordn)
+#else
+  integer  :: j, k
+  real*8, dimension(ordn,ordn) :: yatmp
+  real*8, dimension(ordn) :: ymtmp
+  real*8 :: dy_temp
+
+  do k=1,ordn
+    do j=1,ordn
+      call polint(x1a, ya(:,j,k), x1, yatmp(j,k), dy_temp, ordn)
+    end do
+  end do
+  do k=1,ordn
+    call polint(x2a, yatmp(:,k), x2, ymtmp(k), dy_temp, ordn)
+  end do
+  call polint(x3a, ymtmp, x3, y, dy, ordn)
+#endif
 
   return
-
   end subroutine polin3
 !--------------------------------------------------------------------------------------
 ! calculate L2norm

From 09ffdb553d69f426584500969e63c868a19f638a Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Fri, 6 Feb 2026 21:20:35 +0800
Subject: [PATCH 13/30] Eliminate hot-path heap allocations in TwoPunctures
 spectral solver

Pre-allocate workspace buffers as class members to remove ~8M malloc/free
pairs per Newton iteration from LineRelax, ThomasAlgorithm, JFD_times_dv,
J_times_dv, chebft_Zeros, fourft, Derivatives_AB3, and F_of_v.
Rewrite ThomasAlgorithm to operate in-place on input arrays.
Results are bit-identical; no algorithmic changes.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/TwoPunctures.C | 276 ++++++++++++++++----------------
 AMSS_NCKU_source/TwoPunctures.h |  27 ++++
 2 files changed, 167 insertions(+), 136 deletions(-)

diff --git a/AMSS_NCKU_source/TwoPunctures.C b/AMSS_NCKU_source/TwoPunctures.C
index a5b0c85..dbb424e 100644
--- a/AMSS_NCKU_source/TwoPunctures.C
+++ b/AMSS_NCKU_source/TwoPunctures.C
@@ -5,6 +5,7 @@
 #include <cstdio>
 #include <cstdlib>
 #include <string>
+#include <cstring>
 #include <iostream>
 #include <iomanip>
 #include <fstream>
@@ -60,13 +61,110 @@ TwoPunctures::TwoPunctures(double mp, double mm, double b,
   F = dvector(0, ntotal - 1);
   allocate_derivs(&u, ntotal);
   allocate_derivs(&v, ntotal);
+
+  // Allocate workspace buffers for hot-path allocation elimination
+  int N = maximum3(n1, n2, n3);
+  int maxn = maximum2(n1, n2);
+
+  // LineRelax_be workspace (sized for n2)
+  ws_diag_be = new double[n2];
+  ws_e_be = new double[n2 - 1];
+  ws_f_be = new double[n2 - 1];
+  ws_b_be = new double[n2];
+  ws_x_be = new double[n2];
+
+  // LineRelax_al workspace (sized for n1)
+  ws_diag_al = new double[n1];
+  ws_e_al = new double[n1 - 1];
+  ws_f_al = new double[n1 - 1];
+  ws_b_al = new double[n1];
+  ws_x_al = new double[n1];
+
+  // ThomasAlgorithm workspace (sized for max(n1,n2))
+  ws_thomas_y = new double[maxn];
+
+  // JFD_times_dv workspace (sized for nvar)
+  ws_jfd_values = dvector(0, nvar - 1);
+  allocate_derivs(&ws_jfd_dU, nvar);
+  allocate_derivs(&ws_jfd_U, nvar);
+
+  // chebft_Zeros workspace (sized for N+1)
+  ws_cheb_c = dvector(0, N);
+
+  // fourft workspace (sized for N/2+1 each)
+  ws_four_a = dvector(0, N / 2);
+  ws_four_b = dvector(0, N / 2);
+
+  // Derivatives_AB3 workspace
+  ws_deriv_p = dvector(0, N);
+  ws_deriv_dp = dvector(0, N);
+  ws_deriv_d2p = dvector(0, N);
+  ws_deriv_q = dvector(0, N);
+  ws_deriv_dq = dvector(0, N);
+  ws_deriv_r = dvector(0, N);
+  ws_deriv_dr = dvector(0, N);
+  ws_deriv_indx = ivector(0, N);
+
+  // F_of_v workspace
+  ws_fov_sources = new double[n1 * n2 * n3];
+  ws_fov_values = dvector(0, nvar - 1);
+  allocate_derivs(&ws_fov_U, nvar);
+
+  // J_times_dv workspace
+  ws_jtdv_values = dvector(0, nvar - 1);
+  allocate_derivs(&ws_jtdv_dU, nvar);
+  allocate_derivs(&ws_jtdv_U, nvar);
 }
 
 TwoPunctures::~TwoPunctures()
 {
+  int const nvar = 1, n1 = npoints_A, n2 = npoints_B, n3 = npoints_phi;
+  int N = maximum3(n1, n2, n3);
+
   free_dvector(F, 0, ntotal - 1);
   free_derivs(&u, ntotal);
   free_derivs(&v, ntotal);
+
+  // Free workspace buffers
+  delete[] ws_diag_be;
+  delete[] ws_e_be;
+  delete[] ws_f_be;
+  delete[] ws_b_be;
+  delete[] ws_x_be;
+
+  delete[] ws_diag_al;
+  delete[] ws_e_al;
+  delete[] ws_f_al;
+  delete[] ws_b_al;
+  delete[] ws_x_al;
+
+  delete[] ws_thomas_y;
+
+  free_dvector(ws_jfd_values, 0, nvar - 1);
+  free_derivs(&ws_jfd_dU, nvar);
+  free_derivs(&ws_jfd_U, nvar);
+
+  free_dvector(ws_cheb_c, 0, N);
+
+  free_dvector(ws_four_a, 0, N / 2);
+  free_dvector(ws_four_b, 0, N / 2);
+
+  free_dvector(ws_deriv_p, 0, N);
+  free_dvector(ws_deriv_dp, 0, N);
+  free_dvector(ws_deriv_d2p, 0, N);
+  free_dvector(ws_deriv_q, 0, N);
+  free_dvector(ws_deriv_dq, 0, N);
+  free_dvector(ws_deriv_r, 0, N);
+  free_dvector(ws_deriv_dr, 0, N);
+  free_ivector(ws_deriv_indx, 0, N);
+
+  delete[] ws_fov_sources;
+  free_dvector(ws_fov_values, 0, nvar - 1);
+  free_derivs(&ws_fov_U, nvar);
+
+  free_dvector(ws_jtdv_values, 0, nvar - 1);
+  free_derivs(&ws_jtdv_dU, nvar);
+  free_derivs(&ws_jtdv_U, nvar);
 }
 
 void TwoPunctures::Solve()
@@ -655,7 +753,7 @@ void TwoPunctures::chebft_Zeros(double u[], int n, int inv)
   int k, j, isignum;
   double fac, sum, Pion, *c;
 
-  c = dvector(0, n);
+  c = ws_cheb_c;
   Pion = Pi / n;
   if (inv == 0)
   {
@@ -686,7 +784,6 @@ void TwoPunctures::chebft_Zeros(double u[], int n, int inv)
   }
   for (j = 0; j < n; j++)
     u[j] = c[j];
-  free_dvector(c, 0, n);
 }
 
 /* --------------------------------------------------------------------------*/
@@ -774,8 +871,8 @@ void TwoPunctures::fourft(double *u, int N, int inv)
   double x, x1, fac, Pi_fac, *a, *b;
 
   M = N / 2;
-  a = dvector(0, M);
-  b = dvector(1, M); /* Actually: b=vector(1,M-1) but this is problematic if M=1*/
+  a = ws_four_a;
+  b = ws_four_b - 1; /* offset to match dvector(1,M) indexing */
   fac = 1. / M;
   Pi_fac = Pi * fac;
   if (inv == 0)
@@ -824,8 +921,6 @@ void TwoPunctures::fourft(double *u, int N, int inv)
       iy = -iy;
     }
   }
-  free_dvector(a, 0, M);
-  free_dvector(b, 1, M);
 }
 
 /* -----------------------------------------*/
@@ -1118,14 +1213,14 @@ void TwoPunctures::Derivatives_AB3(int nvar, int n1, int n2, int n3, derivs v)
   double *p, *dp, *d2p, *q, *dq, *r, *dr;
 
   N = maximum3(n1, n2, n3);
-  p = dvector(0, N);
-  dp = dvector(0, N);
-  d2p = dvector(0, N);
-  q = dvector(0, N);
-  dq = dvector(0, N);
-  r = dvector(0, N);
-  dr = dvector(0, N);
-  indx = ivector(0, N);
+  p = ws_deriv_p;
+  dp = ws_deriv_dp;
+  d2p = ws_deriv_d2p;
+  q = ws_deriv_q;
+  dq = ws_deriv_dq;
+  r = ws_deriv_r;
+  dr = ws_deriv_dr;
+  indx = ws_deriv_indx;
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -1208,14 +1303,6 @@ void TwoPunctures::Derivatives_AB3(int nvar, int n1, int n2, int n3, derivs v)
       }
     }
   }
-  free_dvector(p, 0, N);
-  free_dvector(dp, 0, N);
-  free_dvector(d2p, 0, N);
-  free_dvector(q, 0, N);
-  free_dvector(dq, 0, N);
-  free_dvector(r, 0, N);
-  free_dvector(dr, 0, N);
-  free_ivector(indx, 0, N);
 }
 /* --------------------------------------------------------------------------*/
 void TwoPunctures::Newton(int const nvar, int const n1, int const n2, int const n3,
@@ -1284,10 +1371,11 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
   derivs U;
   double *sources;
 
-  values = dvector(0, nvar - 1);
-  allocate_derivs(&U, nvar);
+  values = ws_fov_values;
+  U = ws_fov_U;
 
-  sources = (double *)calloc(n1 * n2 * n3, sizeof(double));
+  sources = ws_fov_sources;
+  memset(sources, 0, n1 * n2 * n3 * sizeof(double));
   if (0)
   {
     double *s_x, *s_y, *s_z;
@@ -1442,9 +1530,6 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
   {
     fclose(debugfile);
   }
-  free(sources);
-  free_dvector(values, 0, nvar - 1);
-  free_derivs(&U, nvar);
 }
 /* --------------------------------------------------------------------------*/
 double TwoPunctures::norm_inf(double const *F, int const ntotal)
@@ -1850,11 +1935,12 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
 
   Derivatives_AB3(nvar, n1, n2, n3, dv);
 
+  values = ws_jtdv_values;
+  dU = ws_jtdv_dU;
+  U = ws_jtdv_U;
+
   for (i = 0; i < n1; i++)
   {
-    values = dvector(0, nvar - 1);
-    allocate_derivs(&dU, nvar);
-    allocate_derivs(&U, nvar);
     for (j = 0; j < n2; j++)
     {
       for (k = 0; k < n3; k++)
@@ -1908,9 +1994,6 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
         }
       }
     }
-    free_dvector(values, 0, nvar - 1);
-    free_derivs(&dU, nvar);
-    free_derivs(&U, nvar);
   }
 }
 /* --------------------------------------------------------------------------*/
@@ -1957,17 +2040,11 @@ void TwoPunctures::LineRelax_be(double *dv,
 {
   int j, m, Ic, Ip, Im, col, ivar;
 
-  double *diag = new double[n2];
-  double *e = new double[n2 - 1]; /* above diagonal */
-  double *f = new double[n2 - 1]; /* below diagonal */
-  double *b = new double[n2];     /* rhs */
-  double *x = new double[n2];     /* solution vector */
-
-  //  gsl_vector *diag = gsl_vector_alloc(n2);
-  //  gsl_vector *e = gsl_vector_alloc(n2-1); /* above diagonal */
-  //  gsl_vector *f = gsl_vector_alloc(n2-1); /* below diagonal */
-  //  gsl_vector *b = gsl_vector_alloc(n2);   /* rhs */
-  //  gsl_vector *x = gsl_vector_alloc(n2);   /* solution vector */
+  double *diag = ws_diag_be;
+  double *e = ws_e_be;     /* above diagonal */
+  double *f = ws_f_be;     /* below diagonal */
+  double *b = ws_b_be;     /* rhs */
+  double *x = ws_x_be;     /* solution vector */
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -1977,62 +2054,35 @@ void TwoPunctures::LineRelax_be(double *dv,
     }
     diag[n2 - 1] = 0;
 
-    //    gsl_vector_set_zero(diag);
-    //    gsl_vector_set_zero(e);
-    //    gsl_vector_set_zero(f);
     for (j = 0; j < n2; j++)
     {
       Ip = Index(ivar, i, j + 1, k, nvar, n1, n2, n3);
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       Im = Index(ivar, i, j - 1, k, nvar, n1, n2, n3);
       b[j] = rhs[Ic];
-      //      gsl_vector_set(b,j,rhs[Ic]);
       for (m = 0; m < ncols[Ic]; m++)
       {
         col = cols[Ic][m];
         if (col != Ip && col != Ic && col != Im)
           b[j] -= JFD[Ic][m] * dv[col];
-        //          *gsl_vector_ptr(b, j) -= JFD[Ic][m] * dv[col];
         else
         {
           if (col == Im && j > 0)
             f[j - 1] = JFD[Ic][m];
-          //            gsl_vector_set(f,j-1,JFD[Ic][m]);
           if (col == Ic)
             diag[j] = JFD[Ic][m];
-          //            gsl_vector_set(diag,j,JFD[Ic][m]);
           if (col == Ip && j < n2 - 1)
             e[j] = JFD[Ic][m];
-          //            gsl_vector_set(e,j,JFD[Ic][m]);
         }
       }
     }
-    //          A x = b
-    //          A = ( d_0 e_0  0   0  )
-    //              ( f_0 d_1 e_1  0  )
-    //              (  0  f_1 d_2 e_2 )
-    //              (  0   0  f_2 d_3 )
-    //
     ThomasAlgorithm(n2, f, diag, e, x, b);
-    //    gsl_linalg_solve_tridiag(diag, e, f, b, x);
     for (j = 0; j < n2; j++)
     {
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       dv[Ic] = x[j];
-      //      dv[Ic] = gsl_vector_get(x, j);
     }
   }
-
-  delete[] diag;
-  delete[] e;
-  delete[] f;
-  delete[] b;
-  delete[] x;
-  //  gsl_vector_free(diag);
-  //  gsl_vector_free(e);
-  //  gsl_vector_free(f);
-  //  gsl_vector_free(b);
-  //  gsl_vector_free(x);
 }
 /* --------------------------------------------------------------------------*/
 void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
@@ -2049,8 +2099,8 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
       ha, ga, ga2, hb, gb, gb2, hp, gp, gp2, gagb, gagp, gbgp;
   derivs dU, U;
 
-  allocate_derivs(&dU, nvar);
-  allocate_derivs(&U, nvar);
+  dU = ws_jfd_dU;
+  U = ws_jfd_U;
 
   if (k < 0)
     k = k + n3;
@@ -2168,9 +2218,6 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
   LinEquations(A, B, X, R, x, r, phi, y, z, dU, U, values);
   for (ivar = 0; ivar < nvar; ivar++)
     values[ivar] *= FAC;
-
-  free_derivs(&dU, nvar);
-  free_derivs(&U, nvar);
 }
 #undef FAC
 /*-----------------------------------------------------------*/
@@ -2202,17 +2249,11 @@ void TwoPunctures::LineRelax_al(double *dv,
 {
   int i, m, Ic, Ip, Im, col, ivar;
 
-  double *diag = new double[n1];
-  double *e = new double[n1 - 1]; /* above diagonal */
-  double *f = new double[n1 - 1]; /* below diagonal */
-  double *b = new double[n1];     /* rhs */
-  double *x = new double[n1];     /* solution vector */
-
-  //  gsl_vector *diag = gsl_vector_alloc(n1);
-  //  gsl_vector *e = gsl_vector_alloc(n1-1); /* above diagonal */
-  //  gsl_vector *f = gsl_vector_alloc(n1-1); /* below diagonal */
-  //  gsl_vector *b = gsl_vector_alloc(n1);   /* rhs */
-  //  gsl_vector *x = gsl_vector_alloc(n1);   /* solution vector */
+  double *diag = ws_diag_al;
+  double *e = ws_e_al;     /* above diagonal */
+  double *f = ws_f_al;     /* below diagonal */
+  double *b = ws_b_al;     /* rhs */
+  double *x = ws_x_al;     /* solution vector */
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -2222,57 +2263,35 @@ void TwoPunctures::LineRelax_al(double *dv,
     }
     diag[n1 - 1] = 0;
 
-    //    gsl_vector_set_zero(diag);
-    //    gsl_vector_set_zero(e);
-    //    gsl_vector_set_zero(f);
     for (i = 0; i < n1; i++)
     {
       Ip = Index(ivar, i + 1, j, k, nvar, n1, n2, n3);
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       Im = Index(ivar, i - 1, j, k, nvar, n1, n2, n3);
       b[i] = rhs[Ic];
-      //      gsl_vector_set(b,i,rhs[Ic]);
       for (m = 0; m < ncols[Ic]; m++)
       {
         col = cols[Ic][m];
         if (col != Ip && col != Ic && col != Im)
           b[i] -= JFD[Ic][m] * dv[col];
-        //          *gsl_vector_ptr(b, i) -= JFD[Ic][m] * dv[col];
         else
         {
           if (col == Im && i > 0)
             f[i - 1] = JFD[Ic][m];
-          //            gsl_vector_set(f,i-1,JFD[Ic][m]);
           if (col == Ic)
             diag[i] = JFD[Ic][m];
-          //            gsl_vector_set(diag,i,JFD[Ic][m]);
           if (col == Ip && i < n1 - 1)
             e[i] = JFD[Ic][m];
-          //            gsl_vector_set(e,i,JFD[Ic][m]);
         }
       }
     }
     ThomasAlgorithm(n1, f, diag, e, x, b);
-    //    gsl_linalg_solve_tridiag(diag, e, f, b, x);
     for (i = 0; i < n1; i++)
     {
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       dv[Ic] = x[i];
-      //      dv[Ic] = gsl_vector_get(x, i);
     }
   }
-
-  delete[] diag;
-  delete[] e;
-  delete[] f;
-  delete[] b;
-  delete[] x;
-
-  //  gsl_vector_free(diag);
-  //  gsl_vector_free(e);
-  //  gsl_vector_free(f);
-  //  gsl_vector_free(b);
-  //  gsl_vector_free(x);
 }
 /* -------------------------------------------------------------------------*/
 // a[N], b[N-1], c[N-1], x[N], q[N]
@@ -2284,44 +2303,29 @@ void TwoPunctures::LineRelax_al(double *dv,
 //"Parallel Scientific Computing in C++ and MPI" P361
 void TwoPunctures::ThomasAlgorithm(int N, double *b, double *a, double *c, double *x, double *q)
 {
+  // In-place Thomas algorithm: uses a[] as d workspace, b[] as l workspace.
+  // c[] is already u (above-diagonal). ws_thomas_y is pre-allocated workspace.
   int i;
-  double *l, *u, *d, *y;
-  l = new double[N - 1];
-  u = new double[N - 1];
-  d = new double[N];
-  y = new double[N];
-
-  /* LU Decomposition */
-  d[0] = a[0];
-  u[0] = c[0];
+  double *y = ws_thomas_y;
 
+  /* LU Decomposition (in-place: a becomes d, b becomes l) */
   for (i = 0; i < N - 2; i++)
   {
-    l[i] = b[i] / d[i];
-    d[i + 1] = a[i + 1] - l[i] * u[i];
-    u[i + 1] = c[i + 1];
+    b[i] = b[i] / a[i];
+    a[i + 1] = a[i + 1] - b[i] * c[i];
   }
-
-  l[N - 2] = b[N - 2] / d[N - 2];
-  d[N - 1] = a[N - 1] - l[N - 2] * u[N - 2];
+  b[N - 2] = b[N - 2] / a[N - 2];
+  a[N - 1] = a[N - 1] - b[N - 2] * c[N - 2];
 
   /* Forward Substitution [L][y] = [q] */
   y[0] = q[0];
   for (i = 1; i < N; i++)
-    y[i] = q[i] - l[i - 1] * y[i - 1];
+    y[i] = q[i] - b[i - 1] * y[i - 1];
 
   /* Backward Substitution [U][x] = [y] */
-  x[N - 1] = y[N - 1] / d[N - 1];
-
+  x[N - 1] = y[N - 1] / a[N - 1];
   for (i = N - 2; i >= 0; i--)
-    x[i] = (y[i] - u[i] * x[i + 1]) / d[i];
-
-  delete[] l;
-  delete[] u;
-  delete[] d;
-  delete[] y;
-
-  return;
+    x[i] = (y[i] - c[i] * x[i + 1]) / a[i];
 }
 // --------------------------------------------------------------------------*/
 // Calculates the value of v at an arbitrary position (x,y,z) if the spectral coefficients are know*/*/
diff --git a/AMSS_NCKU_source/TwoPunctures.h b/AMSS_NCKU_source/TwoPunctures.h
index 22fb359..6233d59 100644
--- a/AMSS_NCKU_source/TwoPunctures.h
+++ b/AMSS_NCKU_source/TwoPunctures.h
@@ -42,6 +42,33 @@ private:
 
        int ntotal;
 
+       // Pre-allocated workspace buffers for hot-path allocation elimination
+       // LineRelax_be workspace (sized for n2)
+       double *ws_diag_be, *ws_e_be, *ws_f_be, *ws_b_be, *ws_x_be;
+       // LineRelax_al workspace (sized for n1)
+       double *ws_diag_al, *ws_e_al, *ws_f_al, *ws_b_al, *ws_x_al;
+       // ThomasAlgorithm workspace (sized for max(n1,n2))
+       double *ws_thomas_y;
+       // JFD_times_dv workspace (sized for nvar)
+       double *ws_jfd_values;
+       derivs ws_jfd_dU, ws_jfd_U;
+       // chebft_Zeros workspace (sized for max(n1,n2,n3)+1)
+       double *ws_cheb_c;
+       // fourft workspace (sized for max(n1,n2,n3)/2+1 each)
+       double *ws_four_a, *ws_four_b;
+       // Derivatives_AB3 workspace
+       double *ws_deriv_p, *ws_deriv_dp, *ws_deriv_d2p;
+       double *ws_deriv_q, *ws_deriv_dq;
+       double *ws_deriv_r, *ws_deriv_dr;
+       int *ws_deriv_indx;
+       // F_of_v workspace
+       double *ws_fov_sources;
+       double *ws_fov_values;
+       derivs ws_fov_U;
+       // J_times_dv workspace
+       double *ws_jtdv_values;
+       derivs ws_jtdv_dU, ws_jtdv_U;
+
        struct parameters
        {
               int nvar, n1, n2, n3;

From 03d501db042b1559aed0c9b8754cc5f33108a3d7 Mon Sep 17 00:00:00 2001
From: ianchb <i@4t.pw>
Date: Fri, 6 Feb 2026 21:27:41 +0800
Subject: [PATCH 14/30] Display the runtime of TwoPunctures

---
 makefile_and_run.py | 8 +++++---
 1 file changed, 5 insertions(+), 3 deletions(-)

diff --git a/makefile_and_run.py b/makefile_and_run.py
index 72ded5b..4f00100 100755
--- a/makefile_and_run.py
+++ b/makefile_and_run.py
@@ -10,7 +10,7 @@
 
 import AMSS_NCKU_Input as input_data
 import subprocess
-
+import time
 ## CPU core binding configuration using taskset
 ## taskset ensures all child processes inherit the CPU affinity mask
 ## This forces make and all compiler processes to use only nohz_full cores (4-55, 60-111)
@@ -152,7 +152,7 @@ def run_ABE():
 ## Run the AMSS-NCKU TwoPuncture program TwoPunctureABE
 
 def run_TwoPunctureABE():
-
+    tp_time1=time.time()
     print(                                                          )
     print( " Running the AMSS-NCKU executable file TwoPunctureABE " ) 
     print(                                                          )
@@ -179,7 +179,9 @@ def run_TwoPunctureABE():
     print(                                               )
     print( " The TwoPunctureABE simulation is finished " ) 
     print(                                               )
-    
+    tp_time2=time.time()
+    et=tp_time2-tp_time1
+    print(f"Used time: {et}")
     return
 
 ##################################################################

From f5ed23d6872d5a6aa96016666928d2dd7bde349c Mon Sep 17 00:00:00 2001
From: ianchb <i@4t.pw>
Date: Sat, 7 Feb 2026 10:35:05 +0800
Subject: [PATCH 15/30] Revert "Eliminate hot-path heap allocations in
 TwoPunctures spectral solver"

This reverts commit 09ffdb553d69f426584500969e63c868a19f638a.
---
 AMSS_NCKU_source/TwoPunctures.C | 276 ++++++++++++++++----------------
 AMSS_NCKU_source/TwoPunctures.h |  27 ----
 2 files changed, 136 insertions(+), 167 deletions(-)

diff --git a/AMSS_NCKU_source/TwoPunctures.C b/AMSS_NCKU_source/TwoPunctures.C
index dbb424e..a5b0c85 100644
--- a/AMSS_NCKU_source/TwoPunctures.C
+++ b/AMSS_NCKU_source/TwoPunctures.C
@@ -5,7 +5,6 @@
 #include <cstdio>
 #include <cstdlib>
 #include <string>
-#include <cstring>
 #include <iostream>
 #include <iomanip>
 #include <fstream>
@@ -61,110 +60,13 @@ TwoPunctures::TwoPunctures(double mp, double mm, double b,
   F = dvector(0, ntotal - 1);
   allocate_derivs(&u, ntotal);
   allocate_derivs(&v, ntotal);
-
-  // Allocate workspace buffers for hot-path allocation elimination
-  int N = maximum3(n1, n2, n3);
-  int maxn = maximum2(n1, n2);
-
-  // LineRelax_be workspace (sized for n2)
-  ws_diag_be = new double[n2];
-  ws_e_be = new double[n2 - 1];
-  ws_f_be = new double[n2 - 1];
-  ws_b_be = new double[n2];
-  ws_x_be = new double[n2];
-
-  // LineRelax_al workspace (sized for n1)
-  ws_diag_al = new double[n1];
-  ws_e_al = new double[n1 - 1];
-  ws_f_al = new double[n1 - 1];
-  ws_b_al = new double[n1];
-  ws_x_al = new double[n1];
-
-  // ThomasAlgorithm workspace (sized for max(n1,n2))
-  ws_thomas_y = new double[maxn];
-
-  // JFD_times_dv workspace (sized for nvar)
-  ws_jfd_values = dvector(0, nvar - 1);
-  allocate_derivs(&ws_jfd_dU, nvar);
-  allocate_derivs(&ws_jfd_U, nvar);
-
-  // chebft_Zeros workspace (sized for N+1)
-  ws_cheb_c = dvector(0, N);
-
-  // fourft workspace (sized for N/2+1 each)
-  ws_four_a = dvector(0, N / 2);
-  ws_four_b = dvector(0, N / 2);
-
-  // Derivatives_AB3 workspace
-  ws_deriv_p = dvector(0, N);
-  ws_deriv_dp = dvector(0, N);
-  ws_deriv_d2p = dvector(0, N);
-  ws_deriv_q = dvector(0, N);
-  ws_deriv_dq = dvector(0, N);
-  ws_deriv_r = dvector(0, N);
-  ws_deriv_dr = dvector(0, N);
-  ws_deriv_indx = ivector(0, N);
-
-  // F_of_v workspace
-  ws_fov_sources = new double[n1 * n2 * n3];
-  ws_fov_values = dvector(0, nvar - 1);
-  allocate_derivs(&ws_fov_U, nvar);
-
-  // J_times_dv workspace
-  ws_jtdv_values = dvector(0, nvar - 1);
-  allocate_derivs(&ws_jtdv_dU, nvar);
-  allocate_derivs(&ws_jtdv_U, nvar);
 }
 
 TwoPunctures::~TwoPunctures()
 {
-  int const nvar = 1, n1 = npoints_A, n2 = npoints_B, n3 = npoints_phi;
-  int N = maximum3(n1, n2, n3);
-
   free_dvector(F, 0, ntotal - 1);
   free_derivs(&u, ntotal);
   free_derivs(&v, ntotal);
-
-  // Free workspace buffers
-  delete[] ws_diag_be;
-  delete[] ws_e_be;
-  delete[] ws_f_be;
-  delete[] ws_b_be;
-  delete[] ws_x_be;
-
-  delete[] ws_diag_al;
-  delete[] ws_e_al;
-  delete[] ws_f_al;
-  delete[] ws_b_al;
-  delete[] ws_x_al;
-
-  delete[] ws_thomas_y;
-
-  free_dvector(ws_jfd_values, 0, nvar - 1);
-  free_derivs(&ws_jfd_dU, nvar);
-  free_derivs(&ws_jfd_U, nvar);
-
-  free_dvector(ws_cheb_c, 0, N);
-
-  free_dvector(ws_four_a, 0, N / 2);
-  free_dvector(ws_four_b, 0, N / 2);
-
-  free_dvector(ws_deriv_p, 0, N);
-  free_dvector(ws_deriv_dp, 0, N);
-  free_dvector(ws_deriv_d2p, 0, N);
-  free_dvector(ws_deriv_q, 0, N);
-  free_dvector(ws_deriv_dq, 0, N);
-  free_dvector(ws_deriv_r, 0, N);
-  free_dvector(ws_deriv_dr, 0, N);
-  free_ivector(ws_deriv_indx, 0, N);
-
-  delete[] ws_fov_sources;
-  free_dvector(ws_fov_values, 0, nvar - 1);
-  free_derivs(&ws_fov_U, nvar);
-
-  free_dvector(ws_jtdv_values, 0, nvar - 1);
-  free_derivs(&ws_jtdv_dU, nvar);
-  free_derivs(&ws_jtdv_U, nvar);
 }
 
 void TwoPunctures::Solve()
@@ -753,7 +655,7 @@ void TwoPunctures::chebft_Zeros(double u[], int n, int inv)
   int k, j, isignum;
   double fac, sum, Pion, *c;
 
-  c = ws_cheb_c;
+  c = dvector(0, n);
   Pion = Pi / n;
   if (inv == 0)
   {
@@ -784,6 +686,7 @@ void TwoPunctures::chebft_Zeros(double u[], int n, int inv)
   }
   for (j = 0; j < n; j++)
     u[j] = c[j];
+  free_dvector(c, 0, n);
 }
 
 /* --------------------------------------------------------------------------*/
@@ -871,8 +774,8 @@ void TwoPunctures::fourft(double *u, int N, int inv)
   double x, x1, fac, Pi_fac, *a, *b;
 
   M = N / 2;
-  a = ws_four_a;
-  b = ws_four_b - 1; /* offset to match dvector(1,M) indexing */
+  a = dvector(0, M);
+  b = dvector(1, M); /* Actually: b=vector(1,M-1) but this is problematic if M=1*/
   fac = 1. / M;
   Pi_fac = Pi * fac;
   if (inv == 0)
@@ -921,6 +824,8 @@ void TwoPunctures::fourft(double *u, int N, int inv)
       iy = -iy;
     }
   }
+  free_dvector(a, 0, M);
+  free_dvector(b, 1, M);
 }
 
 /* -----------------------------------------*/
@@ -1213,14 +1118,14 @@ void TwoPunctures::Derivatives_AB3(int nvar, int n1, int n2, int n3, derivs v)
   double *p, *dp, *d2p, *q, *dq, *r, *dr;
 
   N = maximum3(n1, n2, n3);
-  p = ws_deriv_p;
-  dp = ws_deriv_dp;
-  d2p = ws_deriv_d2p;
-  q = ws_deriv_q;
-  dq = ws_deriv_dq;
-  r = ws_deriv_r;
-  dr = ws_deriv_dr;
-  indx = ws_deriv_indx;
+  p = dvector(0, N);
+  dp = dvector(0, N);
+  d2p = dvector(0, N);
+  q = dvector(0, N);
+  dq = dvector(0, N);
+  r = dvector(0, N);
+  dr = dvector(0, N);
+  indx = ivector(0, N);
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -1303,6 +1208,14 @@ void TwoPunctures::Derivatives_AB3(int nvar, int n1, int n2, int n3, derivs v)
       }
     }
   }
+  free_dvector(p, 0, N);
+  free_dvector(dp, 0, N);
+  free_dvector(d2p, 0, N);
+  free_dvector(q, 0, N);
+  free_dvector(dq, 0, N);
+  free_dvector(r, 0, N);
+  free_dvector(dr, 0, N);
+  free_ivector(indx, 0, N);
 }
 /* --------------------------------------------------------------------------*/
 void TwoPunctures::Newton(int const nvar, int const n1, int const n2, int const n3,
@@ -1371,11 +1284,10 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
   derivs U;
   double *sources;
 
-  values = ws_fov_values;
-  U = ws_fov_U;
+  values = dvector(0, nvar - 1);
+  allocate_derivs(&U, nvar);
 
-  sources = ws_fov_sources;
-  memset(sources, 0, n1 * n2 * n3 * sizeof(double));
+  sources = (double *)calloc(n1 * n2 * n3, sizeof(double));
   if (0)
   {
     double *s_x, *s_y, *s_z;
@@ -1530,6 +1442,9 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
   {
     fclose(debugfile);
   }
+  free(sources);
+  free_dvector(values, 0, nvar - 1);
+  free_derivs(&U, nvar);
 }
 /* --------------------------------------------------------------------------*/
 double TwoPunctures::norm_inf(double const *F, int const ntotal)
@@ -1935,12 +1850,11 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
 
   Derivatives_AB3(nvar, n1, n2, n3, dv);
 
-  values = ws_jtdv_values;
-  dU = ws_jtdv_dU;
-  U = ws_jtdv_U;
-
   for (i = 0; i < n1; i++)
   {
+    values = dvector(0, nvar - 1);
+    allocate_derivs(&dU, nvar);
+    allocate_derivs(&U, nvar);
     for (j = 0; j < n2; j++)
     {
       for (k = 0; k < n3; k++)
@@ -1994,6 +1908,9 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
         }
       }
     }
+    free_dvector(values, 0, nvar - 1);
+    free_derivs(&dU, nvar);
+    free_derivs(&U, nvar);
   }
 }
 /* --------------------------------------------------------------------------*/
@@ -2040,11 +1957,17 @@ void TwoPunctures::LineRelax_be(double *dv,
 {
   int j, m, Ic, Ip, Im, col, ivar;
 
-  double *diag = ws_diag_be;
-  double *e = ws_e_be;     /* above diagonal */
-  double *f = ws_f_be;     /* below diagonal */
-  double *b = ws_b_be;     /* rhs */
-  double *x = ws_x_be;     /* solution vector */
+  double *diag = new double[n2];
+  double *e = new double[n2 - 1]; /* above diagonal */
+  double *f = new double[n2 - 1]; /* below diagonal */
+  double *b = new double[n2];     /* rhs */
+  double *x = new double[n2];     /* solution vector */
+
+  //  gsl_vector *diag = gsl_vector_alloc(n2);
+  //  gsl_vector *e = gsl_vector_alloc(n2-1); /* above diagonal */
+  //  gsl_vector *f = gsl_vector_alloc(n2-1); /* below diagonal */
+  //  gsl_vector *b = gsl_vector_alloc(n2);   /* rhs */
+  //  gsl_vector *x = gsl_vector_alloc(n2);   /* solution vector */
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -2054,35 +1977,62 @@ void TwoPunctures::LineRelax_be(double *dv,
     }
     diag[n2 - 1] = 0;
 
+    //    gsl_vector_set_zero(diag);
+    //    gsl_vector_set_zero(e);
+    //    gsl_vector_set_zero(f);
     for (j = 0; j < n2; j++)
     {
       Ip = Index(ivar, i, j + 1, k, nvar, n1, n2, n3);
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       Im = Index(ivar, i, j - 1, k, nvar, n1, n2, n3);
       b[j] = rhs[Ic];
+      //      gsl_vector_set(b,j,rhs[Ic]);
       for (m = 0; m < ncols[Ic]; m++)
       {
         col = cols[Ic][m];
         if (col != Ip && col != Ic && col != Im)
           b[j] -= JFD[Ic][m] * dv[col];
+        //          *gsl_vector_ptr(b, j) -= JFD[Ic][m] * dv[col];
         else
         {
           if (col == Im && j > 0)
             f[j - 1] = JFD[Ic][m];
+          //            gsl_vector_set(f,j-1,JFD[Ic][m]);
           if (col == Ic)
             diag[j] = JFD[Ic][m];
+          //            gsl_vector_set(diag,j,JFD[Ic][m]);
           if (col == Ip && j < n2 - 1)
             e[j] = JFD[Ic][m];
+          //            gsl_vector_set(e,j,JFD[Ic][m]);
         }
       }
     }
+    //          A x = b
+    //          A = ( d_0 e_0  0   0  )
+    //              ( f_0 d_1 e_1  0  )
+    //              (  0  f_1 d_2 e_2 )
+    //              (  0   0  f_2 d_3 )
+    //
     ThomasAlgorithm(n2, f, diag, e, x, b);
+    //    gsl_linalg_solve_tridiag(diag, e, f, b, x);
     for (j = 0; j < n2; j++)
     {
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       dv[Ic] = x[j];
+      //      dv[Ic] = gsl_vector_get(x, j);
     }
   }
+
+  delete[] diag;
+  delete[] e;
+  delete[] f;
+  delete[] b;
+  delete[] x;
+  //  gsl_vector_free(diag);
+  //  gsl_vector_free(e);
+  //  gsl_vector_free(f);
+  //  gsl_vector_free(b);
+  //  gsl_vector_free(x);
 }
 /* --------------------------------------------------------------------------*/
 void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
@@ -2099,8 +2049,8 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
       ha, ga, ga2, hb, gb, gb2, hp, gp, gp2, gagb, gagp, gbgp;
   derivs dU, U;
 
-  dU = ws_jfd_dU;
-  U = ws_jfd_U;
+  allocate_derivs(&dU, nvar);
+  allocate_derivs(&U, nvar);
 
   if (k < 0)
     k = k + n3;
@@ -2218,6 +2168,9 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
   LinEquations(A, B, X, R, x, r, phi, y, z, dU, U, values);
   for (ivar = 0; ivar < nvar; ivar++)
     values[ivar] *= FAC;
+
+  free_derivs(&dU, nvar);
+  free_derivs(&U, nvar);
 }
 #undef FAC
 /*-----------------------------------------------------------*/
@@ -2249,11 +2202,17 @@ void TwoPunctures::LineRelax_al(double *dv,
 {
   int i, m, Ic, Ip, Im, col, ivar;
 
-  double *diag = ws_diag_al;
-  double *e = ws_e_al;     /* above diagonal */
-  double *f = ws_f_al;     /* below diagonal */
-  double *b = ws_b_al;     /* rhs */
-  double *x = ws_x_al;     /* solution vector */
+  double *diag = new double[n1];
+  double *e = new double[n1 - 1]; /* above diagonal */
+  double *f = new double[n1 - 1]; /* below diagonal */
+  double *b = new double[n1];     /* rhs */
+  double *x = new double[n1];     /* solution vector */
+
+  //  gsl_vector *diag = gsl_vector_alloc(n1);
+  //  gsl_vector *e = gsl_vector_alloc(n1-1); /* above diagonal */
+  //  gsl_vector *f = gsl_vector_alloc(n1-1); /* below diagonal */
+  //  gsl_vector *b = gsl_vector_alloc(n1);   /* rhs */
+  //  gsl_vector *x = gsl_vector_alloc(n1);   /* solution vector */
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -2263,35 +2222,57 @@ void TwoPunctures::LineRelax_al(double *dv,
     }
     diag[n1 - 1] = 0;
 
+    //    gsl_vector_set_zero(diag);
+    //    gsl_vector_set_zero(e);
+    //    gsl_vector_set_zero(f);
     for (i = 0; i < n1; i++)
     {
       Ip = Index(ivar, i + 1, j, k, nvar, n1, n2, n3);
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       Im = Index(ivar, i - 1, j, k, nvar, n1, n2, n3);
       b[i] = rhs[Ic];
+      //      gsl_vector_set(b,i,rhs[Ic]);
       for (m = 0; m < ncols[Ic]; m++)
       {
         col = cols[Ic][m];
         if (col != Ip && col != Ic && col != Im)
           b[i] -= JFD[Ic][m] * dv[col];
+        //          *gsl_vector_ptr(b, i) -= JFD[Ic][m] * dv[col];
         else
         {
           if (col == Im && i > 0)
             f[i - 1] = JFD[Ic][m];
+          //            gsl_vector_set(f,i-1,JFD[Ic][m]);
           if (col == Ic)
             diag[i] = JFD[Ic][m];
+          //            gsl_vector_set(diag,i,JFD[Ic][m]);
           if (col == Ip && i < n1 - 1)
             e[i] = JFD[Ic][m];
+          //            gsl_vector_set(e,i,JFD[Ic][m]);
         }
       }
     }
     ThomasAlgorithm(n1, f, diag, e, x, b);
+    //    gsl_linalg_solve_tridiag(diag, e, f, b, x);
     for (i = 0; i < n1; i++)
     {
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
       dv[Ic] = x[i];
+      //      dv[Ic] = gsl_vector_get(x, i);
     }
   }
+
+  delete[] diag;
+  delete[] e;
+  delete[] f;
+  delete[] b;
+  delete[] x;
+
+  //  gsl_vector_free(diag);
+  //  gsl_vector_free(e);
+  //  gsl_vector_free(f);
+  //  gsl_vector_free(b);
+  //  gsl_vector_free(x);
 }
 /* -------------------------------------------------------------------------*/
 // a[N], b[N-1], c[N-1], x[N], q[N]
@@ -2303,29 +2284,44 @@ void TwoPunctures::LineRelax_al(double *dv,
 //"Parallel Scientific Computing in C++ and MPI" P361
 void TwoPunctures::ThomasAlgorithm(int N, double *b, double *a, double *c, double *x, double *q)
 {
-  // In-place Thomas algorithm: uses a[] as d workspace, b[] as l workspace.
-  // c[] is already u (above-diagonal). ws_thomas_y is pre-allocated workspace.
   int i;
-  double *y = ws_thomas_y;
+  double *l, *u, *d, *y;
+  l = new double[N - 1];
+  u = new double[N - 1];
+  d = new double[N];
+  y = new double[N];
+
+  /* LU Decomposition */
+  d[0] = a[0];
+  u[0] = c[0];
 
-  /* LU Decomposition (in-place: a becomes d, b becomes l) */
   for (i = 0; i < N - 2; i++)
   {
-    b[i] = b[i] / a[i];
-    a[i + 1] = a[i + 1] - b[i] * c[i];
+    l[i] = b[i] / d[i];
+    d[i + 1] = a[i + 1] - l[i] * u[i];
+    u[i + 1] = c[i + 1];
   }
-  b[N - 2] = b[N - 2] / a[N - 2];
-  a[N - 1] = a[N - 1] - b[N - 2] * c[N - 2];
+
+  l[N - 2] = b[N - 2] / d[N - 2];
+  d[N - 1] = a[N - 1] - l[N - 2] * u[N - 2];
 
   /* Forward Substitution [L][y] = [q] */
   y[0] = q[0];
   for (i = 1; i < N; i++)
-    y[i] = q[i] - b[i - 1] * y[i - 1];
+    y[i] = q[i] - l[i - 1] * y[i - 1];
 
   /* Backward Substitution [U][x] = [y] */
-  x[N - 1] = y[N - 1] / a[N - 1];
+  x[N - 1] = y[N - 1] / d[N - 1];
+
   for (i = N - 2; i >= 0; i--)
-    x[i] = (y[i] - c[i] * x[i + 1]) / a[i];
+    x[i] = (y[i] - u[i] * x[i + 1]) / d[i];
+
+  delete[] l;
+  delete[] u;
+  delete[] d;
+  delete[] y;
+
+  return;
 }
 // --------------------------------------------------------------------------*/
 // Calculates the value of v at an arbitrary position (x,y,z) if the spectral coefficients are know*/*/
diff --git a/AMSS_NCKU_source/TwoPunctures.h b/AMSS_NCKU_source/TwoPunctures.h
index 6233d59..22fb359 100644
--- a/AMSS_NCKU_source/TwoPunctures.h
+++ b/AMSS_NCKU_source/TwoPunctures.h
@@ -42,33 +42,6 @@ private:
 
        int ntotal;
 
-       // Pre-allocated workspace buffers for hot-path allocation elimination
-       // LineRelax_be workspace (sized for n2)
-       double *ws_diag_be, *ws_e_be, *ws_f_be, *ws_b_be, *ws_x_be;
-       // LineRelax_al workspace (sized for n1)
-       double *ws_diag_al, *ws_e_al, *ws_f_al, *ws_b_al, *ws_x_al;
-       // ThomasAlgorithm workspace (sized for max(n1,n2))
-       double *ws_thomas_y;
-       // JFD_times_dv workspace (sized for nvar)
-       double *ws_jfd_values;
-       derivs ws_jfd_dU, ws_jfd_U;
-       // chebft_Zeros workspace (sized for max(n1,n2,n3)+1)
-       double *ws_cheb_c;
-       // fourft workspace (sized for max(n1,n2,n3)/2+1 each)
-       double *ws_four_a, *ws_four_b;
-       // Derivatives_AB3 workspace
-       double *ws_deriv_p, *ws_deriv_dp, *ws_deriv_d2p;
-       double *ws_deriv_q, *ws_deriv_dq;
-       double *ws_deriv_r, *ws_deriv_dr;
-       int *ws_deriv_indx;
-       // F_of_v workspace
-       double *ws_fov_sources;
-       double *ws_fov_values;
-       derivs ws_fov_U;
-       // J_times_dv workspace
-       double *ws_jtdv_values;
-       derivs ws_jtdv_dU, ws_jtdv_U;
-
        struct parameters
        {
               int nvar, n1, n2, n3;

From f345b0e520402cc5e97a0a102560573353e29fb3 Mon Sep 17 00:00:00 2001
From: ianchb <i@4t.pw>
Date: Sat, 7 Feb 2026 14:46:46 +0800
Subject: [PATCH 16/30] Performance optimization for the TwoPunctures module *
 Re-enabled OpenMP.

1. Batch spectral derivatives (Chebyshev & Fourier) via precomputed matrices:
Chebyshev/Fourier transforms and derivatives are precomputed as explicit physical-space operator matrices.
Batch DGEMM now applies to entire tensor fields, mathematically identical to original per-line transforms but vastly faster.

2. Gauss-Seidel relaxation & tridiagonal solver workspace reuse:
Per-thread reusable workspaces replace per-call heap new/delete in all tridiagonal and relaxation routines.

3. Efficient OpenMP multithreading throughout relaxation/deriv:
relax_omp and friends parallelize over grouped lines/planes, maximizing threading efficiency and memory independence.

Co-authored-by: copilot-swe-agent[bot] <198982749+copilot@users.noreply.github.com>
---
 AMSS_NCKU_source/TwoPunctures.C | 1074 +++++++++++++++++++++++++------
 AMSS_NCKU_source/TwoPunctures.h |   53 +-
 AMSS_NCKU_source/makefile.inc   |    5 +-
 3 files changed, 917 insertions(+), 215 deletions(-)

diff --git a/AMSS_NCKU_source/TwoPunctures.C b/AMSS_NCKU_source/TwoPunctures.C
index a5b0c85..ea84474 100644
--- a/AMSS_NCKU_source/TwoPunctures.C
+++ b/AMSS_NCKU_source/TwoPunctures.C
@@ -60,6 +60,10 @@ TwoPunctures::TwoPunctures(double mp, double mm, double b,
   F = dvector(0, ntotal - 1);
   allocate_derivs(&u, ntotal);
   allocate_derivs(&v, ntotal);
+  D1_A = NULL; D2_A = NULL; D1_B = NULL; D2_B = NULL;
+  DF1_phi = NULL; DF2_phi = NULL;
+  precompute_derivative_matrices();
+  allocate_workspace();
 }
 
 TwoPunctures::~TwoPunctures()
@@ -67,6 +71,13 @@ TwoPunctures::~TwoPunctures()
   free_dvector(F, 0, ntotal - 1);
   free_derivs(&u, ntotal);
   free_derivs(&v, ntotal);
+  free_workspace();
+  if (D1_A)    delete[] D1_A;
+  if (D2_A)    delete[] D2_A;
+  if (D1_B)    delete[] D1_B;
+  if (D2_B)    delete[] D2_B;
+  if (DF1_phi) delete[] DF1_phi;
+  if (DF2_phi) delete[] DF2_phi;
 }
 
 void TwoPunctures::Solve()
@@ -303,7 +314,7 @@ void TwoPunctures::set_initial_guess(derivs v)
           v.d0[indx] = 0;                                     // set initial guess 0
           v.d0[indx] /= (-cos(Pih * (2 * i + 1) / n1) - 1.0); // PRD 70, 064011 (2004) Eq.(5), from u to U
         }
-  Derivatives_AB3(nvar, n1, n2, n3, v);
+  Derivatives_AB3_MatMul(nvar, n1, n2, n3, v);
   if (0)
   {
     debug_file = fopen("initial.dat", "w");
@@ -1284,9 +1295,6 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
   derivs U;
   double *sources;
 
-  values = dvector(0, nvar - 1);
-  allocate_derivs(&U, nvar);
-
   sources = (double *)calloc(n1 * n2 * n3, sizeof(double));
   if (0)
   {
@@ -1343,7 +1351,7 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
         for (k = 0; k < n3; k++)
           sources[Index(0, i, j, k, 1, n1, n2, n3)] = 0.0;
 
-  Derivatives_AB3(nvar, n1, n2, n3, v);
+  Derivatives_AB3_MatMul(nvar, n1, n2, n3, v);
   double psi, psi2, psi4, psi7, r_plus, r_minus;
   FILE *debugfile = NULL;
   if (0)
@@ -1351,12 +1359,22 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
     debugfile = fopen("res.dat", "w");
     assert(debugfile);
   }
+  #pragma omp parallel for collapse(3) schedule(static) \
+    private(i, j, k, ivar, indx, al, be, A, B, X, R, x, r, phi, y, z, Am1, \
+            psi, psi2, psi4, psi7, r_plus, r_minus)
   for (i = 0; i < n1; i++)
   {
     for (j = 0; j < n2; j++)
     {
       for (k = 0; k < n3; k++)
       {
+        double l_values[1];  // nvar=1, stack-allocated
+        derivs l_U;
+        double l_U_d0[1], l_U_d1[1], l_U_d2[1], l_U_d3[1];
+        double l_U_d11[1], l_U_d12[1], l_U_d13[1], l_U_d22[1], l_U_d23[1], l_U_d33[1];
+        l_U.d0 = l_U_d0; l_U.d1 = l_U_d1; l_U.d2 = l_U_d2; l_U.d3 = l_U_d3;
+        l_U.d11 = l_U_d11; l_U.d12 = l_U_d12; l_U.d13 = l_U_d13;
+        l_U.d22 = l_U_d22; l_U.d23 = l_U_d23; l_U.d33 = l_U_d33;
 
         al = Pih * (2 * i + 1) / n1;
         A = -cos(al);
@@ -1368,72 +1386,36 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
         for (ivar = 0; ivar < nvar; ivar++)
         {
           indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
-          U.d0[ivar] = Am1 * v.d0[indx];                    /* U*/
-          U.d1[ivar] = v.d0[indx] + Am1 * v.d1[indx];       /* U_A*/
-          U.d2[ivar] = Am1 * v.d2[indx];                    /* U_B*/
-          U.d3[ivar] = Am1 * v.d3[indx];                    /* U_3*/
-          U.d11[ivar] = 2 * v.d1[indx] + Am1 * v.d11[indx]; /* U_AA*/
-          U.d12[ivar] = v.d2[indx] + Am1 * v.d12[indx];     /* U_AB*/
-          U.d13[ivar] = v.d3[indx] + Am1 * v.d13[indx];     /* U_AB*/
-          U.d22[ivar] = Am1 * v.d22[indx];                  /* U_BB*/
-          U.d23[ivar] = Am1 * v.d23[indx];                  /* U_B3*/
-          U.d33[ivar] = Am1 * v.d33[indx];                  /* U_33*/
+          l_U.d0[ivar] = Am1 * v.d0[indx];
+          l_U.d1[ivar] = v.d0[indx] + Am1 * v.d1[indx];
+          l_U.d2[ivar] = Am1 * v.d2[indx];
+          l_U.d3[ivar] = Am1 * v.d3[indx];
+          l_U.d11[ivar] = 2 * v.d1[indx] + Am1 * v.d11[indx];
+          l_U.d12[ivar] = v.d2[indx] + Am1 * v.d12[indx];
+          l_U.d13[ivar] = v.d3[indx] + Am1 * v.d13[indx];
+          l_U.d22[ivar] = Am1 * v.d22[indx];
+          l_U.d23[ivar] = Am1 * v.d23[indx];
+          l_U.d33[ivar] = Am1 * v.d33[indx];
         }
-        /* Calculation of (X,R) and*/
-        /* (U_X, U_R, U_3, U_XX, U_XR, U_X3, U_RR, U_R3, U_33)*/
-        AB_To_XR(nvar, A, B, &X, &R, U);
-        /* Calculation of (x,r) and*/
-        /* (U, U_x, U_r, U_3, U_xx, U_xr, U_x3, U_rr, U_r3, U_33)*/
-        C_To_c(nvar, X, R, &x, &r, U);
-        /* Calculation of (y,z) and*/
-        /* (U, U_x, U_y, U_z, U_xx, U_xy, U_xz, U_yy, U_yz, U_zz)*/
-        rx3_To_xyz(nvar, x, r, phi, &y, &z, U);
+        AB_To_XR(nvar, A, B, &X, &R, l_U);
+        C_To_c(nvar, X, R, &x, &r, l_U);
+        rx3_To_xyz(nvar, x, r, phi, &y, &z, l_U);
         NonLinEquations(sources[Index(0, i, j, k, 1, n1, n2, n3)],
-                        A, B, X, R, x, r, phi, y, z, U, values);
+                        A, B, X, R, x, r, phi, y, z, l_U, l_values);
         for (ivar = 0; ivar < nvar; ivar++)
         {
           indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
-          F[indx] = values[ivar] * FAC;
-          /* if ((i<5) && ((j<5) || (j>n2-5)))*/
-          /*     F[indx] = 0.0;*/
-          u.d0[indx] = U.d0[ivar];   /*  U*/
-          u.d1[indx] = U.d1[ivar];   /*      U_x*/
-          u.d2[indx] = U.d2[ivar];   /*      U_y*/
-          u.d3[indx] = U.d3[ivar];   /*      U_z*/
-          u.d11[indx] = U.d11[ivar]; /*      U_xx*/
-          u.d12[indx] = U.d12[ivar]; /*      U_xy*/
-          u.d13[indx] = U.d13[ivar]; /*      U_xz*/
-          u.d22[indx] = U.d22[ivar]; /*      U_yy*/
-          u.d23[indx] = U.d23[ivar]; /*      U_yz*/
-          u.d33[indx] = U.d33[ivar]; /*      U_zz*/
-        }
-        if (debugfile && (k == 0))
-        {
-          r_plus = sqrt((x - par_b) * (x - par_b) + y * y + z * z);
-          r_minus = sqrt((x + par_b) * (x + par_b) + y * y + z * z);
-          psi = 1. +
-                0.5 * par_m_plus / r_plus +
-                0.5 * par_m_minus / r_minus +
-                U.d0[0];
-          psi2 = psi * psi;
-          psi4 = psi2 * psi2;
-          psi7 = psi * psi2 * psi4;
-          fprintf(debugfile,
-                  "%.16g %.16g %.16g %.16g %.16g %.16g %.16g %.16g\n",
-                  (double)x, (double)y, (double)A, (double)B,
-                  (double)(U.d11[0] +
-                           U.d22[0] +
-                           U.d33[0] +
-                           /*                      0.125 * BY_KKofxyz (x, y, z) / psi7 +*/
-                           (2.0 * Pi / psi2 / psi * sources[indx]) * FAC),
-                  (double)((U.d11[0] +
-                            U.d22[0] +
-                            U.d33[0]) *
-                           FAC),
-                  (double)(-(2.0 * Pi / psi2 / psi * sources[indx]) * FAC),
-                  (double)sources[indx]
-                  /*(double)F[indx]*/
-          );
+          F[indx] = l_values[ivar] * sin(al) * sin(be) * sin(al) * sin(be) * sin(al) * sin(be);
+          u.d0[indx] = l_U.d0[ivar];
+          u.d1[indx] = l_U.d1[ivar];
+          u.d2[indx] = l_U.d2[ivar];
+          u.d3[indx] = l_U.d3[ivar];
+          u.d11[indx] = l_U.d11[ivar];
+          u.d12[indx] = l_U.d12[ivar];
+          u.d13[indx] = l_U.d13[ivar];
+          u.d22[indx] = l_U.d22[ivar];
+          u.d23[indx] = l_U.d23[ivar];
+          u.d33[indx] = l_U.d33[ivar];
         }
       }
     }
@@ -1443,8 +1425,6 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
     fclose(debugfile);
   }
   free(sources);
-  free_dvector(values, 0, nvar - 1);
-  free_derivs(&U, nvar);
 }
 /* --------------------------------------------------------------------------*/
 double TwoPunctures::norm_inf(double const *F, int const ntotal)
@@ -1544,7 +1524,7 @@ int TwoPunctures::bicgstab(int const nvar, int const n1, int const n2, int const
     for (int j = 0; j < ntotal; j++)
       ph.d0[j] = 0;
     for (int j = 0; j < NRELAX; j++) /* solves JFD*ph = p by relaxation*/
-      relax(ph.d0, nvar, n1, n2, n3, p, ncols, cols, JFD);
+      relax_omp(ph.d0, nvar, n1, n2, n3, p, ncols, cols, JFD);
 
     J_times_dv(nvar, n1, n2, n3, ph, vv, u); /* vv=J*ph*/
     alpha = rho / scalarproduct(rt, vv, ntotal);
@@ -1570,7 +1550,7 @@ int TwoPunctures::bicgstab(int const nvar, int const n1, int const n2, int const
     for (int j = 0; j < ntotal; j++)
       sh.d0[j] = 0;
     for (int j = 0; j < NRELAX; j++) /* solves JFD*sh = s by relaxation*/
-      relax(sh.d0, nvar, n1, n2, n3, s, ncols, cols, JFD);
+      relax_omp(sh.d0, nvar, n1, n2, n3, s, ncols, cols, JFD);
 
     J_times_dv(nvar, n1, n2, n3, sh, t, u); /* t=J*sh*/
     omega = scalarproduct(t, s, ntotal) / scalarproduct(t, t, ntotal);
@@ -1845,21 +1825,32 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
   /*      (u.d1[], u.d2[], u.d3[], u.d11[], u.d12[], u.d13[], u.d22[], u.d23[], u.d33[])*/
   /*      at interior points and at the boundaries "+/-"*/
   int i, j, k, ivar, indx;
-  double al, be, A, B, X, R, x, r, phi, y, z, Am1, *values;
-  derivs dU, U;
+  double al, be, A, B, X, R, x, r, phi, y, z, Am1;
 
-  Derivatives_AB3(nvar, n1, n2, n3, dv);
+  Derivatives_AB3_MatMul(nvar, n1, n2, n3, dv);
 
+  #pragma omp parallel for schedule(static) \
+    private(j, k, ivar, indx, al, be, A, B, X, R, x, r, phi, y, z, Am1)
   for (i = 0; i < n1; i++)
   {
-    values = dvector(0, nvar - 1);
-    allocate_derivs(&dU, nvar);
-    allocate_derivs(&U, nvar);
+    // Thread-local derivs on stack (nvar=1)
+    double l_val[1];
+    double l_dU_d0[1], l_dU_d1[1], l_dU_d2[1], l_dU_d3[1];
+    double l_dU_d11[1], l_dU_d12[1], l_dU_d13[1], l_dU_d22[1], l_dU_d23[1], l_dU_d33[1];
+    double l_U_d0[1], l_U_d1[1], l_U_d2[1], l_U_d3[1];
+    double l_U_d11[1], l_U_d12[1], l_U_d13[1], l_U_d22[1], l_U_d23[1], l_U_d33[1];
+    derivs l_dU, l_U;
+    l_dU.d0=l_dU_d0; l_dU.d1=l_dU_d1; l_dU.d2=l_dU_d2; l_dU.d3=l_dU_d3;
+    l_dU.d11=l_dU_d11; l_dU.d12=l_dU_d12; l_dU.d13=l_dU_d13;
+    l_dU.d22=l_dU_d22; l_dU.d23=l_dU_d23; l_dU.d33=l_dU_d33;
+    l_U.d0=l_U_d0; l_U.d1=l_U_d1; l_U.d2=l_U_d2; l_U.d3=l_U_d3;
+    l_U.d11=l_U_d11; l_U.d12=l_U_d12; l_U.d13=l_U_d13;
+    l_U.d22=l_U_d22; l_U.d23=l_U_d23; l_U.d33=l_U_d33;
+
     for (j = 0; j < n2; j++)
     {
       for (k = 0; k < n3; k++)
       {
-
         al = Pih * (2 * i + 1) / n1;
         A = -cos(al);
         be = Pih * (2 * j + 1) / n2;
@@ -1870,104 +1861,193 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
         for (ivar = 0; ivar < nvar; ivar++)
         {
           indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
-          dU.d0[ivar] = Am1 * dv.d0[indx];                     /* dU*/
-          dU.d1[ivar] = dv.d0[indx] + Am1 * dv.d1[indx];       /* dU_A*/
-          dU.d2[ivar] = Am1 * dv.d2[indx];                     /* dU_B*/
-          dU.d3[ivar] = Am1 * dv.d3[indx];                     /* dU_3*/
-          dU.d11[ivar] = 2 * dv.d1[indx] + Am1 * dv.d11[indx]; /* dU_AA*/
-          dU.d12[ivar] = dv.d2[indx] + Am1 * dv.d12[indx];     /* dU_AB*/
-          dU.d13[ivar] = dv.d3[indx] + Am1 * dv.d13[indx];     /* dU_AB*/
-          dU.d22[ivar] = Am1 * dv.d22[indx];                   /* dU_BB*/
-          dU.d23[ivar] = Am1 * dv.d23[indx];                   /* dU_B3*/
-          dU.d33[ivar] = Am1 * dv.d33[indx];                   /* dU_33*/
-          U.d0[ivar] = u.d0[indx];                             /* U   */
-          U.d1[ivar] = u.d1[indx];                             /* U_x*/
-          U.d2[ivar] = u.d2[indx];                             /* U_y*/
-          U.d3[ivar] = u.d3[indx];                             /* U_z*/
-          U.d11[ivar] = u.d11[indx];                           /* U_xx*/
-          U.d12[ivar] = u.d12[indx];                           /* U_xy*/
-          U.d13[ivar] = u.d13[indx];                           /* U_xz*/
-          U.d22[ivar] = u.d22[indx];                           /* U_yy*/
-          U.d23[ivar] = u.d23[indx];                           /* U_yz*/
-          U.d33[ivar] = u.d33[indx];                           /* U_zz*/
+          l_dU.d0[ivar] = Am1 * dv.d0[indx];
+          l_dU.d1[ivar] = dv.d0[indx] + Am1 * dv.d1[indx];
+          l_dU.d2[ivar] = Am1 * dv.d2[indx];
+          l_dU.d3[ivar] = Am1 * dv.d3[indx];
+          l_dU.d11[ivar] = 2 * dv.d1[indx] + Am1 * dv.d11[indx];
+          l_dU.d12[ivar] = dv.d2[indx] + Am1 * dv.d12[indx];
+          l_dU.d13[ivar] = dv.d3[indx] + Am1 * dv.d13[indx];
+          l_dU.d22[ivar] = Am1 * dv.d22[indx];
+          l_dU.d23[ivar] = Am1 * dv.d23[indx];
+          l_dU.d33[ivar] = Am1 * dv.d33[indx];
+          l_U.d0[ivar] = u.d0[indx];
+          l_U.d1[ivar] = u.d1[indx];
+          l_U.d2[ivar] = u.d2[indx];
+          l_U.d3[ivar] = u.d3[indx];
+          l_U.d11[ivar] = u.d11[indx];
+          l_U.d12[ivar] = u.d12[indx];
+          l_U.d13[ivar] = u.d13[indx];
+          l_U.d22[ivar] = u.d22[indx];
+          l_U.d23[ivar] = u.d23[indx];
+          l_U.d33[ivar] = u.d33[indx];
         }
-        /* Calculation of (X,R) and*/
-        /* (dU_X, dU_R, dU_3, dU_XX, dU_XR, dU_X3, dU_RR, dU_R3, dU_33)*/
-        AB_To_XR(nvar, A, B, &X, &R, dU);
-        /* Calculation of (x,r) and*/
-        /* (dU, dU_x, dU_r, dU_3, dU_xx, dU_xr, dU_x3, dU_rr, dU_r3, dU_33)*/
-        C_To_c(nvar, X, R, &x, &r, dU);
-        /* Calculation of (y,z) and*/
-        /* (dU, dU_x, dU_y, dU_z, dU_xx, dU_xy, dU_xz, dU_yy, dU_yz, dU_zz)*/
-        rx3_To_xyz(nvar, x, r, phi, &y, &z, dU);
-        LinEquations(A, B, X, R, x, r, phi, y, z, dU, U, values);
+        AB_To_XR(nvar, A, B, &X, &R, l_dU);
+        C_To_c(nvar, X, R, &x, &r, l_dU);
+        rx3_To_xyz(nvar, x, r, phi, &y, &z, l_dU);
+        LinEquations(A, B, X, R, x, r, phi, y, z, l_dU, l_U, l_val);
         for (ivar = 0; ivar < nvar; ivar++)
         {
           indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
-          Jdv[indx] = values[ivar] * FAC;
+          Jdv[indx] = l_val[ivar] * sin(al) * sin(be) * sin(al) * sin(be) * sin(al) * sin(be);
         }
       }
     }
-    free_dvector(values, 0, nvar - 1);
-    free_derivs(&dU, nvar);
-    free_derivs(&U, nvar);
   }
 }
 /* --------------------------------------------------------------------------*/
-void TwoPunctures::relax(double *dv, int const nvar, int const n1, int const n2, int const n3,
+/* --------------------------------------------------------------------------
+ * relax_omp: OpenMP-parallelized replacement for relax()
+ *
+ * Parallelism analysis:
+ *   - The red-black ordering within each phi-plane means that
+ *     same-parity lines in the i-direction are INDEPENDENT of each other
+ *     (they only couple through the j-direction which is solved internally).
+ *   - Similarly, same-parity lines in the j-direction are independent.
+ *   - Different phi-planes (k) with same parity are independent.
+ *
+ * Strategy:
+ *   - Parallelize the i-loop within each (k, parity) group for LineRelax_be
+ *   - Parallelize the j-loop within each (k, parity) group for LineRelax_al
+ *   - Each thread uses its own pre-allocated workspace (tid-indexed)
+ * --------------------------------------------------------------------------*/
+void TwoPunctures::relax_omp(double *dv, int const nvar, int const n1, int const n2, int const n3,
                          double const *rhs, int const *ncols, int **cols, double **JFD)
 {
-  int i, j, k, n;
+    int n;
 
-  for (k = 0; k < n3; k = k + 2)
-  {
+    // 偶数k平面
     for (n = 0; n < N_PlaneRelax; n++)
     {
-      for (i = 2; i < n1; i = i + 2)
-        LineRelax_be(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-      for (i = 1; i < n1; i = i + 2)
-        LineRelax_be(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-      for (j = 1; j < n2; j = j + 2)
-        LineRelax_al(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-      for (j = 0; j < n2; j = j + 2)
-        LineRelax_al(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
+        // 偶数i线，所有偶数k —— 不同k平面完全独立
+        int n_even_k = (n3 + 1) / 2;  // 偶数k的数量
+        int n_even_i = (n1 - 2 + 1) / 2;  // i=2,4,...的数量
+        int total_tasks = n_even_k * n_even_i;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_even_i;
+            int ii = task % n_even_i;
+            int k = ki * 2;
+            int i = 2 + ii * 2;
+            LineRelax_be_omp(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 奇数i线，所有偶数k
+        int n_odd_i = n1 / 2;  // i=1,3,...的数量
+        total_tasks = n_even_k * n_odd_i;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_odd_i;
+            int ii = task % n_odd_i;
+            int k = ki * 2;
+            int i = 1 + ii * 2;
+            LineRelax_be_omp(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 奇数j线，所有偶数k
+        int n_odd_j = (n2 - 1 + 1) / 2;
+        total_tasks = n_even_k * n_odd_j;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_odd_j;
+            int ji = task % n_odd_j;
+            int k = ki * 2;
+            int j = 1 + ji * 2;
+            LineRelax_al_omp(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 偶数j线，所有偶数k
+        int n_even_j = (n2 + 1) / 2;
+        total_tasks = n_even_k * n_even_j;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_even_j;
+            int ji = task % n_even_j;
+            int k = ki * 2;
+            int j = ji * 2;
+            LineRelax_al_omp(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 奇数k平面 — 同样的四步
+        int n_odd_k = n3 / 2;
+
+        // 偶数i线，所有奇数k
+        n_even_i = (n1 + 1) / 2;  // i=0,2,...
+        total_tasks = n_odd_k * n_even_i;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_even_i;
+            int ii = task % n_even_i;
+            int k = 1 + ki * 2;
+            int i = ii * 2;
+            LineRelax_be_omp(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 奇数i线，所有奇数k
+        total_tasks = n_odd_k * n_odd_i;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_odd_i;
+            int ii = task % n_odd_i;
+            int k = 1 + ki * 2;
+            int i = 1 + ii * 2;
+            LineRelax_be_omp(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 奇数j线，所有奇数k
+        total_tasks = n_odd_k * n_odd_j;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_odd_j;
+            int ji = task % n_odd_j;
+            int k = 1 + ki * 2;
+            int j = 1 + ji * 2;
+            LineRelax_al_omp(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
+
+        // 偶数j线，所有奇数k
+        total_tasks = n_odd_k * n_even_j;
+
+        #pragma omp parallel for schedule(static)
+        for (int task = 0; task < total_tasks; task++) {
+            int tid = omp_get_thread_num();
+            int ki = task / n_even_j;
+            int ji = task % n_even_j;
+            int k = 1 + ki * 2;
+            int j = ji * 2;
+            LineRelax_al_omp(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD, tid);
+        }
     }
-  }
-  for (k = 1; k < n3; k = k + 2)
-  {
-    for (n = 0; n < N_PlaneRelax; n++)
-    {
-      for (i = 0; i < n1; i = i + 2)
-        LineRelax_be(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-      for (i = 1; i < n1; i = i + 2)
-        LineRelax_be(dv, i, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-      for (j = 1; j < n2; j = j + 2)
-        LineRelax_al(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-      for (j = 0; j < n2; j = j + 2)
-        LineRelax_al(dv, j, k, nvar, n1, n2, n3, rhs, ncols, cols, JFD);
-    }
-  }
 }
 /* --------------------------------------------------------------------------*/
-void TwoPunctures::LineRelax_be(double *dv,
+void TwoPunctures::LineRelax_be_omp(double *dv,
                                 int const i, int const k, int const nvar,
                                 int const n1, int const n2, int const n3,
                                 double const *rhs, int const *ncols, int **cols,
-                                double **JFD)
+                                double **JFD, int tid)
 {
   int j, m, Ic, Ip, Im, col, ivar;
 
-  double *diag = new double[n2];
-  double *e = new double[n2 - 1]; /* above diagonal */
-  double *f = new double[n2 - 1]; /* below diagonal */
-  double *b = new double[n2];     /* rhs */
-  double *x = new double[n2];     /* solution vector */
-
-  //  gsl_vector *diag = gsl_vector_alloc(n2);
-  //  gsl_vector *e = gsl_vector_alloc(n2-1); /* above diagonal */
-  //  gsl_vector *f = gsl_vector_alloc(n2-1); /* below diagonal */
-  //  gsl_vector *b = gsl_vector_alloc(n2);   /* rhs */
-  //  gsl_vector *x = gsl_vector_alloc(n2);   /* solution vector */
+  // Use pre-allocated per-thread workspace instead of new/delete
+  double *diag = ws_diag_be[tid];
+  double *e    = ws_e_be[tid];
+  double *f    = ws_f_be[tid];
+  double *b    = ws_b_be[tid];
+  double *x    = ws_x_be[tid];
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -2007,14 +2087,8 @@ void TwoPunctures::LineRelax_be(double *dv,
         }
       }
     }
-    //          A x = b
-    //          A = ( d_0 e_0  0   0  )
-    //              ( f_0 d_1 e_1  0  )
-    //              (  0  f_1 d_2 e_2 )
-    //              (  0   0  f_2 d_3 )
-    //
-    ThomasAlgorithm(n2, f, diag, e, x, b);
-    //    gsl_linalg_solve_tridiag(diag, e, f, b, x);
+    ThomasAlgorithm_ws(n2, f, diag, e, x, b,
+                       ws_l_be[tid], ws_u_be[tid], ws_d_be[tid], ws_y_be[tid]);
     for (j = 0; j < n2; j++)
     {
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
@@ -2022,17 +2096,7 @@ void TwoPunctures::LineRelax_be(double *dv,
       //      dv[Ic] = gsl_vector_get(x, j);
     }
   }
-
-  delete[] diag;
-  delete[] e;
-  delete[] f;
-  delete[] b;
-  delete[] x;
-  //  gsl_vector_free(diag);
-  //  gsl_vector_free(e);
-  //  gsl_vector_free(f);
-  //  gsl_vector_free(b);
-  //  gsl_vector_free(x);
+  // No delete — workspace is persistent
 }
 /* --------------------------------------------------------------------------*/
 void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
@@ -2194,25 +2258,19 @@ void TwoPunctures::LinEquations(double A, double B, double X, double R,
   values[0] = dU.d11[0] + dU.d22[0] + dU.d33[0] - 0.875 * BY_KKofxyz(x, y, z) / psi8 * dU.d0[0];
 }
 /* -------------------------------------------------------------------------*/
-void TwoPunctures::LineRelax_al(double *dv,
+void TwoPunctures::LineRelax_al_omp(double *dv,
                                 int const j, int const k, int const nvar,
                                 int const n1, int const n2, int const n3,
                                 double const *rhs, int const *ncols,
-                                int **cols, double **JFD)
+                                int **cols, double **JFD, int tid)
 {
   int i, m, Ic, Ip, Im, col, ivar;
 
-  double *diag = new double[n1];
-  double *e = new double[n1 - 1]; /* above diagonal */
-  double *f = new double[n1 - 1]; /* below diagonal */
-  double *b = new double[n1];     /* rhs */
-  double *x = new double[n1];     /* solution vector */
-
-  //  gsl_vector *diag = gsl_vector_alloc(n1);
-  //  gsl_vector *e = gsl_vector_alloc(n1-1); /* above diagonal */
-  //  gsl_vector *f = gsl_vector_alloc(n1-1); /* below diagonal */
-  //  gsl_vector *b = gsl_vector_alloc(n1);   /* rhs */
-  //  gsl_vector *x = gsl_vector_alloc(n1);   /* solution vector */
+  double *diag = ws_diag_al[tid];
+  double *e    = ws_e_al[tid];
+  double *f    = ws_f_al[tid];
+  double *b    = ws_b_al[tid];
+  double *x    = ws_x_al[tid];
 
   for (ivar = 0; ivar < nvar; ivar++)
   {
@@ -2252,8 +2310,8 @@ void TwoPunctures::LineRelax_al(double *dv,
         }
       }
     }
-    ThomasAlgorithm(n1, f, diag, e, x, b);
-    //    gsl_linalg_solve_tridiag(diag, e, f, b, x);
+    ThomasAlgorithm_ws(n1, f, diag, e, x, b,
+                       ws_l_al[tid], ws_u_al[tid], ws_d_al[tid], ws_y_al[tid]);
     for (i = 0; i < n1; i++)
     {
       Ic = Index(ivar, i, j, k, nvar, n1, n2, n3);
@@ -2261,18 +2319,6 @@ void TwoPunctures::LineRelax_al(double *dv,
       //      dv[Ic] = gsl_vector_get(x, i);
     }
   }
-
-  delete[] diag;
-  delete[] e;
-  delete[] f;
-  delete[] b;
-  delete[] x;
-
-  //  gsl_vector_free(diag);
-  //  gsl_vector_free(e);
-  //  gsl_vector_free(f);
-  //  gsl_vector_free(b);
-  //  gsl_vector_free(x);
 }
 /* -------------------------------------------------------------------------*/
 // a[N], b[N-1], c[N-1], x[N], q[N]
@@ -2323,6 +2369,37 @@ void TwoPunctures::ThomasAlgorithm(int N, double *b, double *a, double *c, doubl
 
   return;
 }
+
+// ThomasAlgorithm with pre-allocated workspace (no new/delete)
+// l[N-1], u_ws[N-1], d[N], y[N] are caller-provided workspace
+void TwoPunctures::ThomasAlgorithm_ws(int N, double *b, double *a, double *c,
+                                       double *x, double *q,
+                                       double *l, double *u_ws, double *d, double *y)
+{
+  /* LU Decomposition */
+  d[0] = a[0];
+  u_ws[0] = c[0];
+
+  for (int i = 0; i < N - 2; i++) {
+    l[i] = b[i] / d[i];
+    d[i + 1] = a[i + 1] - l[i] * u_ws[i];
+    u_ws[i + 1] = c[i + 1];
+  }
+
+  l[N - 2] = b[N - 2] / d[N - 2];
+  d[N - 1] = a[N - 1] - l[N - 2] * u_ws[N - 2];
+
+  /* Forward Substitution [L][y] = [q] */
+  y[0] = q[0];
+  for (int i = 1; i < N; i++)
+    y[i] = q[i] - l[i - 1] * y[i - 1];
+
+  /* Backward Substitution [U][x] = [y] */
+  x[N - 1] = y[N - 1] / d[N - 1];
+  for (int i = N - 2; i >= 0; i--)
+    x[i] = (y[i] - u_ws[i] * x[i + 1]) / d[i];
+}
+
 // --------------------------------------------------------------------------*/
 // Calculates the value of v at an arbitrary position (x,y,z) if the spectral coefficients are know*/*/
 /* --------------------------------------------------------------------------*/
@@ -2512,3 +2589,606 @@ void TwoPunctures::SpecCoef(parameters par, int ivar, double *v, double *cf)
   free_d3tensor(values3, 0, n1, 0, n2, 0, n3);
   free_d3tensor(values4, 0, n1, 0, n2, 0, n3);
 }
+
+void TwoPunctures::allocate_workspace()
+{
+    int n1 = npoints_A, n2 = npoints_B, n3 = npoints_phi;
+    max_threads = omp_get_max_threads();
+    printf("Allocating workspace for %d threads\n", max_threads);
+
+    // LineRelax_be workspace: arrays of size n2, per thread
+    ws_diag_be = new double*[max_threads];
+    ws_e_be    = new double*[max_threads];
+    ws_f_be    = new double*[max_threads];
+    ws_b_be    = new double*[max_threads];
+    ws_x_be    = new double*[max_threads];
+    ws_l_be    = new double*[max_threads];
+    ws_u_be    = new double*[max_threads];
+    ws_d_be    = new double*[max_threads];
+    ws_y_be    = new double*[max_threads];
+
+    // LineRelax_al workspace: arrays of size n1, per thread
+    ws_diag_al = new double*[max_threads];
+    ws_e_al    = new double*[max_threads];
+    ws_f_al    = new double*[max_threads];
+    ws_b_al    = new double*[max_threads];
+    ws_x_al    = new double*[max_threads];
+    ws_l_al    = new double*[max_threads];
+    ws_u_al    = new double*[max_threads];
+    ws_d_al    = new double*[max_threads];
+    ws_y_al    = new double*[max_threads];
+
+    int N = (n1 > n2) ? n1 : n2;  // max of n1, n2
+
+    for (int t = 0; t < max_threads; t++) {
+        ws_diag_be[t] = new double[n2];
+        ws_e_be[t]    = new double[n2];
+        ws_f_be[t]    = new double[n2];
+        ws_b_be[t]    = new double[n2];
+        ws_x_be[t]    = new double[n2];
+        ws_l_be[t]    = new double[n2];
+        ws_u_be[t]    = new double[n2];
+        ws_d_be[t]    = new double[n2];
+        ws_y_be[t]    = new double[n2];
+
+        ws_diag_al[t] = new double[n1];
+        ws_e_al[t]    = new double[n1];
+        ws_f_al[t]    = new double[n1];
+        ws_b_al[t]    = new double[n1];
+        ws_x_al[t]    = new double[n1];
+        ws_l_al[t]    = new double[n1];
+        ws_u_al[t]    = new double[n1];
+        ws_d_al[t]    = new double[n1];
+        ws_y_al[t]    = new double[n1];
+    }
+}
+
+void TwoPunctures::free_workspace()
+{
+    for (int t = 0; t < max_threads; t++) {
+        delete[] ws_diag_be[t]; delete[] ws_e_be[t]; delete[] ws_f_be[t];
+        delete[] ws_b_be[t];    delete[] ws_x_be[t];
+        delete[] ws_l_be[t];    delete[] ws_u_be[t];
+        delete[] ws_d_be[t];    delete[] ws_y_be[t];
+
+        delete[] ws_diag_al[t]; delete[] ws_e_al[t]; delete[] ws_f_al[t];
+        delete[] ws_b_al[t];    delete[] ws_x_al[t];
+        delete[] ws_l_al[t];    delete[] ws_u_al[t];
+        delete[] ws_d_al[t];    delete[] ws_y_al[t];
+    }
+    delete[] ws_diag_be; delete[] ws_e_be; delete[] ws_f_be;
+    delete[] ws_b_be;    delete[] ws_x_be;
+    delete[] ws_l_be;    delete[] ws_u_be;
+    delete[] ws_d_be;    delete[] ws_y_be;
+
+    delete[] ws_diag_al; delete[] ws_e_al; delete[] ws_f_al;
+    delete[] ws_b_al;    delete[] ws_x_al;
+    delete[] ws_l_al;    delete[] ws_u_al;
+    delete[] ws_d_al;    delete[] ws_y_al;
+}
+
+/*==========================================================================
+ * Precomputed Spectral Derivative Matrices
+ *
+ * Mathematical equivalence proof:
+ *
+ * Original algorithm (per-line):
+ *   1. Forward Chebyshev transform:  c = T * f   (where T is the DCT matrix)
+ *   2. Spectral derivative:          c' = Dhat * c  (recurrence relation)
+ *   3. Inverse transform:            f' = T^{-1} * c'
+ *   Combined: f' = T^{-1} * Dhat * T * f = D * f
+ *
+ * The matrix D = T^{-1} * Dhat * T is precomputed once.
+ * Similarly D2 = T^{-1} * Dhat^2 * T for second derivatives.
+ *
+ * For Fourier: same idea with DFT matrices and frequency-domain derivatives.
+ *
+ * This converts n2*n3 separate O(n1^2) transforms into a single
+ * (n1 x n1) * (n1 x n2*n3) DGEMM call, which is BLAS Level-3
+ * and thus optimally parallelized by MKL.
+ *=========================================================================*/
+
+void TwoPunctures::build_cheb_deriv_matrices(int n, double *D1, double *D2)
+{
+    /* Build the physical-space derivative matrices for Chebyshev Zeros grid.
+     *
+     * Grid points: x_i = -cos(pi*(2i+1)/(2n)), i=0,...,n-1
+     *
+     * Method: Construct T (forward transform), Dhat (spectral derivative),
+     * T^{-1} (inverse transform), then D1 = T^{-1} * Dhat * T,
+     * D2 = T^{-1} * Dhat^2 * T.
+     *
+     * All matrices are n x n, stored in row-major order: M[i*n+j]
+     */
+
+    double *T_fwd  = new double[n * n];  // Forward transform matrix
+    double *T_inv  = new double[n * n];  // Inverse transform matrix
+    double *Dhat   = new double[n * n];  // Spectral derivative operator
+    double *Dhat2  = new double[n * n];  // Spectral second derivative operator
+    double *tmp1   = new double[n * n];  // Temporary
+    double *tmp2   = new double[n * n];  // Temporary
+
+    double Pion = Pi / n;
+
+    // Build forward Chebyshev transform matrix T
+    // c_j = (2/n) * (-1)^j * sum_k f_k * cos(pi*j*(k+0.5)/n)
+    // So T[j][k] = (2/n) * (-1)^j * cos(pi*j*(k+0.5)/n)
+    for (int j = 0; j < n; j++) {
+        double fac = (2.0 / n) * ((j % 2 == 0) ? 1.0 : -1.0);
+        for (int k = 0; k < n; k++) {
+            T_fwd[j * n + k] = fac * cos(Pion * j * (k + 0.5));
+        }
+    }
+
+    // Build inverse Chebyshev transform matrix T^{-1}
+    // f_j = sum_k c_k * cos(pi*(j+0.5)*k/n) * (-1)^k  -  0.5*c_0
+    // But the -0.5*c_0 term is part of the sum when we write it as:
+    // f_j = -0.5*c_0 + sum_{k=0}^{n-1} c_k * cos(pi*(j+0.5)*k) * (-1)^k
+    // T_inv[j][k] = cos(pi*(j+0.5)*k/n) * (-1)^k, with k=0 term having extra -0.5
+    for (int j = 0; j < n; j++) {
+        for (int k = 0; k < n; k++) {
+            double sign_k = (k % 2 == 0) ? 1.0 : -1.0;
+            T_inv[j * n + k] = cos(Pion * (j + 0.5) * k) * sign_k;
+        }
+        // The k=0 term needs adjustment: the sum includes c_0*1 but we need -0.5*c_0 + c_0*1 = 0.5*c_0
+        // Wait, let me re-examine chebft_Zeros with inv=1:
+        //   sum = -0.5 * u[0];
+        //   for k: sum += u[k] * cos(Pion*(j+0.5)*k) * isignum; isignum alternates starting from 1
+        // So: c[j] = -0.5*u[0] + sum_{k=0}^{n-1} u[k]*cos(...)*(-1)^k
+        //          = -0.5*u[0] + u[0]*1*1 + sum_{k=1} ...
+        //          = 0.5*u[0] + sum_{k=1} u[k]*cos(...)*(-1)^k
+        // Equivalently: T_inv[j][0] = 0.5, T_inv[j][k] = cos(...)*(-1)^k for k>=1
+        // But cos(0) = 1 and (-1)^0 = 1, so the formula gives T_inv[j][0] = 1.0
+        // We need it to be 0.5. Fix:
+        T_inv[j * n + 0] = 0.5;  // This accounts for the -0.5*u[0] + u[0]*cos(0)*1 = 0.5*u[0]
+    }
+
+    // Build spectral derivative matrix Dhat (in coefficient space)
+    // The recurrence: cder[n-1] = 0, cder[n-2] = 0,
+    //                 cder[j] = cder[j+2] + 2*(j+1)*c[j+1]  for j = n-3,...,0
+    // This means cder = Dhat * c, where Dhat is upper triangular-ish.
+    // Dhat[j][k] = coefficient of c[k] contributing to cder[j]
+    //
+    // From the recurrence: cder[j] = sum_{k=j+1, k-j odd}^{n-1} 2*k * c[k]
+    // (with the factor 2k, summing over k > j where k-j is odd)
+    // Exception: cder[0] gets an extra factor of 0.5 since c[0] has the 2/n prefactor
+    // Actually no: the chder function is:
+    //   cder[n] = cder[n-1] = 0
+    //   cder[j] = cder[j+2] + 2*(j+1)*c[j+1]
+    // Unrolling: cder[j] = 2*(j+1)*c[j+1] + 2*(j+3)*c[j+3] + ...
+    // So Dhat[j][k] = 2*k if k > j and (k-j) is odd, else 0
+
+    for (int j = 0; j < n; j++)
+        for (int k = 0; k < n; k++)
+            Dhat[j * n + k] = 0.0;
+
+    for (int j = 0; j < n; j++) {
+        for (int k = j + 1; k < n; k++) {
+            if ((k - j) % 2 == 1) {
+                Dhat[j * n + k] = 2.0 * k;
+            }
+        }
+    }
+
+    // Build Dhat^2 = Dhat * Dhat
+    // D1 = T_inv * Dhat * T_fwd
+    // D2 = T_inv * Dhat^2 * T_fwd
+
+    // tmp1 = Dhat * T_fwd
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n, n, n, 1.0, Dhat, n, T_fwd, n, 0.0, tmp1, n);
+    // D1 = T_inv * tmp1
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n, n, n, 1.0, T_inv, n, tmp1, n, 0.0, D1, n);
+
+    // tmp2 = Dhat * Dhat  (Dhat^2 in spectral space)
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n, n, n, 1.0, Dhat, n, Dhat, n, 0.0, tmp2, n);
+    // tmp1 = Dhat^2 * T_fwd
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n, n, n, 1.0, tmp2, n, T_fwd, n, 0.0, tmp1, n);
+    // D2 = T_inv * tmp1
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n, n, n, 1.0, T_inv, n, tmp1, n, 0.0, D2, n);
+
+    delete[] T_fwd;
+    delete[] T_inv;
+    delete[] Dhat;
+    delete[] Dhat2;
+    delete[] tmp1;
+    delete[] tmp2;
+}
+
+void TwoPunctures::build_fourier_deriv_matrices(int N, double *DF1, double *DF2)
+{
+    /* Build Fourier derivative matrices in physical space.
+     *
+     * Grid: phi_k = 2*pi*k/N, k=0,...,N-1
+     *
+     * The Fourier interpolant derivative at grid points can be expressed as
+     * a matrix multiply. We build it by:
+     *   1. Forward Fourier transform matrix F
+     *   2. Frequency-domain derivative (multiply by il for first, -l^2 for second)
+     *   3. Inverse Fourier transform matrix F^{-1}
+     *   DF1 = F^{-1} * diag(il) * F, DF2 = F^{-1} * diag(-l^2) * F
+     *
+     * But since fourft/fourev use a real representation (a_l, b_l),
+     * we construct directly in physical space.
+     */
+
+    int M = N / 2;
+    double Pi_fac = Pi / M;  // = 2*Pi/N
+
+    // DF1[j][k] = d/dphi of the interpolant at phi_j, due to value at phi_k
+    // Using the representation:
+    //   f(phi) = 0.5*(a_0 + a_M*cos(M*phi)) + sum_{l=1}^{M-1} (a_l*cos(l*phi) + b_l*sin(l*phi))
+    // where a_l = (2/N)*sum_k f_k*cos(l*phi_k), b_l = (2/N)*sum_k f_k*sin(l*phi_k)
+    //
+    // f'(phi) = -0.5*a_M*M*sin(M*phi) + sum_{l=1}^{M-1} l*(-a_l*sin(l*phi) + b_l*cos(l*phi))
+    //
+    // Substituting a_l, b_l and evaluating at phi_j:
+    // f'(phi_j) = sum_k f_k * K(j,k)
+    // where K(j,k) = (2/N) * sum_{l=1}^{M-1} l * (-cos(l*phi_k)*sin(l*phi_j) + sin(l*phi_k)*cos(l*phi_j))
+    //             + (2/N) * (-M/2) * sin(M*phi_j) * cos(M*phi_k)    [a_M term, note a_M has no factor 2]
+    //             = (2/N) * sum_{l=1}^{M-1} l * sin(l*(phi_k - phi_j))
+    //             - (1/N) * M * sin(M*phi_j) * cos(M*phi_k)
+    //
+    // But the a_M coefficient in fourft has factor 1/M (not 2/M), so:
+    // Actually re-examining fourft: a[l] = fac * sum_k u[k]*cos(x), fac=1/M
+    // and a_M is stored as a[M] with same fac. The inverse uses:
+    //   u[k] = 0.5*(a[0] + a[M]*iy) + sum_{l=1}^{M-1}(a[l]*cos + b[l]*sin)
+    // So the full expression needs care. Let me just compute it numerically.
+
+    // Numerical approach: for each k, set f = delta_k, compute derivative at all j
+    double *p  = new double[N];
+    double *dp = new double[N];
+
+    for (int k = 0; k < N; k++) {
+        // Set delta function at k
+        for (int i = 0; i < N; i++)
+            p[i] = (i == k) ? 1.0 : 0.0;
+
+        // Forward Fourier transform (using existing fourft)
+        fourft(p, N, 0);
+        // Derivative in spectral space
+        fourder(p, dp, N);
+        // Inverse Fourier transform
+        fourft(dp, N, 1);
+
+        // dp[j] = derivative of delta_k interpolant at phi_j
+        // So DF1[j][k] = dp[j]
+        for (int j = 0; j < N; j++)
+            DF1[j * N + k] = dp[j];
+    }
+
+    // Second derivative
+    for (int k = 0; k < N; k++) {
+        for (int i = 0; i < N; i++)
+            p[i] = (i == k) ? 1.0 : 0.0;
+
+        fourft(p, N, 0);
+        fourder2(p, dp, N);
+        fourft(dp, N, 1);
+
+        for (int j = 0; j < N; j++)
+            DF2[j * N + k] = dp[j];
+    }
+
+    delete[] p;
+    delete[] dp;
+}
+
+void TwoPunctures::precompute_derivative_matrices()
+{
+    int n1 = npoints_A, n2 = npoints_B, n3 = npoints_phi;
+
+    // Allocate matrices
+    D1_A    = new double[n1 * n1];
+    D2_A    = new double[n1 * n1];
+    D1_B    = new double[n2 * n2];
+    D2_B    = new double[n2 * n2];
+    DF1_phi = new double[n3 * n3];
+    DF2_phi = new double[n3 * n3];
+
+    // Build Chebyshev derivative matrices
+    build_cheb_deriv_matrices(n1, D1_A, D2_A);
+    build_cheb_deriv_matrices(n2, D1_B, D2_B);
+
+    // Build Fourier derivative matrices
+    build_fourier_deriv_matrices(n3, DF1_phi, DF2_phi);
+
+    printf("Precomputed derivative matrices: A(%d), B(%d), phi(%d)\n", n1, n2, n3);
+}
+
+/* --------------------------------------------------------------------------
+ * Derivatives_AB3_MatMul: Drop-in replacement for Derivatives_AB3
+ *
+ * Uses precomputed derivative matrices and DGEMM to compute all spectral
+ * derivatives in batch. Mathematically equivalent to the original
+ * Derivatives_AB3.
+ *
+ * Memory layout of v.d0[Index(ivar,i,j,k)] = v.d0[ivar + nvar*(i + n1*(j + n2*k))]
+ *
+ * For A-direction derivatives (fixed j,k, varying i):
+ *   We need to apply D1_A and D2_A to "pencils" along the i-direction.
+ *   Collect all pencils into a matrix and use DGEMM.
+ *
+ * For B-direction derivatives (fixed i,k, varying j):
+ *   Similarly with D1_B, D2_B.
+ *
+ * For phi-direction (fixed i,j, varying k):
+ *   Similarly with DF1_phi, DF2_phi.
+ * --------------------------------------------------------------------------*/
+void TwoPunctures::Derivatives_AB3_MatMul(int nvar, int n1, int n2, int n3, derivs v)
+{
+    int total_pencils;
+    double *data_in, *data_out;
+
+    /*=====================================================
+     * STEP 1: A-direction derivatives (Chebyshev, D1_A, D2_A)
+     *
+     * For each (ivar, j, k), we have a pencil of length n1:
+     *   f[i] = v.d0[Index(ivar, i, j, k, nvar, n1, n2, n3)]
+     *
+     * We want: v.d1[...] = D1_A * f, v.d11[...] = D2_A * f
+     *
+     * Collect all n2*n3*nvar pencils as columns of a matrix:
+     *   data_in[i, col] where col = ivar + nvar*(j + n2*k)
+     * Then: data_out = D1_A * data_in  (DGEMM: n1 x n1  times  n1 x total_pencils)
+     *=====================================================*/
+    total_pencils = nvar * n2 * n3;
+
+    data_in  = new double[n1 * total_pencils];
+    data_out = new double[n1 * total_pencils];
+
+    // Gather: data_in[i * total_pencils + col] = v.d0[Index(ivar,i,j,k,...)]
+    // where col = ivar + nvar * (j + n2 * k)
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (j + n2 * k);
+                for (int i = 0; i < n1; i++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    data_in[i * total_pencils + col] = v.d0[indx];
+                }
+            }
+        }
+    }
+
+    // First derivative: data_out = D1_A * data_in
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n1, total_pencils, n1,
+                1.0, D1_A, n1, data_in, total_pencils,
+                0.0, data_out, total_pencils);
+
+    // Scatter to v.d1
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (j + n2 * k);
+                for (int i = 0; i < n1; i++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d1[indx] = data_out[i * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    // Second derivative: data_out = D2_A * data_in
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n1, total_pencils, n1,
+                1.0, D2_A, n1, data_in, total_pencils,
+                0.0, data_out, total_pencils);
+
+    // Scatter to v.d11
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (j + n2 * k);
+                for (int i = 0; i < n1; i++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d11[indx] = data_out[i * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    delete[] data_in;
+    delete[] data_out;
+
+    /*=====================================================
+     * STEP 2: B-direction derivatives (Chebyshev, D1_B, D2_B)
+     *
+     * Pencils along j for each (ivar, i, k).
+     * Also compute mixed derivative v.d12 = D1_B applied to v.d1
+     *=====================================================*/
+    total_pencils = nvar * n1 * n3;
+
+    data_in  = new double[n2 * total_pencils];
+    data_out = new double[n2 * total_pencils];
+    double *data_in2 = new double[n2 * total_pencils];
+    double *data_out2 = new double[n2 * total_pencils];
+
+    // Gather v.d0 along B-direction AND v.d1 for mixed derivative
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int i = 0; i < n1; i++) {
+                int col = ivar + nvar * (i + n1 * k);
+                for (int j = 0; j < n2; j++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    data_in[j * total_pencils + col]  = v.d0[indx];
+                    data_in2[j * total_pencils + col] = v.d1[indx]; // for d/dB of (dv/dA)
+                }
+            }
+        }
+    }
+
+    // v.d2 = D1_B * v.d0 (along B)
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n2, total_pencils, n2,
+                1.0, D1_B, n2, data_in, total_pencils,
+                0.0, data_out, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int i = 0; i < n1; i++) {
+                int col = ivar + nvar * (i + n1 * k);
+                for (int j = 0; j < n2; j++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d2[indx] = data_out[j * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    // v.d22 = D2_B * v.d0
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n2, total_pencils, n2,
+                1.0, D2_B, n2, data_in, total_pencils,
+                0.0, data_out, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int i = 0; i < n1; i++) {
+                int col = ivar + nvar * (i + n1 * k);
+                for (int j = 0; j < n2; j++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d22[indx] = data_out[j * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    // v.d12 = D1_B * v.d1 (mixed: d/dB of dv/dA)
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n2, total_pencils, n2,
+                1.0, D1_B, n2, data_in2, total_pencils,
+                0.0, data_out2, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int k = 0; k < n3; k++) {
+            for (int i = 0; i < n1; i++) {
+                int col = ivar + nvar * (i + n1 * k);
+                for (int j = 0; j < n2; j++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d12[indx] = data_out2[j * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    delete[] data_in;
+    delete[] data_out;
+    delete[] data_in2;
+    delete[] data_out2;
+
+    /*=====================================================
+     * STEP 3: phi-direction derivatives (Fourier, DF1_phi, DF2_phi)
+     *
+     * Pencils along k for each (ivar, i, j).
+     * Also compute mixed derivatives v.d13, v.d23
+     *=====================================================*/
+    total_pencils = nvar * n1 * n2;
+
+    data_in    = new double[n3 * total_pencils];
+    data_out   = new double[n3 * total_pencils];
+    data_in2   = new double[n3 * total_pencils]; // for v.d1 → v.d13
+    data_out2  = new double[n3 * total_pencils];
+    double *data_in3  = new double[n3 * total_pencils]; // for v.d2 → v.d23
+    double *data_out3 = new double[n3 * total_pencils];
+
+    // Gather v.d0, v.d1, v.d2 along phi-direction
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int i = 0; i < n1; i++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (i + n1 * j);
+                for (int k = 0; k < n3; k++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    data_in[k * total_pencils + col]  = v.d0[indx];
+                    data_in2[k * total_pencils + col] = v.d1[indx];
+                    data_in3[k * total_pencils + col] = v.d2[indx];
+                }
+            }
+        }
+    }
+
+    // v.d3 = DF1_phi * v.d0
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n3, total_pencils, n3,
+                1.0, DF1_phi, n3, data_in, total_pencils,
+                0.0, data_out, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int i = 0; i < n1; i++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (i + n1 * j);
+                for (int k = 0; k < n3; k++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d3[indx] = data_out[k * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    // v.d33 = DF2_phi * v.d0
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n3, total_pencils, n3,
+                1.0, DF2_phi, n3, data_in, total_pencils,
+                0.0, data_out, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int i = 0; i < n1; i++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (i + n1 * j);
+                for (int k = 0; k < n3; k++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d33[indx] = data_out[k * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    // v.d13 = DF1_phi * v.d1 (mixed: d/dphi of dv/dA)
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n3, total_pencils, n3,
+                1.0, DF1_phi, n3, data_in2, total_pencils,
+                0.0, data_out2, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int i = 0; i < n1; i++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (i + n1 * j);
+                for (int k = 0; k < n3; k++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d13[indx] = data_out2[k * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    // v.d23 = DF1_phi * v.d2 (mixed: d/dphi of dv/dB)
+    cblas_dgemm(CblasRowMajor, CblasNoTrans, CblasNoTrans,
+                n3, total_pencils, n3,
+                1.0, DF1_phi, n3, data_in3, total_pencils,
+                0.0, data_out3, total_pencils);
+
+    for (int ivar = 0; ivar < nvar; ivar++) {
+        for (int i = 0; i < n1; i++) {
+            for (int j = 0; j < n2; j++) {
+                int col = ivar + nvar * (i + n1 * j);
+                for (int k = 0; k < n3; k++) {
+                    int indx = Index(ivar, i, j, k, nvar, n1, n2, n3);
+                    v.d23[indx] = data_out3[k * total_pencils + col];
+                }
+            }
+        }
+    }
+
+    delete[] data_in;
+    delete[] data_out;
+    delete[] data_in2;
+    delete[] data_out2;
+    delete[] data_in3;
+    delete[] data_out3;
+}
+
diff --git a/AMSS_NCKU_source/TwoPunctures.h b/AMSS_NCKU_source/TwoPunctures.h
index 22fb359..5f95797 100644
--- a/AMSS_NCKU_source/TwoPunctures.h
+++ b/AMSS_NCKU_source/TwoPunctures.h
@@ -1,7 +1,8 @@
-
 #ifndef TWO_PUNCTURES_H
 #define TWO_PUNCTURES_H
 
+#include <omp.h>
+
 #define StencilSize 19
 #define N_PlaneRelax 1
 #define NRELAX 200
@@ -32,7 +33,7 @@ private:
        int npoints_A, npoints_B, npoints_phi;
 
        double target_M_plus, target_M_minus;
-       
+
        double admMass;
 
        double adm_tol;
@@ -42,6 +43,18 @@ private:
 
        int ntotal;
 
+       // ===== Precomputed spectral derivative matrices =====
+       double *D1_A, *D2_A;
+       double *D1_B, *D2_B;
+       double *DF1_phi, *DF2_phi;
+
+       // ===== Pre-allocated workspace for LineRelax (per-thread) =====
+       int max_threads;
+       double **ws_diag_be, **ws_e_be, **ws_f_be, **ws_b_be, **ws_x_be;
+       double **ws_l_be, **ws_u_be, **ws_d_be, **ws_y_be;
+       double **ws_diag_al, **ws_e_al, **ws_f_al, **ws_b_al, **ws_x_al;
+       double **ws_l_al, **ws_u_al, **ws_d_al, **ws_y_al;
+
        struct parameters
        {
               int nvar, n1, n2, n3;
@@ -58,6 +71,28 @@ public:
                     int Newtonmaxit);
        ~TwoPunctures();
 
+       // 02/07: New/modified methods
+       void allocate_workspace();
+       void free_workspace();
+       void precompute_derivative_matrices();
+       void build_cheb_deriv_matrices(int n, double *D1, double *D2);
+       void build_fourier_deriv_matrices(int N, double *DF1, double *DF2);
+       void Derivatives_AB3_MatMul(int nvar, int n1, int n2, int n3, derivs v);
+       void ThomasAlgorithm_ws(int N, double *b, double *a, double *c, double *x, double *q,
+                                double *l, double *u_ws, double *d, double *y);
+       void LineRelax_be_omp(double *dv,
+                         int const i, int const k, int const nvar,
+                         int const n1, int const n2, int const n3,
+                         double const *rhs, int const *ncols, int **cols,
+                         double **JFD, int tid);
+       void LineRelax_al_omp(double *dv,
+                         int const j, int const k, int const nvar,
+                         int const n1, int const n2, int const n3,
+                         double const *rhs, int const *ncols,
+                         int **cols, double **JFD, int tid);
+       void relax_omp(double *dv, int const nvar, int const n1, int const n2, int const n3,
+                  double const *rhs, int const *ncols, int **cols, double **JFD);
+
        void Solve();
        void set_initial_guess(derivs v);
        int index(int i, int j, int k, int l, int a, int b, int c, int d);
@@ -116,23 +151,11 @@ public:
        double BY_KKofxyz(double x, double y, double z);
        void SetMatrix_JFD(int nvar, int n1, int n2, int n3, derivs u, int *ncols, int **cols, double **Matrix);
        void J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, double *Jdv, derivs u);
-       void relax(double *dv, int const nvar, int const n1, int const n2, int const n3,
-                  double const *rhs, int const *ncols, int **cols, double **JFD);
-       void LineRelax_be(double *dv,
-                         int const i, int const k, int const nvar,
-                         int const n1, int const n2, int const n3,
-                         double const *rhs, int const *ncols, int **cols,
-                         double **JFD);
        void JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
                          int n3, derivs dv, derivs u, double *values);
        void LinEquations(double A, double B, double X, double R,
                          double x, double r, double phi,
                          double y, double z, derivs dU, derivs U, double *values);
-       void LineRelax_al(double *dv,
-                         int const j, int const k, int const nvar,
-                         int const n1, int const n2, int const n3,
-                         double const *rhs, int const *ncols,
-                         int **cols, double **JFD);
        void ThomasAlgorithm(int N, double *b, double *a, double *c, double *x, double *q);
        void Save(char *fname);
        // provided by Vasileios Paschalidis (vpaschal@illinois.edu)
@@ -141,4 +164,4 @@ public:
        void SpecCoef(parameters par, int ivar, double *v, double *cf);
 };
 
-#endif /* TWO_PUNCTURES_H */
+#endif /* TWO_PUNCTURES_H */
\ No newline at end of file
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index 489bbce..c25fcf1 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -15,10 +15,9 @@ LDLIBS  = -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lifcore
 ## -xHost: Optimize for the host CPU architecture (Intel/AMD compatible)
 ## -fp-model fast=2: Aggressive floating-point optimizations
 ## -fma: Enable fused multiply-add instructions
-## Note: OpenMP has been disabled (-qopenmp removed) due to performance issues
-CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma -ipo \
+CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma -ipo -qopenmp \
                -Dfortran3 -Dnewc -I${MKLROOT}/include
-f90appflags  = -O3 -xHost -fp-model fast=2 -fma -ipo \
+f90appflags  = -O3 -xHost -fp-model fast=2 -fma -ipo -qopenmp \
                -align array64byte -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx

From 914c4f47914c69719d8c6e81380bf7aa3281a282 Mon Sep 17 00:00:00 2001
From: ianchb <i@4t.pw>
Date: Sat, 7 Feb 2026 15:55:45 +0800
Subject: [PATCH 17/30] Optimize memory allocation in JFD_times_dv

This should reduce the pressure on the memory allocator, indirectly improving caching behavior.

Co-authored-by: copilot-swe-agent[bot] <198982749+copilot@users.noreply.github.com>
---
 AMSS_NCKU_source/TwoPunctures.C | 33 ++++++++++++++++++++-------------
 1 file changed, 20 insertions(+), 13 deletions(-)

diff --git a/AMSS_NCKU_source/TwoPunctures.C b/AMSS_NCKU_source/TwoPunctures.C
index ea84474..79b73a2 100644
--- a/AMSS_NCKU_source/TwoPunctures.C
+++ b/AMSS_NCKU_source/TwoPunctures.C
@@ -2111,10 +2111,19 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
   double sin_be, sin_be_i1, sin_be_i2, sin_be_i3, cos_be;
   double dV0, dV1, dV2, dV3, dV11, dV12, dV13, dV22, dV23, dV33,
       ha, ga, ga2, hb, gb, gb2, hp, gp, gp2, gagb, gagp, gbgp;
-  derivs dU, U;
 
-  allocate_derivs(&dU, nvar);
-  allocate_derivs(&U, nvar);
+  // Stack-allocated derivs (nvar=1) — no malloc/free!
+  double dU_d0[1], dU_d1[1], dU_d2[1], dU_d3[1];
+  double dU_d11[1], dU_d12[1], dU_d13[1], dU_d22[1], dU_d23[1], dU_d33[1];
+  double U_d0[1], U_d1[1], U_d2[1], U_d3[1];
+  double U_d11[1], U_d12[1], U_d13[1], U_d22[1], U_d23[1], U_d33[1];
+  derivs dU, U;
+  dU.d0=dU_d0; dU.d1=dU_d1; dU.d2=dU_d2; dU.d3=dU_d3;
+  dU.d11=dU_d11; dU.d12=dU_d12; dU.d13=dU_d13;
+  dU.d22=dU_d22; dU.d23=dU_d23; dU.d33=dU_d33;
+  U.d0=U_d0; U.d1=U_d1; U.d2=U_d2; U.d3=U_d3;
+  U.d11=U_d11; U.d12=U_d12; U.d13=U_d13;
+  U.d22=U_d22; U.d23=U_d23; U.d33=U_d33;
 
   if (k < 0)
     k = k + n3;
@@ -2182,12 +2191,9 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
     dV11 = ga2 * (dv.d0[ipcc] + dv.d0[imcc] - 2 * dv.d0[iccc]);
     dV22 = gb2 * (dv.d0[icpc] + dv.d0[icmc] - 2 * dv.d0[iccc]);
     dV33 = gp2 * (dv.d0[iccp] + dv.d0[iccm] - 2 * dv.d0[iccc]);
-    dV12 =
-        0.25 * gagb * (dv.d0[ippc] - dv.d0[ipmc] + dv.d0[immc] - dv.d0[impc]);
-    dV13 =
-        0.25 * gagp * (dv.d0[ipcp] - dv.d0[imcp] + dv.d0[imcm] - dv.d0[ipcm]);
-    dV23 =
-        0.25 * gbgp * (dv.d0[icpp] - dv.d0[icpm] + dv.d0[icmm] - dv.d0[icmp]);
+    dV12 = 0.25 * gagb * (dv.d0[ippc] - dv.d0[ipmc] + dv.d0[immc] - dv.d0[impc]);
+    dV13 = 0.25 * gagp * (dv.d0[ipcp] - dv.d0[imcp] + dv.d0[imcm] - dv.d0[ipcm]);
+    dV23 = 0.25 * gbgp * (dv.d0[icpp] - dv.d0[icpm] + dv.d0[icmm] - dv.d0[icmp]);
     /* Derivatives of (dv) w.r.t. (A,B,phi):*/
     dV11 = sin_al_i3 * (sin_al * dV11 - cos_al * dV1);
     dV12 = sin_al_i1 * sin_be_i1 * dV12;
@@ -2230,11 +2236,12 @@ void TwoPunctures::JFD_times_dv(int i, int j, int k, int nvar, int n1, int n2,
   /* (dU, dU_x, dU_y, dU_z, dU_xx, dU_xy, dU_xz, dU_yy, dU_yz, dU_zz)*/
   rx3_To_xyz(nvar, x, r, phi, &y, &z, dU);
   LinEquations(A, B, X, R, x, r, phi, y, z, dU, U, values);
-  for (ivar = 0; ivar < nvar; ivar++)
-    values[ivar] *= FAC;
 
-  free_derivs(&dU, nvar);
-  free_derivs(&U, nvar);
+  double FAC_val = sin_al * sin_be * sin_al * sin_be * sin_al * sin_be;
+  for (ivar = 0; ivar < nvar; ivar++)
+    values[ivar] *= FAC_val;
+
+  // No free_derivs needed — everything is on the stack
 }
 #undef FAC
 /*-----------------------------------------------------------*/

From 133e4f13a24241ad4c108998d12350cce88d0831 Mon Sep 17 00:00:00 2001
From: ianchb <i@4t.pw>
Date: Sat, 7 Feb 2026 19:04:51 +0800
Subject: [PATCH 18/30] Use OpenMP's parallel for with schedule(dynamic,1)

---
 AMSS_NCKU_source/TwoPunctures.C | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/AMSS_NCKU_source/TwoPunctures.C b/AMSS_NCKU_source/TwoPunctures.C
index 79b73a2..1b6e590 100644
--- a/AMSS_NCKU_source/TwoPunctures.C
+++ b/AMSS_NCKU_source/TwoPunctures.C
@@ -1359,7 +1359,7 @@ void TwoPunctures::F_of_v(int nvar, int n1, int n2, int n3, derivs v, double *F,
     debugfile = fopen("res.dat", "w");
     assert(debugfile);
   }
-  #pragma omp parallel for collapse(3) schedule(static) \
+  #pragma omp parallel for collapse(3) schedule(dynamic,1) \
     private(i, j, k, ivar, indx, al, be, A, B, X, R, x, r, phi, y, z, Am1, \
             psi, psi2, psi4, psi7, r_plus, r_minus)
   for (i = 0; i < n1; i++)
@@ -1829,7 +1829,7 @@ void TwoPunctures::J_times_dv(int nvar, int n1, int n2, int n3, derivs dv, doubl
 
   Derivatives_AB3_MatMul(nvar, n1, n2, n3, dv);
 
-  #pragma omp parallel for schedule(static) \
+  #pragma omp parallel for schedule(dynamic,1) \
     private(j, k, ivar, indx, al, be, A, B, X, R, x, r, phi, y, z, Am1)
   for (i = 0; i < n1; i++)
   {

From b8e41b2b39053a3bf818fb8c547ba223e9b6cb9f Mon Sep 17 00:00:00 2001
From: ianchb <i@4t.pw>
Date: Sun, 8 Feb 2026 13:00:37 +0800
Subject: [PATCH 19/30] Only enable OpenMP for TwoPunctures

---
 AMSS_NCKU_source/makefile     | 8 +++++++-
 AMSS_NCKU_source/makefile.inc | 4 ++--
 2 files changed, 9 insertions(+), 3 deletions(-)

diff --git a/AMSS_NCKU_source/makefile b/AMSS_NCKU_source/makefile
index 0e2a08d..f2d4e3c 100644
--- a/AMSS_NCKU_source/makefile
+++ b/AMSS_NCKU_source/makefile
@@ -16,6 +16,12 @@ include makefile.inc
 .cu.o:
 	$(Cu) $(CUDA_APP_FLAGS) -c $< -o $@ $(CUDA_LIB_PATH)
 
+TwoPunctures.o: TwoPunctures.C
+	${CXX} $(CXXAPPFLAGS) -qopenmp -c $< -o $@
+
+TwoPunctureABE.o: TwoPunctureABE.C
+	${CXX} $(CXXAPPFLAGS) -qopenmp -c $< -o $@
+
 # Input files
 C++FILES = ABE.o Ansorg.o Block.o misc.o monitor.o Parallel.o MPatch.o var.o\
            cgh.o bssn_class.o surface_integral.o ShellPatch.o\
@@ -96,7 +102,7 @@ ABEGPU: $(C++FILES_GPU) $(F90FILES) $(F77FILES) $(AHFDOBJS) $(CUDAFILES)
 	$(CLINKER) $(CXXAPPFLAGS) -o $@ $(C++FILES_GPU) $(F90FILES) $(F77FILES) $(AHFDOBJS) $(CUDAFILES) $(LDLIBS)
 
 TwoPunctureABE: $(TwoPunctureFILES)
-	$(CLINKER) $(CXXAPPFLAGS) -o $@ $(TwoPunctureFILES) $(LDLIBS)
+	$(CLINKER) $(CXXAPPFLAGS) -qopenmp -o $@ $(TwoPunctureFILES) $(LDLIBS)
 
 clean:
 	rm *.o ABE ABEGPU TwoPunctureABE make.log -f
diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index c25fcf1..ee94ac7 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -15,9 +15,9 @@ LDLIBS  = -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lifcore
 ## -xHost: Optimize for the host CPU architecture (Intel/AMD compatible)
 ## -fp-model fast=2: Aggressive floating-point optimizations
 ## -fma: Enable fused multiply-add instructions
-CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma -ipo -qopenmp \
+CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma -ipo \
                -Dfortran3 -Dnewc -I${MKLROOT}/include
-f90appflags  = -O3 -xHost -fp-model fast=2 -fma -ipo -qopenmp \
+f90appflags  = -O3 -xHost -fp-model fast=2 -fma -ipo \
                -align array64byte -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx

From 4bb6c030133bfffcf5992f401e27d75d7f2f6a65 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Sun, 8 Feb 2026 16:14:43 +0800
Subject: [PATCH 20/30] makefile setting updated

---
 makefile_and_run.py | 9 ++++++---
 1 file changed, 6 insertions(+), 3 deletions(-)

diff --git a/makefile_and_run.py b/makefile_and_run.py
index 4f00100..096ed58 100755
--- a/makefile_and_run.py
+++ b/makefile_and_run.py
@@ -15,12 +15,13 @@ import time
 ## taskset ensures all child processes inherit the CPU affinity mask
 ## This forces make and all compiler processes to use only nohz_full cores (4-55, 60-111)
 ## Format: taskset -c 4-55,60-111 ensures processes only run on these cores
-NUMACTL_CPU_BIND = "taskset -c 0-111"
+#NUMACTL_CPU_BIND = "taskset -c 0-111"
+NUMACTL_CPU_BIND = "taskset -c 16-47,64-95"
 
 ## Build parallelism configuration
 ## Use nohz_full cores (4-55, 60-111) for compilation: 52 + 52 = 104 cores
 ## Set make -j to utilize available cores for faster builds
-BUILD_JOBS = 104
+BUILD_JOBS = 96
 
 
 ##################################################################
@@ -117,6 +118,7 @@ def run_ABE():
     
     if (input_data.GPU_Calculation == "no"):
         mpi_command         = NUMACTL_CPU_BIND + " mpirun -np " + str(input_data.MPI_processes) + " ./ABE"
+        #mpi_command         = " mpirun -np " + str(input_data.MPI_processes) + " ./ABE"
         mpi_command_outfile = "ABE_out.log"
     elif (input_data.GPU_Calculation == "yes"):
         mpi_command         = NUMACTL_CPU_BIND + " mpirun -np " + str(input_data.MPI_processes) + " ./ABEGPU"
@@ -158,7 +160,8 @@ def run_TwoPunctureABE():
     print(                                                          )
     
     ## Define the command to run
-    TwoPuncture_command         = NUMACTL_CPU_BIND + " ./TwoPunctureABE"
+    #TwoPuncture_command         = NUMACTL_CPU_BIND + " ./TwoPunctureABE"
+    TwoPuncture_command         = " ./TwoPunctureABE"
     TwoPuncture_command_outfile = "TwoPunctureABE_out.log"
 
     ## Execute the command with subprocess.Popen and stream output

From 471baa50652a229492c396cee95ea2711b43089b Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 9 Feb 2026 10:59:26 +0800
Subject: [PATCH 21/30] PGO supported

---
 AMSS_NCKU_source/makefile.inc                 |  11 +-
 pgo_profile/PGO_Profile_Analysis.md           |  97 ++++++++++++++++++
 pgo_profile/default.profdata                  | Bin 0 -> 403408 bytes
 .../default_9725750769337483397_0.profraw     | Bin 0 -> 334480 bytes
 4 files changed, 103 insertions(+), 5 deletions(-)
 create mode 100644 pgo_profile/PGO_Profile_Analysis.md
 create mode 100644 pgo_profile/default.profdata
 create mode 100644 pgo_profile/default_9725750769337483397_0.profraw

diff --git a/AMSS_NCKU_source/makefile.inc b/AMSS_NCKU_source/makefile.inc
index ee94ac7..a5fd83d 100755
--- a/AMSS_NCKU_source/makefile.inc
+++ b/AMSS_NCKU_source/makefile.inc
@@ -10,14 +10,15 @@ filein  = -I/usr/include/ -I${MKLROOT}/include
 ## Added -lifcore for Intel Fortran runtime and -limf for Intel math library
 LDLIBS  = -L${MKLROOT}/lib -lmkl_intel_lp64 -lmkl_sequential -lmkl_core -lifcore -limf -lpthread -lm -ldl
 
-## Aggressive optimization flags:
-## -O3: Maximum optimization
-## -xHost: Optimize for the host CPU architecture (Intel/AMD compatible)
-## -fp-model fast=2: Aggressive floating-point optimizations
-## -fma: Enable fused multiply-add instructions
+## Aggressive optimization flags + PGO Phase 2 (profile-guided optimization)
+## -fprofile-instr-use: use collected profile data to guide optimization decisions
+##   (branch prediction, basic block layout, inlining, loop unrolling)
+PROFDATA     = /home/amss/AMSS-NCKU/pgo_profile/default.profdata
 CXXAPPFLAGS  = -O3 -xHost -fp-model fast=2 -fma -ipo \
+               -fprofile-instr-use=$(PROFDATA) \
                -Dfortran3 -Dnewc -I${MKLROOT}/include
 f90appflags  = -O3 -xHost -fp-model fast=2 -fma -ipo \
+               -fprofile-instr-use=$(PROFDATA) \
                -align array64byte -fpp -I${MKLROOT}/include
 f90          = ifx
 f77          = ifx
diff --git a/pgo_profile/PGO_Profile_Analysis.md b/pgo_profile/PGO_Profile_Analysis.md
new file mode 100644
index 0000000..bff40c0
--- /dev/null
+++ b/pgo_profile/PGO_Profile_Analysis.md
@@ -0,0 +1,97 @@
+# AMSS-NCKU PGO Profile Analysis Report
+
+## 1. Profiling Environment
+
+| Item | Value |
+|------|-------|
+| Compiler | Intel oneAPI DPC++/C++ 2025.3.0 (icpx/ifx) |
+| Instrumentation Flag | `-fprofile-instr-generate` |
+| Optimization Level (instrumented) | `-O2 -xHost -fma` |
+| MPI Processes | 1 (single process to avoid MPI+instrumentation deadlock) |
+| Profile File | `default_9725750769337483397_0.profraw` (327 KB) |
+| Merged Profile | `default.profdata` (394 KB) |
+| llvm-profdata | `/home/intel/oneapi/compiler/2025.3/bin/compiler/llvm-profdata` |
+
+## 2. Reduced Simulation Parameters (for profiling run)
+
+| Parameter | Production Value | Profiling Value |
+|-----------|-----------------|-----------------|
+| MPI_processes | 64 | 1 |
+| grid_level | 9 | 4 |
+| static_grid_level | 5 | 3 |
+| static_grid_number | 96 | 24 |
+| moving_grid_number | 48 | 16 |
+| largest_box_xyz_max | 320^3 | 160^3 |
+| Final_Evolution_Time | 1000.0 | 10.0 |
+| Evolution_Step_Number | 10,000,000 | 1,000 |
+| Detector_Number | 12 | 2 |
+
+## 3. Profile Summary
+
+| Metric | Value |
+|--------|-------|
+| Total instrumented functions | 1,392 |
+| Functions with non-zero counts | 117 (8.4%) |
+| Functions with zero counts | 1,275 (91.6%) |
+| Maximum function entry count | 386,459,248 |
+| Maximum internal block count | 370,477,680 |
+| Total block count | 4,198,023,118 |
+
+## 4. Top 20 Hotspot Functions
+
+| Rank | Total Count | Max Block Count | Function | Category |
+|------|------------|-----------------|----------|----------|
+| 1 | 1,241,601,732 | 370,477,680 | `polint_` | Interpolation |
+| 2 | 755,994,435 | 230,156,640 | `prolong3_` | Grid prolongation |
+| 3 | 667,964,095 | 3,697,792 | `compute_rhs_bssn_` | BSSN RHS evolution |
+| 4 | 539,736,051 | 386,459,248 | `symmetry_bd_` | Symmetry boundary |
+| 5 | 277,310,808 | 53,170,728 | `lopsided_` | Lopsided FD stencil |
+| 6 | 155,534,488 | 94,535,040 | `decide3d_` | 3D grid decision |
+| 7 | 119,267,712 | 19,266,048 | `rungekutta4_rout_` | RK4 time integrator |
+| 8 | 91,574,616 | 48,824,160 | `kodis_` | Kreiss-Oliger dissipation |
+| 9 | 67,555,389 | 43,243,680 | `fderivs_` | Finite differences |
+| 10 | 55,296,000 | 42,246,144 | `misc::fact(int)` | Factorial utility |
+| 11 | 43,191,071 | 27,663,328 | `fdderivs_` | 2nd-order FD derivatives |
+| 12 | 36,233,965 | 22,429,440 | `restrict3_` | Grid restriction |
+| 13 | 24,698,512 | 17,231,520 | `polin3_` | Polynomial interpolation |
+| 14 | 22,962,942 | 20,968,768 | `copy_` | Data copy |
+| 15 | 20,135,696 | 17,259,168 | `Ansorg::barycentric(...)` | Spectral interpolation |
+| 16 | 14,650,224 | 7,224,768 | `Ansorg::barycentric_omega(...)` | Spectral weights |
+| 17 | 13,242,296 | 2,871,920 | `global_interp_` | Global interpolation |
+| 18 | 12,672,000 | 7,734,528 | `sommerfeld_rout_` | Sommerfeld boundary |
+| 19 | 6,872,832 | 1,880,064 | `sommerfeld_routbam_` | Sommerfeld boundary (BAM) |
+| 20 | 5,709,900 | 2,809,632 | `l2normhelper_` | L2 norm computation |
+
+## 5. Hotspot Category Breakdown
+
+Top 20 functions account for ~98% of total execution counts:
+
+| Category | Functions | Combined Count | Share |
+|----------|-----------|---------------|-------|
+| Interpolation / Prolongation / Restriction | polint_, prolong3_, restrict3_, polin3_, global_interp_, Ansorg::* | ~2,093M | ~50% |
+| BSSN RHS + FD stencils | compute_rhs_bssn_, lopsided_, fderivs_, fdderivs_ | ~1,056M | ~25% |
+| Boundary conditions | symmetry_bd_, sommerfeld_rout_, sommerfeld_routbam_ | ~559M | ~13% |
+| Time integration | rungekutta4_rout_ | ~119M | ~3% |
+| Dissipation | kodis_ | ~92M | ~2% |
+| Utilities | misc::fact, decide3d_, copy_, l2normhelper_ | ~256M | ~6% |
+
+## 6. Conclusions
+
+1. **Profile data is valid**: 1,392 functions instrumented, 117 exercised with ~4.2 billion total counts.
+2. **Hotspot concentration is high**: Top 5 functions alone account for ~76% of all counts, which is ideal for PGO — the compiler has strong branch/layout optimization targets.
+3. **Fortran numerical kernels dominate**: `polint_`, `prolong3_`, `compute_rhs_bssn_`, `symmetry_bd_`, `lopsided_` are all Fortran routines in the inner evolution loop. PGO will optimize their branch prediction and basic block layout.
+4. **91.6% of functions have zero counts**: These are code paths for unused features (GPU, BSSN-EScalar, BSSN-EM, Z4C, etc.). PGO will deprioritize them, improving instruction cache utilization.
+5. **Profile is representative**: Despite the reduced grid size, the code path coverage matches production — the same kernels (RHS, prolongation, restriction, boundary) are exercised. PGO branch probabilities from this profile will transfer well to full-scale runs.
+
+## 7. PGO Phase 2 Usage
+
+To apply the profile, use the following flags in `makefile.inc`:
+
+```makefile
+CXXAPPFLAGS = -O3 -xHost -fp-model fast=2 -fma -ipo \
+              -fprofile-instr-use=/home/amss/AMSS-NCKU/pgo_profile/default.profdata \
+              -Dfortran3 -Dnewc -I${MKLROOT}/include
+f90appflags = -O3 -xHost -fp-model fast=2 -fma -ipo \
+              -fprofile-instr-use=/home/amss/AMSS-NCKU/pgo_profile/default.profdata \
+              -align array64byte -fpp -I${MKLROOT}/include
+```
diff --git a/pgo_profile/default.profdata b/pgo_profile/default.profdata
new file mode 100644
index 0000000000000000000000000000000000000000..dfac738dc386625ea5ea27aa9d5957f2ff7256dd
GIT binary patch
literal 403408
zcmeDk2Y3`!bMFY!B}kEOkY3GRIw%H`gM@k{lpx^dawS=~#+8r&YG?|mbO8~OrYInS
z6j4x6DHc>Zh=BBFql=Y)-tL>*y^`cE6vhAUgS^|l-B;$#n>RCW%1x8aZZ-0wDl)=H
zAr{i#l}k!X7w~O!)B8NGKcm-pH=O=zqpxN35^vbflzotVbC>0-*C5wlZ;Jn&l;KUu
zU+H)3$oyx;Z#Me8Qhba_tW-+)mU;fYO5{rzy?<=F_$@PTUs-ai4831aTkK)t@RLH%
zgdgFzhy~&k_T`O)3M<p+H#aROe4ElMRcNvfy`Q<Fym<d;p3t!-^ga_KLU8kA7U51i
zdVl@~p?ge$DPFj9p5DLs^!>s&@B5K;Xb%pHJ?umQk<p&sUno}aJ_W?#4&wbs#b%fa
z6cDi;#rt#VbHC90kJJ0@X+M6X^Q2%Dwv`3-Htf$ENPo$pCHF*+XfyB7v8+vNcNjSM
z>vX7lq&wp{PM4R*vaBjg>)>^q!)fO&*{Qm8C(G(`w06#E*YZwBs!pA*g+FR_T6zqZ
z9!vhE@#%3K{M)<y#2MpL?S2wr%`i?nT8a#`2Mp7l-p3MuxJbWD_bTysoMi=5QS<HB
z%U0hgXhVNWq$P|lUZb^ZO(ugWF56+^v=+Tu6Wcw%8}D$Y_DJXAvhBRyVaQgi)1$bI
zYU=5W%PQU2hV2wrO8ux*Fz{rb<x9g<^p!}dA6?n#4k?{@i{4;Q=IsWZGsdQM>T*<(
zX5PX%_-wP5%g(VnoZN7$#h}iuc~E?nPH>@JklL<%@!DI{znOHPEq%6G5pBl~cDkIr
zDNbv*Yx7n5R9?--I$T)}ot?KiIjhm=FgT$Pv<5moK7Ekd4i7)ozITOFTU*g*!o}sw
z0Q}j=EQiCw=}cOOLlu*5aJp<<N0U}JgiEoS0N<<*-pN}n>fA2FTm7-}hjsg(^lG)R
z*1fx<_r5`|D|po>^;-O)I0$34Bk_w@NtY&5kKV6OOT5PVZ&!)%!1}zp<GyU@{w97w
zTIu~hUVA<6zVse9j+c@g_iDlGIQk}D<KE$2K1`p(`}iK-$M=itpSz>?*cY5X96xqn
z!q2KZPk;Ee<GHUMr9Tz5qT_}G=_d3<<;*cSwVW-7hjq-^bF3n9QS0?-`gE4VRtkfv
z)Ot1BrY*+A{Z){L1=2bjV{v&m8#ooInOJq){`Ji1+O(6Iv?NqS<<MzOu<HnPBvzek
zHRT%AJoi9_jv0r_xv<wbx?3%=J_XZYrG4qeu5YevOskYZ!JD8{q8gi%Z?ih10O0z-
zhu&;T!3$&C**}i)ZN_Kgz^P^v$Y#xJO)6oUhuNK6etvMxHa|9N@Q7E#QgC#cw0Qz?
zukDIe3HZf1@*PftIa#I7tzY){ChxvfWhVlQzI)3B)~8@vWbV*6pR#LNYg#9wqMz<j
z;K$glE{i@@ua46hcoQ%zYW@5JnZoP1-U{oV)NHHprr*6jdH6(ug@wmua~_{(6W3Xi
zO3m{cUZdx+zT#KZBerKwoqOtyx&f`{JY3K2B}^8UdvOQ9o>|SY1`z{y#8FO@iKiXU
zHaIOdgINVzF>i5l$(tAMdT`k*mFW(SqbsyTu$5wBkLeCC{W5B93;L{VwnP>)(lJbH
z%LUfQY6ou787qEG)dK^m7Z|Wzoy1oIovPSK{^WP}xB8%iZ;L*wMr60xc!|m4tQO9o
z&o-#jx&kN2MvC|?+{vJ$54a;t$E8eby_?gWPdlWuW$EnMS~It;UgB@oxf{!gVgdd2
zA1DY#B8W=HCr4N%6Sw)n$ej5bKSB0UHhVs>q>GJ>gcW80qHNaMU<O&0(Z&%J0z5U^
z)cTA@ydX^l3dA^OQo^7mt2D^O%a&bXJ&4oU%(V3w!bkJLFs<>niTktOuh9iZ97uZt
z!_3|~!`wD;Q}pwVHatlMbB3W@0Ep`*t0mja=S6X&RByC7Ke&AP)&BsVgqjRNAOwLB
z1VRu990D466!+GIz+Wr$Nd@z0=As@$@+P%Srq2|$L$NGTWpTm=<%nX<+B_ev5(isl
z9>?1Zc3Uv}Wc!^LGONu<Yt07G3sfxOzHC&-^9~NSW|u>qOO>=9jE8*m$Vw`h4h1hS
zcrX0#zpDE-3HnITC#k!Ok|2>ounIXpgZD@&Rhx9N=3gCakLnu8NaFHE2AqxcBT5G@
z*d@<DJAr%U8y8L;mW7Kj(KhQa6=8^bbLlEB@Rqtqy!=DgZAX`&2w6bkL0XDT&oP)x
z8loUzqf#wSzyMA|*nNkj4UNjx+SR;9qfd|K_>=9k&JEkHTZalgIXpw(?;HdqT-B_c
z_{N7d-fE3vS|V)}rqhQTR<SUZFsEdGWm@F;E?S*6i`QB}ROK@c<W)Kdb)Z@;&@o6o
z>J`3v>A?8G7yYarZ)Jfhnuq>qiDDNH4zx~}gUfOmjRv~|<Yu1*>%DNLCey<8YGuE^
z#$ZGONv9pWNYI=4@~XO3i<7k|bZXWWzv!%Ho6BhcJqrwksIv`J9rfa|S`EfFRNg-z
zP;og>u!o)tK_CQy5ClRH2tgnOfe-{j5C}ma1c49)LJ$Z+AOwLB1VRu9K_CQy5ClRH
z2tgnOfe-{j5C}owE<m6eoYj%zI&$1q&HLQ$F0_BIG@)Sn+TK22(7a+KTKJ{VuEY6l
zG+1C5$w6quhTZQEdT?49>ZRp2j6lF*S=gwhgVKI0&z0U3)-*DfK8mNt(3;x;ijCCs
zxxC)Mfg_Z3?C;?OrHK)21Tw01pY|}+6zHL*)Q=3N!ZW%}Th?Iv;net(7$HRWaG6Xp
zLxfmxGIH7A<eJzaIN^90tPjvNOYDc5Ki4Mpk&h;n%0Y*=!XOd4|KElHVwjS7a_9by
zZJHTfkI(@(qoqH)2sTo(_GVct7|+{9qn^OcpPt;A_3#4otNpMUEd4bXO)RijmKf}V
z2{aF-ny*Q_SJ+a<fhm~G@Y8eSw#8<I(>GG+D_Xsov-3I~&w(L1cnOC0_@k~$fAv1H
zKtrFxArJvS5fBn0CVKV47uiR_=pxcrFB~@GLnJOX`l|=gjPB`jcGPzRo2(Qb%(5lI
zNl6s=jcU>(xm3Y?3Y=g0$1HO``XM3en7=k<&EN7@33GBTK9ja^#fz^+&^o73%ppYA
z!&;7I(+pZY*TLej+Oxq9XVs3HPv(s}h1NB<+@(+jC4zu7lNRRD!)t24HWZnLi*zO(
z`DU}hY0u}f^xTQgBNiVqr<6rHfj;*cZyXYyPI>OKP>yLgK(O^XHExa2tL4d}^9hz!
zYDakV*5VS`knYrp-MhTdUwquV#7Z)tRnjn7Z=~T;rOF5{r;X?X5$VH(Z`7oUIaRlT
zaE%o5SatCie17Bw5ia=q3wuRg0_oo3apE<4lP4b*eJIeEzg2DV_a?Oc`1{4{hv+r)
zz5pf${dE`b5PxucAC48T(H4xMycM?B{)h-qZ13a;WYi3U^%uM-USs>``ij@s9`*;@
z+gV@i54Kl8$&rF_XeJ&TJYq|K5nc?FA$CmguJ&fCB6T?i-4KC`Q|B(dS##D}*NfB8
z^_RX^;zB}H=jMY^XKy|{2s`_xtV`fYZZ~Rm2I323$Oh+o;w$&jv37fpezq~W3Vl!<
ztB5g0^=G8lkLZ2u{XSmf<KEYJAF+wSpak>>X=tt~zwT*X?ef(q`b#rf5^Cz@6N%Q&
zXmSWXP?35qc;5;)0%tN5%&=p7-@P95x($0(miFJMhj;;eu7f)lc5~j^72O&1-ox=^
zcSDGZcRGw0%a7|kEqpmv=MAB%Q`-g#*Xgu{KufVU-@kcqi&RYhlXa&MK2VB_jKTVE
z`!$od`M1_v8*b{0NWBwUCm*9epL67J?S5}P?c}M%Qq{z}_sm~{m<Ui|#%Rx#%<%9(
zk93%QR@;N#iKnF>g!FI%P(=y?7Du>JBeBD^+O^c%F_IIXgxe(S2MK<`T@ek(gO&M)
zGf#ds?x)(DQ1X;57au!ikM#mxbegWYC0sE|W<>Z;lMCv-d<nfxW$mI6DHDC81m{+W
zVdCPlv}U#1pBXX*tGg&mzm3@Z`LNhmk55BqgxT~yIL-ozgXk4n6A5GC)EnT-&=2<?
zdaB*L`|dRN7YUspOO2okassqpLP4fcK9vgQsm*2E{Py7b21r3j4dkOY5bI{E!=SRU
z9Lr5z(_FYs*Rk;3-yejIf*EyjajO<Te|5r7&=YTh>9$BG;YQ44gRpW2lfi7TIKf6;
zzpGKc0JlKfRx+c*7yVc-?$QJd@*%?l!jSuO4_V?h8XU;zozdLEuoD*$F0!fuLge7B
z&BrIc)pzT$mn$LQ5^2w1VHew?UY+0$*rF!J{oRr8@)}-|mpFC>Gx6BIbvwhx%xg)X
zM=1E~i`zAZwP?)-BJ1jHdFtFsBL5|zWl^nSqe|w5%#2k7ua(jw0AwKd#vIS^10ZA@
zbbvIlHxd_ry&l_>Q%<}`N^J9m&FYIcYB;__HsT_E$fUAZ?PhS20o5GWVA8hemzOmy
z_W=Dd;(L+E+~_4%--<47y#FSB4vWIB@qVBs)>l}W0zZ%*k(tMmJllx;fzSNCVu>7g
zO}c}St%iIOsSZWKym;*L%0GXY(NA3Z9uW_`CxX)O7^7?W@O*GnQuR>71O)2ZrDUeq
z9&GV>>CZF)uve-mLYcI71Nf~$^r<`~72vegH5X!;;5dq#^eMKa(%+{)^#<a0GjaHY
zfA(2t?%*1pxE*Ly3T7Jf<FUv`J3iHwHlit_F&dK~nrMu)b{%IjShAft#9N1adVpGi
zji*es;7S8BV2)L<E<fI`OnrV(MY`T-1Hl(%=_?9m`uxlvziU<TB4W-IsngzS+vs$s
z0i65wnmDr+Hb1L<_>eDW&igj(Em0Z@z8AOa4QVv<G%czQxx6Yjkyaf~OFs+~#b%F4
z21Yd-ud`YRvp_;saDap`RJGAKb#b&%lYC#LRr@WZ9xb}~+o73l`yazVCW-WUKRr^Z
zJi~;6pQAx*ae>EXuSU(ME_R09f(O?d$FA4@ds3f%e%7APLhvHEQ9T4cQVbFTzMO$C
zh^12weEjtKpC3lPqkxWG3^xJ-P9Auw=5WhfZ}{%T^@o(G`k+tU@j{xUcP=VBo>;Wf
z){3^-jFx`M1P#x^MpA8WUjA^h4+RPqC9^7g@fWMxJv1A4q7<pMn2si^ZV2IB28CDI
z_3f|Q&)@-(s6mjN_`HFI@c<EOIJi}tt5<K_gd0i;zC5Ch&&2yM>AC9QS(|rvHb``=
z(N;mJAW<5fbRNZmd}4H2bVB?$>F7roy;?)~H%%visb1ZyntAME7z+*`hgV#Q!&fk?
z3)Wnm5x!?@8~RE!sXxU6Ko8?5e$&Aq{imCsPj1;E?rCfXOMkdTj}7z&6KD>ENPvO2
zq-3@ge3aAi;NEv04Pa#Q7&j`2$pZmXV0-0;@vyD9oIvR87I4uFy!CAtzxnjJ1<WFp
zj8Z7$4x>zXB3dW9Xp0*L&-a=5QN1TmzLKvlZq`D-halhw0=Sr!%=Uu0?|t&kk>6|3
zr)p9L&;c7YoU9v6dJe*XIYH3p91iZ;mnWR*(KMnQ#$)tT^?&*n*^*E?kaNo0Z67o)
zZ`m~q_mCXQPSSW_EP>swzh=%p)#kMdoBz`g3Jop<fe-{j5C}maPzVsE2JR`ycn12e
zzvmRpXPMdsBN}TPpoDCrj{z&`78v4%v(3V-*RmGY4_~t*Y1i*}TKSHwh=Tb%^2VP0
zlbPH6DNba8ui2P10|}t6b85r@f1u;ZD*gS=N<FvK-}~=ToP25PoKmgngy(Qdi;`Nr
z#Y6}p9`Dvj3(?}i(l98QY3Itv)TXst_mre{;UwvnLYVKGQsG=in|0?SDdJ)2Ph!Kd
zW0WfhHw&RJL3D#K=D}*g70kiNUVlyL{kHvK+Hz4)7d3{4p%Akaw1W>(mQBvq$(NUe
zr$;Ytep>TJpAM+tm5r`w1+P)9>ZS(W*MKo%BY_^xlw!V*OghG2X||^u?a^#n0zkc+
z^wc%M*&GP{g7z~`3~40B9Oj()Hi-EweX_D%xt6rxyX!43qHak(_<!O%0{r{L^Ovf>
zGcT<~;O<=laDN}J&1slWZH}m*WZc1hi^5*CT7Z=s2|?O&wI+xkH(1TTdNxylUGQqo
zV^bzu!mD>qKs^mkxlun{Fkm>TtzQxKU3YtWPz)kyEMG4Q=J?Kib;iAx*tQ?-lFVk=
zz4fT#k_3$~)qgteoXjlHpG{zzU=&E=3VR<tU%J1Y=A1cWd;7Z$flzz@DhMF0P%x(>
zH?EC4-()dL;?lAaZGRj&I$~Gw#Y5}OVgK~<Aw)q=7?jMJ&EIU=dtls{$0>A++P(@2
zRL90*q&hC2#-|L}aQY1MWd-$x@Tti2rO<8&#|t{EEuU-AxhC`MA90mYi5@H#NE3C|
zR{EP&>?<7!Eg_#bDIoz9ZLKBS1^EfgR$|KlrVT=rxR`a%^?&hl>C&im7T*f}z1t9o
zfCkA_5yUMA|Ghs7=Gy#-@7i0g#&@JY6@|o}Mpg+#jZO}MBv%87vnr_8gNn1NWUe1G
zbZ<K1rIoE{A983(7$$iD&qz28*X0PZkk8I@`tkYEKO7$SyT4I-kGdq+xE8L5pUgb8
zfBsTryii<oAL<PsP7d`R9Qn@0j^~e5!o^vVCIfi~yQN@$-FfcV^i^p?@!%<*zV43^
zDuf!v<H3lU?@qa1ImIigKT<z#Fh8Xo`!&NY&o(QfAD--Qyw%QU1O5yT{2WHX{I&Uv
zzW>ShMk4=LRC82%i6#~=By4{aIo;A`2^^q{q@JQ(m2*k*LE|8mjI!4s-&Hzw^t2x~
zH%gbC!$wQS$Ry#G54L7arS+mzfs7-T*sQzB<5|n=Rvod{PYBXNkMSfStwf=S!!8~D
zaB9b9+2OP=;S?+$7DIsQXU_L~didlH%DUL+|C5qn3({6O#weKkE=|}yXtL@E%JWDg
z{0M-BtVEV|<Xdz(b}%#<P9(pqtPPe~L;q~F^1|ICDCHJ}b$M{rp{Zyykx1v&&nW1^
z@-QaR6H`+V)>RzOPd$|*^xGS|i^CK*_A?c#bZY)p={ibO8KD?I91dGaY+8~025Z7u
z;p4f@O%Jxs3px=-6v?!6YnkJ!j@mJI<M3sz9-}~z5iVaX0hmRAiLK6Rwd);h447Q#
ztPWy+Xm)WH7bp#c3|B!VxvD+1#q_Q-a%P}u7y{Jab`gg*A2QRh{E{eq>NZ%?!0t%-
z87<iJ=-Bn3KXXNLJJ;>hRa!qMtU_^kahrZe^inYOt1Ox|YjCBdxQi6f762M<NjSmn
zL@beWe?G)5hhJP(Yj%^XDAe4h&K6sZG@2%>ZZvK;)_N4VZy9R&Y!;#oMx4OI8T11G
z7NjMHf@#`d!0JiI2e7EZE~-7;@`-hy-4-v#<=5JS*?gNH@3nSg&k0pKP>>YWoIlD0
zW^M_fwIrUZkh2HOaERlOK_9rwYV%9ao;$KO_jMFW$J1RLq#-jTdlW^WbC$g)!aDv^
z3MYX{rkliFDhp`u?p8U4&c@v;ad{P1y4MSUoj{&&vSjxV{dMp!!ywa#aQd%ZE0~tM
zTFzBC@;}a^AX!NfQP{}6Lle+EOu~Lj3_;atZu>MKb_vpbwV>yV2Xq%y)oP7ixPi{W
z@f^6;L}%t!I@0vA3eDVU2SUZa3<A>D(Q4GpUmhF%>JSufWo!YOJrncHsf)!Cp!k9s
zCM<D$QpK$osCFrO@4A9pe+qp>Z+4m3Nbb=5xBCqq;BW^7!3qK`rH0~<yEIkD?_Lmy
zRt}G|gaZL|%aYtnO0qX7n8&7Gc>1+(_J4+HU7OJ{6u~#g>%m>rU=Ub3yH*d0D;y=r
zgYx*UXI?GW>0RE<BU5(U0?|hdkT;aGWk+hc`7gZtL}}f+u#tg+HuPKw0wD<8^AL!K
z5g;GbAc)aGPO4E8pPmyrXLJ&ME0LD|L`7up#e-`VxRZ$aV`S<K4v#!QuhFZTE4j1j
zRy;d8Ht2KZuL-{%O`x5UZCF0Cj)xU^q>v5_<JEAyDE07s@Ma9jqdrh|oz|{~A4%S)
z3*I{p96{gee$#2_)E5UF8yt;{>uhOyL}rYYhepWa^>dycJT>m?*Kv!dkN;zZv~{Pg
zs(G;7?$4jZKoSIH$%pKm;ur+>lZ_l^hb&8im_-aGz&&UhVMI_@P1#!k+lBYN{zwh>
zo_eaoo8LW}jE4reRSO#>Q7hfNdGnV&<-3>1D!poQdsix%z8!v;fAUJyPk4r5qpt{k
z7tX|l1m3EcbQ1fEOQr79$s}k(H>(SL)YZ8aMlV07?$dQ*3-4w^*S8e{hyZ;@E%>m;
zCr884-4&;w__sq&aqtiUFJDko1day^rk~=>eNiX3D3H%ZaTw~<=Q+5SI((*Re$HA7
zd9>R)t{^Hy5Ga@@w2j^wYTk3H8htyDmVmfI^6IEgoqDSsCdiH#$z9&b?j2|yu=8#!
z=#<Q$kL%Xy{rvZHQJaz?_0p}NV`H*hJh(uJ=aC-Pl2j^vq!zE<d!&xhTTBTQa0s<Q
zit5jP{QI1FjeKF|?KR4>YP%hLDU*nj38+<8`ocXEr@yu}?ry^nqJ9ni;$W%L^FF}c
zKSKsX6yu}Q;oL#eZ;GiAU&<R4-n!O;4-uyW1y^CuAs7{mVb^DKn|%NJ`e0-wDj*5o
z_oCQT0$C|%)&8nI9*uB&M$6a+Z|ytXvZ>#<Q5|D6fgWCM44zRK+^c`P&($xu11-oJ
z^<fk+YrF3uJE%$zijYO=yEr&2nIXrAo;cOxy$Z-BHKVVP-N`Go53BMxY)AkqNCJJR
zIFb!?7?8#Md_d!xw1VO`#v!YAPdWPW-)0=DtYM!ayQ3?_z_A8sXNhfr$dv`&9>k0q
z)%NS0-(Nn8OoWV{2}iRDZVzWsab@D+e3s{%Y`eUz_L!>IaarO~6_N@ZC~{5sdts&b
zoS>Q#?@MbSmwoJa<$^sUuqCvu(VO5%r1Ihk&zV-%X7Jn>Uk{c44hTroIIKa`swO*J
zeF9lx(H&Db(DGzkAb1Y1bFi_3xt7sx1@kE(TPVbN(Bl9R^Y9u=sp+Q_Ij^1jbloR@
z&R>dN-SHM-q2&<|?m$<xf+-kkOnLSDiQjjnJxQdcKVsrN(m1z32sY!89@TD8rx9CG
zmE7K0t-p1-aFq7TZIgH9*K9;PR}|q9&cKADC_T`ez>lI7%$QzfM`sLAu8Qp3c-orD
zI?Q0tvbrpK@bu<h9=>?almUO0!WGWkL~<xTo;X^Z<N1{MY^Jqfkpf@H6GXtllKh5a
zW3G@ZhCvIA#Qx$nPALZPQ!wL(F8$#BVLy}!7aw3gqsRqQ7b^zGghP9cj(>jeUokKD
z_<07VRHl#7x5Qq!FW?LQUW?wu>p)BFsrU2pHg4s+cfBROF0Kz)@43IkC$Yr)_`dgb
zVfVY0(05m&4dZ*A+rA(w?d9&Y3E6h&OB>{ikd5mhZjho{T5v%q%r#+i<kEe0(sx$I
z%@c=nr%D{2l9}AA;*Mue);seEZ7P$Ngcikko^7dE6$oM3CTo_~WV7a}!Db?ogMU1z
z5MFreT9?IxZ|=g1Z&$~$zR6W~KhS*Vw>{9l0M|cs(}xWbIX@K(oS$HyX33UWSgNzK
zg6BJ@ef)dU8*hzKqwP>LIy{@z2{yYVid&$14h1tyJLt>(tv742t|_#xJR1kl1<Mq!
zWs{?Q4%OPA@aA}K7fcJQhtLqRu8>ONb4q4*m95X#AN9^56dn`lPyUc3h6q48-VzWb
zhj&cf(wzJ&aV(D6yIy#&ZvL5h18D0xQZIaPz`xmoiWNg;5VHjmdrXL%VYI1@J;2I}
zjkAEY7zsQIfxNV0Xpw$@_nmO<*T3II{T6NUwiSrp3g(qd9ipne*nSGCQdZJ7h$@Ag
zKXJllsD(hjqw0JT_x6tM<?+ee)|uN}ku<hf*_f$chE-^d=6tw({4HLTVN@!Jxels5
zA~bo4GJ>rZcDAsMKx%z{m8g9?Q+M@3?ecv3DnVW!(anQ^C)i2MYnNq+#X8JFgJG((
zcuiMb)`@ZL-b&f@$93cbusi>BDGhr;uN_P0{_yKz9ClGa_t5K$A!|r<7cr^}*rbyf
zHgF>t#%|H^Qm)^X6ZRp=D5`l6oxVz+%9kK)&XP-2j*i+gqAdDG$u<bzS@smrfrqD9
z=0-VS=LIZ71EoL}1q$ZPp+5|2dGk^Pj$76b-{7KgB*3b}kgZm;K$*Z=#F{TyJLh^^
zH{VAYgQvalO`7hv8Z_OVb8L{kD#gI@GAx(501(@QC;mR%;mj{*R^Z_7HqJ_&Ud9et
zb#_UWv1lPHLlW;v^GDFZdDg785hJv~P0y6f@=LFsczVU<lqPiC8VORAg;zxyd5fN!
z#AfjhgSZ*!d5xZ5dyOx9GPP*}M$o%h8Bb08gK?)(oU+{C@eT1g1j6!Fk3XSfyM-gZ
z$UsoorWS|pmn6ItaTf_@UA}$1J^RF_2179d&N<p`B4!yJU?dCc-mSOi>UC1>-Lr4r
zW)w^OkMZ8Ui?g6)Rt{}<F5<$9zflCtpo4;4LP)v;w#r(w%>)4@4Q9^eAmNbto)hjn
z*5m1&rBSW>uoock+PlQZJTXEFHM+9HqDw#g^qV!FK8PjRv1DtRjixli=5TpBNq8BW
z!TFv*z>3CH?3L6H1+#9d_J^&rG%?7EB6f;|k{s|^17>}d%*IQ7=U13IZ3zm+SX)ti
z0E_xlQIjbsP=kt>w{d9WF*Vz@JC34N9)*J2sK>?GPrkb9;}st&jS>h#-$D=wK_Ey7
z5MBob$UyWi3T9KUCp7K#))(;5Uq%tU82~Wzz*HuZzofq?-QJx>8n0ls^lH|rU+aw*
z@UToqSAF(cHZ}*m>4sY&`n_SO%V5zN*eD2fkOOjn!Q$dAK>jnTX?HIH+neCY>ei`$
zCu+;jFNMP<fFmD&gi!P^hz5ImuxiXEvJe#NEPe1=jO`zHOK5$x=a`^b4Z&GQ5DSI`
z!)knXy!nE!3O@b|DQ}86NX95wpBQ=AOhIkZbLg@@mE4M5`beOKG`FAkT6?7F**`WT
zNHb{_!k#IakFc?#>5E32WwLUl4{8n3U%^MCOL%+PsCCKH>S3*c_M*7wus#Lz<${X$
zE&Hw03_M$lr{XJg#Kckj=5=maUp&iDacAo*S~I!XOoQTD`ak`>CX5>ij~ta0%#NWI
zFFWQ}eE?V3n-oF>E#e4TsMAHBS2QkSJ6N=)d<XAHCs_qK`lFiHhn+|t@$8uJ*ed^0
z2umooldU*x!yk|L?m>H+BaPUH$oUhhjOqlc9{YDF#&!)oYh}yL7!VBALdRXOH4t<c
z!BDN;+TSKNc((I|2Pxca68r>n9yZbfK^lMzgSZYSJ$=q(J@Cbai0i1%rBC1XLYm+`
z3mik^W{&;~HTLVJ4*F{BS<oK}+76<y2O^ioqo-r_nm=6rJl}Q@6$ZDx$G5pc2>^Sm
zRP5Eoa=jg{=|oCIVNFwe&Dd1IIgabuL(OTdL_gs6!4V8{z!oc-<ExBc_2{#6(o*mg
z@clkwmn&xo(h}2BAy)jwHu1iedb#2?|AKfwgXZz_F3YBgzk8SBT@bUpe)oPqXOn0B
z_})KV;!G%+14A#o^5dM9qw3Qx$)Y&>p{}8D&j0kx{Wsc2{5x=|&;3_>EE$68m+^FS
z29js7MRTX}G<{#L$d~Iv$piW)x`D8eehZZ%AVP2m!GS=agm^GTgr4*l>%lwpdNWmf
zhDs4IAvlEKKp;?3JP@JBFe&s)s1yMaf<p)n1Og?+13aB8tQ4WkFcH9iqVj1l+{DNj
zcfJ&RK$KtPgY+YG9fC&)A42OPL=Qwd5Tb|wEIm{(CoWam)#9=DPoTvr?#Omx+?t~`
z899iLN7S_3kV^S|Zco7FACKQW^3H3I??%hrH$@;ou6Ml{U^ebq^{Yd*Z<R-XH2V8L
zRuD8LYy|$tjwqOmA2+mbe})Z1Mr1zy35EjJ;^)F{wtxTQQvbL^bm9HKwyI30_yH?d
zw4?oQMoZAw6Nf^T3NkW_dBi!m<a$~luXnD&1U`kHT6>6xCH~{H&`OJ{_GpDtQI>vH
zFxRI(zqa+rr{<&MfUNPtj>FvcbtJukp2Qar4DNzCMEbQ#!Ne*RRy=@Shq6N?-!qzM
z*%^%kd@13WhMdv}z7-?BI<|dfw{w5rt>dLq%%9q48dPe0cs|->;wcNvmJh(>cEfCp
z7+n+WCBXAv2w)woiNc?k>eTGA@YAb!AR~jCc=Q(CyKl1HWyv-SaXFpZC^(lDyy}S$
z%GQ_X59xb!!*h2FP=79{+k8$${yMZ}lYz;{a)l*kz9JGi*k~Vn@{)v1Db;aLmls-o
z71@9yI>r_z=i1SpZaWb9gRU+IB#3Tw`Lm<HT~SoTBO7VW{C|CuD8zl!uCPN^49kqC
z0LY<4g_5V(H1Lt<A-E+EJ}eL+){7>^aOuLoEDeTt`}0V<Qjc~!-U~xp|9`>t&W{#n
zt~66_+QE<C8GF4^6WVAVEy*HKQCnugu7mZLMC;llYx%`p$|}%2=}z|?`&~}8>U8T_
zN5;3L4HiK;;xW<_NgQAuMoEY|cULFzU1c$Sb~kCyKk&xL_@~f0q8WY9FHM(ID^(1}
zwIyr7XyIhrVZeDd%4Nkqp>KEmav&BQY?SC<NJBMaM0*I9O!y1(DQ?Rzr>wT=#gCu)
z9*z8p8mrsch;;{P5aJ~WR>pZGOhXV}-Bor!aaI3RzmEeMriaH1HLn9p{-Dh3s=izI
z**Diss*MB96u=`G5xOI~#HZ2ZagqT9#uts^gm9yRJw$pe$178Qn_T7Bw91GxO=)#l
z;B}xSzK8WGm>Q~2?w?nx^kyWqvYGMOGCgBx#Ji^l0$T(fLPNpSR6RfJQs3758q-c~
zrX?X1vRr%Mx(zc<K0xesLIJjc6^5=pz4Y;4M__y(L_jqAtWGP#`}DHVVq_t|pgRuM
zgF7@{V~Livc<o(c^%CIgrm-or@>gV_)uDzy;x&9$l|+NhX&ijCnqPWB@!9cham`Tf
zD6YhY@j1MfI?}-2qu;(^=Q`omSOf;p72*yWqv}C&$<?NH<Cw7tETyKJJn-O0;gNqV
zLGz{@`Ur+kAifI_``%)8a=C5UA;SlZEdzSo+wviligb`5h`gf^=ljH@Wwo|FV@J|2
z8@~^4?Li{IDNe7}5s@fRGN@o$f08sZ)jTN&In<&WLqh2GwonPdW5`kqmJB}f?w{FP
z7Y&c^Okr6-OF%X^SyHhYt&_N{Ko~a?#auMfa`+G_i9!j?R~%$Q*nH`ejc2}2YEqF_
zd$$S+v*LE=e*WGGW;bG19-U)9ImDkb)%$Sh@rmUT-`$<P;VGsR9CrUAeu<=72`pEl
zz+1?3Ubh+ddvg4f9x6cZFX>ib-|$Gk7kwN{Y5~W1mDo-}nD~64C3dE;=kfQ#S6bWA
zZThX7p8pFHZ4CvWeEADj;Sjg$i|~&t4N0C*HVY{_Rv#)u5C}ma1c49)LJ$Z+AOwLB
z1VRu9K_CQy5ClRH2tgnOfe-{j5C}ma1c49)LJ$Z+AOwLB1VRw_4@00C943<UL~=~_
zp#Ou#|M2JoADV(`Z+Bg2*=E;9JZ9BULoH(O&eOzYmaH5Hgp!2w$I_p*uarLMz55>z
zyou10|6vFu!q^DHkR^u3Mex<<L)PK_K6lA`NtX+L8GJBjINET_Oh3FWtvt+31WUA%
z+PrrgeR0zo^Eco6u{SBQQA`_LLR0(hm*1;C{p!s=ttljAWA(AAahthBSs*c;5X6bk
zHfsYnE>tjmr~PQJ71pC^AX#d>jM&Upy$gcQ*$sM^&H$E_5XKK|%mO#)>7SLp)%d{!
zjnSxRCmk^{<BD~->_#nA3tlu}udFpeQcSy%>!-~%sP!7+W}%UXj@1yeKhbdcp8Ly#
zah@J57TpHdhyR}0^U+6o{*Bbu&yu(&Zb>Fa+$WXB>>3dN7&=U$iLhO-H`w`H2N-2h
zhbd*{mc5goI9@(bOJD`VpQx~~_j*-Vv_VUhu*hwn#YT&X0JB`CA)Js0Fs36!5gVcr
zjYl)q#0*#s!FH%s4--w9fw|Ox#=Au5;{cV+;D?7h7v?VShyF1|En1{d7}QO#jt5g&
zJ1ifF!5Qf48NASXrqkKHp6Km`4H~sW44f3rIPf$c4pp<3-#7U?8O>pFieNGNkR36E
zXQY^JLRj}f=O9rsqf|!Qq4L%Yv?Y@@SO|Hgwv&3bs&j9kGy}(o(-bJGjCy$YhKnyw
z=+lr+AA+pV5ysI}d%=*?=SH{I&Z!f73XP^^qw)cxFCqxh{RXRZgLO1gGUHF2+VSk_
z1I=inCq~w;uY*=BA*y!4^xdY_4KYC6KfT)x#4FY|2`tBJz)vJqw5$f3MPkM1$QYaY
z8i9PE&>!Ei^LYK*)Yg7>Qy;*@4Hpv)xve*4v9g0SVxOQqHv7OIdHw?O`ZSC4A$Z5Z
zF0NNc^$0E){R@}B`7>qv=W~N01K64-R}Bf4g7nN&GLt&)|KY6zY=$ZTtfm8uwpi`v
zR3qeQfB?XdBgSC1Il&>JZh*GPlXj21Ix}uuJ3q{r4@lh%N*uL#cbnk`IgeBAhyQ$X
zXO}7%xL>w-F%5-C($yqi86YUqXq4-aw&VS>^oxRd>4EU*t?w;66G&na3PCo~1QC-V
zvjC)P05oA^h8yfw4&p0klk^3_q;G)yNuOMAda1#xni%L;HZmV@vXN4#=ma5Eg6NnS
z=&qq)=3MTye$<LDhm@nkpHEAjElX#2+J|u4>LvbWox8D|KSrEBdsm9WO=0JyO?$sw
z?aqt*EV80E4#4<Gz<7b91e#|I9BNB;=L~u0@2jt(t3oCP0pV0-2@Db(IR=x7u;L_T
z-g8qo4gAJlqa9+}?E)Lt2f0}mj(MctwDoTzu`ddB-05Q>_YKLTDkcUp=z-}7*cC~^
zEK}9Ed^qm@vwnmVT!y}B))E9?cnB}+Qj^u0i-5qTiPu<416=;Vmq*Y2l=f&W{VAT7
z{<drn>MbPQ5$Id4)&#z){9tf3xStX@%GF_Wg_cr3-cfEUSGGaysowP2L|T&hFEZs)
zbToJmLw0v***ZARW^xG}?@*Uk4{RT#7PmUJP9DT35CyWPE>52IKx%n6Gg@f(ync{+
zyZ%J!U$4AfWk(14L{Vr_2tiAL@azy07?uj8i_(!y)duhw4Sd0T@WAT|-Hz5NNwf<o
zwDdP|B4$QK)9g$VsK95=;?#nE3Btq+C<M9gz_++Y>YOt$BzatHFHjVDDZy#u!u|~_
ze>m^yN9ps4v@CX3RVv~WPCW>nR?<(06DCrv=WjJnsgl|9?&Dp)TsH3&WK%U#uM(b!
z)^VZ(Xgs<$C6Tu6041k7*SzM>GHu>`>b$qZ60ITN0ztH;<AIC@1($jwfB@>k$KNb^
zFF)87;~lOnhtAI1oFuk1uLog17+SNf<D!c%Ml9HtNLxiJ=Wlvs`=TmArv*nGm=;3l
z?IN9%kV>7KLDzqvoU4M_Zr@mO^0yz&3j_{s-Zh@2J|vmmJknN+X}Ex$rh`J=2VS~M
zoC5{3>s|8?Rlj_=EREL8jHk~493%lZD%oYWaY>p!TrvcBkU1U+a<0G;i3~jP1Kh4`
zGNk{4>}SwJ&)w)<`XY_(!0w-yt+}|V3VJ_%Mth*un>jmgFl#LqZr9rL&qqAHy$t#%
z-K9>JxEVR;B43FL<~wEP%-<hcJ2?<eQyz*!<tK$5VKjlK4tzl=nWLk>YqVsdqB~NS
zm2`;0g7S{BkVJ?+*TXQ(0it%+r~w%bs&~Hj6Dn{@44gasB4XCjPlmO8=&{62skA*A
z5%p!NX{u?FTtvm>f=bGm&!MY2=KwG}cqeG6v`!!>7S0N8%~P*FD!9DKC%7bI!wxH$
zlWCbJRt_@!giB#OWsgurW^m?k^%t!hAMrr#Fl4_<(qibHl0yJzOUaxcUGK{C5oLQJ
zVl|_c`rDj5Qklc{1X(zpqGH=;cX9~H&qa<%4LMwS>}zqn^7-A3M;;&0wlew$j;Ak@
z6FNg4WPjxVe^gepAzRCRrrLewWX+=$|7r5CWPW)dQZb?T(Q376Z{<+*&1Moza-?6<
zsy@6c%=mn?Z_PdgfU+)bwMdkZWjV{if$ZQ4LOd$P+*r7O<6}R)^Co)3PNA(2|JUY1
zzA@U`Om)6~v>)w*B+z*U;3=s*cVo2ktw+|p9)~m&XL~4cNREKh?kSkxvijT2T^p4_
zjX&1oXYC<ZD(Tum00k+F&PxE?*B_(X?CtwV-ADW=bS3U9S`d*0R@1~o#4EQll?JEC
zno1iCoag+r<6m7L+3#A}fW8??OBf_h46VGFRI8}?!V-sG*4-s#`cKEcef8NHxK?CM
z`K%QZxJ8Qn<c_97R!p|h0^G<!vD!cfs$9LOd%p))RzmO=F_&>hy&!Y3F=ngDpmRaG
zExT6FyBvY@KnkW*!zS^I4lX^3=g>AvSOKi$P*Kc~oRtO1WgudP!qWa^^>O>pw4k6W
zj0hu0k+H&S48VZzAyDudpYtw9dfh-mjZ^4dV#E~h`^AaKg|&nA6<0n?`-z88RIqZZ
zF0g$ZFZK`b<1i5w6-?NeT60FL6NfdRKgkq6i1qPcVIr(FH5_9&40c#;pziI}sN3!(
z@Dg?bt1hgRnk;?t>A18H@=qd=kI`2k8liYL>B!L$8RU;;lloS;*N<cimrd?ly{XzX
zTgLKEboiOHgoWXzbE;^Y-2mJ$WnMTZ4@L)KY(sjI>Lz^RVG#xs<NID;{K4l{x|~I@
z)5>qT!1@$S*-!uYd131#&!LnYFcDL+f^xtBN<uMKlBlZ)o|Gw=`^Q{)F>zz_S5RG<
z;Rl9nj2Ib|B(VY=lEdV6_9ms!-q-w(-m_aPCL<NORbU~kluVVV9>3O}l2fS>ty0!c
zKWUEG$W+n9iyscm(9D;+^|+!v-u!m=s!GGuA8KFNk&g4$OoE-yCKLzZRkcoC4jTih
z&WVZz^x4APfv8F_oP3bxh*#2Igo1*pdZp^ypFClTtU`ahL0=gHxw2WJ)3b<qvbl#B
zUrKv)teQb`C{-5vb}vGJpca{HvR4$P&`>bdbiH(4T26Z@0-huvjaZPprt&yjY*ZTX
zBcLS6HKaQYHZ_0bkGw-4u&v7@r;A8UUw5C*<9#e~LE>`~vObu8erLz&ga2wwe=2Hu
z2<90Hge4OfMG)sZb#%wW#*A(|*sW`$EDI4MwHAlfp3M<EPYw({Z#@6i?wmnsmGM9y
z`y49o4G1JcH_7ahm4MtZeD(Q|RpRe3SiwAerDwx)3pO51qVJ^85>|%~$!0y2Z0<Oa
zg1Q5RG{N>kFxgc1>YTiL-DBl%!y!+jQaz&BDO2_Yq`Rm4ib^F~P}y>L@9jm%Hi<AQ
zevfHhYDdN>_28Gf&{uX!AaZk6Y>bdCSKy<Bc$7ZkqZlPx3LXZ=g5p0uE9=RJmhpQo
zg*Ca?Ia7($wMbtxb54`b??ZH&;tys~g0>b8zAO$SoaLvv8BZ`@Vx!y#&Rmw(td^aA
zq=Wg=dw;1PY`ElDS${~4GkZ5mX~dCZ;@aG|X#J1}X|v6w5hvu^IE%pS2#O00n2H9W
zykOH;-w0cLaSLin;-!kc&#iG0qNc=1j_P^d$W=|9L&!w%f>qR>@pahuvsVXl+Cf|Q
zu&V)cjgs5dD4FQhvz8B7ADI$P$9#isW%)KUq&#;H*6OTTkb#^#wIb}ofHA*R?oFQy
z6(I=R3lK<zPU8NJq=fXFEL7B|lk37h(bG4McX10VqH;?{bbNPj+4*{$IiCyGY$&GG
z<I%gfk27Eh*nrZ+hqA;MHg)tq5p_|Hk*m}cOk7fCcl+K?O}NFS&^O@hpX#)RL5h-h
zGTRTiysUZ!`Mbq5>G3mSoq}mwb$i*b{;c{nhRZ~G1~@@6(Lt1xH<@w_kQjp;E2}kK
zbyKf47b>Gv*`s3l1va8&9#865s_pWoeGpM?^f4lg`5qRr(UN5h*V6^oF{%pH-a9$A
zNp(D&k+*U?zhjRd|8!E5-wv+7hQPqmAA9V*`|8zkyd{^Im#X>T?Nw4%uj=yW;DT;A
zQVkuRz+iJ)y`F>!u0y6CHL`(@UygEe?pML2>aIO<EF<wL6b5o=mHtMH!hj>+;WU^*
zt4NeN98c6ZR0ju2oot&$&8P8TDigkF^SJ4)ntxF)&|U`l98Q>m>E`J5(_^oEWA}3!
z=0g*4$^@Va_J+Y)i+4}2(c}3cEjOScYl;N2!niY`G3sC@GK3%-@YOa%A8OTk$*Nml
z$UUM4R9Vz+?+!FD2!dhMiwq-JFmijufdtPoY8w7D^Oxl#axk+FA}(3tUUrr$)~|UN
zt1^PYpd*K5ZE?Zk;hT2YF>c|I-R_{@LE?t{aS2J%PQF#P&B(c_2pcT@VtS;A+hoI3
zMG}J@z;G~3BWCxay`!3c^=zilO7P%HZ@6}k_4`4Ycyxh10rr+83>Ov6$(tAMdT`k*
zm4mOo@1ibmeRjETxn>9iy5h-f#CX~ZsS=2WNHCcJeKt6ZbWm~ntYObpH*g<SsEhCa
zpOg}+^w)h<YI*rmRgmvVq!0iI#)DudDzQZqVZa8xAkM0Do0K~=DOa`d#bAlE)NbaY
z#wow=|L6f!<K@tHMZ~b0^fZ|W9Hn)6dC7{j^DQdfE`5GYXbPDU`QENzv{zClkJwy)
zY#^E#58^6%@%mbmf}<2^jeO*Lk$6Y^iy#SObWsmooz*LA45kdpq>quQ&}hNI)MPNR
z(U@L>(;C6l%by~~Lkr`RWJ2Edt$fFR>-N|)7W6#zcM)zc(s?Ls2)Wp3aRAXJ&8@d^
znz>sBeL=>YcvD)|!|hiU1w_orYfa#@Ib6tH0bVdJ&f+4zzk+rQc5L5&NTTE@fqj*i
z?tx#4NO<Y|kxjTauBQ(X+9UJ0U{#&qw1(@h&Ew53vov4A@gsQEMsqJb(5T<4b|YHi
zQjj<HZ~Tq`P%ws4oo^02{>O5hnr1Q(cx{HB43%i3L6h4AW3@l{%9)G}SBEsk?YF2F
z<#r%|cxhdGz$rW%BUy(4b+bFv2;$=KQNfr$T{Up-gkQfzsyCayYSibEoPhIAYU}@F
z7HfpekP+a2X;k(rAC7pu)8TcfevPC9mB;0mi0yZ6T31>+V_NwLtRPeh5J3169t9Tw
z`9aC#I?8@q>8DgT`-UhvEGV0?+$iJmU!oRw=qR+tFjxyv6Cb|b!@@}=c-axbMDifu
zKrG7x<7*)$An7^z6p!EeNd?Qge)(>VWbuW-`w+zvPe0K%!J`*~33!mb7*VSAkdyH<
zZ#)ugFW5-I-!SMC#gVI3*2Jb?K7>>(g*HqGxfd1l*z}2zlPii88e#~0`(&IkizfAc
za^kD?3RhNigVbaiEigx&c#{(h!SuoACsQyJ7oFU^=fIP>C`sC6!<O$~|E64-3g-De
zzpmQaAgoCR+FK1RMa6;6YRkU^nu8Zlwx|^O{K9d_fhN*MZB}ryRdGvyxUeXve6>or
zFVJ6$Es%~Vm`QuKoG<^;_A9vRWhm&o`eg!}VJK{Cu&aH4HeOifw<=zTF_RtBn}54G
zajG9{N8g@!oR|v7`9ad0$*W(Sx%S~RPvQxEJcXG*s^@3z3C^<AeX`_I>g4pNj{f=i
zqLFAkgOlK|6X-jo@|V7D_;A8u21;)ykIAgt@pScOXqt%RM~|s_RW_DWaZ}d>r-f87
zQ*`egP=E9Dj}0j>W#d5$MM<ELjJf>Tt`~%RB5_%IsbHp`yy<+h)y&Fhnv_U?0icOS
zzcC=m=`%n#*eL(IMerjoj;2b_jR>!?r1iKrSp_rG@tF3(_pWxp_&>901p<Bc6!O`q
zRKcUpC%cuvZ3`K#AXvn%6=UbU*Z$%9xWizRq4J-B0AiJrnVmFeS*g-x4*5CpDP$`~
zmxvg<0rY8sOP8~wURMn4cIpHQT?KUL#$kN6#bD?3oDtlLoxIh;t?T|~(!^ROCAvM`
zEg&IS6wJKob$*V!e(cSFC=^<V_@hw4W|n*H)B3HacX;*!(k2-x@!1WKG=lN_EtovM
zadKAUPu?Fo9aS(X6x#lXu?HW_#uuuc?|vml5bkevcZ6^T(|dmUL*$AkDDxv+{PoUl
z0vf9aro_tzG}!Pt3TA22*)^q@FP1l@0MST*@i6p*g`m{~Z<qyf&%kO2;yeI%sL{nM
zs;)Y>xp!l<_bVw9OGvqV^{DPC?e>0$J{iI6-6YLBXqj($>sBypK7D&cdYEoCE>6Ty
zqU_C%WP_5yl+1hS`ks4Nmi--poGAfWQo+TFk-DtIEMSoh=FzO0nwIllkKFK4Po|<C
zfmBi;d%uVEy?3SNh$Z<khw$tJ2kRI8&=&>i0I@+Pjzxj;CkkeL`hhl4H~LLRg`^DS
zd{)1QGjO!*7{OrxPZ%daiYVnsc!Wt;M5x|AOx&1MYd6zHc@24y@f3ap2Sm?8!K={q
zuW>6>FrPL2V*ZVp^IA2gU6m0Mx$-b3Js)CQcqt9}sr02lHI)kH>!g7NJD+&vLqCR2
z-utSjE|rb<urow8YLGUD-=q&O9d6U?^0Te`a-=@CasC)n3ITV4D+FQ@q|e+_^Vid-
zQKZPA&-hy-@?b@5ta$7t=`Uchym}yi(#cGQLBY@6UJ1WQ-Q24i9r4z=5yO!Gc(Z|6
zrCciq$#O}s+WxCQnWwK2R^~orp-b3!=(P|8LJ$Z+AOwLB1VRu9K_CQy5ClRH2tgnO
zfe-{j5C}ma1c49)LJ$Z+AOwLB1VRu9K_CQy5ClRH2tgnOfe-{j5V-dtkO_9P#B`Rp
zuym(3wD<m~{yig5FyCI8-=TIy<Y+XBE6QNX!<=34ABFs(G#Lpo)5<uI*L@FEbo<Pt
zj;>xXX5Zy885qOKMnMObF>It59@+{X>)<Mv1<^0~)E_rYn!ty-Lo^`9U|CYYd%rK)
z#GFi;|LLN=O%Gt4qeNK;y&Q2o-3g1xVKkh(Q#p(-O#kj|=~|Ow(a=a{!sWIVOb~LO
zc;!3MkXRD3h+ib%iML4?nloaFz(!yxnIB4(%U*h=$^B@GDl@<IG3koUfy8ga!Iary
z80s=ubcO`2&1L|v)Eo$4ad5v)u#P2UA&?Jt;fE{rY<*eX4Mg^4^ku(>Rtb)Lv)SOZ
z=gYj*;zcJltvzrDP$hHa)22O|ReQBzBih=0icSQH{e)PFOmkbqs&l`baY_05jh?4*
zrUDsl=$ShY0mP^)x}6cZ$<+tmvYC5+P>wiC=C4oB4msrPGz%R<ib7=%x-Gf@in(tB
zclG~kOxwiy#xHxKjeAkeVR}lH${j+O*pj=gGQs00NMp>h$(C=@-?}~pW7W*26HKgS
zEs#uyJGbufU%x(gybL-f-FXBkx&=fJB~!6lyI=ZP-~H5&{j(3v^GIouz(Z;pA(lnp
zw5DR%$j#3@b36>;G@rT;7=}{lYyRerf1FY_?5(1^ANn-}fe-{j5C}maNC+gt^Mt!2
zj465!z}J93N~TisYdO=On7ccQzEjjj>*-7ujTsjpy*BZi2{?>Tr8VX4j&3hrM`u;!
zHT`nM@(3lWNQ2Qx!ujVKI9VKnpwrevj)z9GUB3*gy9y<OfV;pZ;HV+$Y&Ok^sV+ee
zDql@uBlh=kwW4rOq$Od}y#zVRPO*^&yWMIBcO9ODGw7-tKK1I*NyNb=Sf>Z%78FdC
z<Qo-UZFI~M2v_Gh`;mfV5_BMm2b_i;<vvdO7?W$r0Pl8l@eNDnjs&e%$3eo4Zam4(
z1o0%iMM4TgpF$dN)in_f%JfY<g6N)8IM_YqXIACRw;2duDQ1T5svFg-!M5_XemsE8
zk58+&cmq4FWNKUuYnZ#Q;`@)&8k<R-c8k$$41~w*sE42zsuW%bnC%XxO*2eEj6u(^
zSJ*#qZ3EuN4%E=A|G0GG-OeaRkC&SFMpZAEu@2&!Ww%;L(h;6NvSjA{KTn(yC&<#+
z%3UmRKnkYzn$11ySE;)R1#_7Plmt-~I4*LaaDsqtI$1U_h)pg<1OT9(9ai(mle6On
zp##(aFL>fLmN;PVYrHS@vd-A^7sh^5aUb&Xvc=*JcuFH;jIQCs^HYtmObk2(-pE!P
zgLk8?=TyvUaCT*tX0%6G64K-oF>tuK#F5RFO#QJ=UUfJot08R($uYDfO+yq&T|(#*
zh!JKW8NGOj=D|<xoLmQYK7?FRB|^3S;@1zaiTyAfGYrWF=i{*HA;&^+P{@WH>sCMl
zDKHA|^fhU-UeoUG47RLbBJ{mhtQ@qqZa~8Oa8VfZ8$}~nAN9s#AGf!Dwrne0!2uwW
z-RiOkBaWmwn6n|0p8m-(;wS@mt85Xrvr5MLU2V~eb2f#GKV*s)@~-Ihnm99%45!t8
zf86K0CXD*xtAC%E-MaU;t;_VQ+8ULQ1$0=b!-JT=+{4?dhFveer~*FY#)v!o1re_G
zmIU>m2daI7D4s{#^;lirp4w4vPi=nx`V3X2>qB41I6`;0+p=&bZPpz8<N0ga7R_ms
ziF9rGLmD;~=!4#6&eua8Gm8VFQNT{KuVvYY@!eK_g(}cH-Sz)U{fIgWCNeoP>qwW(
zVSZHiK6KKPGmJ$JS>O<XOD+j}9KGc)SHuIe-$7QPfI?V|hD)LeLUiEetv7u4;`&4X
zVAPSgMki;EG<~x?i*^swJrhKg2MCL`*{vq4C0k--J#wAMbFpUe0+%KQ1clHPu;Ha5
z7Z=Y#041JZr+f6^b77lrB5&|t!N7ZE9MVdOPriKl#a3S|t3tbekP<7c-fV`T3Kpl!
z%w;(o7H(*NXSIl4KbJ+O^IjS1|9d|p003l8iIOE8{(FBEOhTjbt`5;h2O@tZ<70~<
zmMV9M7a>yqD`zu>+Jil4R5ES%*1Z<B@5w&5^I$k%Iv6(dME79OlVkU+sf&}RJ&;<y
z#CnIed&6I@cxtQ`C8qThqLi%1J*$3EIpwkYaY1>*`=7q92^}E#fd8>S3g*$PuXkTI
zs8wnpr&iv=1;qQgrQp~K=CR~v2UqWVTw9HHXfrKgGZHrsFk1lW2_m~^@q@bjTDP6~
zVt0HNRY;U};gA^QT~W#5jhJ{{Sm~}P$S;MNbVy{kL!+FvEyt|Q!T_Kt(r8()ROc9H
zZ^*z}&nu25y?m=du9QqtbY`n2DYK^q6aq3T+homxP}@2yM2C08gPlP(1brPIxWY6^
zf1%l#Rbh);(jhjJhU!CJ+#$7CqNgJID!nZ)@TQbZr&IfGG_EmY0BUE8YRn^|5li?z
zh+qV%Ngyp3?0Z2b80r+gzT&3W>TJbuFOd`{A%`m@^VNdcjkt|MxR)BgX}|pN<8Q)7
z28mUn$3qYZLEzqn0O6~U6GOTb$Y>Ny=NTKm*nWKWGCb&zX~29)sE~P=1s#;$1pxwq
z>2c`{kT)0PSbea{)KW}p@}~t4joVf)5S<?z-7$sJ^V)2S)#2oI4mMf{)(i@`EEgPn
zK_&}5j@Emh#`|UIm(<?#wQp@Pe}{*H2rb|Re8%g+iGaBduhy9Yw*g5_J~ZnChq+@Q
zJP%sxu<<1A1c~?Pk@ef1c>+gM+$a@H*G8*5CJZ~*!9ZWp&{9Yo)F!Dd5yZWY(^wVP
zxm(YU9lCK`56Cha2}wgp7Iy<jEdU)H0376XoxuUAk_Co0jpQTsu@F@6n3eSHz?3h$
z7sjmMFp4X2(v(b(M&&DPuDtOavRgapt46&(KcA>P+Wp>o+R0OirI2qcuIhiw?}hQq
zJ!V`zbn}e!NO{^(oIf7&w%cJ6?nIKa-pSXFKl8&g1N+l9WwgK-R|sw(>qc^%`N^6B
z35IWP+7tzoQEkF>-Kg0MkO|AAT?KTO4o0G7Cw^u=4;8nNw#9w)C&YA4kKyikiW>#f
ze@&M%b?a<sPiQpx$S6+HP-WvOR8^3FM#x1Y1PLb?Lq5gRfPs5sCw$fN_g_@v3k>$a
zAFcCLRYtj`Z^440#7VqLF;DJY-O;)FSlJZX2N_QJ&|A+#(x_<2QDCq`W_FWFX8G%Y
z;L0Wwta%{=T5hnp3!c;;GCf*NR};^<WwYVaA4>l{()Q}rv4ovB+5#6Ho=j$@bal?%
z;3w})VNJ%lGvVdl;?Y`WbbkKjMtwH8g$If@@>r2HgG(rV3&l~d0!cIx<#9(Mk0=<O
zeo(c2gGNO^Oy4L9nPLPJ(ik1FmIxeol#G6HwIS9Y-&4708|!IFHgGs}wHraCgp_+u
zLpEgjVx!0%NEqdCXgUC6rsp+Ly6hYcA$MY$^%DFAJv*K|u6pwo)9QY^UPo*~EeP$C
zTPuRsg_ZbTVPzwH(S%=U8RRuimtH?gH`IBeEM}^kPpcz9^gg)<Wsrs!juL+A`&o^V
z%eV63UY+=-FL6`~#^{{ue5~hd50{jh8P&0()+KO^gj80G=QNE;eWH3Ag~OC0fXRAg
zve&qGVBj3(r#q0#OlE`wdF(YBz2o1P%ih(SO`6|!TXj5s%b;TyT%b5ui*Pv4EnCqr
zd{e5WG^%lL6<?(J&TBOORL2gEil|R7ir~0o>c={@w-8i+jQ-Hh#nYNSABdcWVvJwg
zj9?uro;x+HjAr>KH}Igf$g$>&Mj>p1n`I&{55s_a$j=WZvC4C6CbW2Y&to@G#U4So
zORA|Pbk=Soft4HoefDg-8I3C<MY+{EzE|IuZ;o<~6tXS#-mYq>o^b}L=M<{8B)%eA
z3rLXJoFyyA!6j{3W0@bZ>i$*~1e((FdKd<;E8;Tn0u}y#yGo2$@6`;0?cc5v>&NzP
zS4qL_K7{hV#&&B0KSRuw2(-x@DZD?_mI>ci{GVMDc2BVIDdqma9foNn`~{fN(~`RM
z`Y=UXvLeU_Nk`~;5gzvnd=$*IH9rrWdAi=PWU=FNiQPwFD<o03iWRa&gDt#}PB9-6
zD#8JfIT$u;di1(O!#>%50O{v?ieH3&nyfAdDB}eB+0>Tax^u+i<wFK9bh_?x5fAOj
z>8N+}gpQyVPyU;Nd1+1fsQ%jYy{LO9HIWaIN@Py;Y>ZZ~2LX<UygUXIPfYyLB|uPP
z^@>iNNM0iikq@QQOr&_pVD<FUEyF69m)C5a*#4o^uL808^;FJ4ws%aygH~<XMldi$
z;^(=AW6P5KtYGFhI`d2039~sgWyIc+!FwsDsUC*faO>5oZffA^1_W(#yFmYz=9eeF
zdI_7HPx}Q;O3Fh#lonY%!7czYEelDX`S`b2l-a+e`XF4A(zyQFZ^#)bm?ipx8xvAS
z#G-&8Ln$B9<*D+M8QhSGeD!RmFeXH*;sz*nVd<$dNlmVeoY;WAl1NKAlw-T8dRXm{
z(OR^>5cCuLg#7U6CQHkW3oEWIuivGn-`;CZh@N^G@+gU)0$LKB^3|2Zrl)bKMWp-_
zRVQ+DMIi}bJhyuDg@GH##MVXa1#RVy7dTKQ^G>6ULvotdjK@=~;unuxqeznCOkFH?
z7l}n-oyRucah`8n{n?vw0g(z1-!v8pL=R3#pDmht2EG$2nKfHp>+{&EGS!l3Co?H^
zfoUb$EjA_%lwZ7_>uG^}QMm><qvM5{@}utul|TH;ax1jD9!+bW-M?W@Gg>tQvJt&T
zdY0mK?fpAGho$%L^!3|T1ZsL7s6`JZ_{I+6IPki-())Qtn>91`fBAQ{oo5=-3J}g@
zMS4+rc|xV&(l&iu?Nvk0*3N&S1f`*kK_k9I&%?K06=gHI931Fuz-<z~kkePu)jvz8
zn*DCSW({VA-@Zf4ExotaeXiEwJsoKOE=v9MB~K912Q<0;w7CXvEiS=sJ<*q;R+hhb
zqK(PWyUDTIw8H;tfmpT0`OT<oS8PkfrbG#lJ`*k)Es*ry<lIKER><nUCsTMMjJ_9W
zf$f)KwvIh<?)j_Zr}#PCmskl^ngI;7cpcbhX<@HJrVS0&OX_yGb?kzl`kqh!z>h}G
zXHBW($Fyu59@E0fte_mr13n6uZgDKz*5r@6zW3yoT1eXRDAdSOjuh;;btX7>U}H3*
zNk0xAsBzY{N!Id<yOdP~O11)>kiwqBiBd3MUcDM~sM;T0aj!-KuOnhqj@D%4^0<_7
z3H919EvF20FNB<Ui%*SRb7FJ_)L9`S`lC1^0>+3L?!mN!7kz_+V3l_!M;<)=>SL>s
z5@pa~!x5-f#oc%R*<H?0o1ePf+GZuQYwwhL4f)-cXxd&pE&Yws!&XLg36w;H!6oM>
zcg^TL@%K5O)yEU36pE(cM8Lt)((zoj)@;@im27yAKkBOVSMPhcFsumO7a$M;e+d)`
zYwuq$-P0&~BlFveK7m;Ax{n!DZVZQAG#H(GDdynS(~r-5<NGmBK#$1hnDAE+gnj6_
zryR;g>3F-&Wd<WK5}Qm-g3pN`IA0QvTp_uycseR1WQIUuIaa;8Y|9=u%?S;XkoeIC
z@A(1=-@)XQi&k8&HKjy{C!9Ew<n)AW5CQKH2d_TY_vzNZ%tR_bpMq0o%hK7!s8ieO
zCH`ieyRqE;|1hM<yyF^>Z+sAkaYp+U6_RJnMkN7m7-XCC;#ht461_{Hmryc?Pj&uf
zW5wtCATnwwaG*(%S70MMfsePCm>z5$n>0<hw&~B;e#ZTvq_9L}IlLu4QDr@L9F6PN
z(+a`3E>G|$ymuW>jzqVJ{Ozf;T~P;C{6-ybw9ze^*kOu$b-*h?!5rH=wtnXh#}jZ3
zWKyO=FjwOA`H)|`>9__@795T&r7r2bh2HzWhCl?29%&b{wQ_(cm@`|#Tk@Btmql#P
zpg#jaaZ4xBBt5iS0f(}Qpit&t${Q5ky4HdZk)@2LBoa$(4X?4p``#rI8YS~{Smeb6
zO_q(po?+>arIb6-SPbg4uHfxko6<Zv&6c-@E&aTAf170+HoT6Sz&Gg&go=Ck9}8+;
zz1FD(xnDO#FeP^jYQ82aAbEo-I90SB1tXQn7Y1pW(iPuCb*sE9q3{1Z1P~n*%%#0M
zHXRLX@nb#ODH-B<NUt72UvU7%VVi=vzGl|k57jeA;vt-@dLItf%`r!zCz`m+1RN(!
z!Th?nQG_9Nqa9`OOxjaG?`Sjc(8Z-0bVRoe?1-jQx-*VgdzuV+5U543{<%f<k$l$)
zqYySY$XhM3J_Ymp-lzZAVCwQYiVulW?|gs}kLRSU%1C$|(BKl+a8Me2zjJo(rAPL4
zE~%16!6?U-j-J^}Ik7WsKVIqws?Lb99}yXP0FXFNmzT$~tSU?E;30cDsBSFTsk(G0
z%j$CA^p^PAIUT7wb-EV*sMWo~%1^rts1f`TNm%uz$L-%v>W(~SQP?7?4^(=C322l)
zXiTZJ@5k%fLoe%5!7FPjKHnxPJBj<N=>JLqBy2DEU0zCa{NUOLH?`dJ>})i|Po$5@
zw-^<Tp(0`*IFgXKQMtU`>C&2f)L|Lb%*o^+v*goVuW_ZPX0L5jfOgh4KV4#3nQwqk
zAABN#J!YBn(GLkx$NY)Oa=6^;cL}cbw~ih*bIO5UI8Rvm+aN{MV2Pz0ac3p527};K
z8=N-IUh)oK4LQ|=lv5>&F+hE-p5-QAdTC;l-yEgT((_h_8G1hifja>KBBPT%no#0e
z0W_ds8dpER$1rT^r5yUSoImt72xo79kQzSHe52-%Bj^4cVjKgQu7BVWi6A#!`^Kx+
z>RkQ{^+1`lH{Oy&!Z14zTbu@rbgZ0_HyJ=BEjki_22G>m6W(4nYF+ZQdRX)A8Wh&2
zV482O7WL4k23e^8ma#i>bD{)0Nozn3Y}63_J(7cey&5&2z8E?bJSWp?ZJ*xNPX8K&
z6_48xfmfHr4ne`RG0Z!kIXO22IeD9Z(Jo#{pFvd7BuB>g=bG2-^ichu&|u<rK|fTF
zCj=yHe8jLnBjT3@vk@B;>4UItVmk=t-)tl~ZU-~Q4jpYo%?yXy0ydhzx$@WExS{ir
z6ZAIh#unckjo-vlYCGB$zhq#)R_BoEji6cs3wRD1a;+vBgg+bNC0p{i54xBezW>Z4
zN>qD#)*8ABK_CQy5ClRHxYr<%0v$%F0M9{7G6n?`d+m*Nugy#;gI<3*v>FhVEw*Ut
zKHcTzB`ea-x2S|l^O7_rf2Sr~VE3tLF8r)u;$7!HwO;>ZDxUu}qp#T=!yvlu&6_uW
z*;BrIdCC^as}#OV+hp77<2PF0T|5I>Tdc>Qt^w^kbT%`1G}u6s7zY;M#Ck4pOHKvT
zLH+&KN#7k!z>`J|?HyRT*|pgQ6_?wVt#f%<^$NK6`}Dq$8**UD2VRQl=z7fba{J^8
zE$N#Xw1hzls!}$ps|(VL*^@*SsoFzZD%yS5?ceBF!K$Agx?MAiGte>SlY$n9j2i4(
zQSe9CO4c2|EU45H9o1KVS{SqCOd)`ey6u2hFr7-bd!|#GttD!KiyED%$?}RU6r?_@
zN9niA&uA0oY(yt`r8LnV8vZzH^PS`lpQg@AueJLbZO*~JAE58xOv_P;{Df$Uf>Lp1
z1`Wc8Vm@BeW_${47oW@7<oO6<j)Ljk_-cnv``cH>d=W)KS8iF$#?z=89#J%~74Pxl
zeQa0B4BR(4IpXV-j>y*I3Wnw6K3Wt-VIl*A=_+xh2l-c{9~Qgd>b9nT8jxz`(8_1i
zGt6kDuJk@$+ZKBE3i~p!&k<X{l_TdOZ1d=Q@}96USuWnB=d8ml20c+f`>1@uSm@LD
zD=$CO#=aL7p_qTbyF_4M*%ZHcm4TjyDwsjl`~To{Ed3E%MnVh%tHI9af<1BxY!fs4
zRDE4>cHK&h32=;d&jT)Owj+QH4lRd`Y_aY@c3nbU$!D^B9};f~f8R#DrT6CIx}ewI
zzvH!ciB(3>cEah*XHuNO`}iD|k+eN5F+Uw%<8xRd3Mm<b`tZA_7H=>G5+a9gfnMQY
zV!-OvY*X`{(_bh(qs-s+y@rlW`jprQ!@gJEiT{3jUp!)%PoETwrnI`DL%Dyy&6Kfp
z|2NCL;@A)f6n(>mC0Go3PR?cpg%m$vb&P;)!9r2V3~{})c;@)XM}jcPMaL9k7#`Ga
zIwWRY_2VNyY=qmvY&vH~eLi<C?B=|a+WHl}sF~0F->Dk}d}P_+e{4s=SX_BEM`dM=
z#q%+wHb5ABj%9t>JvNTF<Pz48b3y7F1K3JH%;R9g{wbKe*B^;_t-q=cs_8X!i9;t?
z73HJ_J907S1<#M&KBeO$-~Y0+2@WJwmIwk!ZxqZ^ebV3Cx3T#{m1#ZmX^ANW^m#%=
zy@wl3IotSr)ym-|YVOXxBn@Qr)`z+eY4P}{cm~~!HcD{G%TzPY2-`pSh^eR@zBUh}
z7qs&ee1Obw29En2#YvwrNKKE~dOoT5>VlRCLu7-1lG&{`6N#E=(q?mI8ejPJMuqRo
zAkX7dV}LiLhR2uww*QAOJZ(kO0ofw<9y6|CA(j}J<d;<8{`~6+Uw2)cwha~T1+>!w
zn0tUqH9f~*G6|WfrPxW=U!R^cBkJ4E{tVOt9CV2ulOXk?Yu28o=0qoMtW#)x`DPB}
zcA|Q2+2m-SL$x+2?sgxMM3YTUj%o^K(n~eUjo;pRK_Hu$hx=|k<QfdxHe~YY!R6bi
zF3v)sFp)wCz@vkBj&`o|malhpukfr}?4iFGTS${IW$TXjTFhG54~Yn_6T6$i6{*g;
zSLTiU2tp>^zJ)UDrIvNxzWDTaD5%8KUK6a9JJ+)^=X$l^h`g&&^D0gF@<E@5DVf=Q
znyqj3Nu}+mZE7a9>9fPS<B=zzQ<gA)Vw}fdtnO#4$2lr=dVgO)jTR9nDJY)}1@p@3
z<o7h=2mFo7i$rOxK4IpGsVQWw_cSuq@Kd)mC;x5%z2;u4-S6RRs$MAb%K+|84Lz1i
zaQ>yQzI0@Dov`6I`_UoFTJfD$3SpJo*N#vc;!06SNMBLKB>ziW@gNO&kCf8tT2wu%
z?ytJ}pQHGdNguOWA;n!3_xF86U*Gq~F$`G5%>Vg5f!x@3<D}8&@ilsX<)>m3-X%UQ
zbzt%7+9#TBZr>D{U0h^f?Jfi`1}`m^Tl&L=QpCM3Se{<NywSLB+Qh}>%LMI!7A0nA
zbH}LQOYVTCU{=J;xt6rP$@)Y(ejKD9Hp9P&$i|DI`dvbFIIxC;EN-yEr!E%96+B#4
zo$md3mDwBXAXUwvJ>#B;1<2d7as>Bxj(_mn_44*_-kyi}fvOUm$SnG$iF_BrAN`cl
z#IN4EaMSQ|EkDK0742sruTQoXrryETYI0w-(j9*(h3Y>))rD@|1qehy8)SM3mic3J
z6wG?HbJkPNpJD>pK>Q<kyl9;oOi)|}^ZvNaHDZ2zz5r=QS*rALAJS(>vRra>$4e)+
zKVBBYPQV~SpZ_2PB4A92rHBynVJesnFAZEbFyZv>Ks>oT6y7ZC0+@YLog1hFiGtZU
zuH)K6t_QyH<KpkL>&snLRM8eIL>qwM=t58us|!L#LijI;8yU<=*%r0B>45m~s(~y@
z_t_A#k}6^I75q1Y;_6B<+g(TAUX<2-O%)3KX0(L8F5!u29Ve(}g5jRFyQ2D++gWQP
zPb=CfRajii3%R3Cz!8jnf@4&;Z_?@LNi!y)Ef8)0o-1(g-Tr#DKjyApv<%U*Kn75G
z7={Flzd*w=a9S7S2<Edqxo|NY^nm;4H4Q)0WrDx`;Z6by$E09(tX=z4>r;lj2WfM1
zyvwtdIFqu1`Kr&NIq?r%uGN}Wd{7Q9NpZodlB{4G2BA8V!52)eac7wn5U*~W)3H{4
zcmVe9PQv7F)GfjNn{hR_{Mmem64kMZ5_m*MqHL|pWXLuWM<QaL$M@QzuEUzb+%g+-
zjy36v$Q(1M8Kd{5Cifej8}VMsBg#N@93CnxAp=VkC^~|nqX(`X-!OK@^Me}Fe#j6D
z#Zl?tQc7PAimY7vhFcCRKz7?_NC#gxH#fB%^9(8?5ePsveYOgJ9F$Sbl3fatpV=Wm
z4P=BbdGxjK#`S5{-~R46l<*>HXA2irV#JKrMs<wQ1c}(x#$a<<g9Cf@h;rGzYfTU2
z{Kx<J=_#7Aq^D?y*S@(ZV(mk7Fic21#Y^JM0w|mfzDJRfkg^DNWpxc>lsP83as!;-
zQ0V~yvXYS%ldIzt%<&lO_+fSSxwECq){+mJd$3?6orvIQE5_Ce!qM@>wd^f<=Qg!Q
zDN=^cK20LAKocdvXyC)R!Rp-LkEu=?hRmz5uH0v6FJ9D8v0cpBp${rel!7@mu1CeT
zt)pM=M5p0RTKc0Np3zTK33jcXhqz@hOfk?CQ8wv$J8Wb^zHczScv!vvx7^-0k0D3r
zG1vcsi?Xy23g+}nl`ma>dbI=BFv5YXVImZASyq=tueIl^xSq+cF8}G7@BX!!P^Cd#
za1EJY>!{$9=rC=x^h1ve2_+0$QCe4$XDd=zJ!0}m;M@4ovpOH%U+?n-)WO`T$&?0j
z<=WG1?L~F!1tgS^oR>~rjyoj3EUHXUA^DZejd3kkI~z`FkL+nPI#P#I54l5g^}Nv-
zu+`%Y^@MWg&F2%4`zVT_c&LnHi8Mzdqrx%aL9qi=VNodDCBXf@@5QsR`j@^#gMoPZ
zsu{9(j?Q^u@|<t4W*~+jM};L;?|qH;u^fqCXo+GpGOhUjzrDm^c=yx$eqq;mA4{wU
zud(#L?|mKYbA>&R_pvOj9q-@qIV|ya39J6vSHDKj4mGX>tsVzXTCZlM_-wbJ9#=Ad
z@9WO$drW%*d$E&tm{2&6P#Z!B9AE?BpTh}x8zHtbvfwl%BHwe*&D7o8>KL?Y#4(4;
zdkX@Hqko@%XK*K`X>UAukWpLj^Es3YRKpE+E0@Fx+!UaxI+xe<=7LT0reMnLkKQnS
z^qUMejhlv_jTf7agi|vE3DXbu?MAf_6~SmUBILc-A>PNaDwxX8Udn4|e&Ho-5+z5{
zq_<OXg5aJgDjRSW2w`Q2w_@3CjrX6J@kFn>*v9`!DS`5VbuCZ#{%*u<+{DgN=tJg9
zlhu+<(!WM=8F3q5d+~C|(#VedpFrt9Gfc812_r=2R?bV2qblT-;4A!I?aW1M)$6@3
z-cK&!Q<FaKJ}b(CP^jFuJ)f$75)O+{H7Y(E`ukspKm-hs;1I!^aQN^2Q7|>OSqxtk
zoLJn4{v_KBeAEaustQSbDr90NQB^?v^0!F<6BTE%T8L^R8xDCO`x}wEi2{Xuir+A5
z8h`t3%<PQrO~e<NOj`QcqtJjcUY`dtkAZMc)%V=@O8FhjzC@}?U%ur6>r*hbW_FHP
zv~SB++|Y^wo7<l0*3!+@ukrc3%3nYEJnAp!OCX`KFjYb<%<f>pX?Dq?YKxmEiHq*&
zeRK5o_@8?DLxo!g&Mj1ca8)u9_o;vGl(K7K5LzubRJ5CcD~Y$89US?t&dnhB4j(z`
z6z_Qc#dah1FUotNbd6SM?uX2n9b(^E0f)J%YecKk|FQQR@J&?z--T5+$QD61WoeUc
zKqw>7vMep5fO1Wfv^_|hkffz8h@i++86r~z5h+VVMWzD~ks-)Xh9L5jJrsU`Z1Mkn
zcki3KT+%kz!cX*{e4sCPxqIXL-ur&P?>l|1kYySrXFXAai?3f~!Ed46Cp1j+abGs9
zS7+O3<N^ZezJpEV@<`H>6go7Cu+y3W#%OV_vj^;LN$&q<jhAzag>3n&J_R9?A!X?f
z;r~BZxR#n{nnG>$s;@vNqx>*~cgz_^WV7llMp}f;U(zFM!w0C#%db&)L1~1T<&?`-
zqdID}z18b=CRba4qM|5iVaX4+`Ev5M53bzpw(ep?qyIlk<e`id*BQ$Mk2C%BO6QRC
zNDvTf!S?nb-LA-rE+<)&4W?YJ_+P_>hXwAP`gFfGxWcf6M)9!bCftx`vQ=Xp5q|UC
zjtic!{Dn(Q){e*E=r(f2&x!4xsZ!ApF|$ke*oqSmhSMp^50u)Fj?th=Fr=hg9Zufp
z2m?D7TLz>ai{N6O=eor7(3=uf(jS&-eY4iovVkAGj=MqD0R*c{@eV3c6G@+8&F;ZN
z%CpRAw9~#5r?%rNudVark0biiHxp>-b>*P6It-jQ(#;@!Fme`idWsXwmVFE<pVY3u
zz4?>X+M=-~ZLQFSv;{hJF;4yXb^8@B$W|#u(Yh!62u{w($;syQy*U%feByg3cb4fG
z)@JFlE%V1l&;iJnW&w>V+_=StRRkvNG_zmhdl9epMm<mvWmrfUNie1otV_*l#A=>9
zQD@HE5xGAWtDYCHU1;e0U-U!34*@>}{1EU%zz+dG1RgB}QlWan!Vr!c+0;kTBFl8{
zSN@6p4PGpdxe}4RbCZ^UKZn41+Z-8$`F2lVM@&(I#U!3idxr3v9s-C8d^tT46xel%
zw~g-i(exg<&+Ms7-;wnPj|8C|!M16rK8#OynC)-^5dxO>IFJi(sBbUk?9z@C4C|Uy
zqV3(L=ZPGMYXyczLkvc163N=VeMvEXn`2_JJ_U}&|9~F?j}HW*petla6KsOJ4896G
z#h3J;EYmG4`L(buuS|0tzsT$G0SqB`oc0#H7f)eWiZ4nXVVUkT_ofHO?AqxP*3w73
zoypzIue4$EXe~rJqehh1E6mv9e22_C=mfHwHcLzk`E=gNgI#cX5_l~Nc81OWida2k
z&!SR@BXAghcUcoUfK)<``B*0I><_0qZ>{nsiuPyI88DfRyvZDF;ttga>N!1gU&+RF
z45MFKly7R_s3*tgJKE7N*Atq+GT(>c$EXrwBs44wdOmS{W#N&iYNCt?OMLI-Xi*}M
zCEj1XS;Xh)x{UX+RNh~jTMd88w<JUvK~J_73m4=+0#OMEyvE;^<Hl>2i9cKA-pgHH
zTZ$sUg|r{ABYahO@sGR43nHEMJ2Svm@xkbxbab)OC_Mz7G;L#;7!N@vi38J1^63Q(
zfY+psWhU4)F_T{`C%0Os?WigcZ)%vqGe>@N`_}>Yn$q{9Xz3MQ$?S7ONM;{>W>NDD
z58mEz`gieNcA$DKFu&&A5?gC^F5mYQVzf$72l)t_R{ZMr7l+I;hMBW(->G74T8{oM
z?mvdH6I@xygt;0frC*n}3BT37h@$8GMuJj&ot8$%(8*1QRoM=w9Qve5#pBDDBjwAY
zgOcNYNcv@W7*k1@Ku991nRfN<owgO_AC?rC3>4|H9A}g7^2vbkT;uBfcG39UAVdWD
zfyhl4AOt%AzbJ5Y@O_$xRd04|@}S;dqt&Jlt%)jVuz3jP(;-(A@64u(Xy03Pto<ru
zZ=00r$n8hb`GEZtkwdc)X+s1<QKQvvf{aV)5MQ=Q>7U-r)Gc}gm9X@s0*e6p1j{(r
z*8O$Jl_qJZc!;9EkalAYb_2NnS+qe03!fs!HiIOa#Mur0$MPeut?AVAg}WWGbwue3
z2RD!2NUdj-?0n|c1yjoTWJZAzT8d^yk=gH;rQ>Ht)v?fS$)?vsdauy*c)I0M{{uG!
zqvw;7lHe$qPmW#Rmqqs39tT@~vu6xOrjzy7gF3h?c6C~03ww#~*5bib%}y9`lS?_(
z@TrLU6jX_{gtg%oH#WEf_;hDGct^Zwylk2?rS{!xjn~z~iAIcx<mU-m(I{Fff5&TF
zl=Lwd+s-mCpUqg`Rd=8zT0ut8M`YnubVUfSGJ4#y_s;6B55a0>VE0%g?s}yN7iLb&
z5F-{5KXczF{FUlWwm$h;$DXLv#U2othjfT07CvTsXTgsNQ5|}9nMA`}6IUf>E<vnv
zq>2#qR^lwN%&Yy{My~Ak(|hO`kwqWRgDCuc6k$TxgQ#z=t(;$$b}*Wj0Ht7KN-8;l
z9kV<6@}sY75h)=_Q6ek6MkpYJ@S0^N^-KKlV8Gsw@CbovRj9>nFc*Ju(UyyqFP99Y
z@6LY1Abd-_uufQ?SYp*ZCRY`{PVF5d@Z@SstS9UqeiKV<S6Rl0CkEyiRg*rd(!Dnf
zgY7Es<2C-SEb(`;Ysj>bg^bfge$y~-Bp2Hk8`P~knt>zaVg6AzCaKFw=sloU<W2Iy
zg&<x@e{sU!SX+I>g_6U9k<Xb*Uoh!R8EH0damS|VYeGIMi56;71^ItF@^)Sg=l`Cs
zzhbaxU!Q+mpG)<zV>n$bGv(%+hi6B3zT=bR#En#ILy<<3K)2*Lpn^|)tKZh(66;nq
z_F{YBL7Kf8dL`=%VdypE?4?VuH0C};N;;cDOH4@qxJKC3Ff$LGbsU<UwHOW5@azN|
zHZNd>OLQ#+4!kfoYOR%K_N&`@_0P^ph`86wfR)2JQn`O>_I3?3EBR=vE4t(*cxucK
zo^tnCkPcAmZ6WRsMBg#k!EsY9WM_4GKKkRcCI;6&ZrXgf6v1mrIFJeMLquE=3o-Ed
z8<yR(zUzOw6;6_m+u!HMBs?*9`|k^WkNqtaF?S%XBfm8$^*WTG2vq?#<}G>qLc@U-
z8luZyl+>PFT&xQf^W$~2K$>kX+6wvcAmTSjUcq1<U<Btat&oXsP338eqszDmAyN}8
z5g?+J53l4B=7lra3N`k>@+*pZar`bZFYzRY^<YRNahZHimh!>P*IV=%vmvrRZB!<~
zQpUTa;}+Fc{BL(Y?=Y_Isq2W$q)w~*CQWhfxZw>t&V1?*UxE|33DLtKc#2BN`O=ap
z*Dg=|CdLcdQF7|&qM#Ep($WaaWFHnHzVga(l}?S_y5#GY6h=6UzO7;qh746h<W?nL
zPuw2r7><^Lvexn%By4ZdD_<)_`4V=J11K#xiHoj_WQ{q*X9SOuNZ}{pCeFKZQR97S
zrZ@IGJ?mD$D`WAf5=|c=7)a(@8wy7kQ-Yo!`a-SA?1@fu@HBuG`dUg2e_irqm+wwn
zVjI#|Q)LY+T^Y4nz1?oLbDc<3c)e-;^SeGgR(ejKM~~`uZNL1}^7WQ^&(qGy$b)j)
zL@`Bhun|JQfC*t5FZ3A0!cotF9BaDSORNPveJgQ}5~>J24fEaE)0b;?Jum@<YteM3
zVcH~dlh&k@`GAVDewR~%%N3O0cKK+l0dGBXyD@DJTfq{0f!A23(jOjniR~4&%&T8T
ztry3S_2Bh)<7)meZp7lTD3zH&=R|($CrMF*xn*SzmhSu3jq)h;$C~_Q;UEwJuaUh&
z0A9&U73ARS4OwWI1BZ5YI8pzNlE_cn=-cvr6b6}W4Cy8*y0n`=55!5?Jhat>`IDz4
z{I9~K9GJPXl(9iZd}rF(K&jInhX6O~9IPcSF{0K>II(dAA#vc24lJ3v_>mBjYi;wO
z(9(0_P<2Emfqe2IpxzVPm<k<|YuvuD;(Ho|Bi}PxXde_w2Hs)jhJA6U_1n?+10MCP
z)Pz>a!Xt}}{Kt=m`FUpU;)_QwzmBxkEp7$D1Y)pD%tO*K&G~G~oAqxapNqr>D@187
z-p6aw0rH6!3kI+0rK`aEd6oDe*4v2Q!1k0SK2H_pOg)P45-Ak$d3;V;PNg>z6(zoh
zzbi|u2jlu;d-do{<Ma5OvP`5m@+z@?Wr=XX`*@A;#CDJ#{M@7}|B}sGwXo+TF|rue
zPJxS!xJqn|Wqt|M9F1u7@mKi9Qu+*G<&+#1k?g*6w8^yDt54mbQcYKlkINTnWG9<!
z`8>1snSH3<ilV@Pkx>hVuo&==w%fSpd+E7Y;%X{kYsqbw=POV6xb3*PanZQ6AD5v%
z?){La;y;Jpc&A$X-n)@t;$|R=%)4GCRPYcY={${Q9^#*XlaN|53Co<yj2)3xeQ8|`
zybwqsmJhKJ-PnYzG};J9Mv}v5=WR|7%uc~zNu31Z@{%#88q3>$iKH%CYTe^xt~EPT
zIhtKh%=Y2RyZ};~cXChF*igf~u;}NfE88#iJsCUghX~r2ELorAQF=oaQF`-=(EG=m
z)-sE`1+b_JLXlKac~pEKOWIAB4pPHh+rD*au?<{nY;nD8Bq6=rvj2dMp4lnHA+%Yu
zxMagn$p2_E#qn{1a7W8kt9j|#&TQL}D%i?nUgEyGc5~B#t%ui7M&QTNew!gQE@brp
z&&WrRKJ{joen;wkUp5!nlPKD#gjK~XHlma%^UE3)Z&un9xIwN#@&&v&MwYp?ebDQ#
zPkJYIFnw*a)SxHd>aJh_(`<-<VJ9bRjFJb|0Yvx-pZtvk?8RT{6}NrFX;D|`OOGFq
zXAo`>oiJ=s=LzkC?0DE;D#6Wl*pGk&!z2c+Ln3_2V@ezxRZI!jvKRc8HFX*ieI;9g
z*I3FqTGA}uSHcLNQ~r+E1^tfo;izvfd42H~Q@H^#^oOamBy>h5mm-!zK==hSo@BFK
zAM28D!06>Z(-5_TC@*6KZXiCK<JbMEuhB5~WIzRM`EM$5z$|lTZIg=j!Lb!zqCHtH
z8*-Q<!=7v~0^Jh#fkhik?r=RJ*KTYFLR0xzIb3{>W-o?kSNx4N#e$11*k4)gV<raA
z?DFwbf1*(1Z-P>R%}QXr-(-~bg|&5-BeNJNfzboYNFilRwk#TpM?4>^GB#nuOUF#9
zydq9{a?6K1aXShp>m!qGq<O-)@@k{5Xqb}2_ckm4;@v5g=umgiUFU#AKxTWg84M2v
z8nW%3VxL@Cw2wvR%>~sGnXa$GmrEVouOHIY=xK-s+$$X2$^BaGmB;(nX$@Fng=Y~R
z(Hp(<DCuowy?EmEwZvwzjD|0y2LuYG@TOd7(4(Djw;}#EL6iuKmhEt}hS>j-UDwRH
z*2*vd*_;46tQ3ni3H%HMlxPDBC!L8)9a(whe;$n0xT?Ua|D`24{1Ry3e;g)+Yn&DO
zbMY@G6+^rbM1S(ON!_GoS|T+QL}Vn;KvI(0(~E|wG=Bf_u0MU&8fi@y&KJg=PB#yC
zaJrJEQ+q8MRT53su<QQv(Lex6Mx}Kd*7v=;*~JpMW=FA`xVO%}yJTML_e(2}GLNQv
z|NdGDWk#{RoG_5@@@tl<QfktJ=rw<hYe|73+q-C|Ch5JTSX<#ngHwp@5*x4MrqOqO
zRkA@$zwqEa=f)gzIY-D^_24AjF$Sa~;8W5JRM-HD;v-_?zP7DlY8-A>yu^~Vt(wtZ
zqp_sG|4OoBoi5(&%&>7W)WwX1d*wPAz;&(cD=W|I`*xp%Dtuaxzj(+HKrB)tcR=Zx
zd%DdjjD!k29y}#fs+=tvrZgHby3USWXkU;(N9m2Yq4$gS@ry*HVHyu#`%OsCly2?m
z00@pCA8!MZX8_TK6ABH+51hdSF4krUHYjPhe7DqSe0bc^vE}1e1&ggR`8Ds&7}2B;
z69d8d-XzO3IroJ1)n@k(`NEmFGO>kuIkBkaOjxFA$}*<zyRYxZrlaV%37S!ebKTt{
zM0}SFDl7<;3^K*uRWmwwm1S+B^%Pj(_F<X8-07>bdR6@z5tdvGC_nLQWg@_ThxD%)
z(=vSQC#}0`$71S1+4glwc(h?j8N`Jw2?E=LP%y<|kwiVB7DT^p&G^uJ6Dk(NvqcEy
zGqKETHZIT~7R#wF+{4LfnQ~xG=F`^}MA7GLv?QxUsaev78HtsS81NH>?HRIeDr7QA
zn>N1}pKz=9tVgY)b&aFxtIfJJ$*JpwjmV#%M@a0y`aRaF)ZCjJ&i9`iPN9|`PC?x4
z)iW_mRjNe@Y<MmxY<AOG#c);S*Dyt97z8$w7z$(>EE(WqT9fvhE+%><6$o9H2_Jv<
z<j4E(zJZpJS@a>f1&qUJumF|@t6^|^d2NAxe+gWzQjLZCMuvy%q`a?WQOmDcCSu*n
zZ-2QuWo>2JPy{WZpC-FW$V@M$r;mOu@{80mRm&^(1%2GJkU-ITR_K~a9j0oZrVq(>
zv{py>H+@f0`>ze6yc?ebu%0=mN3ZLK|1^78Fu@LKnCNxQLch9KaY;Sep;%ga!SoT`
zXp9n~C9bgbli2YU$1X%83;LSs0(%lYt6k<x-AC8O`bN{5EY{(G)&6dy4VLL~YtFOf
zzp-6Zt+f|4jhGM2_dOGLE4b{dbJyN#NZ~+MG5L67cmy-gaANQZ2_)2P%)U)`AKzA^
z@-@^TL<voJZv@@p1cOt^<3gf<M!NK;Af7y&)syUp!s>xEO#j?->mr+^*Fz>tRc{_{
zXZnYC>DlL(vqqnAGj*Kxikov(;bsjp;Ba8X?|*K+Q=iU+Y}%D7<p{xu6Y{R<N#+jv
zyc<Ttd!)pDHegoe%x}AQZ`gtU7)?uW>ne}DVA=@KE`V}{O9mxuHYYeulaK?V__L@g
zYz^~b%6nUe|CShs>%a{L?mn8@U@F@*LIO#XL#u@Zbim`A?Segl?@)QM|L&P5jhh?b
zQC<cWCD^q=f+ioD$ONSt(HqGW`43NzKe%bNIb+8}e1r%6{D2Ua3Wp0Y*@LMVmSIje
znhAoY^IG77V439MA!pxV8_dU4tVs4?Nf2*O(VryN$h(w3z1LKpz69z=@`qFuOC<^j
zpnYMPl%}z_Yc|b&+nXDHb{fsw_6XeYhcq2ls{6_V6`!L$$q$;5UW~I{M)$H%8+zX%
zJoMbsYkgj^T|v{ZRQhVN-DY*ddL>bSj^CZqG^p0rhsO30QbQ($Op;u_q+u+#<{Uru
zQO#|YXfL8^3G?mp>Le@ZX2Zij{XAr9hobIiOR0}K#ZB4wlWNi_xHAckL8^ovX<ffM
zm2S8Fj>sD~wKo*!E}x5l^cEz8WhNNv6WdqfvZ7k9&ob7g<L7@r`}oKgDPUzxp67Xj
z8Z?N?8OX*<u$Rqh0h0zeKF7h)$c^v{Ako8ZEhjT%(t{d%euLu;t<DSE9yW`}GQ-ZD
z?X~q*yVr2_9-+emj@_6+I?4^@dL3b2IXbR>Mc;xN(Fz`;LcUw%=!=E$GyOh!y<Fud
zqG)ersH1?%)alZ|+YCTN+&)B25fMbC>En2qJ{&wEO}xf3fPP__;ay*3nr3~q+>0la
zM-N<bph##+z$>D}c{q@3RRL^RChHu(=%<yH%c2vw3{7~P?jOD%(1`Iz>TLfwvMb5}
za1$FLJ_Ar*E{lUhSe<suOKarF4S^>w5s(^YbScZhML#rUu+Gi&F$bTebJ$YhoH76T
zj%+8(tD1kRQPAlA8NY|`d?f=d4rGhfQ*I|F?xmbl7_OIeF|J0IDockk!w=0Ut3Q-e
zG?WXng~FoTSHnNOT5?q&UxQAmY~Yc=SfmRXVFgYmmiWcu`Y3qwjV*PdW0~VC%xL2&
ztJq`nxf2uc1r$B+h}|&+6Cx;vd<t&!weVgif=(A}h<f~3y2R!35)w4foW`v#_w+Xl
z+QgMWxwzPb|L^}-2t>iaQP`CqEhbzcnjOet#WLf%&KUS?lk%s~vI`fyn5ik5qF+a<
zQH2ZhgcQ^1lbd@7VV!apI0&?5wWn}Nd^#l9_PfBzC*vV}kAOOGJs`g?ua>NX(()Vh
zJIlPDQk<>Rweu1rmgnggKtky@$aUu6PG`mTn^TT2-7PPS=A~Z$Ek6YO5b#654*@>}
z{1EU%zz+dG1PX${Xn26In1ojy0{{QlAC`GD*Br6n{G7K?ZV*Mg01{<Sv5FvSpvLxI
z^#&l;?XHyTf<l$o>*FIh@>7T;+coLIvYh83L2i+hs}RL+_@`^0p3^%*Y1;rp2ub4|
z#;~3PY}VmAJ-@kg`KS?V%9kY2_T>{mA7Ysq>*6$5HkNsSa{eg#3p7FWNLrUOHpG_5
z+Zj8ds($w3fOlPb<OJ%Xu%WM59hP{XHsVrnvdpZeU8daX-Y^@5V2M&cB&#Xy^BK;L
zrXDclXkH&H8cKmw*5xNAI)sICye9h2l*+f_D&jbsVuQ5AYhO!z9qVJ6x#P!II9WAu
zFv@W7#O+OA;i(MJN=kSxLkuEqHi7CuMdbB)DZ`&@krP~_HSJpzExmOBquoIyZmUk0
z3BuUqY*EhTuo;Y?cIB)?_58HcslstlE=tFN=T}NVc_-ZXYn_HW`jP`I`N)9cx#ip>
znI0j6K|`)4MDYBk=jL>6aA>R-U7?4>&uu!0QADOUlU-F|?H0_cw4*_#FTWcgj+;Tj
zH%vzU1J{M12p4PugxJV-$ST6wQhC7~lDa~>l+~^;YNJfC%zG*SZ90{!xdFpp$>zob
zLhk0F!QqZ<Sfh4uBFr&!XivmZB|g=XWUJJW6k~Fm4jA{*?%ggU>!lQS1ZHv@(Qu^=
zB80AWISRNthVnaJeRoN2RIg_cVbUren*z5=?zslPA0IX|3Gq*&Z0rhCU5t|#Y0An1
z16@#d>iKF1OU^6v-HP2<-NPCm)|cBq<xHBjbsaCp93E?h?k0r~WEfG!s>|2Ctn09`
z-+p@iXS9m3Nigwf)O~?!gOjabOp7biOHelOi50xdJ$19N|AAb$_;Ojrr4{P7K)Kn&
z0;sYc1Tf32NU3%uDrxi>bl<E;<#Dk3C3=U3GNOK2&x0C741KAEYy<HB{<>;+p8CwW
zxt_9}|L4~dm{*?b<ov7O-J{6f1X9R&r;?JFfi}qMB)UbjDMgjl?CS8vrG6YTq&-^A
zPLSFY6VnlOmY~fd>+z@d;}3ni`}s7)=16%_X^+#WyvF;==iAan^iDzQRa$`rr%z|?
z?UI<1e%BX`nHU{W7bGeni76Q*S+-JFYZV%^&&J!=w+#)yfrgASqUpKeWi~w8P|_TD
zSd%Dc#7zW9rFu*5wWU_ZroP?v9dxEmkY*}!V2JU5Y0%3u8^dP=y}hPFX_WQ{(U~<`
z)4}ZC0Q;X4{KTr?G3@?g%lE}c;tKGWehBy>@UMpeIZ&ZA1xc7MgJzkp#;;p6_<lbV
zB3V3|c_V;s2O}_n2Uo@*S7I<;&(A-XC^V{G%CO~D?)BFr9W#;N#W8s6g<u%34I)k}
zCczF$jTOe%xfl6~!N1<|h2FajmzpgSYZf)_ZA*Ev)5ZbqzD66G{04>rO1#>ftMv!k
zHU7JPx8k2oRzt7}NJYysQQW1Lx!H4WN9o<Y&SZ;$Ef^+>E<u>Z{7<>sP;$BjiVcQz
z9*0}*ptv@XnW2>ySV+vvzOHR{-fwsO9@^UFx5iNvLdLEQC!zj1SmFQ}$RL&uL5KK?
z)R{&7B0tde(~X@sZrt94c73%BJnn8n;W2{2DA&nF-u0RDY8Crxd0*o$G`A>l{D0E}
z64(#bs9_%ZbC2oWX-`t6@p|%aZXv*eb(mv>%3TRVN8RjUm894p%D-T5S?T@Fuf5f>
z*)DI^4i97e(qIk`|8dye6JMU{L8~1t4Mw@PbwTd_4AhyzC6o}Qkii@Tagv<-NoI$D
z*+-YZ@XOW7d9m{kV?^HSz)?aJ+wsRwT<TD%YIFKnA}z@dmdjjpU@#)ecOW*O9wPDu
zk#q|@#OHf`*&p2&5BY09*6FRi!ra69e(ryAR>f{tj-pH1LRuL~=90}pGM9E6wiGMo
z%?he8trqs3n(!i_$M_%Xf#8-Y&G&7rf6jnMx@h_nn!q}SgB9#YiS347TT!iSQH}I9
z%(-)8U*K-{jX;zfNSiAdC5Hh@Hd-A7E4y$qhF+A0gWudsoUC)R-oBdr>ET&ws4Zr&
zN!APgb*iZC`KDWTE&93JLKM2oL_{7QKaa8NGRs`*8ap~Jd*<#)3fFuomON*KPGZOq
zg$fy43(uNeZTkB0S$%FSjG|qUtsoC9j=6SS$9*o%3?W#JL{^O-Ttj4wkPj6}h!?WI
zxQ1BfzvG`;^iqgrI?C>6(^tqE_Vh@nq*KsEL7b(|k}z1nyMlx)gyZ+G8vE|Lb`9#H
zzqG7n|JT0(0@8HfsPR;A@TkN;5r<!;y>WSPIh;u*F74HtcTK<aE{@CSZ|L$PX%Z<1
zVJ}O`T3{JA^}Y9hIj-qhk=~t6OSIuNWrN#hD%YUV)bTIJRABHiSsj1NS7~C4pYL`p
z_2c0iQHbS=y=8WW0Fp3*!deIy(CWv(j#jLkq(Mycw{-ho*l0Z%6G5G1X?bHYStcN%
z!|KMTYEMC>Ll8VkK7eUGa6O)mC3;=RjB^^M^n{diPgXQkX(_fQR||VI>#o@m0s*PY
zL0CFqnK|lX$8a1PF0%ZFh~DuK*1VUPj!BIOpiDq+^1*J|ZIPB^%idaab2iZhDLfZN
zX-6S^7b~1!b^BK3n8~>FQYoNCvu}*j;o!Q>$z2t9q4`5gS1w0pa+L$iRIABWP1x{S
zcLYiV?U4^aaY>w93=TOC&MUO+srvc%o}X0hr5Uwo7gA|Yp)2muJ1}?0{!+6~G;Dga
zd<=cTU-%*LFd-mO%o+(_1{Ghqbp)!Nr_yG!(m2?<L}u2a$%(!{)!M{*!{-mPPs+OF
zJ6q1dvrO%*1s{KL^o0S4=CJg(vps1@IK)N<G*^hkr7Tk~uvMjFZMv01QMM1L9YY{#
zgNf|ZkmOJw2dTkqYn!`I&EyAD5G|FRPUIq!Fq-;WVAn{jEPb3yBBY3wB?K>bdF|^V
zLN|$KPUC)oIU!gp<mUYO-`K>7Ut=sc<^1@s|6T}4d$>v9#XG(3*KCdlP1&kc3J&G6
zXJTXu%R)R+gSjXUN50wc9x0^;TST9aJ8Zty8(q9*q!rDggp)9&Ss(#lggoE98}&Gl
z3$>t7`&~sdO%<mJskLX$pIAM{QGTK?n@%3XQ5$B?a@x&lf*ZY<Qdfm(Kyb~f^*$LH
z@HJ{T@<TFmsA@xGMhV0+Ky`j(mI>X_dfBF@uJ@}?!JkD-KyZT5EySzINKY{j&2Tym
zA$r~f7CEAHH1V@?)iq!Cb0z+u?>({tC#e_{7IC6wyJM!q-W;icmK4^JIxH)!-HaDX
zmqa8an+4_4rkFkyLer<4Vv<2|=md#A$!`EUmE^&%itA0zBYFc1jwtN*xl%)t7Pa)E
zRZ}*M=5e}UB9x+OWT}$NlHq{B4Za)IYMAhVU8{fIKcWNXZrMS5nPs$Qa)K8vxBs&X
zlk1K8wiNn#dmG2&bWcvnQK(M(7hbc>?Trhq`*BhOX{Wu>aZx23$)|(qFl6I1nJo~R
zSUjz$*wk&;{}$EBd9f0z>GEsQBP51SurVSLG1NupVwvY|AKH=ioyL`LY@syJunvMB
zvld3?3gE(lK$A-njEYDqZrt6l$8R4oes%H8@VS*}1+gU*Sd`w!;^fnEcry%MM}5@@
zAMsk^b6$Uho66sD*RV{7nys=bP42+@B9B)@;ffGL-EvuKj=o(J-krOt#P(&r*omU{
zTN{oR&t$_EBE(7bk&)q1tHxbwK;a`>Mjqng!i8I7nV6chGS9zNtPhH$Wo>v$EWE{@
z(uScmDwj>uajLNG?~&Sa_0s*;L)a{q<jAU&h(~7I3XR}drss|?_pSV<XF4Lh*%YW|
z@D#8^ikcJy3GJCN?p}CBlvZvYDY80IuedM&g;<AT-ELM~N5eIFlkg%~l1CbnKjd>=
zEYL77YJhl+#EqdYA{wUGj#V#2^=jQ8f02PHGN<rR=@qbSbn=1GDZa2gc*2oHNZKG1
ziQ6vRP_vg}XU87DdUSb+RUEBcNajKFa>Sr(l!tT|nSps}cVp83AlrESj$U_~4E-`H
zopu-ri8lh`-bHPsWN7PQwJrTbLTT~fS0(=Qh^i%8ZYTU8+WPy-TChx?BaJ>A@%A&P
zk>%Y?`wu5>&YWd1I>7<MV)@5M6=Iowvwuqb_;Rg5sEWo368$Mmz$+Q7oTg%nKAi{t
zr;P9L>pvmrJKexFHPMy}#ry<0xtqB}c;++EXU<JbTUs);#Qhc&?Ed1>LLh)v4`E7=
z3^@8sK>DU9=^fd@5i^8E4!848b24v%T#Uf_keHEVVc@Y5%|@`S=S~4!htvT9C#Nl5
zJE?kS+L8=0dy-GNdK;2jgWrhAzDtMzl3EkHJatK}S!Ph`FTb(x^|*_S0wFx)BP>)Z
z6gOHREUGp*4kEtU9S}k=-f6b!`SRSKccymQJGJQc8Qgm3-S>i;Wg-M*eURKdBE(?u
zMr)eQVkTJ;NjP{>9Q1vYafdWd1Qx@dAk9^l<EZr<-WNwIi4C~ulV9%mzCt460PK%9
zWUZuWBxtY@&{37GhT--TlNTT2hpMKcf+c2Qsc2I4iazsu4?l<U(nJafbW$*w(zvE0
z?jAUO!BHjvf%K3{tWU!jZ$G<tRJo|Vcqc*X1$g!aaV0C9+wc6k*=b~{irN8e$9UwO
zli&9Z-h*P3Kw7b{v#ehIrD0ODhMUiPdZI0^P+Vcz4oez|Hue0(<*_Avr7o#~o%`B@
zGh9|13#9?Lwo4>t$F#UhSfx}!rpWe{El)Em$5*1SW8dhdz;=@Fh`!X8SdX&AdX)F^
z8s~{+h8$Vm<nz{CSv(;wq>m6Yx14`~nOoY9Jt<|IZavqG_8VuN;8ukLBZ`JFb+oRl
z9_)o)P$?3Eh^9wwja>Ck?XJi;Ajn9Q;X)Mtc+tK<#OdB_Z0lC~W&hw3KV89fK|BAq
z7t*@02bQ_{$B|0=P(vS0`<6Fc!%;zR(!+Ux2OG_#J%>9_Ujlenx$J!%r_`N{rEO0b
z!sE_(5yW{A@_f@>2=3e_B8wuQy!MIIaCSn8O7mhDT|>j)lk^o)P{ZlCz)`zL@?)nL
z!*~H=#s0tlGzgF-LFN{v0oZ?*$w_$k(BZGnht;9CWGF_I!v{Ngiv^rC&BB2OmOdPO
zr`-@SlCK1ZWnMZzIc&)#dt2ObfwVc;ai~u5B6N|oe0p_p+eZbq`E}xhK6O#rAsdy)
zjuKNuK%z<^MTBa*5DoM4`V)y$<7X^Z!Gnn!Q}FyLtj6@^^>aVbJiF>0JawYJRJ27Q
ze%cU)utWQVz!Dv=6hlEJ&bq(+-$I}sG>5wn?J?y&V42Z@_ck`)*wKk$M)Dy@5Y!|a
zauhouBB*qB(`seGBVdmvC1qwz`!YW0$hx9ar&lAIeY^Hfg#m~mkj*B<Qs#P*e^wr(
zMamMv;43E4FykU_zWY+Q)CXvbA3>{t?s#l%xzbV>CUZj)Lf8|pB=kortY!DO=wa>a
z*I9fK_aP!0a>}$i%sQJEs3?Re5<2PoAjd}x8kRBOEdw%sGIZ%>kkUE`1G6p=`1>vq
z9e@7J5AXlp&WfQtHdAO4F&$4cWd2J8b(5C9+pgTMpifYxcoK)INLs5kaig-ExBm0l
z@Brkb=#&5WLgM_U1}y$#YroX?C_BP+>une1k?Tem<feRq%>*kRYzTR^sasiQTHv;e
zS4uf{qKaWNPK~>;7-B_$%s=a2AT*wt@Xep++x+<erQ=Iw0~WR$NpG#=w#?o(BV@{a
z7I)|4wg9E|G$-KH+|c&7Y>2R;Xjci5@P1N77AS-$a`YzddMHP@Qz~Ked8ASo=0=A{
z1nhq!8--GVQWru%sG01IgG6$K%}KQ_2(%4qIdye9F3H(aZKBLj8zeBqu?D9xRi9*<
zJ8H<Z@Vy`4gyJx;#0J!sI2i0$LDyJ6KF>0X&c~l<*y`-auJos?w1k;)347pVFC@y0
zP0e<6><p4or%N;{x2}_9Kk=blEc}lT1EpxmDOdELyocg$?7+XRM1X3T_m^&8{p)LG
zI^mf(Kh!B_K(yha#Jy-CRo;&{l={K5#~L-E0FI)id^#hAl?my$WQjxtW3{B-RSnY{
zL@&^&U6wd{mRXk2=&34GD%AExR^c}KNU%v2l0H~7zzRgIo<YMb-!baghTc6_HJ}4t
zC=FZ|NyeKz>gn(<CmWPpyRQ;`<8dhvsLPM64>^3S_K+U5WBa6$X~P^D_GC!TELwTl
z4HgJ#Xiw()8!`pmk<uSiOu8n7;R2JI5H1!~PGw8Jc_!q|8E<05q{jsYYWsmOW0_S;
z8#Xg^{rtT^S_PI~D2~Di2LyQFMu{yeNdVrLTKYJ!-}WjyG&fKrnomovJfK=_j@eF<
zPJ*2i82ezQ1vj=P>sW3=i~YTjkesJlL0OC<qFo7TlsM_cnG2;IShK(ML%<J##})!a
zN<lV1+0Bhr^ispD+i~VVR_`uvpq#^Jb|X@dcL29R5=YUvA8<NT8^dkg?4z6idosb%
zlJ+{k_ED#e%93P#FiE@1Cr~8js{o`Jvo#{1QdC^>4-ILnCuu2Xa|n9@iQJsLH64PL
z@;r&10sr-(GhV!8TfXYwdU)SDd(@KTF;g#eq#((XK%+crfvnK%%&@s6IVl-thePm)
za5ojBkp+J3Z0HjE?#yrUFfpX<JiG!)?A9HJ&u=~O-#?M&ZKh4gY{lR>{4Y56f1Uc)
zrR_6zn0&I$rsjv*NNUL|*=DO%^X;4+y6WbZ@A{$v@l^_6!YU~ZU9}+qbs=ap#H0Zw
z0=Qn7OmRHMn|Pyoo8}+%k4*Uga@=E?-4iP8O?l>CMlTAqR0((<qF9Rm+@kcF^u+F+
z1b~4+y{2CAI!+s&4ndwpuMG|?Apw8s`#<P6@sC>%J}FIWf7k_XHI~^MVEiU=`1RH(
zNmxpoBAd<Rw5FNC82RU2wa=cmv?_rc@?rNzZG8llBlVQC&@A&q>Vac>YwtByqE$xI
zpG}Yn(=3{p5>Xl#6VvRKK__dLLVBXM2mjxmmqT1`KgBXX)=aWYeD<wKT&aN+G$x%G
zrA9^WyF&?wHJa_e4n(DJG_A_Z5e_*E$pTz3!+?C1RX2tF)Us>t$3<6k9ZM)XXwiZ(
zmAstuJa)QVv=Na;)7<;6c43*HQ;!d9shu<cjXV*IF!p>KBYqu%qFRMZ(21<j56(R`
zU=zYw#=<E%1~el=53_KinYWOP@yQDhCkoT!D-Xvq|5-YJ^0YMjIh@vgvgs{It|9aJ
z{eL9WICFkR`=3_--qI)jAdBXN_v8<<RHidNSMzql8SC!>sC|x*CdzXy$_<G@GbH$W
z^CnRjZ8nKnYKsuV^ismMrSFXYY+VfPLzL7PDsdN#LUbW^v%$o5v>1#-xoF5GO_Wc<
zQGle74&ve<gnJyx;~+XV1QTy>@!$R~ou@7CF}(;P(BE&bwO_ex`p=8BYbRx0RI*bL
zNsKtX3C=2z1Y{^kJ|V9?aYlEUy|^b=fDVI+4fH%l3~(6E!Br6FSTK5d8{-E*W)Z~v
zZ~6q#!DyIkJB)V>zkaX@853NEz?hiqCL<j6>?E=E7pY~cmZ#^*0s(=wU%TCA%+RKm
zM##{Nrf<5UK7lzXM15M>YSXbd*8ilzE)-b*LwW$a$uc+3*I4<?t9>|R)dOh@-pB%)
z0v6HNPs7~Kx?`SL*|7)dLVk_X;B*nhSAfVB3KQe@cEIlwFO2Jd9^1ioy$#YOQ4Kd+
zz|TG12_g)&j?OG|Cwl#sBj+d0K_(%Zf;ESjPd^CV6#Z39dI|hd?W6|K7g*-O`X-$>
zpC5h}kLEZ)Zv*pc$D`A_bn3)Jg*Y`5a_>81p<y%|ba#K)XLb2P$ok-M*ei<vo`!FH
z?*7s@&!ZiVY!a1Bg;wX5g(y<g<AaU9XIM<Mqw$@~C^0d1^vpVkjBV*GAlmQ>b2s7@
z>`A;tZ|g#nFAY<MPY(T~$1fdF&mx10kmyTG4TCty`laXhcM&^{qs6n0Qay(&tjvJ#
z)|dHkRw8QIC(tp&Smne~8%&6!=zvDri8IBL#=+0JT-em9CodR^Bbe#?|FZ%I!ZKwy
zTzvD$mmR9qr)}HhLy-ddYD1*x%^c(<(`Qcp;pEdz6RzLJXg*3@jkf+sC^6D=K_xzq
zu#mc1VZ*WLS+*Byp(#M1)Kx;GwK@>8L0B4_!)Au`VjhYmq&c1ySK2W9>U}*^5x0=6
zVh_H{?EoZ3jn5;y84d&&6Sj+`G_cAW`dw?Za@O;76*5uu5we^VMjP((!r&lLt|%Fv
zIXEtv_;WgJ#8en?G@mqWap&nz#FQz5MaL5{2kp$WU(fN09nM=^rj8vh##CAM+1e)`
zy!LJb3XWJASd{!7-F6)T!9i}f-|l?gVO-l&*KrNf7gZNHMOFBon|D?FCK|Cwehb9q
z`5y{_hC$jyh_i^!e9!P!Wk9>zYcDqqs78A{IuB`ziBC@EW*sUwY033j0f>xLkJA4_
zz7VJfzY_QpUKfQe@YVHUnd&=J>zw`XuZPhVL$**Q(;h8s)nv$iD2N$(*Rey)lcX08
z*RfqlSYdtds%c|yL{4HJ*6L-Mniq0+=`VIY-jjAZnwDM=4CO0Bptmx+W-m#`Vj-TB
zJOq*+G8+iwtmy1pt)rzr-fg<S4=sE0+ir3JkTya<gmC&L+!{nB<4vm4S=Da#R@};G
zhh#RP;7OE$$=%l*La7)m*$&<j@63QLsP75l`RZpYJk=tg>KBMK=*vYeus#S0cVYN<
zTgLVL0e5=-aFK`tu||e-g74fb%hX@?)$d=QE;SO(<Tuk{NUESA8UKc;0S#-JXFd66
zM#H*vd{MN7oe`0fMkPCBGi2DnMBN10snQ+#%qFFOdNWhE=nW-*NMFvgkfyTn&d)X_
zk13|}MaJoh4x~*tK!h=%DJEOCn#l}|{9@_5OwDe1n2nYOSs;JI>m~LE*olP0Sv?QJ
z>qXz>Ep|3sf9{I`As91twbUsIX$Fb*kfI@^Oj0AWfP~BwM4%MH-M3aARciFP4#;4x
zrQH0>lz8HGIK9SlI33Fs%E{KF?=7Rk4V>i++QEyoL`Bq>^!X0-KJxU+Yx=V*Yyiu&
z;$wc9P(OM`q4+8qH$aFHMfAqLvYQ%4S8EEt=$BXCz>pTQ<=`IDLNw4KGzmmuMxg*L
z<T23ommhsyTht|>i#$Hg@Z<b}cyLIi03s+R*)Y`14awl9%uoF*A?76OjqV~mi&9D(
zGGylzX86lvN8pA;R?iEGq(^`dCx`|}I?X;DC==nIdMDrTJGVMqj_f?}89IhQT6$?T
z595Dt#?(rHNP}!0lkudX?$p<+(nl)Mtw598Qg>7ESksxffXO$u=t8bAh#8f&{(rfa
zpx36^>+>6L9$p{OXg;&0JSFlFBCv3QlAgOzGw9bv_ajlPB5TwGcguMpU5LxKYB=vq
z1!G_8V+G{PS5(0=?Xyp;oE~<qua^bt(Yo81AzTq(h?FNCBJceb5;F5ZN4mQ59j!M9
zyu6)ZXpMBmd#qk*nq!t73!Zk#5#ED76Gclen^JKa5A$*ww~?@nIb5n4GT1-NGkGum
z{QA$nFx5u#nJ=Vd=|pu}F}e&e$Yfm<W>LhJUTwC$^u<!Nrd=-skcU1|8!Q+~_k_SR
zu^m8v34wNq3=EZtE_INqFQB$TgKGZcrSmMG_TT?O721o(y^t1KpF7*5+NZ^9)Z!Ci
zZxt4w^vzyU*?MDM4Lqynw{B3e;XQ?4mKv@D;&V;>w&k^H&0oNIk`q{&`zj%5d5L2w
zqve`m36%Y7ZTR`=ray6w=x?dCBzx9FRHW+!PNCrZ!1V%)6uoKL`qyX2EPPG(=y{9*
z7s6-H9QI1rPPBJ2*n7zNydgK>$HYi?vi+=wjRQiy1yop2FnSwQ`s%yOLXWLNYZB~4
zGLQ&xxr7)tR}PlxS*D<hG)!V-+uR+yKCXov6IKK;_n-}OK|vwRG!l0PrR>S=8mL-8
z3tJ^NQx7Vhj3kHA&fA<ENMKUUp#L@LRYa&X4QOSpmAmym`u}aF6NqX{Ggvt}h~hFg
zbxf76dqOqHVA1Cu`yzn$kY$E8+xtP?|1>z;ir&e0R^8GZ7AmIdu$Yy*+J_umgyAov
zX|u41FkG$H=HN0ogOh^{0R-i|_S8jgZPnIsc>X9TFs%~!(pc@yE`QM>Z1QYGz%rEN
zv4Tapm_R)VV@0I8l7L08I$8zGIBGS&xI1k7*BGrrPDMRXRu~+LT*jc}a6|whS%X%q
zdFk5DY}*mUt;!)kZr9QjWK0~iY0t84M%4_apn4H<>J3rD&}Po*uy@fD&z4866;8Qb
z2zTuOr)Ds1sMBtFX^oQDC}Aj#VMOG;X<<vQoN7!Tk*#4NbW3=OA;V%$NrpM&W4pvV
z!^O~d<m_nD_uc5c+jm2w)wr6K%@lMkbz>wycl1|nGjCw#mq7X|p@AN3nYVMJ66Isn
z8fIeY7bd;gG^iAA6nWJO1r<F7xS8H2>mjodv3>`m0bkD^6Jy3c<J`&*^GP;B?f$%&
zXlJS9QYOdTE`KuMw{y5FWh3=K33(1ROBkw(W7ZpY2Gw0~!~VRNNOm5Kfx8Z0mo6xo
zTsbX$1ux6YsMYjlnNP+K@&&+diJY`yC}kH;5`YPP-+&tC?TLwR7Ju&jG?cOLkgd{?
zUZA>+Pc>UCf;YD|SU;?f5Ne<kA=$8flGc^3)Jc1xSDk7FZHveBcid8M$LLDbF(vt=
zQT4veBE+!tV9W0FI@2&SCyu_@t@f#2S_&T7>Q=5ZZ>_pwu6gLzmEgv4&fGcd()Q4q
zFMC0ao_u*QnSQP#$*EwlgX!cuxu<Gus9|1MbksPPpZDC2(7P6tcpjns1=J|Xn&DVr
zv6vwsa%U0<fkq@1&Z$p@I~||tj}Jn_gU$4HEa@eK*AJ`2dW%|Of3O~$9SyT!L!DJa
zx<Bac<us^V5DMcVS6q8yK7?`YeZ@WtY8}2cyVu}(UYhm5vZ(#=eh3vfLSLKJFz;n|
z>G*w*5l$~>7Ug*91_&1{-GwNvMhmg0@U^k`cD~fvUN(e53#3#EeM0=n;Zx>FoNVVZ
zTWg2r3>sSsPh~h&g)K=h2|Xt|3^`qAnI)x-t)3mkx57hcB0NDp^1Yx7vDwX_LlxcK
z?VOVby_3b9Y4!|9AzH^m2#QdS?{{<Y#+{YBox}AdR$TPISRczQ<+oSparOQ?&(cZ*
zX$hV8SU7Y7F}_J8p;nm&ONJ_y@QP*&x29h1a;hwCD3+eHNpKi*rq#j?=jNPjmb&~<
zz2aXMeW3mt{1EU%zz+dG1pa{#h=x8R$wkYh!VH6DKD^U5qxf4Ny^YKOQaK``4fb6`
z%Q7F&nS5&Hhd;mXi*&_ZmlfGdw0$wFQWt(&y5!#9zTZEuu%~B8Ni3WxK~UiHsfK0N
zO`OwjUCg4<$kd@shX_8rOD9C8jtGY#*gp}4Oj|6@l<z{H^&3WA7`5bO9Ui43D3>K?
zqar(Jq}kk$6KKOCuua6Kf?xKb_M?p(UTM^jt`#(gz!I0xJM_!LF0uZimU;E7sP!u0
zATfg*b~f1b-K&?I`m(xRR=GM?@GmM(_LZM!nJ<sVlxo=I?mavPPM|{*)|tELf~=_p
z_m0l8oW0Q)?SYC42(|A^fcm!C&dFD=epLy#WrWo6ytroBu}2%^^3MR%>cR$SWtp9K
zz8+P#Nl1_vfs=BZy33mcW3S|NPG&&i^C^sF4$Rs7d8yoM8>`YmucsT8m>Ibut0tv_
z`o_VHoEzDFRsB60RDP%hx&Qg1L4Yhwf`Z8uRq|35InAQvUj8%79Gugk$H?TiH47m@
z6*4t&`raIb9tRnt@A%*czR|?ydoPysvY<V-mHUczNl<%XJRqORorXEIGj^h-@|koD
z{UIZFVx)K-&0HxaWdqlIr9K_09KMO5M2vB0XSsDZ+8DyTi2FSThT<7d=SNkd8J0O)
zI$}t`wfEk}@YXUUg|;4wd`;kvt4!I1!~)CvI5b+~2wCRbvUY!7vV2$KIr>W=E%T8i
zxVQ$07hhD3^2KJ;cElg((co#?Y_!z8D^<2Olv=;0S{-1F4{4GzD|D{0=)HYMD;HfP
zdU?Q-5AXI%&p_%V8^0J=)tiP$Y40q7^Y;zeeM`NuITuaSV`bxsH9)*Xi`k+L>JBLk
z1Q#8LUUGmCBe%Za^y(i!HmGrc%2!<8O4y{br1iU=!)vKa|BYOdT>HnMYPiZ}BlK9s
zDD0C0W`zUMBeq*=7}4vci?>dHs@Z&;9c<B*l9}nVVFk<Fn0Wb2T>m#Bz2GvBj#IUC
z5Yb7CoK0aIfm!B{oge*jpPjinn!>T3#Lg;-GxZP&7b54_4aA=Xgqh~#WPLB#k=h9P
zeF#O8Y6VjZJ|dxetGz4Y8`Z;k@|OYxq~&_&!qw=%manP%JcSG{TR=#N|Fpq2J3yC9
zgXm#~6f?lv8P0LWtSqe-47Uvq-Y7V|q^HCf<DFWqF%^vbz+-`TI%16acmw>=>y;-R
zI?rxGV$uWbn1;DGr&Y6<mgC39(2hmX(i^74LnK)Pb{k~XfQS%AP=1Rc$vu)<f)bzC
z>wEuD86xx7VR4Jo`U@<ui}x<fo$~ctoz@}h2&8Ws9m7HE?5jZ&%iNz>a`|7Sq8FjW
z9_xXD;;~IcjU@FD8b7)Kr|doU4!qIt%xcr3U+*hkNR4uDDU>V`pw|@@ye?O5;827Z
zU<e(YKfK0LYM#mY!2ZqaeGWCJKgourY#z}dM)v{RDWdf7oh8x?tl|9PkJE|BY|Gk0
z5DF(>Z^UJvVkpuGisiHn=rHCJm#It?9f`LUsIb!^>11RWF)69%!9?M0<#f?1^DLy^
zlxW_fa`NJ!Y8a(OwoyIMvo@q-G-u)sDd|AMd7}ejPYZznL68GVAWld<2~IVQUJ|%k
z<jeBvgw%(CCmY-vyrT7GUyi;CJxGLexRpz{+EoNIV3{%l%{?bSDAg~DcI_%HVFo;H
zOMo|$g+`WJ`-&OHW#N#o{`!o?+^5M&<Ykd>LkK9Z@qQ!xV!<zBspR)O-pA)V)5Uh2
z!gM_~?ZXo9W9i;Zfmh0YNHbS9r}(Pb<?Gf(Z*+9Qa3zy*q&t&L-0c>%+iO<^un3p}
zTl|MU5D5Lo6Q6wllan5bKgrNorsCaIK^;r)k8Mvb;WJe%g#4xoDW7uJ2?kf7bM+Q+
zlezh_zVg||-73)P{;on=A(iLGthm{`=VcTK$__$#;Oj8p{L(Yh^rp&(6RR`<TtcAd
z%Lg0PFi$jZF|F~Gt3NiNui>&J8{EShF$jZaI3RXLqiZ`(+_}z{^ZN;jpnGEZ>l?zC
z#6_#HRaO|wX~XCNo>On*!!lJ`cbf7-le3dL(wQVXjC{NiOE;;6F4EJmwUD`pYtG%+
ztMp6ZFR513C+meys8rKym^wL8we8Ox`a=ahbe-mjpAwv&RHXZ@(|qH|38Q8tU~Bnt
z0LW6|$<icxMS;<(+5pfR=ILG6-s*fpzoex&ql~(C3l{?V>5DJcuDrO#hrS58Ttarw
zP<U!X<<{S|_4+*SbQ85qt6&x^80z@Wv^H)&uHk3lTe=`v^V>1>@Ec;Zf;TwGj6sO(
zG-Rj|5;V!FIVrNuwEehv@@vi8;!(F$S*B^3o10U&eZ3APGYNF@06q}Kh1z&N&E|kZ
zd<>}FOePNt<<iq9EIz#Mzcc0JnATCK0*MaG1a{lh=ic=WbG!iFOO9Lb-pJSmIrD(`
zNGY|}Y~#lNjI4U%7d$3L)5myAhB1XR4zcKi@1+Nz>_%RPFW;qhn&&u%-TdmK7~C<j
z^mRf?6^x22s2a!<triHB3n4zuBy>f#!)Z<fu}M<Dd0Fj0JY~3#o%W?G-k!nkX_!{a
zYaHlPY={m8e;BFP#efp_vv28Ns+BPPRtnhxZ&mv5F-$!G0$F)^DJELYeX8-Kfw9Ap
z5ax%m<vvncEu0Xg>^y2o1<PoES`_0v9(<-LouxopdgB6w#H(6CglG~Y75S`<V43i{
z8!wHTq5HNPZD2Irh$cfOL?cb(ElwgHv?YOP%E4(@{*^lWKgBB`R;Tayi-!yWLi=!8
z%F#B<L^Llo*g0xUt{0T+DZFrV?-DFCQj%3gk%=5qa`obO_rEMiH=s{D=r~E{96N6`
z^4$K<E=;aB>f2KP6wf6&WaT)SWm@mjm00@I;#b?yG1_QJ(7r5+vNlYN2k1(vEXxfB
z5tSlc_x1XuO`G3~Pq@{47J`q~_|OX^4lMIr>pF{$TE;f@WqEjEg;e^2bXcBnY3zwD
zJ&+ZOrMLq?CYj|2nRpV(DT$oll}aNL-j09vx$Ph8_Y6JVgu(?Sdsr&LRZe*$k86Am
zO@9$eST9~HU&r6`D)ITee$VTEQQyP&^D1#X9R?m^LfhWh(w06LNK0>|13kpGkzh?@
zv^tal?=W2jwn--#FI^?J%`%+^?t7)grY5CvP2|_QNVvjX?ntNuQ^SsT-pG8o<hN-_
zXt5WO&uH_A!4e@HAHiH+&-Z*)9HCkP49i64v^X*O!_>vN>Tuk4gK^j}P@fRJ4}z;;
zDE1msFJoN$8Ff&Ggtd8_Lox3<J^T9(x?)Vf)*%ZI4cvX-i@qcx$0my1foX@>K|B~C
z_}ck?&9nPXJF)$(c=|#VEeRe~u+OM%64~XD;Jm_bz}n=jMyG+O&Um}sYA4>`4<RyU
zzizJ_>|n}lfL+WF%D~}!Nf#c5-XIumnDG2bbi@J)$M5nofL>^rA<NfKS{ePU#f#4;
z>RVjq1cIR>R#VUt8Zz*$gHMi+Y2TQ>AUnjMUv_vBcxf3S5;Rb9PRLh6rrJb;q?cIH
zEApeuA0dIfTG4$!Eab!(U7Mdv7pkv!Vi5Mrt;BJHSNihB?`M^5<izzHMW2I3f!)!{
zx&u*0#GXKB2K}B=dV2QO4-l=|PNSWuSjWPFrMv<|YCQe!q$lQX|6(B$f_-!}#DWY4
zZ!qb&$!SZTWcs%&g+$+N82$@C1pE;ATOdHFIoaK0$0F|Vr6Vk3eRA8-Un(AY1Eo0m
z;dUyfQ;6{+z=WQVZ51X&8pcs3H1@AH;d{E!US`n}5FJ{907;GQZsZGN{Bi8%>WB7>
zf8%GwWGL)XmcD?<+cQ`X{)RZzu`96E!RISIz*F84`T)V8#FLIoqE5fT+=ZFTJKOiP
zEQUtbSk*tZL=doyvrLyi4@IUP^vUU!CYAB-^r|wZK}H$F`6^e#|H7r5uMkQenICe{
z5z|A6r%Mt>!_l9(ztXwW6fhyuxJTS=w&k;+cJHC5gls1%89KU=LIsmt2#+C{o)cT5
z6ti8g!ZLT{#`C{c`~5@~HW^Jj3%f`<SVoA}m0~asaL6SFmdXR>v$c5r4?ovV#)XaI
zG-a6=FeE6vba6)ghKsf9y)esi@c_yC7pG>Zqb3dLQmp>fmAz;eWRok3_k*2abV-82
z3vvgT!onbqX*Wdmf$y_Ex_N`WjoC)=UW}eR1x>PeRyrZ3i;!*u0`8`R43vZ}7V>ZS
zel}s5S0{a_ZPs;02HH?YNh`pkdDOC?)suV3TN3e>kPqY^X+;GV($tSH6B^W5?_7xP
z7qShIS6@V@<z&4!m`_h8UJBW&O?F<-`C)OTTferdM|&#c;KhXz-XE+60KO*37=U5P
zdET_!Ua3sgX1f+6^Uk12Oh6^ErYLIM6<u1qUQO9&MC!CXY5Z>vES;RteV{9Iu5A2D
z1R$4z1D*34?ab%n5z9;&cp$V~NXb_#&_2zkT_tn}g7T!mrVk3@I=4P@;G_5#i~GGk
zD471oMNMcAnKZeyTEk4w>Hkrc7XvThTEvx;0r9sSK3jH9-xdAZs`4pSThei1EkF(O
z+JB;PfMA{)+>28cVQN;+f{BAasA=-D+m)-`gWM4b2ImBuSqL+3gcx5q5p>z&rK^<o
z*uvJ_i4XcUa3Y5lO`ox6q^FpNW;mUO5YAyVSU|b>QbN+QYb&aiMVjWS&BrfNql+g!
zy`x6)%S&*m5wwN^0V{;lkolDjDT-g&2SXMcrX4&t11X<P>V;MrQAnOt*Wn=QZWBqV
z8^poC5qnO4ySm5u2md>1`;wf62RBr`XDvhwS7HS~k{lE+hO35I_R|*?{%G{v6~uW6
zJeWG=DwUMfB!vYhrT;SRZ<H+n%U7;o+1+n%=RWxO3?4rM>Ap4(<3#&r9ap3MilD1A
zrj^|2<6`tb=7)eE0)7biA@I+FKooQrc|PRJ)Qo^-R@`N0W=>40)r7uAY9t@GGk%zO
z#!rGIJ#f+yPWYk=PXgpvs+3mTb*dXgS**(Rm={aAqpN7AFIFxyCtEr2Oc!Q{^>d`4
z$Z>h0pq>Xzsup{QNwYT&v<x?VxR66jqd?kWZ@id1Pk>fS*a*leL)Z!5U41mnSG$h2
z4|(=p7qoNEhl7xx>U7~o19-DKAt{=tK1`pPKy@p=vJ_uES^E#&o&6K>gqJ|)5yF>Q
zIdhiN4(&KN<LZMomd}`8rZEMIzfcDO`3X%vGa6>|u0{P9225Fo*8fqoVzLXf9$EgR
z&3FI0v7_S3N{wi1vb874_d<FYQs5kw!W*b*tEdu8SR=an$j9Lg8qzW6yKXs2AKY6v
z2T=jG#v6%cn<a~$t7iNZ7oje2@SeE~hBe)6e+f-<^WC#<##kZFY@3QWb{b~y-R{5j
zO_}#heNTwV#gAH#R9DmJ3%-JD@7y+HzG-v24D$F0EPILpmV;o%0M4F5rM_0lGT#sR
z<@ZZX2gPA!3A9rM;ab5OT)?$NAI$T8pPGKTeYK{C<x&P(RiO%Ljr`EO-5-MnpWWcH
zs-^W|TxrK}2rd0lV!NRa<K$hO`Ef|^;TLxHY@=SJ9|n%v5ag5xV`B(DK@7H3$1eXd
zXU^Ga&Rx2}bc{GFUS`AHLL)fL2nlgP)NX@-`BoEgSN5a<jy$A(`x~iSH9t<;JZjF!
z!);OBBI{+IQXk1l16-HEcUYDzK&=VxkFBr%I;85Bk8vNQQec_WldX26nKPttnrT-v
z#@!3A_^?)^97|I&C^X74N0$e+UXt?MJ(Q!Npe8xl0P${1?jJO^=8Aa=BMsVLF9oi8
z4RdVc^wHC13_Oi=HJUz6uzxH@eej54K||{*V_AgIK4bX~Wd-mWOY9ML<JgeOLl=aE
z?GSBB80H9lfCzbA0e(Qq_;1!N9-q{++v!2v30!TnDGY|fE+dI4tafhjD0AsM>rXLA
z#Sn~tSBcZdGQTu`Cm^PC{e7sd3#46wRaD?kP1Zxa3679?NOnv%0Qtxlzj#OdD>Zp?
z<E~db9o>?P@Y+EiLwFhO+~(_DPcKUwRt62*<rV!CzT;pu%&EE0#6`EwUG599pzia*
zpmQS@fnrFJq9nRFb#Y+%X=lc~9YtXlO-pZ+D>fb+0=c5hb|(ixV`Mot971C2Y~pg2
z0YT3bi-p0zhmnZ#%*NlJJW;pK0_4JEJ@k+thmn*)oSxVaa;~8C4?4DMH)_uOIz<(z
zYnZb+GcK(Bw(3bQN@6tUqY)^)1yE3GC~*axZJoaOt1Um;T2Rmj<}(E@gI-szQI$5`
z=Pq_{@=T-M*HNaOkWXWDvFXev(8L)`Lkz^4kQ@z#hz-C8fK;AO&Z>2;dR%&gheah3
zD(B`dKc92??z_+U02Q|byuehdbs1%u^UZ&3wS<3t5ORpfk5FG~olVPWIrXgZ?{g2P
zr8YYjjR)Y9lxh;{M~xHV031Bx*0klH?JjSpgY_4F2>2oJ_(327x<t4avWXk0=pF<O
zd(w1w!1V4{gXvo`B(GHHDS`~ieVNm(DpK?mXZ{$-CHx*b>k`K7i=~YNagQ7rV&se#
zAmv(}Kq*CO98m6&@0W4@VCk_64<jmu>Gmih@;~Nget2{6{rRc%*Yi>*Jm`0%&2F_=
z(^FhtRv;bJ$GNP&6b@K?ED)d=$$%cxPLdmx1jk2kLQ3Rq6E@l&9C-R1+Tgo&@?UV_
zg7Z(du+gPV)4Z%O4>sM!M!3?102?8s2~lOc_{WpE<$BC6wFlXBq?vY8q0@C~n7hk=
z+5c?Dhog`k!b)M$Dt8K{`;h6GPnTzU9z@-Ie3f9`y?A-u^fQ}}AO{{OEm2R<QPWQ^
z$*gizhSa<__vdwY)|`v(Lz`Pl`wJs=9nW<kovi8LU`K70;Y*yE_}dws9>$Q6X);dO
z0I*FU6rEt(?6hZaNrp7N{@5JDnne?u>U;kSR=j@*|2_yH7K1IYBBuC+jF~0SYDu;k
z^Vt8AJ#w(XR=W(eeD;%PYDb)&_W9)}n^VBb2&D&&iij6N#KnNsCvUKb;p3A`Ye%gc
ze7p1M&JT-fvJ6|c&6!vC&3V6&Vi)z^4J=b^XyDM|sk#tExmbD=2H=?sWwMY&5W*sH
zAePnhYPEzcQ)<M3k_S3eYJkRFOR0<q<}=+EVzrpK4($^HOLV+a49|oAzAf<27*Rdw
zCbGbIsFn8|f)Tb^6ZLIGc6DD=-Qmfi^8(N-gI(B9VuTCg$v|r@NLr|2%GQ4R&%>E9
znXU%uD{?vtT(m7)FRB=0d0-RiKP`R<;yPJ+oNJU)f~hYbj{mz00*Io^wi!K-9W|&9
z!byfKsY`>+YRM*UA$A*Q(&`}~D!83$Iex>rZm(7Bq-plBaHNK*I5e!<i2IIAbR)=z
zRwzzYItbkgRuvGv6%ypB2rFOlQswu5pZ;}HX$lr>G06&^I7z8$;@MW77ufUdC-1#g
ziB=Uv1(dGbWrESAj{A1x$g1P!R@1!WnhF0GKLq>`@I&C=4FS2Z4K>)lj2L2U?#>+?
zzw^KyjLs|LV?_!Tln%CMI-7Mk_$^xEEOGq)CSuLLN(@-0`sDtXp4HB8iBu7(V6r_K
zqQIw-jG?uOF^N*^Q_u(q+e7#lB4VU`jPMG})V>tAF8$P-Uwe*98`P;&pYB}0{swzG
zSkiPiip)(;!q}LFWJJD?>Z$H*NV@@Jy+ub=9=;R=HB5>y<07i+!^_kewBy0(SM|>{
z6voUjNM7?6{)B-7-D-k>A-?j9EK_&T7)w%}oTVrhO`wgDM&zNOf&`aLG5<y8^1o`%
z`Yhv(=?`1a#WMA3-;ew7_~#qw5|oDxb%}wr)KWG!HQUj#vzw)?N_)9tOryyy?lU*m
zwdm^!W2rqIikSrQkxK%LvejTtkTi+eWy8b^Z(=8&w&Avv@g6C0`!pK*+xf23bLxT0
zSombowXd9$uo#iAd_LXG#S#&hBnA_6wwdBXIG*qQbEE0Uf7ymIL|Uo8ctj9z&0^WD
zCrcdpW@A&@jtucC(Fc_u1RIhZF464^D&@8;(|A+4jN|OMG8lDShA%uMx86hiMDSqk
zW+QS7(aIVwe8(jkrb+Dqb4+2WRS2;nA6W;KBUT{H2zuhxkwXZ{(49rZ$G&2*CPSaB
zG(C3RpRO~n*u2*;(kLb;Sp@*rg$dzYjA?f7&`tLHC4Znj`BbSv7uJY?Y$oXrFy+_B
zx-bS{1tCG4!<?em!`_tPjc|@%_ou!_!`zbrC`njLNtLqfMO*W=!1wVzyvFzOK3?Mj
zZZ>c6vNiY1SMEuF*hfo(hQdhR1h9bst2Kyt06CM~6DfGaVHa}KgHRr18F2oUWmPC!
z^35|LZ_aoV%}B5l|FqHtv=RJkJ9TH1TGIi@cD=_Yq-#+Ti$$wTwh^$BEtqW6Cnq%G
zRe3IIm}k1T+`nbv(n@GP7fbsh1P$OE8A-4-!Itu2b7jwL8oX^{>HVKqqRpk!(j~W~
z#^>GU<gSXl(7gP^;vNW^KrT_v-9cp8c?YV$dwEQS%Csj@w1gELD&+PGg}#{*KuFst
z``G*NBQmHBdeA3nf!A2#uQ=;06WV6~lp`;+YK`+9NFRZw@|t&9RQK>+oG>|R!bXJ8
zyAr%QCw(%ugeBRY$}|X(SvD?RuvDVnJSu|Ru}u4+6?$bp)o~J9o#7ZsONuaebV*Y!
zM6zDjRj*G@R!_^Kc3;`ipz=107v5LW*27ppt4%(DRUkht6uilVb0a@6;5|}GbJk&U
zi7mU%O$|f)FQi-f%$eI>g`h85;J78D&cY`g?bQ9roU7%pSi94n%0TR*D7p|ExC$BU
zBGQF)S$rBq;WlTQJ!8Sh2um0jFZ|=D(W>QJgx+#1B=~fmoO5nd+*_q^Wnl^MK@&f>
zLxMaYEX++NR$I_aXqYbdY?rLN#y3FsI$28|yGM+q87i840*<6{pnc{Rx(v$cV%+j<
zV?;lrX*W%P7%f3u_VO{SO4N)ED2KiOAC(f=qvvr+W%Nxaqwzu%?Lpq#&23dClayaz
zkEjD;JMDC;Ksykx`8pP<Gd)%u*jM%bNDJ<L+05jz_g!esq%t8_&o<NI%gi@lKy1C9
zx<g>xNfJjR$>B)nQZIy#A3bnv>7H~ckG6<A*I)YKKvuYa9r)LQe;s)4gQyS1kURhO
za`Q%!<M5Y$I1oJGUkCnm;9m!x`yhq@1wNJL{QoH1Qhz3YDbBYa4t_Wg2>925e;vrz
z!B{FT`nQ)y#c5}-M0$wV%91|LM1Tbj;i!mN%2rbT<3Hla8i@rny0*wKK1HwVrHWr_
z;x!e_`JWd7;)jn22mg9_Jk~>$S?mYy-ymu+i2HXTwJ^Z>deqPR@rgJe2>*J1{3!qg
z*QXzUit7XSqkq5n_X~l5e?5rnz>gn9IQZ9te?1Tg`1uF_`IM{!KR-#J0D5k}yh4D3
ze?16b@UI8IyiQmMett>Z4}ShxgoA%Q_}2r0fS-T%^Uq`*`1vIQ1wa4nr;p+~@Y6>T
z4uAK0c+~nhfBoV-BmVzi>qGtU_rsq+0P*erm-WChu`Onpe&Bn(hOUj#;zGzTQiChK
zH3Vw_4^4;B&f6gHH&1fiAB5LS&??jx0rUly=`-THr=r(&U5RlJWWKjb7e|@}B7)|I
zBEb*rf?KsL`G@zMP(0>R@ZJ5k|Dbwr4{bZ*Sq$7F>z9X9tX7+1=S`v$xg(sULrF<a
z2XFEt;wXJ>RKpBx^TaP7Pk3pd5B{FoFv!)z=UCGr&&jY1Gh_iL&gD1{;t>O{q!Qsi
zu<SFlPA@$9jhE3Wp^h;-oG`AKWWBx*2hOeVPrY0Di?y9;*N1N$Q^erbS*jv~vrJ-}
z@bEE>wjL=>!LW~($tF{F4x~Kd+T3k5{nY8GVpSzL{Ug2+3Q8s#|6`{$Owy&BZ-01x
z>5vBWRw6Bl6SGHj0!OOZVo5ionf0+oe*CnrUijW#y$voDth1;k)|a$mS5T{VjY^lL
z72c+0GL6#?(~(ntSf$U`y~x%oYMYPg`|@ccMy&W@8FQN#AI#mhf7mnhRv<0&35gIw
zL+M07C<Jqw&6%ywe40izEeHo_nB+EnD*xxfpL@~q-)9^b0b%YrNSB$SJ||%E?$7U(
z?9h88?#3N-jF?dCUz1LYWl|=yZ!Ney_4`7^goRMBBmxbDhE2~<5sQgshK_i0>+mB3
zuH%&Yu!KY!A8dkvOhyaPb`|mKY-I=6ZTwlWdl+RaQChIBz!?}Y&N@8Z3?Y^smLNUN
z>&NdMx#`R2nQ|sX4w$$vuM!jeDNB5ww(bftqG6ofpV*%J(uT6QvhxE+c(#~MN*fAc
zumJcZ5rr57+V@~s&f3>TPqNu_`qQrD+g^^?p3ar}0s<Eb@we=5Z9~*zh*|9Q9}c*n
zt<Ex;yQ^EY%QIfb4kbu46#`+$lC|2N<}|B4yRX9l3G!moq`1^VfNH++4bD_Qazq`B
z+kyC7ZHYa`DQB4x$0jCzGUH-rq*bv}&$K~8#0fDuOo$#6Vp>v+)^u2?bLVf~wDD3_
zUyARrYSpFGmzP`o#m|3m?==iRvXo*e$Z}!iIY>;KX5a>2x9E=~&M4g|FQBV#-~WOi
z0)7biA>fCA9|C>|_#yD`gn$i(MOY?s<V}SCkNTrw#_TTt<)T4-@A`6_7G;atFr(FK
zH$ft7NQx@*{yt}J8Z+<p|8z=PybU?x33PyFXDUa98wr~Z)L*eaq!>Q(s6l{|1_E+-
zNyE6wFV(4h^V7i??Ja=v(C!&OI4d{%*oxn7jGtP5?W69izkWXi{1EU%zz=~(0)Z%~
z6{#=E2GumgGLz;tKYjOyl6~sZ*CtT;2hl0W<uuwjvjLLir8}(l6n$os#nn3<oSf69
z6@3eZCV7<w^~sdS14vS_UP-2t#|w(vBNf+piHbwa(1D}JYt-#Mtg<+5IIj|e-j|~T
zj4dIKSou8mUxLHrd%w3`-KWZTE$B}u63siXZK&Ovkxs<Ip~)6ti}a?!DzhSJn72oa
z4c@wDMp+brN74C#MkN7pQ0I&^n~=WJB^q`G?H5yNKzQlNKYzF}V`20sjc{cC(kBSu
z0(g5<g@F0{_Frv6-wLE<-qSCtmV|)DDuPMR9PzX1Mztvh8ufsQklLX+`A9@ziy3s}
zM4YORcZSm&u+S3LRIc14t&AJ9n%^jKa5FE>-gW)`D$n4WE_iU-@Koz?$hDE4EsG$o
zLh~{2(&7(4_;k=l)EQ5Zh8ZT}zHoAe=+F`Jn2)RW>2rytHsm5MK^%pfBCin^^n1O$
zUR2yiC~27GyBAe%^<~LZo#_)YI0=&zYUu+Rqx5mTU{*NJn3bi~YIR8l2XEv^s^|2S
z7-PIst2L$?AOO1Ez&jl=Mt!^i{^<4Out7dJy3v?HRlMy|$}ArgwdaR{bC;t65c^=#
zrkP1PY3{GT{<?CoOwTe{5q;lPNW)pN$(%DdB_Oa1{cSWY<=921g|taMc!!gV5%cv3
zxq2K@vL2d9NDA7{$3l_}$Oy9ezgs^)ySGylR0iMxqiHKx;(aXfK7EYAYb^0O<?nbM
zK)<ZGbY(`9L*Z>PvC3!(cZz-12Iny(0ci@ufDA;RCv5oR)QDx@Al1h`(vns;l{Sag
zD$x^=mWe;$wX($SVu|l7OXYibjql+#mLBgH7XhNYkMBROB~ByDtZj4h(!M%lw&SkD
zg#gPme^Vk|SV}4+^8~diPn40oE9!oV4fJ1eJm>^_UJn(}N>L55G|Yxg+vX0t+~OwY
zEs3Cjg<cA{Ap|ncfazC4NX&vKV&-XF@`QzB-PcRKZ{21D!LZ?8Y}uHX!mHG#zpkgt
zkL1aQR6W2fa_LDBW8MLF3^Y|q-v{<l_qxTF#Fgt-um9qaK_CihCUZ(=2n9s&)#F2!
z03t{Ek1X?f_vmZcH$KqdijSo~dt33M<SjT{Sn3=Yw3#_j?>Y^9I?x*~-I{K++SAQ;
z&L-qo<N1KCPt4vlVfI7JZ@zix)(-FezWKje+RMOvdK*ra_S!INqEQ$t0hZY|xq8JK
zhWBnar%lN=n+Hk|Q*H!<flsEv0%nFLXi{&gKqYpreMoD{tH6E8GT+==eDp$-M#Yg3
zAjO8sQA1bw@dvuryz=UlpD>V6UM>II?n{u|KDqyZ=W8u4QG*UKnwIvA^c3^Z45!l&
z!WnIrEQ-%wN=RBp5^)w4SF_BH+NmcW?D}IlT?5Q)+OR3zm=eU*T)wt*+w-%FAtwL3
zCqM$&ck`-8?H%_;tWOr8xYHtC>FLN`Bl+oaNPaq>Q_g6ZJtHC(UjIFEpch4e(%RKM
zHC`m$<XPD&jIj1>a?Jkj`<YXaYz0#IdqaNIxK?I@72J#CeNRNCVZPsVvctfPvCW&&
zR%ERy$L5|M%B0und&98m&_zV)vBzS;+53LeM<a%O{pHJuHe?NXpe(mx=}a-azA!nq
z_6^#fku$RE;f|g|^Jvj)N=2Qvo55&J0z*ZP7%ak350(;_<~w*<=J4cR5%2dtH?@Oj
zAC%yAUpm?dV$DU&$T%T;I?e9xGUh@!7X)^eIXdX6?GZoh{o`r+ij9`Ao}_GC+K^7x
zbU32{*>rNxXE^nllYcn*bkl_Ew-v`QZ1<s+xIS3s=RxgjC0I(?P)3C-1v**)tRlhC
zk#03Pumr<5JT<#>nV#L3`ti%;ItQ55Teh~M59PN~wLzi>0T0Gyk%ARJED;A7m*FX`
z;Q9G=MDE1r=8Rf`=oXQ&z_4&GEAs}8rjCC(rUHYHd5++Jdq;xTxi&9#(A726!Ict4
z$80x~L%-1(%)Rw)h4&VQB$RA`U2Naa4K7iyiA;d999<?-cmqp(-S&j|ZSxqE0*Kcc
zl$(kAS-j?GmmYSB?R-s1aZ@@PypR1<miW7}#OKJOAytuK$f-QbT$)@g@(6$RKp1^A
zf|dmm1+6J2wtJ>t8|32ucs*bERCkw$E*sS3O4TjMIZUPf5Y4aun`j@iXZ>Ba0=>Ji
zr9s?wuON95e^~gO+w?Puf1P*Ro(WVeR!~Ws@hGIVd1b}+C7<*e8HvsS6X>(#*l0~N
zrx@Vy2rRKv{BB9-cIXaVKUMQYIYb*CbwA=8QrEAys9B4D>zk2{X^YXc6wqO>42vb6
zI9`Bs%9yIvbpoMihSSXTG7onEQBHa%_f(AyHOvd;t4K}Hu^SrZ)}Y9$?T)1EKxtx@
z)D2M}tCg{<dK2WXbB1M_jZUjQ#ss20lU^T39DYJMKJl}1)iq!Cn~b^^HT@~fvp9xZ
z_cAwp@Z_Iokj)O1Mj+3UPSS}wKubY3A^Es3QSl!6i`BBs?G_8(KJ?@2&AxDI+92tG
zD&#E|vNfw=CGPHS729S;jW4i&c}YM}{LyLKno%2;^)HUSlSbhG_9!6`1(g$QM%GV3
z;ty|ILBrhJy?b(O>0MoYIp)Y25N)XBM+m+F0w3ZtBXVzY$o+`6Y)RD=2KaNDOI4IF
z@I!$8DZF^$uMtnz`7EL2@P+_B@<|l_GQ`W&O-~#aZ+2$bxb9}VJ>HngTTJ@Q(whxy
z-i&PgI_^;VW|0f5k7YD3#CE@1dEFYkbA;B7?q}zV|MkEWe7=;DNh?tu<(A?LU;ikU
z2kqYoUltyDOCW&dI!qI;mr)ApYbn;|`8OJFk#$J^6Q+V?MXbhBa*OpBc+C_a`RbIX
zq8It(2_s6JBGas<42zYsn@t&zYn-~mAoddb0bNpj5V9;&!czNA`yZX9kaP#qCt)Fo
z0%gZ=gDoZ&2ux-iIF$x-Sd*)2$|d4`sp^vDF4bGxX=u#|`jhOW;dwHYJLhU6-6ZOS
zzcrcFd+M@GnR4|$__}xhIP`pqqCF9adxz*Qd^*_tb>{8=*WQ!BH&s0SQb0<%3UU;=
z?*al%T6%C6N}%N^g>qB{(lkliK-!cfEp55wmiv-JE(HX+4+Z2_KoR8zsoa9djdFts
ze7kRVlDzFp@=`$Y|D``=GPAR@`{wQ2V|I2H4Wx829HusDENCUl+Y-)S3E~x*AD&Gj
zw5g!*nHd4U&pJ>(h~`{Kq1fyq1dWUaqeg8=GiI96PM8@jaPWoAXnn<>?)kp%n)Lje
za^CZmSc`v(&GxiKi*#OGq|dRMutbTWRZwfS*eaT?d*%13%edl2BHJwt+51UVT9#e=
z&DF?=5j%)KMJw53RL1$vU3zEh^28`usix7Uk6$8tPFEffnT1Yj#TxV)9hxD=grpc#
z^=Ou+&wlGn;`mQ~QPlmXUd#W}a-cQl<4WADyP?@%+Wuv7w+y(No7`}(Y%OvTH~Y<l
z+!BA6K2v1jjRo)??b;h_KFMug<4<l%?VC$%lNmPVKVD0uq+BhV76r~AK`A;l4sAf6
z+}c$$Z33Q2#+8~ou>85=1_d<nc*=>IxYYwFC^joq<7`J>-F89Eirmz>AQldMvhW%e
z&eECMSy7ND<4TXe-E58b-##$#N75(5>&&#|EaU;9HmLfl_Rl+8G-i5*V%4l7JU_%V
zPz4dO2JxH)`fT*m`X}Sc{4{#fo~Umv65P=Q;WdKs6d6U=z~_{6h&(zMvI=K^*xquv
zo1;2M|Cs$7u}X2A(|H564C=H=It8-6=#$XlPh`*K*L}Pt8P%aEwWCO{!aILwx0!x0
zv0F5)Wh8~@d&u?e$rZ#nY0g4U04WNx0>y`@c@?0&QBw*U$&t5?O7NAU8P$ga2V8vk
z`R*q#Yd(;1)hnn=UAfGCCuJ=Yl1Wcc=iai(!aFE#EX`{ezTH>!qbL3_B^g82guh2!
zCh|m})}J@U+~dX78^5qz?<`9%@DL5Ry;x#r2}m;<vPjSxWM<JKCnLE^-?>!O!u2J}
z%h*AIW_AdmP1l?I;_J1QeY${s&aOo}7&ICsre|kop-3)@wq2EpiSCAR@#5+iIe9(b
z+s{nz(aObBh*~f;DB-264liIWW@TPn$+{qGQ*1E)5Ba!+sG?`KDs)}*OJ#Uwhe~lX
z0p!)6duPJx8`pb-q0Zm-K)F6ierXg&I)fB7a_*Bp5;hp0uXKlNH}^>Tk{oY-X1cZc
zDdPf*%wPT}-=s=l%7Ce}NlQ;9p^p~3R;V_9GJoKXsMG>r8g^5gR(4RUjB8}5ePmX7
zMeSZR?Shl(E$U*if1XxtQKOcl>5Dx+Oehk8*6Iq3y16jErfAicu2jY%-!^>=`i7!-
zcQ@>@hkf|WGpmk0^YNm)!J*a)d4BvaXu#I2LRXpw40`{oIU?KnxxQC+ri`4~aeS^m
z?tHjSn;Pe6YRanRr96Ee%4`1a+_UXQe!3q<5}1qPRbhbLra=I9oHnAK)|`x{B1blt
z8yB^$*bL~!{ukc)Klu!{_SK?8{eHc(LRV88p4EX@muWE>(+p~~O`}Ot)i3h-i1?>p
zzXETbaD&FTo4(I<FebwouGgU8ZfM<sd={pk>Jr*~c_A<9^UR3x-^P7d_tW2DGv3*t
zCiqBT!!gtv?~nKW*6Q5xOObKy29`gcz2oU+k@<bDk5n+h55cY)d5WJW<2wAE^UGJC
zO*qq(HXO+h%|}0y=YHhA?(`F}6;5|PFrvm(c#nr^E$BFl4+5`yup?*GU_A$xgMYGt
zzsj;~A4}K2`<DOZz|$+xS=p&P6#4S<3mAD2It!7Wh8#Jy$U`O7tjvJAxV9g3>-qky
z->QWaY(=w7rqJGgAeZxE6LqE(eWo(Te#Q`j*Ggtx5<g$C`S|16!lq}+velPf@P^ME
z>hw=Tn=a#js*`=?c+F|x6agK-!I)-7c51Ea=R*~qT;KCWakh_tyj@6%tV0y*-=!X2
zfpdPNpYw#Fts3z?h=1S*JnlV%Jp96HzWh^f_Vwn|b6WA)xa9R@GPv)<{5(BvBe9Q+
zxlo$t_Z@hgr^7x!$h&%pG>5|_$*dFPU7bRV0lS_Mxgd`hX7`W(P*P4#4ygwuK{>7<
z@UzgSYR%0njm(R>j)8TPU9)w$ZbEKziHTC(=Davv)9APF7qB#LOluQPp?wQhge0V+
zEimNyjL$})0S3iMQ)TE)mUOj2k;^g`S1P4-P}E0UUKfqJBCR#Y1M5AKGNAz*1X;L-
z@qz!48QQItPvX0)cKQ#$Ba5U@9&ghCt86Ham^|b`G}bHMjp)#+o%U!IV83OG?LY~?
zclh>D{Hzl*;Pq1RFAYGRj7y$7=C5a83{8Wz(JU$(dv|52(5~V9OX^Dhn$HPdgW~TQ
z{)Y$m;tWk&?ddY^#2pxKU}}Ne9`w#QZmd2=AEVVDX+v`I-!upjfuI*d(>gbwar#U+
z1h<RwVj~TXB%w;c2T0YXER{wzuTv{ogkiWB@QR3iBT4YAGA?CckpW>*XJpN2J?%y!
z=dD-~zz=_5wlkwm8ysX0wOoBd)jEbHx6iab_ofU&UR<hSUrg!LxKVjBQ;=O^-bvf7
zD7~pa-F`p2=!z{6UT`7Ru_i4+V^XWWs~G;oICop2e_KoNq2W=9A3$j}Wt^$V>8iy-
zbp;`|wm(flA6o9|uAOC>x_lUs?-w$7xYe(Eapsi=l5RYj{s{Jf<86iJYLSf$>LfJx
zN<!0k{v0IULe%Q<25^iX{iDCK-*<rbu~s9Yy;D&y4M3jx<}d60R!vH(N+tTyP6jDR
z9whXJ3&s71xxXb5S%38UOLaDVX>3w=NQ;-Qibufzf(D>L$+&dGm(}xiifRp=#xnYN
ziCR9acgQH^yngC0tXq2j_QONx!H&{0uK&A!7qT1a3qTXM8>K}$51SvNB1EG`?i>~r
zr#34EpPtULkA$BQM<>rxhjSS>@Mf%h{FV_F<WyJw6pHm?*3F)mI|(;<{Du>8B_3=A
ze_eQX6FmsPo2I9HN#^O&pX9@v1*<;Jt}y`yYiCa)dUiw}Ob&~v)5xZu+N6~1iYMcS
z-;5{~dgb_1SQUrc6d9VC=4e%1tI(;58H&#)<aJ&z<3@DYvh3R*I+lVnd6Bkq?M;Wl
z9Td@M^H3RsP3O;BHE%w6_PmM(D6hM~n`V%4<HkR3dbMlP3$Xb(Q+h6&QwAS>8h<4C
z&wg|z6!I?==EY4MIAKoL`DF`%U$b3d?BEv)$AHjO7w?t|7a2;B@2bp+70y%*?L4e?
zCz?Sp0Td2l@<4u+1+#?ECc*4t2(1z^Z=hXbYSZ$khxhbar=bsim}&}--MQS9g40Y!
zgE2M9wpG)`-XLTD@cffo*CBYX2hBvHXh4S8Q0x=<R<A+p%k-UbJQ!Y*2mU8DVEb;T
zof*|otC%+l+(MzlM~#VW9|v0W21BwAxlShQG<}u&Dfiv${HLw#G<D2h6{bOxu`3|g
zXi9q_d4NHms>5dkkw+@J>L!tN`l&eHf!l-Vtfn(cM^}1s4eUM6%2&wAY#bi~u^YSP
zaw8i4OvKj&jXOEyol715ytp|<y7XAQFY!lMj)c-igOnVoNlKOnBJI-6BZMmTF$vah
zl<cMksnGr^-eOJYyeDcuwhK@_xNLp!rss56G46b)fhEAm<V+3pHCQjRKz=Q}cZ<^P
zIgA(g$+l}9>qR`8=SI09nzR)D)hAka>)dth`DEqCGou>L$OkUVe^N^k31CkT_aG~7
zkm}pgs&(VnZYq4(r6xTL9u0Uj;L(6b10D^$ehtK-BJjK(kMpfxVR15Ue$V%lgUg!l
zOIa3LtqO8{mV#cx<IX1hqMt@gDZO;%NSN{1O*^dq=5o1KVU0PNYj@4I9*aS7C&_s(
zav~6G1*SIuK~sRsxMkxjrS0_!-vJX4f69VaOF_b;LBfy`p(gyiC~Sm#uCiae8)_La
z==xsp^az()p1hGYL<PF>2*qE(<-%n{s$;~eoOfHq@`2?N!#~sX0{`#Hv|d?hDrDfr
zMc1o!uG^_{TV-NFq$u-i0e(m-G<Ew$zl>X9Xt_>1as32vAc0oIzdL4$AEd?c5sX=B
z=5!oi(AJI^N5#%H>hKeHcPG#?ZtYzE@2{M{Gan9_*|nrxD;aWTFF>m^AO}i5M3iLL
zR4;Cwq3(>(kG|L|eK(v$tU<m)dbi9r>$b)8=oM6JIDD13)4_it--f_IgwCkymHb8}
z-m28=yH%KavqkCJC&Bbfq~!fy+t<5c<){z)tn<1_92__<hc*zrCt*DZV$$nS=+IPE
zzxOPqs&u~X4I40duYf1#KdFH#s4(aNd_@ZO;=U?UbCBWby<RnFs$E014I@FsX(J)s
z&=)&wz`b@;)|C1?W5u^~UUlRAszZ|%`@ZkIw|nk7y#~j7Q(vvJ;kwCP;VDdXBpAZz
z>mKdb07CL&##&+f#5Q&)GVQYh&r`rp4!SjB@i!%#6_R7X%D7EMYIX`e@w^9&A<(n*
zH|Z_9M7=?$N>sUPL6UJ_zq{u_Tc5ErYSE|3q!9O03hI+duBB@fL(H9BXs{f#t)K8<
zqS0q@J8v00AgJVZL7Qr~+&t`;a&rC$A|pnwxkpf|NR?KvPD(`~M)evq>RmISg7$+V
z&@hC8ytr+K&l`;I^L#@qnjB6cQc$j;$&rx@UA97ko`88C>n>r+Z^`_OA+HmUZ9Q)t
ztTVdh6*%t@Kp!R%9dXbYGgM|3IryM@^mx#nXS%D!E7Pj~e+N~N0-#eYB%%y2Zu{S(
zZY1pOd|QfTRp8Sr4@yt%n~H7#r9Lpq1T==bYhv4Os8i}_r4v7e(7HjlA=c!CrH8_y
zf9(2CPV%|4q}VmEOzBfY?;V9v-dVwdSqncsk_Yf-TGS?!8ePuoM=S5@3zKo*&b_-~
z+4J@@BP2YoxEWg^C$m9f%_hH*xmo%?rWd!nXZFog8-1%l44TQb-u!%xnGZWUpMI};
z?OPr12XL?+5@}i<(m$X9=)89qX<y;W^p@|#)CNXOvG0gqRfOWtMw_SGo>8>fGu2wO
zt$n9<8Ty2eY1aaMKN{}w#ntGnAP)WfbNATveO3JOHE{HO`~!OO6yec;M*|)Wcr@VA
zfJXx!4g7!9KpJ{zSPRDg0}7CF-;EFXI=1KFLXwUhuyIE6dh9^P9T@mS*&?aS{wPKt
zaxH~P24ez>_(QyNRQslmoztM<!lK~ak#>~qWexrWVv>?<zU|-Pe>j3yvkBkSHPkqk
zkGhG_QUR>p4U=`C5V&@i(5S}pK`t40bmfY%3p3_LL)fKIDu`dW2{)l&$!c?gp@#MZ
z)iILG{hf>B6`nN;2(G`eDlK-iUGW0@87c~GI-x&g*GIc;`tjwa4KBF2LfqRl!<!C3
z<6hjUxyhHlyV!d<m?x6$9@*)(pF9+{I&GH^EA_)VSN+bX+|83>mY7$e6sY*AZ6!a*
zEOz}z2z)h*uDtmD4s`;G|Hxm<^Ik&!<y^u<Z`dJv6;<%auxS8)pZMFx+V{1Qt-tUm
z2pg$ZBKjfYPH!tauFU$l5b$)j|I%|g=f3_u%d<Z{oziUMiP*Zdmi`oqSr=%}18#qA
z$Cf+S^t%a#R?Lw@I4`?L&t-%bGm#}K<#H5O9mN~qPev&d^B(o~f+2d=S0A)|(Um@K
zxb3lX8Quj^y@JTucsu7$vr3g_NH?o8vsL}l)ml_F3%b6-WHO>atjI#HPnfc}_0*D4
zK6yU=E8{K>-1~G?^0c?$&_z70Z6XR=iX0&`^(pBosu?40l-h~n0YOhed0rZTJQ;WS
zr`_Kj>ptv~q~j)8^wdPKHZ6<#g+NSNH{y!j`l*6p_<I#{1ro)VHNLJuqJI`Cm^!$A
zTO;(HE)8ySIWo5K$4+>oo7<Lh8Tat!^oiw1w^#yU0qlyjZC?hXKAtyA<Jhnky%7b~
z<Ie)3TR8cbESziPe($yy`Fv&lspCS1{0=6?c*=}t8}@ethwv`ls#uE_eRC}nj3#tX
z$;AG1r)G^`cp0Rzn`SU0%U!;63dln}>Z$^5<6HO)gPlyMoi-)i5E!6RO-h-$>+4ZP
zA%k<V(o;d6jLTnt+sWqpCuV&>GbdB%q)%i#(!rFE=A*b>fL&jyjYhHg<ss;nG(1yH
zLN4PdG#-AFJ)U<T`{2>@^{;#SfWkbVZDA;0tLIMaBaZ*V`G0wrj$ECvU|S|ofr1HO
z(=u-CwnJ?y{;nPpT|XhA<FR;NUS4+ty|{vdYV^1)9~S`I5B^T-2UB7Gt3bOqI9e2H
zscu}zRB)A7RquQa4@l|Kpfs3xYn7qVBo-Trkm5(HNvC5JvjJP{@;*EEOGVsIFJR>~
zlro{#W&73x=r%Rp|A`?dY*6Sl#_1p3@lfdF$m{Kf)-}O)x~;(1`^)w?KD{DRu9o|{
z3e2OOy{`~DC@AE313`~sW!SF--8z9T<BC1&@cHcIkJpOKT-YI;nYc7UH|6M1R|YC_
z{my*12URSws>BK@%>=?-;6SAEKzv4=9~$_>;*yUfdU0<L`sG+c-D|1fCg@DB&@%b&
zfcL#ZXC%`T%o>wE&7w+A<-2iyHX^l|zI`CUD@t?qOJAy^I124zYM}$_3e}ip`$9Hf
zTU-eGYEWrjp{-q&O6lLJ+vkHW!jQO+ibS6YjnApoXXv%9&|ruT9r5un&=-OZq~S1~
z;n$l+j`B*K2wq`%t<Jxd&!&dbXSeGfTx{V39*)kM0bF*eP*`ud#7!^P6<zRDuG+m9
z=Qr<4_557Fc3?=kN=*ys#!uu+$zNWk)~4W{z@QrOADz2=t&kand!R=H9u2&)8o+CB
z{Qct(8oF31mGx`Zd5P-X7Q11hnnN?8$V!=6D6*xh$zSyqTUz%j@?Y(G@d$|(1OJ0k
zWL&vhPi{2q`K+&$nW^x|dYB%?669lINq6RvaTT5wEgSKD*a?^@I_>&d6T3nMx39Vz
zfVg7)ff*lX7TE}k!$_(Dyf|bczsLizPm!t>4I8D@zN%}`WL%|+mvqgptnLcle#v&V
zuwSAoEXa}5>dcw(#pdy|q85%+K=XvR_o|>b6(r-TJbN}YBKo0`>@0Ac-P>_6{j~bv
z;|l`u1rWHY;Xha7u#Bs*>Uo*(%Klml&Ij8SmTS>wJ(3ebC)w7P;O0S<TJ`IMUw&`x
zRtOyKtWa{Cp^+`@KD~YjovomgQ)Y!Mwg{H4kJ_sSw$k_9-+T^HAa|HT+(v`V>83<A
zx&et_Vw=<kG!-@_s(Pq1&^;{r7<`_ZkE4O26}bElneR~C_aIda+};w?CIg+g2~oNG
zpYqJ}k2^JO*y%a=RnZFn=YZ`4c(+-Pr$;u=sQ^aFS@c=p9#wuccyn)24d~V3;r(wu
zy$UOrP+EOtWJ^m(Rvl^6x;%`JQeKixFY;BNw(YX@W(16?cApK~F~BH+TdFBd?D845
zXj?Ig15M1E$14XB+aJf-Ur(q<Hw~fHHQ5TPofccaZIu>2u(imF^x&^o1Gr)3ZL28s
z+2}Uu#k>3|GQ{NS^+^XDgnWnfc;H9NJ_OvkTr;efce90e6PLi|jMHYz-%f_y^HGFg
zvpmdd%)xg;;|t&2x_@29HNI8otJ=SeI0Z8fyQ0OPGZb6-+&eTU<C^#Sb>{BV-jU!N
z9Zz379y0=X3klzI$rUD@T1yPyC{TNheH<pe@xdRRK6^|5+M@2sxbO+TgqK@1OAkSd
zs?f;+s-?|37|eGVc6To@_bwo_6OO}$FJ4e3s8f`98%lWf!sqJAwcG!CB&Z5if(H-{
z*!tI&XNx{Bzcg?sm_DFU;*Iv~APs8s=)g1Tw#{xFeu_9-W8}z`%4+C}K_+^+xf;5_
zriX*PXD9=s-7#%@amrg;g4-N1J%o+u$@DE}r@W~rdX?K#0$QKDwFhQNb_xnbwdR*l
zytfN)?}J9`dj1?aXw=s+N58obgCz|1Nbxv+4iXvDUW4ygoU*6R6f728XqM74Dgyz^
zq|nx0+6^-AulDx#1tPnK?65C*wa8qn<?o%FvY5z}zKz$uXi8%D!T0}$t(-_&DY51R
zQw<uZS@BQaN!2~&Uf{SzEi<an`q^pU)~6{t(152g=-MSTQAZPRw6V#DICh|WD$NFL
zFQdoy{)?KQ__+goy!Ku)Fge1Zeu7n>tmu_*_SCES;kDVMd49bL4M>^&h%MG--21B{
zi(E7&?-uI|GGC%E_+b0-2cL~8mjb26)5k=|L{oLC=*HJO@uq$|UaKQT&yMP5aqSn*
z78wWFzJdukk&=$5c6`VQKU#0sy`Q>Q@t%I4oGd8Cki_&8jjTuU(2R@R@*%lc&9mWm
zwrk6-h6$HlXP#@cgPlQn0G++M8CJuKOMKR5#DT7VSA#Ha&Po$>!2G^3wi>{GnK3bu
z-yW2z;KXL%{2J<2Vwr+!#;$wI^_);L>>(#A!|+trn1c3Fl=^vB;&~bFc6eS~(%Ie{
zkL_PnBZAh!?&<m6vY@UeeF_eyX$euOG?|%lxm=N;M%QHWm&K$eMQLI!a=9iM#ni+5
zIu>)3Mj5L{|0tEL8o~?EGAMvvH>u;EJ>B1$5C`Vb%`_d2M!D>Uax{yA8;<!XCire+
zw0kF4mG--F_lK;sod23bsf_FQETw_>iJ8gW=ySt@T<rN>P2laLZi-!;rZ4f?pD&6R
zjW`bmLE$U$U~ifR;3Gl7qi^N>*rP$U{P3B?(5mvyMAXw;9w@lkop->Fs}VM*WT7dX
zxIen|r?=HB`&Q%kYd2llT4YSh)r-L(LF`uiY8*#jcE<~5(5>q?3#{;2T9wu{(q0Yh
zN#$649g#|#rPeAlUfmYM&{ajwT{5&z=tqn8x37ZmO_2M-(K10K9I+lP9TGHXh24d}
z>_l*VeIq>0R`G5bXz^k)D|sH?Rujf2@kCm#%Y6VZZdk`}juzN*>LM6vBn&mI-Cf{8
ztIewi?Xa`+_Uv6+xH`0AJKg1KEimSRmlodsaBnFq<34=0V`!;Ck6M+Yx`NIXuf}0Q
z&pW=O9Y~MC6B^XN1979wo56EL{h-YEjq0hAW{hy<YMy6|qf?HTP<Oif2h7_fv|(_4
z=l#%;7biLiZ$VKaD$s7&)l_`+*)Gw~?!7w>ysDPb49JHjMU9+j_~^3;UQIoIF@LK+
z^1;{j@4QD(sa22)@GHXe@nYzI_AehdrvBB2RVG_{)}~4E6r$1GX4(iQai>r`6?_@E
z8Q%~_Tsrj!2X5Wbi7TS@rrAJ@BbZM4SP1+y*&6s~OvfX~suZ03P)QTwD8!Qu_OOW}
z4254Zz||CJWdOH9C8Q^!tNLv5^7x3;F)>=dP3dJfFZ`%?K`8YlAt+(YytgYwl`MD?
zwgUoemCiM`(0~_s4VA}$7aujd@UZuC-$F2xcGe3x-dcClcXfQP<~RBuE4&Kac9Urb
zf`+ryG<0=5_NY7Z?BiL#HCRx1*GsC^lii~Mj|My%@Mz$FLj%}g0Fx5%3V)d=lW`Nz
zrs*R$7w!f}4eSP7=jLd6nANu&o29K$iFspQQCcbK`&pBk`91li%hmfvn$vD5X6pg=
zVkb-T*S;K=antHgD-d_1`6Jj?d`#!_ebKp01#*u_P1W(oyHwQ{-|5nHgpz|pGB5MK
zJbC|p4d9ju-yrNUiq%TS&7POqMHSX<YE_yXPoaoaILw@^GZ=7i0cDIvKYGf}o`+0j
zn!v1BOnhEwAP>cP@AyuVZ@+WJrMMRfY&iT0BkaKHh6n4Sl=Ib91%i@$&^p_F+qow7
zFwIt2Jy>z{aqL)R;(b}EZ>cT#IoUd}{}(hvKS)5W(58jY>&HZF9vSiw&atM^?Tu9A
z*{sVj8dUvMN5_|%-KTM9pGDT}o*y0!cr@VAfJXyj8VE;37#+csE5_%D=EW@=bTlIC
zr~B(*e(P+X12&_GXOn_n)|{H2l7Noa<5?*`ptjd^9uc)*J({VxyScusW7q1P<fjKh
zU8Ia$@-Q@FX^dv-hieUd0lVDr<gSOO<<DldNH1Mx1k4=m=H|J^O~G+}d8iJV?a=fy
zL#IN1gJjH1a5spv7q|Mr<<m`{E`AOUQsK1jj`u5xkvvfugdJ3siK=^zR9NTv;h`l$
z7@}8qj2Zf^dh^}9Y)sPg=F&GNy|^{2&R(8hV#2^$w3^`*qUYs3DZ<*S(~)&93LVTx
zS8}&O4iz{wu0fZH-1xN0xIHNoafZA;?3xJ&`yHB4aTn}KID6e>Q&JItV>0ls*Dfjp
zdg2^Xap}viwP(3+T7>q!4xg;EhAwDoe86Gsb}n7dGHye!k(G823e&*s)9y*x#U7n}
zHcCv-&d$O?9uf`6^IWNQw=v7OEzi<c_G;4c7OXHcZ7(<X*CdGhqX;l(p>y;m6uBc?
zr?N)CCyUGgTR03fDej^tcQK-W@piFb>dZSEDVvmPI^yvBxalzGq_uc$06rxdxAoc9
zsq2pXSgj&0E5@b(dq;Qb5Kj-+-+HpG<*25Y?!7u^gKrLm-?`<zw`2uc{6c#1vVD|k
zeltu*FK@v1@RhoWIrpj-`9f+3{@T>(5$w@`M*|)Wcr@VAfJXx!4R|!*(SSz-9u0Uj
z;L(6b10D@{G~m&IM*|)Wcr@VAfJXx!4R|!*(SSz-9u2(N8VE<uDB!i@xzE@AcZF`>
z-X4Cz*tLHHaA~mLTxU<)$wSGZ_9z;vu{HLUNziT_ys7u&*1xrWRa@=5Q?_g?{_EJ^
zg6Z?v`E;;e7Q#p~@?dl{oev_3Le5~<TO2&rk4kavw)9=ahT6w5lfQ#I*qu3W2^=KI
z?F9konkRI<4>~)qf0?K#->>@f{WX)7S~zAmhSpz)!ZB;LI+H%btcu%uwCak@LHYhE
zUkt26_{{7*8NTnh_EUY!<ic>y^a6F<!6)1;CcRo4fDZ+h+5Y>5@#RMqf_tmz19^Z)
z18=kjaK8hs9(ob63d^{C6}MbFRH)BB_zs}QLLr$@kK}&L#r^dc70s?)V3;p0E|f+T
zw|6x{@f=lOb&H(beEM>qt@a<KSQR}qj|My%@MyrJ0gnbe8t`bqqXCZwJR0z5z@q_=
z20R+@XuzWZj|My%@MyrJ0gnbe8t`bqqXCZwJR0z5z@vdTN&}H-I~sPRgYXZ}U!F7|
z<BoM)cqXKtqAr9Fg&lhoF(+4073%B5UP^)P!^uEbDe6>Oox!43C8kM_B;&=MYSwII
z$X@@N;CAJ#d^rsdrPC(qLetQtyQ&nm8-<-ZVDi#$EVCVMCI6GE3<pCBh{fR>W7HN+
zGP+3##RM{<=P@UnP(+ybx9$I;-10Sb-pP}O|2vtyX;o$1`IJlL&u_U>76Q`;*eNPV
zc()2|5`pRjb5x>I*;N&*Q1u*6zDVi8i!M~0n7L<Joo~QxB+^!3aLZJ)(UgR*S2j#k
zj_AFqZVp^w1>e0Z2(Q5QfHx~1ELOQyN&lKOX($zeTS5p9U89WEs14{kEsX))>>!tS
zL6^#^NJW$x7pBGf){ymm8zL=%cn^HN8nC^-+ZFv(XG>Ra1inZYXu<r4%ts#L-&?Q}
zMF2(j#_QWyMqfBvtmHM|hX%ve7vg?_$00yy$WQ~o0kU++2jzfwB0#tl5pcF1j&P6%
z=}@kW`(vK><|*AiYuAt_`BNy?i`)02ayj3PB8N>k1AyJFKQMZhy8bi>MP*kY>zYa;
zow;{E`u#zL+djPB<tw<IB91<fHYMGl2v7y=y!q9rry<2585ELNXjA0F1A{wnu9iLm
zTwmj<NTzAYgTVtW26awId1fWLQv=1YjluV8#0IL+fBJG;(<WVbZWs*Gp;^Gy7|<LY
z)f&=)ANW9?jC(wx)Pf#6E^d($-B94DORh}}wOyNtZkyI?b?)3yEaU##{-AnQ?e+cO
zocEZ151DEF6~%qj8e@VUUCC+a89imkaCKpi+bg_55Bx7^ARJW^H)-7M!Z(M0@-axI
zOa^7#vyL04WX9Fs?2ogdzcB=Gs5fzZ!BCL(f+77+t)jXgTvqEHh{g{SGDncTSqN~J
zpH?Fm06s{7r$!o>pLX~7>0?JBkf`e^VF=t9r_JL9*>4qVxNBA4j%7R0+JF*qSIo>p
znJBV>iRe~2be9~t;SkU1RmcH3J&nHrkPJskG*3mh{=tK?BP-Bt3h<s^-LKHP4He<R
z?P}v_okTRiUlAS>P3{qNXJu68;JIg8*LLxSF&)N0LE{OCK?fm>TD_)KYiKqx!5y<Y
z=*^ZW{;DVajLcrX^~-&_y&yc(OF~ddncju>o*Q>>w7V@LFz;8Um%n|kUP75u&7<if
zgi?q!lItCi*DUAnYE3e!EjkssG#xGI$X|49fJz>Un+Q(U8&g#&=wyizMS(4q-nuQ4
zEY+196e8m)_P*CgQy?|CC9M~<6|wrs?ZS>K!Zd0#Iw)eaZ?Se!Ni*VTU0}jV<>vyn
zs#NaXeah}(eZGKsjMJ(xw_YY2%@%amS&H@2=p0gz^wO&pn;p9DWc+)jX$|c@7P*23
z1?8vc?#&8ool9*nNSERpBO;dR5%{ac@ckkZuk{R2<>5+C8TanNf=>;>n#wSvw|mgg
zte3dvyngRTL(2W$^iCuCq;{_lzV2N2GTUD}9HLQMa37$ILH*nmDn$DGYdHT(`dg+-
z)~L;qRDwv?3)4#5o!Ch0dVOMI!hw^mr+$vwA1v3Y49UROnB~2z?5Yx4a(5q^_px1d
zavjYJOEVb_#?+)VBl@<{v^E``yi#_tc8Vybuf3x5F{m4e3Pp#r((pK;jM4H0a>Ji8
zHWZyS)1v;OTTGoIs%iOemzP}o|28A&-ir(B{oVQ>clE3UEpeeU-G|uS3~oj}8q&NT
zD-cCa4^W~1zOTC`J^!Yh_k7<l?ZD#(om(@w&mCQKRa!s$cCX;=LLI3|ND+Z-gz0Eh
ziAmO@_WtVbHEw*n**B4!3iW}-qCcIQB*KwLG_Udc+P_ipA4(JeL*^T%&40W)eyBvO
zCj7ts*;^UcdiAqUDrEK_S%}t&xvEj_xu=mT#sfSW@MyrJ0gncV2JjLC4<~rx1=dxP
zlDB_loU*~1FPnDnzPkYxU^ln0+JeF~Xy%Gms%C@j!e%sK4Z%xSvo1-gOqhG?vhO=V
zmqK7ty@HN+0A;0w^@{;UN`{$^jB8UVxZ>W3=t$Ue%N4Rf?g?2S)TIae?`XguRTaKp
zJUw*u=f$;+-XuF}j86-rEI23r6F1uMt3(xcKv2lBfdoZ0P^q<Ot3#J+;mOi1d~KsU
z3^-LYBN>b&wl%&yAR?k`dsX+S)I?)UdktDRWyg((T8P*0(%0~jz1J=(yl{&J?re<X
zpGy3>;6hduH^!hw9gy0jQ5kfpNfxvqZm+Q#%v98<CT2BDXx_tA_np#BU$vQ0#zn2J
zINdPylf%%n`QrDA{tSv#qbUWsZJ;eo<f@@ErI=N}U+XbAds0g;xSED={_p<_D<C{v
zQT6Z-E#tbbF0tWpoiCGM1q97IL5Ey*(7vVW#fukz9P{buW1r1lVYU$?uEF>x{WWW3
zU<v?HVqc25t59gPikM}je<d>RgXdpwtr*;Kxb>=5T2mZb2if`gFh}^lPlak{tMwbB
zC*~BFvN>b_i2t?U_HWzXN-g7h_AZ*0wX@KJTJ(|ZUJ<)zLf;U%?@g;jR=W()gX^ZC
zI>&u?C-S%v-ici~ftsY`P_*4*F(n$1`G=Ls%C<ExZG&EO%+J0}1CzC#Ob2zhZZXAV
zDCGh8!a8?%S!A59_r!IZmK~3)N-MgLLTu`^a|+{)n&@I*eN0FSx<$-lGz}^HXZhsH
zW9LBk4G;QXfuMLVE~$B?!~3@^><;FnP@4*@GgIs|f+C9HeG<8{3qK;{{G7(`OWL<U
zXAchrCN+4tD^i!(tO;edjeEIwadKOi<sr!15c~b9($S4>I!#}lR;hRYF1h3#yO(XZ
zd|p{eD-lE6C3@|)XO{C#Dou?FF=5NF)%0#ZB}W&<p;m!hKgfPtY=}yKXM$;>@#Z-%
z_zJr)DuVqh&{i@X)vr?mz#VkRV<F@NK7c?^r$2U3xsD*@J5C?o5d=O*urYNWW#K@&
zH|VJT=~ORK^a^(1gXe%2BjXIw)gl@^Qx6KHN&Xay4L#P$jP(L)<lDqY!OKKZ@Z1Q4
zmv+!=+t<4<yywFdYDso~>@@Y}6hC?$+YW0<XAc04p5H*{w@c+O>8WErSn<8szr90W
zB9LIJ`+)?#xa`#j$|m&AH%@w&POphfRLTSS*m*{S&ZJJ&=%h~=vQrzM95!{|&o!C1
zCe~E=UBWQpw(O<@+~DTFeUMeC!A;t9IdA%{nbK2}bbZq;7Il!yWK6fHyk;kUpslq&
ze_2`|?ys8UbCU>%79~?Rsc;wV(xk$n)a%g^glYo}MYYEdfWKXAe8|WDah%mlZ9OqL
zz!ZFFS)v&{Y2p7`lgI!6#_z=qSsh#M@$IQoX|KpR>jUhaG=trB&m2-|{X1K?ss~EB
zb{IMv+y1RQ@TEuB4^y9%Un;BG4|=;<<dx$!wLB;q&DHI^?Ss)}yx5gLhTpGMDUcrv
zjI+dn1v^%vG4{yn5%V`SuT}}%VW2sA;J>2*7@WPh5eMHo7;^FE)i$&u;S`GXxPq&P
z0~N@Gf-gW;rzY85f2=~&yG)fHdnPLr5;`7>=jG9Eipq8kpnfBspIlukyu=M?i_X5f
zkWAtRAP+@1fb-XXW4~zY1>jouZvY<|eQ8SZ7p)#aZx>E0j&x&nI*<n?r0We@RYJO<
zFR}eL;_vQ_`?Apo8_@WY*C+Sl#?1d~W{KWqueYS7+C4kFq+$XHhniGmnv<5S$BIDu
zz>_C;6)>j3s$U}iE_kjLt-wOt<LC0&Vx0H_(oD#K1I_aLrW*UFg7;Q}J|RJmY*GnF
zFEyGrXLXMYzEt9y0-)K+xUs#BWtM%r^}}~*)$EiH9bB&7(B3u0J>RHtmAW6^a_Ms8
zw`pl>X_t#<QEL7OjVd((nR}3@OSk8y)Qh_}7J-VrDXRNluLoXN<GB!iGh)paud
z1O2rA$+!v4L-XGX_1Oizh+R|4^%)TxZ3vn(q#4r9(&x=GZt{+Z2_u(B&WNBT$5ALU
zYAeDL^#+5=oRxx{CQW*cD#4hZs#Tk^64DbB@nRWTI6s8P=>0aOm)*SZqu#IHIy~cc
z#^EVT_SOe0Lb83Og=f`5;o^6BkUrI{Lt)W%23-m=+#`QAtxxL;o!a-)4kMFotL|Uf
z4_m)5t9fRZ5r5|F1<GVv2KrJ{wV7tsjF$Ukb*>uo!N%MxtAd+?pnfuLUTSKe&pUQX
z1iNaSUEg9%(Ip|XTdG#2wUFOwCY@^X&r=4*h94~qi!e8f{(sMo7fV>lxJ$7AW@OwK
z^RoubsXoga=Jx(nSNumRZ0{k7T7KA61e*0pDd;6-qE11j$1@t-HK<ZhyN6X7eWO&E
z4cHpN@`;tE#qDU+69$+}%4Bbbr>?zTQ~n&ez;vX5ea&qm-T#H35jsx$iel~9<1%jb
zj)mH~Kc;4jXeU=k36njAoL-ioAQL^_RFswFo~>x@{I(0CN=!KkW9mZslz5&OgCd_B
z3_3%I2AKo!-oC&a)wa1G)}n-=GPiOxj1BJ2`)HA`9N5~xy57?_4Xt~94s^DleUT9&
ztaW-ynu@;|gBc7oTCMkYHGjT1{r%2hBY5RienSP?G`Zp2kuBAJtT_@Kiv5U@1h0_s
z21*#(KuJcOszIlWfenWu<vZORHhk@a7WCnu<pY%Z%mXDd!l5IOU&%qa@T~zKKqv;9
zF+4obT|sy22}e<(o`6%$T90tK!f~&H{{X^_0G`Vg1o_xFhX3ICSvsVHJitjV*Z+b(
z^Klzf*EgNo<LltsG}B=U@n<PGZXtSaO~#W2**^?#(KQ1OF}N=J&Ex=uY}^s>%b}eg
zP6baZf15gT4FbFcnBP;fi(uiFDR|@UF{2AyUR@Pt?$9@y`X;L_WV>56<x67ogC^ie
zfA9n{Zqsw~p%L51Z-tND*)s@^5{2aQO0hpkBz?HwJh*(tq(A)6N-~>dQL{-HG81Tw
zX5MmQXE$-zY9Qmb%&+1-O1b<?=v$mVzTo&$DF3+h_>!KV_()#^d2!o{oz^aRyZKe<
zmtmHJKcxU$Xn`<`&TQ$FZfT`eW`yrQdS~13KZm+|n%_|)a7BkkvTgpQ&vpzBI4rWc
zlB=0hE3Y7OOQMo*E6B(qT|qK#SA&h?R^84~wxZRP{ALtk*s6yopSA{RZ|TdB-ZsB!
zP&M1<WFJ2mp`Z?C9K%IpG-<I{mUO?CpKjNzcd~Gkrx6k!NnDW%IfTB!O`rV6dUa!Z
zeSBh<e4PV=D=TOvLMcQI&(Yfq0h_&68HQZZw8j**J~i(*ZppaQw-1e9d!k%n>p(#J
zD-j!#E=4uH{HCfSdM+#o?m)D{9`GO0Ksc%=e!+PD;mnBz&x4Ai|JgqocVYhWU&mJS
zeFi;{vo<R*{L34ml_<R;j&#xbc~|230$|p~md4`H3(B}(=Udjis4@DHh;M)kBe#N>
zxNYWb>0Quo4F=1bymzM=JUVniVxO!1UY<NSF^z0(;GTlt;&8(w;rHfWY@Bv*p8?k3
zP%7_Kr?NXDrg5YDyPE2Eb?3x=zGT~$vu;ajvFTrGFY3izYo5JnU3LSr6pg^9Bk$qB
zACS+R`_{E{)q1@n8!`d9Akc@{TL{U9Ns4v3j|U@sJ7T6=jv-#$jbf*cw5n6TKqPIH
zFy%wVS{M6@AY=zaC83xqcz;u6(WmH;Pi=<I&b6POGUZR4@`lpbU={jL@9u%!8_^Lh
zYrQCJ^^hD&mlSsWwppK=WYDR$94OXf!?f%|wb;+egS({x+|xnd=_`^G_hPVav`?0C
zw^B<kOKY~aTNO%<rx3RtIE5?^CL4li-wRD-k;N!LsXsVy>yA!b5v@1ne^mhFd2zQJ
zRCvq$O}qVIv$d-k*^dl0_gANpQ{@8lK8|&CXZT-%A8VIB197`({Qz>{Dat~I&&p5f
zAn*3-lb3=@9DXa3(laSUYRlcp6DNIh77AmKB3GoMYX@;>YspH}Dfy@m$T5tM3BofF
z`c^}1fV^;s|35v6mvMhqYNNjKd+Tf%JpG+LnZbzS(y25?G{-f|L#-Vdb<X1ZF{xvi
z7k4)`rfK}T4pYHqX;*TtDW_og4#jIsY)6*9aJajpclXBk3yuYo@GSb2X+{Iy<()o$
zbE21FkqqV;;n|m9IN}*6pUdR?v^1a6{Nyw~<OJU`SlD}I2ybpNt*pUMBp@F^S}F%P
z@BxH$UN}Nz-2K!Qx4ZeA4*@5@7|NnXAurYF6iAvXqp`gF-4&$^gPjLtxPtga;fKN%
zr5!e(MaDfix95l7Bfs7$GNZ}$VywejE^kME!(M7@ka15BUU+M7KEKrv2sD(hjQDvG
z`x%WQSdW)mXhMe?1>Z0*idJE%Xdmz;rgeWu*9(3zZTLxW6Ari4$N3kpkgK&?983i)
z0W|Q7R^J&%b}{6)TI8rim%!E<o=-e7`|i*izR*r1X?w=!4|FKnAa$CExisuSn*~?6
zvo1w@7(5#AXuzWZj|My%_}|e$BzhE>+Q2*_FHa}qygGe)Dc$^VCoD?*sTi>pKJn(q
zQxG@J{xZ&c$cRq$x64M06cd!9H*4gIHhL2ZXw*t)Hlr21Hr5h?1Hc+|nNeD$^f^|c
zNu48>Ts<>M%C-g^V|fMc30_>uLwCO&IXG>L6yuEjc9J|;muWE}Cn@TZt2RlW@|Rq&
zasTmSKNKuWUs=5E)sgk2Jb*vI#rwJ{GcGOJ^SJNLCf+dFqTDYHK%R_yd(yO)Az{XQ
zQr0`UEmVQg?nTF~Y%G+S)zY&1CC=QWkTW;f6-9a*t1{{BlZHA~W8gfyFE!%hm2$3N
zX~BG4Otb<+|CuewcTcIedTUVYl>TaisD?Yn=1Yc!!ArjpkAVNA25cWv_2Nap`Ls@E
zYxuJ5I%R=j2pyWmwoQ0iSmYjtA2h)xxJJWw+axUdEJso|6`X7|>9bMXPP49Gx(=NY
zlLthrD9tUu*ZRf#U;TQ`qxxWRNTc=B7}K&;#XhWAt^bUyeBk>S{-6b)ob!NulA|KX
zQ~X;ne;r1fRH+|YH}OFI&fyr8j3t3J0t_|am2&kSS@S|iba)$YV6h(i@@-1`8L)<a
z`5vhkxOi1KO3DW}i9eSR9A1759TR0-L)D_?Jx1KQ1UBlSgpofyL`DpLyF(t--=w$b
z_#s4vT&9%T80<OqQ+C;e*v&t6g>pbU0I4vm4FFy`)B~(I0C&+0EM(<Dei^42QnkhE
z_u7Sm{g;V3r|`s_gLmM89u0Uj;L(6b1H1<C)&d?@@W2XgcYHz~|B-P)Ej~5;ePhq?
zZd5`jg(ACV<k(PPBaKOigQX+S1U{@h9P!Dr^V*_8we2qBQlc%ugpOoFVD+1IRcqUb
z8M5XV*(&XcpJ2)2@3@-GF~u<J78rI`u<qr<B!wNMp-Q%*L)TQ8(`|g$U@+)|hVWsW
zG_-q29XMO>`s_&A6`vHRj|g%cLR$e%&$rp1+PUzEILd4HY*t?Zc_ZGHu!FI`B2uqP
zP^Z|=PeCB+K$XBtfJabdKzSgEr-Z{?<9xZ}?XXp})vURyeCCw7GaEyV!l}0S#=#!a
zM*7gEr(|i77elHU1%W|FM^4o9t}>>>+5<J%B0RWL4cOj5s~5fx`;9JAxH{#>w;JL<
z^agBg!xnfaP#L4wqxBU2|FcpB{Jo1js|*G!n6455wtrbVi`zKKFGvUI=nG==0S@^9
z2MBaW&=KFOrh`1&OK3ak?}QT-E3TAc6(Zi^jbLLDn;PBP1($K{I<5Py*8R7OLHW#f
z@@v>kjyBdb_y2sw+0W>sAEpq0=E3H4QzD98$onXvYcLF9n4s!`Hn){peT;noEW3-X
z$n{o^{zb8&_<#-8b1N}zGLQp!h|1mnlxLoQ+^K29PS4$3$-*msV<5b18P{o&-{JYo
zn;ep4|D~}AMD4%XZf)*+aj~k|y^m+q&krX=;%$w<*3+<FM~&b{nOx3CaOJ8aIG2u-
zEChadHK3W;H8G_JRj~Xj<-`WH%#yfuiONt*f1?Tqf|PEUmT^5gd52u~Teh(^t%$!(
z9lW`}k*TXmpMtLovV^Eqn#@eOT&_q^o6$jMd{J6zQj{jvg6;`TMxG89lUi>vM`@I?
zYV?mX*KR-}SVU+U@XRtU&iL8hIdQ)&38yK`Y_-T0B_)K|Ijp0-0h!jo)`sQ*_HhIB
z`-ac|d}(-e0|-q-#lA5BG~mVcTF~&*Wv3cFi==hKv4!xTU;qrVi^7(o&vYjc+vBA}
z?rgX)s3;7uM7rl+M;d@P)2pGn>AEUUN`M_UfM(#QhQdR}0>?0U5DbmB%a;6dNM^bX
z;izcq@jMyV+Zg^`pSdQVdX(4Sap|y411BL8aU4rD0zoN`rZ4cIGA{nb&Of})-Y5>%
zMrexoQAMtTwcYz+)(5@Hdp|Ujx_t3{^~+WB(gh;lD_u&OB}<u6nVM@|Kew*aIE{(x
zw-*jNfs(cA3_ZU4$zVa2b-ej!L?MCEf)M$pO7{g%9^yBB(x_ouV(EJbcl-v0QD1@r
z`3)(%#U?tj&L39i1M+ArYUC_vGFs4uU8za<MJG&I+<I!sC?Bgm7v8)p2rVG_#eu!e
z2Ncj6X$H`PNK=Oc<EV+DkwGP_IodcwQE8-JH>Dzb)%YtxUg;*Y5~}O^#pw?zo6XFc
zaJqi(3g>nXgm^}Q-~{XD&bSxX=TJbI6A|Bb0Xx23R{-M=@4Ajc*Xz_K-a9yh^<RfG
zO^!Bx`uwq~R<(hbmxA-{Li%Wl=-9k5F%h@D&6meDO`E%|(7zoN16vmGJHitj`*$Vd
zQqNbjTsh{`P{e7I^;d*m%XULz-i|-WxU@s(7G*72k_5*@?RzigMl@^mlR!DTP#eWQ
zQKM@SO~(Fs?r%i?nuhe0R2A|oMqZm4%NiK|DrgyCy=j}i56J*NE*WQOI6wA6^^J?<
zG_PIr$=zDvghsFyZM-3mZG1k1G+3?H{SdF|3*^cBwhx&K^RF2CzVNAtBz1Zcx@RFE
zK-E{Zsm(!I%=8MyYDj)O4<puq{iguCg_thmGKQ?}`Ay-S)?+!&Ub=Ap5DfDN-jNuE
zg;OTD|KhWa=YKTKY&TG(%|VwXi0y1Yd48#j^YU>68eT1&(sEN}c;aNN5cJ27CX7uj
zAO)X7;OF(WxjeP^U2d^3=*F3mf59Fik@D*Pg%5PVnkJXRwm%7ha?)rKdJVE{;OM1|
zcb8Ta-8?5hWO!9oux~u}Gs6KphwNE8_xn|FOyo~mV6GExs+EP0uc^`Cj0`sBUscWC
zG&!Jo88>K+@#C-p^}my1se;J~>fBKn#gLRNH!r7<af1(Cy)pao{4c>WewZqT?><q-
z*<Wu-R#{YqepxVheoC_K%<!A0KZ*6Rsd-4lj_c0NF0(n2<{U%E4Y6-Hn7wRL7~99b
zXF*{Lk=@qiRg)VvO>;))-}M5fcM_}bVS7ayfOg=;4IOghP;BvX*3-@Yv;@=+a!p<2
zVKfw;{XQ8vCWWT=(&GROExusX!y^e3=rWF*Max7-d$Y4uSM$G^e@R`b2*f>jMUO05
z40PJ~gAh)Bhc!$sUrXQqAq=_BbY(rUgr<3!>@*J-f&c8q6AJkkUXP3$J*0WgWS@b*
ziP-RRy&i>}^n?7dKYog#LXKnT3Ll6F$RAwFLI<;vLC+0Kq8B$+HU0ZxRlIjYpBzdn
zE7nNp?t%5_yOz#vi_y1Dji&aGEBYIBFtyX#BR`+>+U@9QTFPtKO_*_hdWl;<)#wiU
zPI0#9wU3V?4~6?tBaErYWQqb)peQ4n&dUqz4Q+T6W{dEW9c>D+bXGy22pRYB`D#_y
zeLMW8X0$rtcGY6mLCg+vkTudT^0rM)w-0iwI!5eYPz@^6C9qX%_N0TYPMv-+1B^QH
z_SIshg9<dTCK-$gYD1baQ;Bv=_#1Qa^||A}c+hTfpBG0!uFDEYWB_?GZqE632{#IU
z-w>v)0L5A{+yRw4nhUbP=a8c9XLMqfv6Vcx;rwYeZxw6}-;Y0K7b{t?Z04f|AfN0$
z?%4eoteLUn6HB}rTCd%6TDL*Mc(+0n-V|?vp}?U0UyLS3J7ux(;pU1x8KS|%d2x#l
zHT55~B;frjlrx+{^l;YVf;%Xp@$N+onfdeEY-6*0gK8}=G!h!#GMdj3q{-Hj7yYrX
zoUG)~&CnS|+RDw<H42nUE}KwTdnkRMzSzh%aX9%>3qV0`LYqcbc8WalO@-n;{iy_i
zNF(-}jiC{-swg~jwJnTDEO;mwdJez=LP;wpEi3!WwbIXFq)ej>u#CvY7lxG`xaQAR
z*UlD&{u6|}Y6z8*aclpW-@tHZcRP5o@c8aT+K_P@I?aD;-?qR{p;rMZV&9DYNnQM#
zKd8&^S-&IMRQzS-$DI%E-5d!gaSu}k**9Z(SQ3gYot}WYdW}Vup*LC5)pn6Ckh#<r
z=MwE4?{2C;wfm=!L;rWSb~kn!P@==9?Hj>LI-WLB95YOz)~2ZHpLj8L#IN^?LErPL
zTiO4*yejAcu}<+Mpa}Y({X;SHig#Udbp7};b!d{*?*iYif$UB03?yGy?s_!e!WMPG
zVhug5CM`h&G5;2~KKePT2|H<F>kYWAm)K?;s>n9x^oIHa#GNENnP~)vAV}bCGuoTT
z0Ew<TNg208mELuC$I2sM9JDJ*!axxc?f!LZI~Vw`^BVu|*R5zJXHh8HcPZ@SbSQ!e
zrZJ{k&~y^*|ENeb40<)eS4-Zi@^t;4Q(&(EE&N;1_C9y5xxT$-pS{0G>966`ABx+_
z$863^Y^psf|8D(i{Pr}MK03TzQ5}meTwz&+2Y(eE{H4$7_8JqtzFZ%%4?d0@niX4)
zkoSaI8=#tWXU0dho|yA>`M2JVr(BN)BxnGCIxy&zlfW<IeyFTIoOGpoKM2wGnC8Nb
zKP@>6xe%cMKIp~-jb8O_%_;KCTFU%V1WPFUjbrgcH3H?qk{?%6#{Jmo+J&?^%e#QN
zD4EvXenuHgqNUqb0PGyH3z|os-m`yj@U;sQVb(?EyfR?x#1HH&vs6{%QDLZZyhxQp
zVoXMKfqN1x=Fp{(RwpeI->s2K?-luEQi(@hii7A^RacNF<9<FgyFsUj3-d}*(fjCf
z12;jf9_^=F+hJc-!x#11TweUB*u+;=4UZg;20R+@XuwSkgd=_!D`1}NjtCi-W32mF
zS*h3$F#lgh#{@FgCaF`<4JgQwsP{dCGADj|p&E`>NA8sB;q_?1qXCZwJR0z5z@q_=
z2L6XNkcOTOCTQ{hz;mM8DAt7jG}OD{L4R5rKx_tQ16hS-rl?YR`!Ik0BL*Eo)I%j5
zP4sLF<}(W>w*RPBg$ZEA&!ky#NsPgr?0zd6X>}T-)_QKzf=)!M&`p@hMy(PZ1GuvJ
z>wazCs{8{OK%pkD3)-IK?4jEQ7QLhUtR5}O&h*PZ3ElV&vY@Sxs6?f*t14E3|NFpg
zd+)i*{XSS&yh&wvK>$TxRMyM9sPmOC&G>4iPoA&5(V{DF@YT}pTzQj^yJ)PlrtXJ2
z3%KOPQ|034vkyoVXcv&kjN=j6Z)tbj@m{UNvAvqYyLwe^0pwlW8Ct5TU%Fb#RS1GT
zf4Md)CPSIG0|*z_EX){UUb_sg57|YZ3R{|VnRq7{2S%nrk>_=4C5tc&_X4xjtJ1*h
zmIE4=ahDe?XxTq}>+d3Q&%&}_rd?m#nK`$^jrpI$c{}?ri0OdnyK9t~o}HbAzFRpy
zF@>UC8&EiM6a!6}2<mX%?cMw%v3%&6sDi#U3zUlAo+jC(H(Su*8=XP&xi1vU{`?uG
z&%~2c;lR(IR5IU@GX73Ms2F|&54k&`g}D-Y+H}#wRbdm#G^x9!M_AndAMftFsy{Ak
z`fYq%gX%1tzCga0iN!Zt#bEbEc`(wOClm*?@|T0QPy2rH%THRbJ=_r-2;o~m+RwEU
zZtqj0XvCjX!HzW~<UL$zhP-~=xY6uc@g-M-f@?PbH@G<4heP7e2F2=A(#*!xKw~KO
zj6!aTF>M4vXtl~hQ^zbmx#`Zw_FFA4qaIKW$e`UsE$TM}WN%j+!@%e!{GG~8WgIB3
zQ#=uzs2I81=<_#b>(B75bdk=mJ4D0txc9V_=Bq^A&$cseXh9BUkK-A-kC-!zNNxL4
zzB<K7VtFu>Qr?*iz8wa2njYc6S8F3fFG@$pp)g8{)Wsdrbq8|3rrW0N=@7Al87dmU
z$!1zuRtWiVg+e3D_9a&4NMj-6a&U(elDP`dg)np${Y@et<Xa7AJb~Z<?rBL9dbA=?
z5g}w;O7Wwuh4kG@g8$M+NcV{p;w+}2>E~VWvH9jk2`T>Vg!nv)*Xkgo12%=B_v=Vf
zYDELbtA+O^${p27yxgKO;&h;X=pr5X>UD-+1kR>-f9gw95Dwi7+5R!Czk~9BrS#+7
zNmZ8hCQxOK4@~g-@dUd1cLn9Eqjtq9p1#P<d<7GToNNkHv;?oN6PFLv#YyB>LNb9J
zt%eEUc)hT8Um|}6g?}0do|z)8+$$3KdZh~GwKNLx0ck=Uu$KMc7l8*ET$t(_TWE64
zBgRqLETm3n@cI^Ey1Up@n!j(lFy|=-_sJsZ!2<}KM4>R(%VUov%FP-mEbA_Vw;M*%
zuTTiweLjR=1YTosVd~3c8-@#I)EFVejTG-cN=OIHe>D6O!h;UzLM|Ita;)t){<Va`
zA+^#+@Qc7{6fZhXNOu=|>>&Ra<B6oSiS9|f;eh}BNkq;I3PGxFGW;U2^b{cuSix!V
z%RTtJgM5W&NR!ip@)iDAoIiD@klt>V5C?1@rSF^#6at&i5#lVinx+STLQ+;!2z(lP
zt|*7XpXWh}5Z<0I#9d+e7rNpQrgw3`uU#zUbA%nGd><?kavY&}%g+gYHHE;{bt(C^
zcNtK`;ifMLee`kyA5l1K1;J;p6wg<EwK)A{sqMafSqZ}YJ6y;cyIaWb2#eZ7Qof_G
z>0U>iLi!_#e8OBDH}89vLh!5m#Oa^y7pF_51{@G_E@W^>?R*e^5%?p63sX66{~?wl
zj>jGrr?b=@lrQ!Oo8lbb#qft5b<Xc9)$f=%$M)mmbf7l51HYWZt@oU#OHB>9PdJxS
zC^erWzA_KQQ>Hkei*s|_fJcr}@<u;N<@J1=xBP6bN>5nI>%}LzS)T4MQlGOFK6ol#
zKh57l`p*mwsoS5yFLCJiTu7hE;E-D21^g0+`&^`p=gLiO!f&H<+))Zyj@B|6Puf5s
zo8H8Wq_cE)@oS76Lq4J068VL=yYiPZ`PUX8@*2POa&p;vY<5%L^n%XI|Ik}JT~<h(
z&emsvk2F5W*RhCu{L_lM#}DPOP*aS^`JuQ_Ua&90S5wI5bA*>GLGl$SN#NqQ2`pQR
zz)GbFg#70i9O#Z<LK$Ix;PWXfr2G02Jn$VM9r(99phJ3%^5Xd*-4X0uQJC)`gFDJ+
zsYLQEt1Qg#h#%;4su2Er6aqc1Dxv>D;eeV#xi@MFame>UZE-rJ1KcH%5BMFy>;9y?
z-VQFXs$Q3*Poc0zJz@P8F?i&=B>gCbY`OCK!u*hKZXiyFbVu+8%{R26F#mG~U#k$N
zJCau|P@Hdp13D|G8yj4kVfd<%xcni(LVAG^f@e_3h;fN}Ll9?|oI-{any-48us*XW
z{)EEejY)c&rb0fDw!#6uOfw<BjNIb}*<3=uaFTxtg)TEN4Eb6L%m0+YE3^`(uVQdU
zoJ%w?LMRV145Rc(t;N%UFGT4)9r*GJue&M#y*8viITS*<t=o#%^M(UD<O8@%FP<OL
z0ru`Ajqim-K9CD=RbL|iU4yi8ARh~>r@UN#R$iv@)yf0;x-{o<tMnu3G5rZ_lS$w{
z3PDbE7NPH?uthe(Asyg-2XshpGmzxFNg>cRg9!Zqg+SjnSiBra2iRzcG`_VC_(l&U
z`7aL>%1ItB#GyQZR~)2I96|C;9Yx>_8sE@wtWe&(j|g6VoRALk0TvoBOdrMIz^9%-
z_(G-%`PVXd@#(^J$bZfO9nx7C@v*oZ;QO7X&z>pH_x3CyeI|pKog+*Kxt31|J%>V|
zKbR-Z59y9zpZR&q2l5gZi08lTfDZZc3gZ@vmk08WxJaM!ne+T0hlTBzl6*%fg!Bzx
zIF}c++<7|4Vc}Yuulfr2^1roGoPVqXdj3^H{#y*r)(h~{tA+W1{;J{Awc_P0T1V)q
z8^qHc)uZfJ;`}KL{WQg6HwyVXY!>2<%GpNwBDae3Z>97y+r`sIJD@u%ugETOIga>Q
z`sWVvSKcj6?qJGy%K`tmJ<{Z`^#c6uy~6w}865cBg=N1J%5^tC%Wrg3p4a!J{O>7b
z<;nLsuU~^7h3Rnzgt*s1ArA6082UAePd+Tp5BUHVIU?lic~XeqVDP{kVLHfh1((o#
ze!n=+KjoD3bXVobPP>=?4>$SQ@{`Vx^1eJPUT&dt;&fI{@Oi>F@Pagc?pJZXY8S=n
zY<W`gr4r@U{Y_fA_b6ZLWoi6Z9PqvWyD)!=D+J$5Vc=DQe@vm&=LJ6BYb5^&3V{wV
z?K(++K;Z{B2oCA4;C;%Uep8t5ID@;A!=}G~ODGT0Z!+}M+v0q{53uo{gl`>%K)-O8
z&^zCgCI|Ad@Q{Q2ZSG5xyW=6@EBi>uAN*K|v*kL%zo7ZbJ|X!BQpoZb{EMbj$fmQn
z=5NCPGlkL52)>2FZ=VyK&Bx+1Ur6I)^Rc*=^I}P&_-Tf3o=iO7y?lh8m0vtvRJa>N
z--7PR9qxetAafAmtdCG`#iBy|ONw_bCZs#6`u7aq%Hq!RrTaQhXUlm)`7f0e=Iipd
z5NGqTcupzj{2fb^^y+1Ve2W>pWLaT4TMpo-DPN2q;onbT?P|{RZ=&h7s}sJcS_FPh
zA;<?<v9@!0&uIGQI?nk(o>Vx$E|J%*p19n|cg5+B<j;4LALM*fU%Z@#4TSV16tCEj
z&_AKDSb&fZ<Zff=VRCUk;6F~&0~JEPRTQrqD5OI^79L~x!h^)~9cv_{UkDN6tlS=<
zB>g7}A$>#`p&xH7p5MDEp=VME`5Zy-X5w;K{&<G(2E}_ccb@+slisw2bAGm5ckvUi
zNPcv9-s*Xe$v3{GdvcDqc8}kceu}pt^5kuWau-GsJi8r%1v&`R2Qs*;avY`q<v`BF
zj>7UFe_XUU9nueXBIzw-2+ZnCV0^52zNKBo=^zi_JKd!5&2hlDGfrB5C=X!c_r&uJ
z=qXOWL+L5K#M43U%fh)Tp?qCD!QWF8c$`92f{>3b_X7<{57jy6WAm+Z!Cx(r$lFgL
z<gcIPUOA92uW*Np@_tWtuRh)N;{00~dQ=}FU&p>eoPD0o29n-A#W^3FkHx>C`QJ?y
zm$R7Cs~buBItr(x3HeL*6XL&8{Jcp>XUhj%Z6<s<6apP!cZ)PR%PC*}3?ctWil3vf
zOMjAnC`-s!JzI!F`2bH25T;)mMexr@3+cem!a`%j`KCCaw;W6OzooGIM+84iA;|AE
zPAK;-g9D!<IDEV?|FnrheApy{U!5$Zv-0Amh^PBb71Bpg+-sVU&dQtQA|3dz%@oQp
z&JyA|6px%Oq(gp3@EZsGjpm5UIl$1nej?5X<+Ywm(o4*9&IkMeAGyi@-U8?H_tEr?
z3&r_{d@4?d`T+F#jPQ-85a<90ES4q*`11;<EfFuL>*wNhDCgl)lAf}R!1iA_=RfEo
z9pthwemRkQgThg(oR`yhwexh4|0Tm$ca8IW?bbO@2f14v@YPu_E&l?Bulxp*?;wR`
zzmg`$vXSuJpb+ZE!k;%ulLz_QY$p6$DXjdpc>ej6?!ASi@1+prOx-G;FJc>^Kcx`(
zf7?#zO?C+L-QOw1f7>O*AwR(6Z-nUy-x55B!rr@u>5z|w?e+-yhVB*Oz#smdI33bA
z(DYf~i}TgqCr*d_3u*eI{o;H+KN5Ntg}+l+=b$+MUI+B9hX{YzVexzuj)>Eto-CYm
zl<@l>la{aCadE!ul%8@zJe@6fs{_6fKa>0?PD+yla*yQ@{tmx5&)4&`c=~q^=z(X%
z`CDHQr$c@63LF1Q<of>Rp8U}a|DMa@`KSLbPIpw_ge!#q_*DWcUz3)9HN#i_I>|Sh
zLbkl;4(Pxaa8p?BQU(V;fPuG!{6PQN0Ugro{~?|a(iMLS)0a|w>>VK;_*wX;3qH$T
zaXH$1;&fL2UCLMffjIwn488J0!nc6J7LN$NkwR9!>Mus_Q-ZId5cq5V&G1121HY$y
zif2Opcb*IJsSFNcUO1pne<932Q{oL$#bo(FG!LtL32{iA<$&&;kMOt2FU+@<!NUp&
z)4yPFC`T%+|CUgmqkP90zUYF^^L^}1(hC<Na0G?FQV8XY_7Tb{Qdo!s9}By=;0rGz
zO%5x!UQze*&7u5di;;ZODFnH5iW9nzuQa*6Dc@y@{7_C_VR#8)z3P?};tLsEYB{Ce
zCUVA6=v`VUH<z3;F4Ad+a%F{lh5UqgF1eIYq@0lN2L^|Hjo%USt*Ii!fe+wgCOx^T
zbN+KQJ+>O*`?<Pveki9+4QYJ9?+CtN<czHOYUKV+<y@>y<aPHK%00l~j_UWi=!@%+
z`n+9NST87VDnoy}o{%qr!6DxRhMx2;$+w!qYW0P3ARoZR4TR~<8WOx#fRH|z!Jjd>
zUQYOTQV8-pDui-?euSa73?zKxg2eeD-=0Ro^i{zGuNFe!%}`-F<YQr4m^8j$8NTlu
z3-hgSBE;EpDm5kP<0<@`!kNtoy+CsUQz&Hf7ir;K{@rlr>8!jDS`vPr2m&)H)V3Cv
zQ%5OI2e~tu^c8IhfB8t~`4+iI2l)W+xXBOs0CtaZULWB5x8N`BNd3NPFJ8~)9SA)z
zMm!zry_}|x>_YgSQwZs<;GkHN?@tPccP02~3L(F_n|M9$I-o<o!QI94K{~+u4By}$
zB;R8Sfe+y3_oT@+yf2Lp<T`>EUC8P20V(G!g)@7Kms_%zkbYc4@UB`R-BCSW75$RL
z^1A9sz1~lHz4dFJOytj`&`VG7T@<={?u0&s{|JQ+`BQ|?5l8V~*}$_@z<eX&FOeq9
z2lAgY^ol0Jw~WHRW`d8fi0216EIjQd|D{YKKQ2pJIYkE&zDE?Y<+FIvp@hHmFroZ0
z49@2B`cTLZ=?8}sdW#X_>A)8@N|^qT!DGe?(;?rN4(N~$u+{{U|04>0CKB98A@DtC
zaG(QBoka3Ao=V_W3Lzcf;%Ouua7QrWV{yI?GsWp3XA_fNXO?q*$ma-7qxs*OP2}{Y
z5cnTbeB2yiIS&}zYpyUI@&lYi)Bke7clNmR{H7D)={`S;(}y^q_c|%gf1IIzpCisU
z_!Obvrm*7~aXxtNZ(O7UU&FJ`<s4?xe>vxzALN?PJLh}Bq#wBEoFC*~z3!Z^{2h{h
z`mS?6kS7(!+#~W@J&-21&O>Q@Qp=ahcb=BJ`qAqtzuRBpa-TY&w|yqg56|<!MSAjc
zlK(df8*up{D-V}4xF8WBDjDJbnL<ck??vbn@(JZZx+_>BzcAl)250j(D<I_G%izEt
z^p=nh=q!BTg6}<VBIj2M+5A%qIWMP!kMs0nH2rpAAz#lT1aDJJNN3BBC@!9UfuW!B
zC43!95V({=RvzGWN)o>16aszL+rsjSlp?s1!dhj7>5#8WSweq8VV`p1eCH`W;T`dG
zkS7(EEKlT&rBG@<;A>JrSdSVN3Es1kkPiGTJjU=vR~FB=q^dX_<dv=_Odm<{0yPLd
zokHLTxZeRC(jCEeHHGEvWN=6MSbDQsM2@01fm11D`Cb+u>@Tb@$h%fYNbg#g;N9y9
z>3;7DamWwwFio$}fbivO=$t<+fTXXc5ag^16z0na65_ze!WRsmsgd)1KhX5ZV8XYH
zLRPLTym^RtIV&8{L0*|Kl26k_JU{ROY~57Iw~ykxn+fT_-%Tk_hjf77O5|(ZhRFMp
z!VYbz{77l#Or(5|7=EvI!u*9g5M0-h!1WYDeZ8XzeHVp5uhWUpD|IFi=m1N15z@y|
z+&5N8@6wIn*(xC&<hX)&B<A}eUMN3OEyP`w(<FiLZ_o<!wbBuMHH9E2EK$gJg~5R@
zHA%<^bgA%H2l=}tyC-*_oBVA3LiED&PB1vj-@Omv59}+<cZ}j+8ie%WDMFl;_cxQC
zoGQ+Ln$k}jN&3Y!alZI|gr1Tio_?0nyY?sPrznJa4agMF2kBRt^j=wn|1pKY=LilQ
z;9P!_fh2u8g-<DTB#)(^8%*-IA41@F6taAPzdKY|pQ9B2;6ovO4TD!2E=&h`{v(9+
zaTI^f(1HJD;pZbsd48jW<$~NZqX|7|41t>{gmg!+)>xsuc?=Hu3V%fS3XK!;Lwa7}
z`0?(^+b~g_zx^a}`W6TDW|Im3pA=r3BFukinh=NQYc`$GhkYzekC-LIH#2yf1tk3-
zg&>cGLlz3<u<0!R*=N%Dn=O*Yx7-0=#A0FooG*m<#pObrt*2%MNsnDgV8>PB{97H+
zS$QlTu$st|uMwBa@&mq^;h%U=Jpb%NgkJeDfya&s`Klim;vnB$IPzZJ<P^9sE#K@1
zgwN-pG=6vM5B%AT{IJKQy!KDT%iYG%%l{?ho6g{^o(j`<F*wxY;&UM%&{w_?r$agm
zD{}<|q*V+qNPG=QWtp&iM@7iJgnUOByk|aPI><TYfDY;M{Nni_orSw8fB6E!d~+DQ
z&RfECkh7$qI33biSh|pV{A_*}*Z2^5w|xm5T!O$+r3ma@n!ws+2xRlWEUqi-T<%&2
z>9zexzSwf&`L{Ztv-K_h4#_`~LP#G|p3nzY5SI^p^(r|}U&y52q<Ejo&hvqM7G89b
zZ+jIY_s?qL@=sM4()ZOQ_;0m@bSO8WHld&Q7p8ZtBgE_06XKA6vI9D#15~~%p8t^p
zI^+ZRMSb!7kp8l;Q9~ksHHD7k#RdrL@e{?@%Z2p66+#^3MKvPy3Lyl}qY%=|hYIse
zXK>&H_*EF;4{I#U2k9>h$GoK6qD}HvuPGAqebbD{Z`)kFoNWwU(L%^Kn&Jl;`q$w?
zz6Y%cJ}E*-e@iLEhcft*HYB}VTOpsT_cD?4SBezo+rZ$goEkAgem0%O$5H;fZsud<
z0N%GVDL<`?d-Z_)QsFr&zk95BIbU}p^pf4h)1{UJd}A0nW#h!<o@D3=DsjF-@q|8t
zLMVrYmzne-YH@jxPo{C64t%4u;(YfV&>>%<j^w+WD4rkq`X)I~&rYW4dgpu~&#MpN
z^D_wfM>06@7fliJ4PtQMJ4NZiM#8^@LP%%f!8D=Vh<-wx<^PSQt4xIN7qfHzI15QX
zMj^-x=uhbLDV&)}@CDff{y2a@;CBU^4|I>;l{`q_<3R40gGhPp2aA_`k<vdJB23Re
zRER@4CI@s#|J6l0@VSEbhKZLC`R;xwo*p`!(3epN{0Bx5ddw(czO4)n{C=Z_d>>N$
zK807u2-6`Sz__s_J%>V|v+%@tp`5=a2=P@Dg*cmEDjqjUC?|Tl5C=Jx=M(x^3S$=#
xd>@61h2r^^IiRomOq?Ie^I0UGKGXpn@*QQ;i!Bk#8UMKuhkWkB!b_#e`9IOK8<+q9

literal 0
HcmV?d00001

diff --git a/pgo_profile/default_9725750769337483397_0.profraw b/pgo_profile/default_9725750769337483397_0.profraw
new file mode 100644
index 0000000000000000000000000000000000000000..c9c2485bad301c1fbf6e9362dddb4a9c31a1bfdc
GIT binary patch
literal 334480
zcmbT<30zEH|2Xhz-!&1H7K5~)8i`V*RFrih8B3W6Nl}C(OiD_nX+dQv6(wYlHd|3-
zuOwN@kQNoDB#HRfoH^5f&hyoI-JjR<>W<NSKIeSSa?d^Y&i4u0x_--6AFsc%B;Fqp
za3GO%B;hM?taTCoJNh@X`QRN@rQW~&f5^LBct?`tN%U8Fe;4Dw+w&r-X{!5?H~T#z
zqmy2B(xLxP)c2+h@(%}mvkD7#wn{~K_D)G$_$8h@6vRh<P4L$#f>+?h@z(T<XRfX+
z3>|)T21BYKgRVTdS3o>R^RRzOrhc*4VY?95yzw<mjF&*Xufv6hGfkeS9?)o6ovUoV
z*n^-qT31b{d_A4u{p?$Bm8owE4dca;_%phz%lsdUmUq{zz1`BVGl`1vWW--+PyVns
zyTkt4_l?r^4!YBPFdpevB+nIb&qp3~n7K{j{K9FM+Ac8&`b}BsY5sEBek;Fhkcr)O
z=M2&MvrW^bUU+)Wd_D7E_5DYSym9qM+y62-{oz%MQ3)<&rHWTS?l<E458D1ilXD+d
zJ%1oof2O2+Q=5gf6{h~uNd6}suN-lzEocZ`d)J$^zJJ4cwEe#rYDjJ?p8K#pxM%WF
z_l#Z&!T1th>OW_`@RNeY!g;|2!v}G1Lyg>xPe#Xd>hs=d9ya*+6NQ2JNAqF#rJwvB
z_7wVjf<AzLs`};a=Bdz!5%hZxEuSqmntK6yIzfMJzQy^n`;MhsH@VvxU1mAyVZ0#G
z{Q56jByHNDnwhK0|2qZa(fnsUN>wtrC0P%BGiLro{f1iC+~*I|w4rAc^ak=TTf~O-
zZe4h6mQ2gqSEKwf9_{}kK5VAu^=kjB3m+QS@3Hud^D;>Pd3Hdx<hTA~QO6QH^+{gh
zBqk<4I)17j(89fx8a7wV1|Q78c(ngU22`b!e|#`_w3RHYtp6~bit*_DS#Z51$+vAn
z7v01md8os2Q3}Sx^Daz7rQ6R#qeJI}FKt{i^kEC7tDArRhX0Np`RfG1+rQh@Rp+MO
z?JP}9+2mYz{h%}^KI*5GnV-9^@y(fWO@4&vE$0YTjF%Hc1}}cBoThA9v!M)nT>en6
z?7ef*(zAO$ShY;I4;9^f*d7yqI1+y<XYJdpN0U#$_Q&;qwEd6nu66Gm9_>cYQBu<J
zmc{lzwEbpnpW&5gX)C9(T${tZ{CN}|Q+{;*klq)v$l#{PK{$SC7>|zsA643vbq+VS
zei=VJaO1r2AYA*Q<5yR<tH`6|Zk|kRSo+Jn_M<qDmcLi=OtZ;UT|?-}nDV3k(#6__
zQ%X^R^b+sG{Y{JOzv%eiJ?&S_)U#jfmlpc<EG^JxH)F;Rdj4PGrhUoR`+0ju`J}2<
zTUM5rV?5e_gVPQ>xgI*H3Hu)|KHC2#M5d^@?(%bSRCY+YqNFa8kBN`gU(SMgTx9P`
z&4Q-62NZ2Y^%F22oxg@X%5Yuspz>#h4j5Qr7>|}edgs-gQHhRbMYal7yK@vI=@^fW
zpKY>JXn!qCpS;;OqWa0fs9Gw<qxly-AYpP;PxO$ZxNK}k-{7#vcr^aRprc=B>_53F
zCLPqDg7Ikmm)9(RWhlM*x?_$~Z2!M;$%C(-(D;oqW}ea=r;k8iM$rHK#I^sMm7@jA
zpMvpd`8QZ<l|L*@ajvQM;VrFwFdi-c9W!aN)#CM4c2nYAT79yz?J*wCb0FI!(yYJa
zF5iRla;eG^deZW}qj2>f2O<AxokedAsVkmuG~?c7yC<7IvN7$)@8*I}v3I@{J3qtl
ziKF)X%8b5uQ!w)vTK|}>Z-2X%&sBmS=#TN}{C%Z-wAHp8Hzh}9?~wGq$=M3y(ebYp
z;<wTG?UXe!b8OZ7Kbz?KW5fdw&Bpc*FZ<(nPCG=xtv}HDqpL0cu=>H7XZp^cyc7_f
z|K!w1^}gKUu*1e{ev|eF2@-Dp8x0f9KPF!~a_hJs!wvR-CMJJq|6lbY+LrRve%8*Z
zr#tWI{$7VW|DyG;xZ>S9?9mwM`=UCVmY?3R57&O^^=p2?-cNha?lV4janhy2g8kYa
znDUQB>faLgrb$BW@YERo`&O9i548SC8;{TEoYLc^Vd}T-n%&!#WQ<oq;y-Tu*rqn8
zGOVQSmBI2j!*1O58#;c|9*4vX&$w^^mLIo&ftLTs?vTlMa^mG8YA+UUPqDv(yZ+Wj
z%71>t@UK>Dm_fhuhX2&K=2t`+KKT4iLHud=bF{B3o*Xf|m@QSEG2DfN@#y|dQP1Db
zGQ|sIIDRN229J-{-`V@y<cKuu9etj+1mR-hqx0A5e7~O4RQ(;#bV92|hw6!yVLZBi
zdinkR^^o`o!R{m*<I(vqu(0{V@Go`#Mrs@Fs%q8O`(r#BU*($0?Fr9A6X?p`wk8gT
zNDPce=g)Q17Y^%`@H2<rilDzHKW>lLuWv3fmz00+IDaPz*MHFU@5T>usZROE^XNHK
zR$lF!LRAUIw==wyGu_$w?upM0<dG)zrrntRBQ$@ErNhpMH081<><k>A`*MQ@2jkK6
z_sE>0MOsQ4x0`mV*19H`y5RDU)_<7Pp+ELHe?#H;r(^1m_Ww-ZR+kBX+bPiN5%iVS
z53K7(M@bfKG6*{v5lzSC550btr@eZ5{%SXqu51^VE-gxu#>7Ya-<!f%W=#Bwk3(!#
zQcst^QfkKJA8kLEVhweth<7L8_$epoedJuV#$6Np^)&GMtwkhx_k4^;uOIW4xG$<=
zOZWU=eV9SB5ryTq>i_BuN~YQUeyMz?I-hQ=(B*puSAO*Rp?AU67=OA!{^MB=&QCLS
zM&j~^p1+r@PIRr>VIU66kLy2Z{#Grm^;yOaJaM-`@j|2F)+(Gw%Rk}4*!-rO%T0c7
zQQ9lTY_cX}`rlCG{N-`$ZstwDv!mLhwjSQnRws%Zzv%keCE4h7=IbfF-5LAZuX6S%
z&@ksObp4|LtGY|%+1c-Ty>=>NGdR+EDubW@h9Ko%x@twj$1$c-(9;R}#uD;`jqP#L
zNBmvL25P5ohG9H9e<_~`RIgL?GIpDjJWi7odxDAaX!}nz4Y^`IXHrOB&cP|a!W6}D
z9*s{?|GoI)+ZzRN{os#@kItXV*v%5R#dWE4<pr^0`f_WJ@#y+NODXNxF;9i82?5;8
zY6&`>6pWWg+Ap<vN!?h3#=y-!lF?u7uAH{Q_>qVo@wBe@I(xC8{mL;O&0pHH>3Vz4
zP*;TSBAe)B$s8!dcy#{G`Y2_i^F8no^qB;G8N==L?s0CTQ?<xBk8LV?aQzQG|D>5!
zdz>+PqwT2d7CXj1Su}xQ{MI3_D`x2%NWk+a(f)H*X03tI%8drjUFn4nl;$?!`VZRw
zZRU*(;3|CG0^{R6+J7al-d2wFp<jUURWbEP<3G7QB4f4o4>?i$pV3M`7Aq3<!>(wA
zX67Cq`G56mCy(kp=C~&K|LTwF&W`>uZ|tuBt3Tf(a&$-d2DQHRZwT32oP?`C+W$4j
zDeOtOrp=tOIq6pGw8@-q%>0k`U%GO5+}fao)3E%~1lw;dWy#glo$)tee4Iz)OV@_y
z7}FpBl{sqPGM71iE3W?N{N<r%yL9X1?OM}jDtV0}T{vilDL;Ds*F81WHq4T`mEN%{
z`LjPO#vkLAkok|bHt(g~voCG%?IMgvufN8J-Wp5MEMXp2*_R<^Qv5dz<I(*W_Nh6^
z4oWdEVf|^UgP*_A`afFqiQ|)$wfIfR!@W~KaSpRE9=(5<GpgJ1X=%Rw-RT=&-+g@4
zECJ(3z(nzn`eKjiL3W-;Tt}VX_`F?QM_O(0@}qu&ee>d%>wY-G{X>6@N6(*Q6%~q4
z>-*cnV$m=jZ9mUv)DbUi?ktA$rz*yy^XHd>T}!2+iZar4x!+%mQK@Xk<PY8dQfeE2
zbw-c-PFVgLj7Q6V{`$HA*A3EoMeTQPG(NS_Nx^t@{QcT*SmkV_VFc@6gz;$ojjsIO
zP?{EC2IJ%U9~$2;SL=i4R~_%bjvSkbt9oX!G4av)b4c*FD61R#$6x6Ga!N1|iN?i8
z*Ds<gRQzs!|Hy#(55vSq^FPB@ujcBDnQks~e`r{Ea~IGsUKs}BAKR9nz1ZWtc{_X?
zSAR5qvYyY%i7fVJ_oTg^F{V$?_+#QL!a)3ET>W1^*NI0J;qy1R_-OuT`^H4A<anCE
z__+L|@z1w@jn}C*oqmH}@V$QbxzaLB`6nXfFa4GN>XVMP_`%9Ks$YYnUpHgMuLk0~
zW;@qVp2=n0Qc>(8KhY})8#(y=h1S1HN#1ep<}M4Ru*=g!lNQ^1V7xXGpQBTJV~2V}
zIrR4GgU3g`)`$nE6rZ|AY;*d%|GwF0M?H<fJ$n9F(m3qbzS##dq4yx@-+r9)^@jYx
zr8>IPzTf_x{3R3P(fQAQPiO(HvbZy*M4vYWC15-{|L-TKwP~8Rhr_h`U_3g0h7`Q9
zKjyPa4SF+ze*I39#uFlAPWIn_Jlp>v7>|};Y^;u1T1{5H$Y#s>;RmW4YcTCU9u|~;
zyjoXLIOfr~1M=#N+Jb`F-<vV<XCi)Ekoi-Op2RwxdmZ;i1`q2>(Hgw}p!+9bQ~y|%
zc3e35W~<*u1?IO&`52Gxzx|%oJI|<kI~$&VaPiUekL<?vQ@+oCXAPep@WI4Ky{O}_
zHwqu?8en`Yf?hKA+oVm|I~l)gEySkJfA2`fc<_|qKqDl{FJ6{jw*HZ0iNnL$eQ&Fd
z8a)4K|M?v*ne|u7J{5i<7ZV@t|M7W?MZXrx{^{F)O-PqMMZ&coI{)RABrlzDSxR|c
z-D3R>%g1^oVB+h+g7S~wFH6lfTglFb^Kt^F{%HAE*OBhE+gELYAIl)<8w27$UAV8z
zfnJZGS2d2<+3sxcLeBSUL)Oe6yK(tP&;P+@`uB5x4q1LQasI+@ZtwMJnE2@Wg-rfv
z=_L2DbZ)@JU+mW0YI}@#g%#x=ox|@>?1&k^3XY%d(S!Ftbo@A5x2Dv8oBUaB|Al6|
zrSlGzVLUp2sl3z|mpGei0DaAv!Q-R;@9t5W*XWWvWs2N#4o@2w**tb|kM3V&*)-*d
zkse+!6B%~7xyWf8&ZFnA2aeZjb(?+_O}ltLDAzVtvxZ>&L&wK|?5UD;(n%j-^E@KJ
z0_P2o_WPo#y1I7w*eSF94svRT4E;nJH+cQg`%lVi9oNpC5PPKdm;dX+Nd~e^j7RJL
z=Ym0Ogz3J<!#hvJ?utxl@WFUA|6lL5F6Gc-s=goIBAY%}S_J3O^H1&3jP#aQZIQFQ
z{fsso9^D;=i9Z#|U)Phpj`?G@hp1imiRS$A+S{!&c>d7x@9tW?p?<7}Sz@$$Psg}C
z3Q>RmjPkD&SJTd~9CAvR+&DKJ=h5q@2h{H8yXqPDB;J)PEGp5eQq>*2{OJCFsqL+K
zd9EdDF#q-#kLF)v@g)0WyRzw7Eh1&_@0sc`Fdpqcas@4iYi?N&i>Ts^(xrdvreQp~
z|FlrzqHMgOxZe`B%6)DgHGgpN(fc<?-o-0@eyr`h)-g+>)Xb=jjfs!Wzgn90>t-}%
zJDtmqOmIj!V4R8Z=>E%%A#dE1hgmjTJ*;fM(O7MUi;w1i_nUCWmG~Chq?1M03tRn{
zmSN(f`ERd!e7jD3d>b4V`52F$fBlMTCO7>Z<8q5*QB_xV!<LEhN-z-r7`QQsd3*Yf
zPWU#i{AhgH73&s6{E>3zelYY}=cL17VdA6rKT4cRH4du1eGWZEZ}9Ph`uCY9BVxR_
zHpxjIZZJ6<f0&K&=>FIJ?UR?wl&jr<o}xc^eAF-8GH%<>v*&By{yDm6y3wLPEP`J5
zV&JTes~%cHPa01wzW(v_b2+~ilwkRN2>Ps=e3O@N)IFi+5cKZp%A2;d<r!bjJnnUM
zS;ZOJgu%-{40bgBktV}l=d<T#CiIyE{m)z-#jUP1#h~!XM`vHw=p{`YJU%-AEMK#v
zbbaB_aWMZhj7Qu5VwLwalbDWMSBqL!-3XqlQH1g6`NM1atdhkMFWTYykAv~(`p@e}
z;@kR5swG`xU%syOWLdK@9=-lMu&_Qx@$al3@cEqtj7P6OTJ&SemQ>Ck1E2r!$9OdU
z=gmVieP*zi!sibd7>}O+*ZMxJ5tBGo2=9O6JbL~JZnIG~YpTl7k$HW1hjD5Y9TOj|
zf6>F#Whv6p=b$$u=$Eg(C3ZnpObL2bf_{T8ty@($;|TQKnDK*_e_QVD?N2Q>jDWs|
zpdYKY?%2rQ?PH<OC+OF?9=@EHSw-Kc!d3Se6`quU@#yzw_O!&09-BTXU$Cym<PSZ6
z6*_-B_CtDq$fi|l5h8UqiDj7hX#ZXNd@KF*qK|*zw8qAGH2y@g?wd2w0f(UXC+Nk4
z)sptxS?z@PZ>%sL-M?6I(O&+;7LU6yzADC}<yUyo*5&p((H(l+`2+P6pGy7mn!0ur
z^qH9R59*!GO;V~?Jo*hi?)-;(yPMur+q%ys(3=sAe{QsHr3c4l>xw^btsB2KX5-G^
z=<`=>>$LXP&p)>~YU}f+c0EjdwEfJx)L3$QXCmSL87@A0{xF@Y_mnlt*#g$T9J78w
z^Y`P|j)F5IdmG^ROCabiC!VOCd*JlLihQ*QhZ{qVFfe``EGYl@`pH(&jkzOkuDJ2=
zoLbf;eS1v)(DkEUMr^kKLgl-|Ra-kA?DDCp!FY82awx67==n?69lM`!?z87N|Dj^W
z4|@Gnd+=>tt2J3U^4#~i>7IWpaN`#}|8=bX+OXC)xBJBeX-e39_7j}fM)Ef%VT(nN
z#?g%#0ln=sM)+L{X8xRnc-x48rt6F21gBLGgTdEdX#WY=^6t^rV{-#x|D|F)+JDU-
z8cSrpP7l6bbb1N>hvP94#-sVa-g`ava>b)DpMT!44xL{Ajg0Z=^_!`7{n0?LXBTqU
zPOmvAUi23iAKgFt^J2jy_l2=57Cry#P`Uc*6g|Vi^M~%AJnfnHdFh7ZhA@8#MuU4a
ze_AVpyw+$2WM=(UJ$7w-RICTa3mTf=4>Bq}HeLGDdGcV)?N!gVj<8^0JlcN^*PZ&r
zh~7be*Q~EPdz98^oF9+$KZAP)k(v?1lYP#7?U|d`V&+2~y#8qaf3h?!$!utc8vOnU
zZPMT#{r*Vz*~s)_clqV;`OPwnNB4ieR8<?EzkdA;HPXe6Bq5*Kjq&LCD;xVTrTgfq
ziLm{xCJ$bIwEZtEvVT#mp|}dBm5lM|_|4E=9(w7~qr|e{Q)e@*78=$V4<26$2I3#P
zIO`VZ?moh9n3-bI`u0E%1rs0Lzga*@Y@K(nE~DOZP4mwCYjgE59=(69z3FrFoY(-$
zM#oz1*thRW>`ewQ{{*D`y4TL0{I1^73-_NHQwH~F{|}j8n0e>H0_8umEG_pYp47zo
z|5<;2qf9&UsrGi{Q0--xEp|_^$HYg^UrxU_slR&is|i*s1>@27k6JHQPNUA92fYVD
z@0pc<=z_hG7xYwuUT^Mor(fT!6QS?Mv>#f2rO69_jAVHz!23T%7>~|>Ux!jf!ky{_
zx0UiS9*y6o`E<yrSwr<WaZAYBBAbRWF&^!|-|p%z)Kfk=_ECJh=$Y<C4Y>BB!bI_p
zFMV5%w<WQImL9sL=~{n$7ia3={nrlhkA3AkwxtXkD*j=~?$BWJ)H1WdJv#mwe{X*k
zt!-62kx{Qwpt3H7JZ*4~_J7}+AA#8?)aPiC-&MFuy#CsaiH|;iG1F$5nE3_WrN(l~
zdG#SW!_6@9(e=Z{_m-1Z+#c<#Ior7E`HNFU_82dC(1D-Fa$9Om!^s&}C5JRs_}$h2
zSdQ^%|6AK_^mMPh)l=xp2zqCqi=UYK@>I(8$^sXaSg9h6NAu72wP>caWdB(dF3DNA
zw_G9<<I(ab*_)b4S48cC-6{p+(ebn6(Fm_eS=%GWb*^?FJ#Dw92galEtsZ?X8>3Vr
zn12`;kH*iHx<K<dGUo)GKlCsjjemc8?Zvdk3vyunDHxB&zsG%c_uy$#8XUjPnEsEB
z-|s6{)4xnP)*6^5>sRG9KfBy~@bQPPe_yTCxMx=N^gFzNRD|*9_{l2U`=-EgLG~!q
z*_<(wx#hU{==d$UGIQ>u^QVq`=lqs3%-r*dY(cF25oe}7otM7&Ue}p8kNC;2=8!O6
z9yS#JXszvWZ9?$1HE{okg7N71d3^2KXM>OH{Ncw+V?5gaQ_booTE20A2|X@<sHX;-
z8cL?+Z-PDn(|)KAHoeM~%+}ioJ%gZMSeCuYYN7cu==BKthU8@HomSTyq304DKet{v
zNR8F$`IY?Z)iJNe&T;t|kM7@`_p-k1e)vih+`r*qJi31q?z&|}=AG;NVfk_K(fqS+
z*+d=4vOl7lw_PPa<&Y~A6Ca&_#AZF88#&<#RlB3C?&miVd4G)8f(7LtEmy1i$DBB3
z4)-5$?T21}?fKl&CUIUi1D^kJ{U04aBz3coF*n*q=I+gN?Y8}B%f<8`bpATtV4Ft^
zTluH|`N#f8AUPN>j@19MYkVGad`pt_y>Zna;#WB0=0EtH75o^NWsi<>))tL{^=Dwl
zKU)8`vqA1ES<`PpZ%@!~SWr^pEEz?I`(IRyN3S0`?%l~0D_Cs~eHcN{efQQ*_VCNt
zs1X+9&n%lp=U_a#e|N?+-7V&MQ#{;%^O-*Q{Ewc0<lY{kHYPk#zd!!ccJaKL<xGr6
z&p(OLPiMV;^Y;kczbnFc^!jgG+p8<87o#`S>*wWcu^7J(=h5d!Csa&0A+l{(u?b^`
zLalCxvA^Zu^*4qckALjmzeUgZla>j5yKLs*9-V&-Tz~9SYn<K=_a9gokM2J->lQyu
zt(}_!_wN`OkG9{LuE+^aK?T#`{+$oTqvL;{(Spl$i6ipi{v9qpx_|dQX~)Gb*WV{g
z!U}!<RE}y2vl={q==z^dlH0fTc1cdNp@Y$_a4`?E_2AwTHWdH3jdqCRxw~XJ+`lWD
zHMmFT|HPA<7q6bSG#2jP<zqbBf0w`1GyBqe=O-){&ZGV3u*TcbW{yF&aQ}>niI47|
z`SyAnO20Vfp_Iz~tEgb}j*an?VL|yv`j*tvB>KlQaQ{l$cJTb6*RQ*cn&rH$^G3n_
zD;mb5`&UP|&2Ur6>$I-O4mp))IYx_)@kU7b_iz5Go*^>Y7kZZ6;N?esTneM@%|v-_
zz@|q>PrVX9S2lZakLLgGs(`lFxn#<>vAUlZbW%y(7;lJ_|JwvrwT*G5f$;pLXFqs+
z^!%r35V+&0zkDwAWP;vBWO!(CPtvI+sm~9^C6}6Z&lx;E`ux|CaK>Tr8EM{mGGv=c
zpB8H3;-mMk>-N9V&Nw8pAZR6h^zb>~Kl@|Kk3PTBQ21qJot9=Y+&?VCcr<^;YS9~0
z-|dfr-ydKT^ybH=<dCgdli>Al0>-2Bk2N##bRPLnFYFd9j7R4W5AMFjso7D<q|1+0
zUHyYT(lH+Gf6KzCkBwL4s3tMIGbKGFeup^>-u~$R?}+Bpiw+In6JH^fP&Zb$OCe?M
z;NAgNlz&v$k6V1f$aBYt#vvLLq?K=G&L7;P^RG$WrM;f*>lVWPkMn5zSI)UwXj@o#
z@3@-S?X0D1AF?p<(f(I3%BfN;W#;&pblb|aeRbksJbL}Jr%2lHr%L|lm>hjxM)ENp
zT|YzzGc;y34A+A`jG%8G|H9zx#>kb>(+T=ed*7L(HPc(5*CXid118i(T=YnX-J*Nm
z;O&q0|J*NO2PGP^1^Fw&cr<@|Bd@-oD}BEX%g-X{pC(xZm0EPmLeC)RDb;EIkrE>&
zLQf^=<&<XYKao%ug`Pyv*Ihjw{Gub6?$CDqaQH^?`Q@1Li>^QCPF;UsYVrOU_}}m2
zU_6@tV@D>aU*zt6Q=zS|q_a_$#Kw4Z{2a+42Q7D7QsvnH9}nyM6GqS*txn5Y7Sdk-
zI6!61lKjU`42(zjzhsv`&X>J-j3Gaj#o~N&6K7&Px_|Ovi~gnY``7s`xV2oTe2L5S
zOpHh8KTDVQ$L_w7w%_vo>!MW2jR%PO<7bb28oOf1*uL)%#-!WJl5ifq{%@t1WS%&9
zEw5s>ZA|+7SW#U5QNQ@IYK=_g1J}O&Bi?_1)dN$1wEgu<l_!t7J$g-_kL#aAtO)uM
zo#JD6ypS(|^N%XVqw~-E@)zm{lC8|!hgi^>z3KNknDZxk{W5+@&e0^D2a<68kDGtc
z^{1_~!qAE_E((41=M62~{D<bRG~`2bL}wTa);|F=f1vgMl~kMeGpEV^O`=;)YM8Da
zZvJzGf%wPi?`A*T>?juk-_Be>Z2s4dnDCp_nI~A5_z?8F$)BT{nu+Z&z8OJp74^zW
zEiGZ=SvQvMy!RC*B#fuPK>XvgB>@s-A6f-`y9nda{8wr8PN7aU$c<Es+bfl>K@Y=t
zbpLA1kVLb~FB!{Wd=AE=@pCs{nI5~WVCv80fCs@dop#{b4}E@I)oR#*>U>he>Y;M8
z=&xnAt1cY8{n7bvrN_I^BB$r~D6H=N$+CIM!g+N4=YPg%O7e1J^^p6lSw`=^mXk2?
zbzq|SN151~;!7c2+VJ~JT#QGrp9&_He4is5egt~yMT6HL^_Lr*W-2AzP*-X0lHL03
z;wcKoqt_o)m-$_t#iyJ5=5OAAe^?dc(fPyOJ!q}3-v{Z>&SfJ4FO+V?)gRqI^l#dj
z`uc*B9K3%-#l%P3&-D1$$?Sm55wKZs<wyJPn@eVonbJm2q32-Q5B2jsCbBatwp2r(
zNzm7g@?DvtXd!t1*N31NEimq>D&MjL#y2DAHT^`6jc#HOZ0iv8@1}~rGSj|%`@}1q
zm;`qH&oa#XF%Srp_{|NKh!I!lrtthl#>7Ya-=5}(sb^caPKWhx#>7Y4Z%u30k&Dfl
zo^bz<jq&LGGj#lfm~qkE7x4ZO&ZGB_6hqtn$9hK|f%i`snEIplPwZ;~O|7y+TVef4
znDK+wpAtRnrI-F_8r**^!^B6|FVT+jk3;J<8{z)HKW*^&3(eoS;h&zb+nLo)_3l<}
z3q0`!=O+m&3SLZdr4&)jhTdID)0bZzC;p|#aq#%+h<|>1o3H87{k`!14Sn(89zB1?
zPFH^uyh`-4q|2TwBQ_nWVq-k|{OUHf@hy+0-V;23O>rU?|3Si(?5^U+OX2+^e~d@(
zAN^2b9#WFa9t!UtNiQ8dK6?FU;(G7OqoP$>@cxl1#-sE9uyfaPNB%i*3f{k<V?28Q
zV&aC%#2uqLlHvUmdyGfRf8KaR$6M1OO|V<w;-lloFsJ5M#CNyx@cu6a6JHw!;vb#U
z=AJ9-aF$uK^WgAxt8dAXoCnW8I{t_Hty?HlY*QS=|GX58N3XvVluARjf-b#=_kVpb
z9=(1GTTt<wBE{;0_upw4kFGzw)01?kIII{BuYc?@9=-kv`|$B`=+&2c^bm*S{<`^N
zJX-%LUb+<t>c+aqMu)#Wn$|HD7vBtNzc1anTferszfWdnS*$(t!oO_U;Oz&$CjvjF
z{h&tb9uu!vc>ltlKDbBkU);TE#o6Mt(-7YOXD%PyqvL11c)1cizruWo>4S>!podR<
zFkTTBoPQ*r$Y{Twwca5>^6mP_<FAY}F@8Mak3R5iy*K6PKDd9Izhdz6qwBxBlAPI(
zKYG#f7d^cAMkdiI1>@2CPs`K_YDek5UM=|kJVBo)KW>rPi$BZY|9>4D<I(>2!kqiT
zQ@QxEXbg9I=r2=6Ch7xdyo~vf`*$};q=E4RW}*dUx5_V+F4zpcKjOLjfcO80-$j=o
zAE%{u=<R(JxG^MF%m?x12Y_et{lNJP#BU@$lCx_e$Bdt&O6o5^XQgoau?v9b6~6BW
z+I|L#JDUqG{V*7^f83azM|O#oA-<>x_%MF_f%6xL|0M8%iu~rxuVt~}Nrpx#3iMUN
z@qJzh$4B??7dKXYw7oOzaJ33`LF|rl$xOsEYk_C+<Bx+CA%T_5X43SxIU|#OKg`*k
zUh8cy&2kZr&-e{|Ip3279?YZ$St^xIVxGoJW!?>!aQ`e-j(D<^BTsPoevH6_Gg+sK
z#^lL+8NJ@Ysy*)S9K};yh2yhE0dJ)Q`p>}p1A3BNfOvL-f|geI1ofGdvZX~RtA#y#
z67c?f5Axrid*GvTN9_J2={q@nmhR>plS`6p#B*(dhs8$kKXu%4bvEym3XhM>UoYyF
zCc<F|$G7qq_UQZ*RX<*V8j*S+tF<M~LsnTq)eZ6cg*|%yN*g{|<Hy>R2Y)1e&%F4>
zk?%(0vx9{_x_*r;vg3A-*!E`h;d>^D=XGUJPYne=pP#>h{s;Q6czfN=m|1!o8b2-D
z8xU<RYLAqkaTxd_z8^UM1MiTn8SfQ)yd3&w#8VQ0FZ+jId9&(!YM7dLJ7cTwEr-n#
zVQYl*mvVaW`j@@eKmCMR+>aLdo?ohf`l57UkB<Mji!OiE=^Qp>hxsJ+j`PFie31C8
zOyJA;<sWE2Q2$wWou5;ulr%z5Lp(DJ_?mxsYrA))hu_pqgPw}|3&3;!;X5~<|FTr}
zohkHW#1~})-~10ByNF#;T_<`MdM?s_q|3l_|KWojrT5bVY=<QVq$jaf_KKAw-s&pw
z-F!cge~>?NUP1oSo}!qz##3jHo2SX-Bi`p4@T8$&{?O$O<o>I0a3wA|CnvGPz-_rl
zpwfl+e?mmrNc~w)fv564xc&mM`#<VX<|#}0htw;3ca1miH8Pd9Un|`I%Io>@d2##x
z`*i#xJRHmkAD{SqM)$ZsO-&Z@<K)W_@52S&j30mC`WuwN++q7jH!aoy>4?r^W0S8W
ze|O>doS(w+2RtZ2!sIg|tLA_Fkh>t$=8&3~sNOnZ&k$b>i^@Bq_m5s>QO(b8nDI-p
zVr7Wx`QwWAh^MFsdvyQ9!++<xhO2ec`^R5+7EOYJ_;SRf>yOWmHN1kCYm5{0KcxOC
zsvy1<KY!@>Q;>H|m-l=w@a2f7jRfBQA3oywkISW_#dTnOHsZ+|z|;QW?XO;*``eQ_
zA9@zzNm{_u|KSbiO{^$R$s|MXgZQFRz%%~gKLnQk3iXJSJQC8Xe7kS{q#>R;8hF?V
z(DO&I^Ym#K=Dt4Nw|+bFz~{UI>V5Qq_u$6|XWjl@0Q&ES>MJ^mZ?m$Xw@2a^nE)U5
z5C1q+wJLOXddNB1=Q2y<Iu)!CPnijPCf|ec-@l3hE9qr7ccxjssGfiPyo*?3Y_qr-
z(*L-0;C+UH`2#%VFyMC=J=i(*<oj6Po7J!PSe%lyS}#0)IJ<y1QwAQadip&W39Sol
ztabj%1s6UUvg~SHfD8@s+#uk~`5x@w55y1K;Qo<Q<VY3Ne}iy*QZn!f!~g&JZ@@=5
z-8UX<7vE@8lCwF5a(RfEhp=bl1J4)%{6t<y==WeJKSIm7ys*B(eCeO9n?Kymm8WkM
z_T_K+^;bbXm`RMESZvFWwA-WWv&3KyWu~mZr?6-B0I#YFJa~SyKR(E0Wn$3{sf>=o
zz@%yOvPVA=P1z*uIa*72C2szQe|=-<O8+4(kCv|y&myfkEM4X$>`Au3=c|GE1MLsu
z$C>25-g)Q#OIZGLZ(+~b0DRcU|1N*eBLkX6yvohK{O>I|w@kcyv#=*e0#8@}|MRCL
z$bZ2vnw-NP(_wx2-}`GWO;XiI*i$Y8Z>E8IkpH2%6B?Y}>`tJY-bjw>m?dH6i}+{2
zQ#65}!pmm=EG*7@Wo~ubBtrYTYmo6-!%v>FvMF1IJ%bB8jqk7WRR51@yjO>u85f^R
zKfSc1CAGLksZFwbr?9sQb>jV=>L?IjkN3C!A0U2{#U5*8EjP`$Q$tRtn9wD={e?a0
z6!2zzKXCm4RuU=ZtLx4<kMY|>UvsX1{Z_V1*r((G55o?uKfpWpB9<**q?RrLJsa^w
z*9P}{EkCZ@C1cnonz(+YyUrEy1jKW5foJf`Kk)r^uoGhCwU)eeqi1~l>&0f4Su&#J
z0O9hJ?g+<6&!3Oy2CO;rD=!gx4ieuA<9A=OsGoN8r>Xhf;l>L2N#bbzS$xmpmw({=
z0ZP)*b-nV=%lrs<{z5(T9w>hb--A}~&pkMQEU<`KB71V(Cy!544l-AS$gq&|v&w+a
z<ogAJ1l-{@py(>vydI^zoM!RAf7~ZGOXWuh=Z|Vh=lx#(IMDyV_1nNI#{2H&RVTuK
zJnHkO>fN;Dxrpa32fm!|!Sgc%>&Hz~a)-YUyr~VnYNT*{iaYQ%|L`1E^k(w#In$uG
zLVUS5@SK16ot&yGT~p5Z^!sbs3rHS_xAF(RS*ZR4yKwQ1t*!gVt-c83ry!mZ4!o)k
z$RApNj}u`%z2}&``2G1SLp(PIc*;LKQ!zQTt71(QjL$_p`2_HK|M0cTIL8#{etp&F
zEendp#8jh%^Uurxp33)N|8}7LJZrLaZkVr@gWewTDTTnB{ljyM$8Np9Z<09l{)jJn
z0=(5feA}jTD|Nmq7x!KN20h8|5y?b6yB2s}C+_=!?mw@8bmOO_wPRq>w>clrdHc%N
zAfEDB*rU%sa|#~@+q^2yfZpn`aQ@i6gZsCK7R>#)a&?{S-gPoR^Xo~Oh%b^6Jlesl
z0=j>~c&s1LR5dQH`kBVhmXdRd9K@Fo6ZYd^BKSwiolo@@TzaBQPKaIklv*xQ7A;(U
zjyCZ2{QQIUM?VHDS<}iL5Ar^cD))G4-t>KcNS4bI_GAm-nS2k{5B(nWq5I4ed3T=G
z_Jk&eH!jqr$aKdDd#eS&hw;5;Kjr-a-t+54oiTw88Tkzn(|u0dkV%OZ_B3bUSwj7%
z{{w)3*}im0=faFlAN^_0iSip|%2B@(_yoS6E9m;3yi!DN5Es#$V|x~Q&Iu$wdj;?J
zn)Si>NBxqq*Pd^A=fbcpO07`oyME-J751#Il{^oB49vXXoi*nlQVlG%Wdam@$v5&`
zM9NSvy^8mXW(FX>8t-odpJHA`PL%%`;$|9Z7bVJ?F@%;O9G^=Cp2qk6D=(P4{#X7*
zKMhL9-gdU=F^H}IXeE|_c%}vLbiP;aNBrFPzuNAVGgfSogKb~@lfG`}WV;ccVh22f
z??L|;Gy=)|%Zy_CJQ+{X0=+4U50oURnZo7gECSwx@4<r_1M~OW5;H5~Eu8nT{>_L_
zaR)x(AN60TEh|@~c%vECpL$L>K6?xBDgUT{+xx$@my%~z!uqoiZxsN1=0EDMI>YhI
z>WMS&_Qf|Yv~`g$L;V5Z*?bS?uYvp>b=I<F*ZLiT^`~Yb<xc`W{~z^dSeTjyY2T@V
z_4h}-)g|DI{!#x1>WyorpLEjut{)$c%J&wpK|JF&@MU}t&Y%4~2lQcy`n{%$3wPC5
zT>JFv{9$J~(s|+X7d-%;!}lZlDen*H1N(b#F_riHm<6w2d{Ey5JlPP8A29z7Tz?fC
zjt-E0>8aYcfAjUZ>;l<@3&Qc)T7v&;W?s~R%!5)yH+ae#8gq}$DS2A4KrWQTKs*QW
z;(!T$c9gCC>Gt8wb^8O;Zuak=TOqz^lyLlkkq<t?EbqeociiY)=v5KVr3~)7Q>$;x
z_<SjIf==Di*J{^AxJdq}V}R%I^Ea@61~Osyxp3<2imhGHlacsTUErJl;j;qO)?1~n
zb%CCWc&mxPbN}I^wjX=0>uu!+Jq_{HNx*mi!yj{Vc~oss<OaPD>ZbxvG6MYvt-lKW
z7FGPho!!v05KplHUiu%t=jQjZqupB`daYU*b1T?Qj*WUN;K_Ust_J$ALcpCMldH!r
ztjwp{f6NwdSsDCQk$g$G|5^nAPoaYHqu!x0b5@vJp3c3qVjD}gg^T%I7WUk$z*8sv
zw>RH!xGXnr*Vl*SVuek%;nL+-g*~eccq?Pz*9bbW3a<l|X%>EZCgWKK$6v}*Vb7Se
zMle?TU!dcU{q>ZgSNq+$(0d@BiSf;wRhw@gE+a!vMZA^$;PGRNdu-003$}y4`-yP*
zDGr1CO--2{PWyenzU_(DrK;VLC_+4SF7VyvAb()h)}IN{{vV_f5zAVQCY_uJuRrq<
z&s_w(v<2|uJk|dLWO85Q_WU`<l@t5!---2Ke<vWGx>&gUg689YPI|-054uH`y3qR|
zp5`>TUt@pX>7?V%Cf(gVl^;KCleI^DxwEhzxc&wOnEL%}Zt_ukskw<6*^57oS3o^w
z74T$!{n7jxUUw}Cm#Me`y%ieY4S32w{E+7C?jK4H5zw0<p0)va>OVXqZJd2i^{t`M
zQxTuy4ZPJqyc6kBr`^Qy^-&zP(II0+hv*@my$yI8->(!jpfaxm6hE<Q|14cPwBo|L
z!!_SV%NI2v{rB*CUZS}+p#Pi`ctf5){a}ynRyh+=U;o<_urfrdO#DyZQ26_o-#thS
zqfNY*j0I@_1^utkG@g1SXNb&*pKgzC7C#d&LOf|Q@E&|02tSwvcG6~><jdbqRxgE~
zAuSv~<tOl&3qgF;@0;*<<H<k24!C~vva4al%aG)Sz11BrUc}}_z-xnI_r1s9y<f9s
ze7Bv}kO$Cnl!ZNM-Dcny|F_p~4{ff!w&P6m=Bf|kv%ZQIX$t#tbsylD0zYv79$X2V
z*>-e9O?-IXce$T3#qo<YS4-H_W&uxk2Hu4CY5hO?*FYpvlaIu+%ae}Jnv#2Pc~pml
z1dSr>eO!RA;roI3;QqtG+QkcdzfFvQ<!6o-_EtNAr!4#L^6Ly$xkaY_%7FccJx18G
zPXW*3`+@Nb8secrnnHlCM9{UR_AJZzEZI!NGtL5^!1vb${nv!|0aa`FQ_eN--nsnh
zom1{3#HFmPgyVCfxAXF3<_5|yDbD+A-;V`6@4nn%i(1B=-x(f3!{$7hB1&Zld!KIs
z5b%!R`f1=Tlak);l%WZiE*M;Y6P5p3l!bUskFXzDe}K=JIAhtbiu@#vG1{zy`y7Ul
z*oY_n5%%c*!-eQfl~<pJ|4|9N#GUo2R-qa7qPqtQ+xH6GH5hnn_w9Wp87J;vydYO~
zN!#$PNH^kB#DzUrwG8+y*306(`CrDs`iHp*=Z~W-?9uv*c$`jq_f~WPtbZorsj9*r
zt$!D}p7FXmB@5P{gLtNfut)2^XX%o>7dP}r^~G-*_i30S7x9cy!k#=(b>6FvZi}Ez
zx?b9_{?s+X^(T!J_GtY-?9K?Ek+}CPtUnF$Y<*#m)<1Mk{0bu-g?hMt2}8Y+uop~!
z{CYH6p39AUTIK~k8lN#~aBp3!@JBsk@@?o<k@!s0!M$luVe8&_<NK2?{Pjq9FFpiq
zzaqX**#yS#ctQTbOmcgq`gh}>72#{y&sDPGV`aHW{BnN~zlQGz_TNN#pA=mB$;Rm_
zbAr^kmLJ`6@1$zh3b!Bkpm6yIb}m3chCNv$>aeysCoHqfH2+h&Oc~-C;lh4k{sVsI
zd;?$CU1r$^@@GRBzY64v5Kl=I_UQeeb&Dd_ZYBAa!u)5VK1tZ4?Z58D@k?g!;+*ek
zTK(M8w}0n@`jfyn^YaJJTK#1QpOn-wJ3lD<(I)6q5Kqejp8F49(|OQ&uff-&(3c~=
z=rZu#|L{{uv$9AA?w_G2xeK=+IiFvDFVKI`@^60pWkrC(`9kQah-W<jUiu$iYWH%<
zN^9~M>zQ;tiN5nc1Mx*&z?1oY;QR|pvM)dBil|Zc3Fuktgv(Ex1XeuEfB3AGR!^!{
zBxS+&FIq3`S=$FzOarY3`d<If7piN#!j0mlK_7;A#?Hb0uy4aI-dW*A9h2U^czTE(
ziH3Ne0N}a&@|y}m59PgzGl-L*w_5&yzHEbV`I$%g_4fwthx(V5U(V-nZ!7ifKSfaX
z-j}l4DD1fpfhTVUewZLW7|GK-CE4kxD)vF2fOy(B;I01Q--eb?6@N0uv~T~+{D}Q;
zX)fZer1tP4`tbe0`3Edy?2lRQ*fWo*1wF}Axcp2q@L~V(3*$Rq|84ZEh1ZW{#22Xn
zpThUzg8GB;dt=q-r}_u2n|^ffY42UvtcaH1XB6<6d@uN-9sl{2s~1A|dtMf8gX`B!
zBtB;j@Law}*RKyoxs`8da`wG5E@qOyj-9x)mvH^dcLDFS1+*X7Kku&um`R66ewlGe
z`nT-EleG%8c#R<}#Ixi0<>&h`g8GA&sD74cxX6Zc(&+Dm*$wGGhA_N^<1@|x-_7@j
z1s;s#;}?z|b1*t0c4zqN%aQCnIhL=m@B5G1@`Q&kD1W)Y+wxwSN<U=RR_wNh{jYo{
z;(r1kwhef+|CVl9FPd}3rYySs$RVAd+r;$zg*`)lA1_Wm--D-F`riVX9Nn-!A>-0U
zW$66_ggwa=c%~nSkNV9$hlVEIyO|Q<eRd>inWa=&ps-JI1Kxf+@L)CHAAfBB57PYw
z?9&^qJ>*8*Y~)0$hssDZg+1vk@QfY6gZ;05soMX8G+S$`W~t3Wd+0s(3;Xga;3+%*
z+kZ)V?(L!f#(whdA2C_i9x0TC2z!PYlNX1>_gi^?>;D0Il2f+Q)o%Tq4RHQc4HNck
z2c|&uzd+Bw-TVE{8ReWYg`RUz*mE&HHelJMVJ>>D&}Sl^F@Ny*JGM!`Quyqk2fYvC
zNec$|K2Jq&6x`)3hu#eFltqJk&(tlAvzz=EK~F+Fi9Wc`jd5!&Jw}@XeOah*{wNq9
z8nH)Hsq3n1!khD-I}frHScqpbKzy!0=s&q6_-7*Tg>oZz%djp-?yE(6wCeBAlqN+A
z$M^XOJS_nD>5%iU-_IJ*Z1NA7c2!0yCwiJY%BDmKdln^#C(8LgP2fTN8@}U$RV^&u
zZ>>Lhxj6f#sDG@mCmjWz8VKTp-Jt#t(d2#7dHs|-9&NMh6FK@GS=AJAk0Zj~sup<F
zJ;2`*#0TGGG1+dGv1-}G=EAw&V+-~fiK-qK_Dt9PJW;k6_<Vr}PjdY^T#?wpY$em`
zgTBvBZXzY52>X-@;C-0D*9yED@0Hp1=DS<E?!>_Mx5_|#c(6e9zd*;|uTM$QcjIjG
zpqEB`5ytOGw0@d8)JUQ4{*7k;{%iSJ;rJZHiwc#7L}Hab&KrL$by@E5Q-S^8A4oww
zGeWrh==I0$gEgA>E>D{S<FgP?ixl=~e3#+NTm80WwL#B7JSS>!|9xbJ{QLx|C(u(7
z&x#)0PnJKG^+POL3)Y{6cv_6GN9(`(jzVz7O0yZFiW8h{SG<?yo)ON!RjjZ_>t8kA
z^7~5H#)3->%T4{y-xVR=Cr;R-*I)G;#+Mh4ZgPV@6Y-oQgL_jO#)7R?cfFuzA)cE!
zxOY36(EW4R7G0Qsf5cmz6832QKeQ`UjGs~PVUxnHrTyPOvq!v7vam<%|ERNb%4_9c
z^I&``;wdS@9*w_5<Bj8!5bfB@-*44~?%hZtA)b3$*bm%41_P;nG2;W<W!-13wA?Vt
z(2?Rki051t_Tc{Uz#!yQg=o#Oem_n3z-U+ITdG(B(*GD8z*F~w`NvK`!A?%l@yPc!
zYtl>T*DFV#&o>ccW(xN|#*7f2VDY`2z>D!--M`3PafxN;4t)aR%WZ(q{D+?+Hq)f?
z{(*H(S|SFd9UDk&#M9;hU&QyL1@S>k8aTZ&kXkm(V9dQ?;$5<7a{lLp%g^-$9x`<Q
z%D1U;;hi6r2Nu?l_P+`pt(bs#>K5Re`SHQ?5B;Ae&ihDt@xY>e``(Mw{;YmqY%eWN
z$`X!W!~|YCIGy+V=XgK+e}J7J=Y-dc%WY~a;rN%ng!p#gAw&D$cBe@;DdzWvpU)mk
z?*INlO}4P7bqITO|7Mv;qvYiJ5|Ja;Wg_~`Tg1u{Px>zG!Bsyj4T+Rs>AyIHTT==>
z2`N8U^uWL`_q{^>xt{yo8GkM}sLVW1<;KTIQV~xc4m>>s<gZZhX<+@ZaO&C#&DJ}9
zj{j@Mj(?IWRg@!Kf695_^A7+&u>T4A?@#;u;+p0|iGQYCx9`s%=^Em%2$x?%5Ffla
z*xXQ+_Qi6`$wjk7Y`lU+o00hB9AS^{zaMY6o~#^Y$qG`xV|wxNeOY@XKJ$*S2fGdf
zg>b6TzP9^_;YS!h0r8|tVUNc5ny%m0OWNoUeK+EZID`9?qas68D)xVX>koRaaQ?WR
z!X90}e7KadW8XG*CX7!(JoUS<N6R0hSJLuTYTE<onTRKehYlpG?-lAtpS%6#?nkLW
z=sAez3?1AXPkS5c_TuD<=#w6Q=?)wbt32WQvqlShaMx;}NH=WMDoJxizn2+Teydll
zleb4aQ&-q43{c*yPnF{W->)=Rgx&}7<wk@11Eve>s2|0~vgJpWCR;3)NI*Qr4ES>X
z_?gLz+CK||k!-njd&>mFiW?GTmI_N;@`lg~gzI0l5%}g%F#b@lzV^L%@P2d8?uaLq
z9xjU&rLQACiC_LO;K8bUApV;#&m!3`)a2sT^G1iPN|ExpA?#D`1Fss6dT=Mgc;D!m
z*~{meRrDTB_-L3cS94R?)7pSHI|O_Yum1f%z?D#>i)HK1=W-XJPq-`WeRdw?3DwB|
z_LFFw(Uet>P2uyK^asM8@f&y;7R*}kZzPg!cJFZw|D6Y5d@ABoM8bH#+#U7b@$dT-
zj+5P7aSVFyQ{njRNZ@Ot|J$2g(nwkw=`<CVpIs&FDdg~h!uGvF%WrekdE76vV8=Sm
z#3N=IFT}zSPa6(=ehi2|LNI}V=b}sBj+r?}w_Uf|dCB%NimF)mTjBUt7KeE8{o{cL
zPYv|H#o)bvwKVm1fXsxuYC4k2{rlf~jl!Pg9l`rO|6_d5`&<7Hu#%|qsC@HO{pnf<
z2mSpkIjU0hCSh+C3VaRUj}>@uCLXrjvOBj;SNd4B{Gqeoj!9FSg?&mU@Z<y#Uti$C
zOhP_b@pjJZYv#t1G9C+4_ez?5685ZTz(Y0xzTh93QeMwft8__l{-d=Bd!}flkU-~8
zZLd3J3Wt8`!TE=cc$%WHN9V6QWiOlWRJQlR_%(=UstS8FzIgN84v)(_3k_cUeWj?h
zM%1iTxcnqt;OYGQfu}b5t0d2>SMH+SO7l<8o6_gQL*9QIV%8??S@VF;=lgMjYyh9*
z|0aVzp<<zlHserT!zUTaXJPNd0A4i_wBI&?2cM*RvT3Y1$#*XF{#;>C<pOV&^xvLA
zZa86jZz`R<@Rx?Md#7aiH(}2Ri{eG}I1c<6L42@(ToFI#P)|~s7W65d!rq4seEvT?
z!(`X44(+Aa-xwMw^xwbq`7Z2f?|_#+0pe2x@uhjMwtl<0d*<x7xzJO)ggvDlc>90&
ztixJy^jlL_^?m>KK=RfK2`=JU;)i*0!uTGHy8cN7OeCfU8#$LNdZM6jM!gj93IFhq
zPRmQ4|2aDzUcYb<&z1!~lkZ0h>My~2RdAqa#FVxOrme}W_78pgZ<#-Y>(5aGzMSvP
z1zv&oYG%d0lQOffY)px~vO;2QuDIDxVb7cmyxB>R|3HBUB~d!Ax8TUgUvc*X1C>LQ
zhKttx7WULs;H^#pe?s6v|IM8*AD1fe#~ZHy{6+d+_5FdrM$w9fFL_6h^?|pXVm?}D
zzL{>@M|jUaTOpqOZg8J-_u}p);%l!$FO7JTC~F{C-zzk}bI|FVBkt4*p1&+7^_PC2
z{0#BIy<)3U+Lze7Yx)RyejD-S7{BsQ!FA243xaRYx{|x_aE&4Z@k|L2-y<31f8hBQ
za3<|OFyX4-*u$1EJ{R$<p@Wxyd-5cYvYY#2^JYI4>A(M!k9e{H@JxPuZ9z7{NQz!j
zIYr(?GT7F<rt;Df7x4rn|7=U(^ZDKY@o%qXrcthqO0pZVezNxzTg4*L{_GFrpR@va
zF5eG~A4%RPH5^fF@7Q~F+alYO7e4QMGbBt**q3_?*B^ZUL{JFQ8&9Q8$tF|FJ{`@n
z-TGvrSUKWJ+lBqW_ea5J?0weUn%I3RN9I-X-c#Nla`xiF@yQ2;J-Yw1?V+B*^F`!8
zFn&JbDW`-z8o%x9dUdn64pMzldHs(nAsoLvU)ZDlU)px_vnA)cSk1XJe>`n|FV&62
zrxgo(uxcL2-%)yLZ?i@3pW=j)c$4UpB53@gGGUMA|K#S)o@W;<TF<JE30z`TDd&%r
zpYjHHN($)z1Lt4R|DH;(EoJQdW?uVHz44=$fdoTRxc<~Hz|;ADp!^^cU(eq=d&Mbm
z8eG35AfEg~xcp$&9jO1spVPOC$6Y!C^IwE`5-Dcjm-}9!`Clo+J#}u%n{4RA5KqN;
z=0*9sdN12GFbECt@O^kh<7cn`#<(|S+fMlJssz1`Udzvgzg59zR^NwkkoJS03y)}g
zS_17Y_f?h&{P#?P-sA6+Qp?>E?$G-X^wBd^f4*AW+zGuILC@8Ve0$8PGX>nu?fVph
z-ZrHveD(2X+o3N*#vd#fJfit~n|yfQAsvmVru+im*^;9kurOW@eh~i{OKRg#r_b6W
z8@5%{A;LvI6XU_GJMbZ~tK;tnQKat<;r~Md#)GrgfLD~apPOP@dK}i@2jkKD7yrok
z7CCL(QRvMG`bn=-9sJ%-Zh)Rd(9izm)4Jv1!7<R6q34f*s`6f;<<~LLw`y3<z79Q$
zpzqjBo6fjAKNfmALC>xw70)!=)B-()pm!}_Gv>7S$z{+tqvvl-{kO}yH4o#O{#C63
zzsSaTbpJc=o9gb2T~l7e_)LsP^Dk?WV|Cwb*9hqC3HolkaG6iupQgd`lQAAG|Mv%%
z-u)Ii$~L3VGkAJ_i8cpWKOyNOQIIzRHk-c;iY=>#<xj!HN9*t6+_2n7@edP@e-DgD
z$A3x02t^gQ)7^0V(=i?$|K^`%uIauC5wsr_<I(a5xjniUU9n3Q*1sE*Kh$fL?%#Qo
z_0kdgB7%Ozz0K<$GC!n4A4bsc7BkpXZ+5gBdKy8mWZNxwQk%0GdR2n{Y5K>IoDciu
zpywd#f26zp&-&$VQH1RTYty~ZXA<;dH)t<sYL-1*W4UbW_>se>`(Qj+^$nD2dZ<#a
z=8G4*q4yx@?OoYvaw&y=(4*I11ChWhG`{+mx(RDWytbq(Z?~P(_bYTve6;_!&Y>|E
z?>hSEWD|oIfJ)Hc{2ki5rquC^0)JpiV>~+lXv^K<NYs=Tt_lVtqvo&h^*^Zfz)#dq
zrEaW$Gh|{RonNs`g8mI%Ze?n65E=F#e~d@RZw=M4m*sSE>nMKxtqA&PrOKiD<*ybB
z@`v$g{qq!^&QxBB6r4Y5{tTW!wEX+Bm#B4ri4~l`QwaLPp=U(aJ~psd7~zoA*tfaq
zf$?D1X`nr~>bKpro*Iz=>rcaYwEp!;hKuc|XJkQ7A?QuwZiH=LohlF8pW90;f3rp}
z{ni`)qYlQ;$9S~-d1Vci{*JSwpbsPHE0!F6uKJ^);pEF*hwB-A;~(SE`Qyes`;J|m
zXGEp%3{AKmmS9W6c=Y@$7BErTI_S#X1<(6}_x-WLcyZou4g6SKe@@yk@Pq@Le<&D_
z&R-AjwY|>D_c{)*i@TBi!+}WP6`Ft5PZ<yGTIRf6{oI825oH*U_Ft2kr@el+mIN>0
z7mSVZX!-9kZ+XnBsk#LFUl_)t<9Eg<RqBV--_xL{5%f;GA8Xj>&A9;cr;71t{+e3m
z=@@E1`nKL*t!c#K&10H>4L*L*{&)4*)7gv-n|omSIT-&x^*7f{edQIR3w<U*AM{A!
zR_e;7g7`iJeH5pI{kt`O*+~AtFeB)<8S71Wr}M`aj(-xyqxlazIZVr8sMJg7%X<dT
zKkDzw&(mm%w_X8#3PE4rvO*!IA?OH0Y-->CNF*PON5_w+<8q4!c9AXc`h|}1X!(=g
z&0W(fb>9ejJ%V0=xvGBYg)DLCyOH}BxcTE!)KlMQQJO{2ml5=h=9|-R7r*d<{Wk&Q
z(f;3+bL_-TyQ6{7GYEQr?XZutthWiye|iLc@?9;1IO|Zs^*gtF@cxIEU)kq&$$G15
zC0PD^g1%_e9qZFyirS%P67<8$8*V<`cJK*oXM2Kvc<s$~-#^R*H#7S_giO%i-+Dtn
z`qiydFn$ek{|&wmk7)iv3{3o2Y;hY{zY+A$wM}l2er7L)`ST#?tyff&rcCcFhUKFY
z^nU6c%tJm~1EB9l?q9<9;SsI>_t!pCnNsdCu>3^?eOI%}1;b#c)zF6#^xx}B9yHn)
z+=iY;&~NrCqYd9o4~1TppbwihC(Qktg8}p$<o-9z8$6=<GuY_xE^M@YJoK3a{inJy
zE+a+uMM00=e}{455sg38;rUjQ(cMJo%?QRfj1(I_|5IBD^dy2_kHw4(vDjJ+eHrrn
z0W3E>qUFEq5!ZSzzRVqZ7D4~`_z0_~p*LyJ(+T>eyUr?Y={&9iJ%ymBxI1REU9M?B
z-;6xJ0qYHqX#EYOlDZ0-mnA{ZCg?Xf&z?^ItR*;q_!IQoGpE<NnJyOWpIZ_1(M$H!
z{eF-pIDbkL^ei76iFZr(oQ3r-?;v*mn;h!?dcUnnGhBZqU_8412{PKOuCsAo7mV+L
z@o4+`8J$|f8Jn91<5Mvnjely@3XiEO+d5%<62_zPH$JnQaco!A8|cg0iRDl2=p0Jg
zi;`04Sp@yCjSGq%4llKbo=(s!jdf@p+46V^^b~?Vux-ht$ik3;@rOKr1;-scqWRMn
zTR3?Vi}f7-JDZ?4^4a&XdCyr5=+WoD;QR21#t-@PGF#b7sTKaa6~XwIxT3Q@q_G9-
zUulBA;K7*dkAvF;*MH?-iS?h%1x{lZO?o4EEGdDYPxF2^cD00w2dqDXpg%N&)8(2)
zmVy08kD#AJKb3S{;@&yvxnGFYU;E;p5%*Ny>p-7R(BF$REm*Q@ub}))g8tk0y^}_!
zscXXc_5^*xQoa0%cNFeJPbTPH)cw4_?JNv}z6N=I61FQmqW!<2IezAA_Lqs!rx5fS
zy$UKe_ouyp-h-eYtKp{H)IhoiJ(Zvz)#9SAls@4i^xeqwr?B4eh}OTSr7bVEp{NG>
zB7)vec6M*|G>_-dhY|Fr;?%#Gc5yPHrxEle8(eG(ms{S2UX`HFzLnxW{?X<D=sD=~
zzc6w9BbvW&Ys)D+Y=^IcK9itd6s=l*D$C*-^gaZ=jeCn;<7IKd{louxei>8#k-p>O
z=EZx&!}S9R6CYha{MOk!X;rRf7A$``^87Ut{(tWOWyUSK+e*#Wf$<YC9*sY1${ptT
z*XsrAZx4(|+iyWf-tf52zk=&$DnY+p(zYQuIa;v)(v3VnkE{Qt%ayFU;y>One?<hn
z-@KvsGWHY*?!Sf+^fp}8-dQ7q=E3+hg8t;BDKU@4<qTjwRSEjuU~{XK^^X=o&q2Pw
z0N;m4wEY}xUmq*n<~<AkdnQ4@wl}!_rn^cutiKOIUv#PE<~YyNSJ0ag^!a<$H8*_K
z8~9p3L4Wc{?NxR00KxOpWytqOU|!%6&7ar8F*b(1ZhK()Sp@yz%D~Q}rUxvbN58)U
z<H92vzxsiEUZ;iIROl%L<JZ{Mr)77jv7m28zJCMb!Xp}g=NuQ3uK#Vp{KY2dZ?rq7
z$i>8F!1(?IeYiu2q2Ha2zR+6{^agiq0v)^$dq6Ku(3jZR>8>;*4}-qEf!O-<;K!X(
zv<r6x&z~d^^a*wcw#m&d5UigV1pV~<&sH{mEo4}JJ%V1=#m2i?t$+eO_am|T%ZMu9
zjw;^w4*Gn8K3VPMkA#J;g69{R1iehOqs^J-x6v@ZJwYGr{<=IpRxbj2GC{x0boK(L
zca3YIuc;@NzeAiCx#i-)r{MWN1>@24|F{R&uCEUgGlubfFdiNMI!!~j1nd8<hVjiX
z9*y7d`0l;u&O!AszBI<8@jDCx7bdtF#KHNg`~$K4d6zxeAg6n$2|j<5fbnSgQ?whu
znujN>Udexc$Ah4s5!13a`B`-ttiKt?qxBbEbh>`~wl2Z`JBgrIS@NlTR-9)qj9>Pi
zSpL>kl%3FdcP1Zt7C~=tqCG0RwZ#>BIzhkq$7H$Sq}(6SQwaLF3yWgIdNktT^Ha^7
z!RwE<zjcH}@xvz8RQUWxKE|WZKjeRq`0?$c(qmYD7RICPe^o~E>E~w^g87e5(7zj1
zf8^Q)*>V`4LeQVyHG9^x`Mdp~Z+<s;{?PKj`j%onl0w~2f9b#AdEd7X*cgvKe{*)6
z#^OWivQjYrDHxCDKmE|CG8OT*v(Wn!^!N22L~yyc$<WgX`lN#ghj5e`g8r|E@o4@s
zB{y`mg_k<O{B!Gw<$r2-la%M0RKfmDK0%**i~8!>?fruLuS|me`GS<UrW1_E!}8k`
z^yg0P+MP5uK^l58LBGFr)PhapXA1T|YHEq)&s0^myD()-1&p6U(C6Fv9oysgc?$F%
z1bxt$%In;y@PX@Zf_|YVWqat%c)|W7`u%-)UWG@r|BZ5Wj=3A;c@94RQS^53{Gs!w
z=#tNzS0_W`p=S~FcQgJUdv5}d)wVzWKZOhtic%V+Ol6Fss3eID86s05V<IAvR7l1$
z7Lr6t6on8`86t^@43$DEl%zC}hJW#Vp8IXx%Rc*_^Sj^sJ^yuH=heqrd%f52-fIuf
z-uv0ltL;J3&xXLCIRTIMKdz$hbf5M={0o!h-=1R1kI+A}0ow0>JpTC6_OEPAm{eIL
zodnNM<&)%NN<Rs`o1eu4?R%5t2N$0{-qe^`47@5y-h8>j`O2!SnZR?9<Qbl<c3>AY
zy$R1xwmcf&ANu?xUyplriNEFpXg{BTNBsxLne1{iin0LSn<W1+k?--Uogd_YS0%~s
zUF&^O{cbkx`DG50{InHo!%PKV21ENT56Ab1j^Bu>J>qO$Fs=PWlKiomLZ4W&15BWO
zJCgjh1U@GJbr*7gmn6yi-J5hz_E~Q?%%8!Q@yCzOpFPqx9dD)2u7UPj2zb<AeRMjb
zCBGZ({%0adzF0gjB%`lo9kg#pl2<TK*4p6_x&nAflDvBKy`9o(Rd;|NY#!eqI{xbp
zB3$)z8)@gS#U%Mbk0I+IPS+Y}KaeC}6;N&PSx>?Scx{q=>X}0ln<MjS_kVau@*jeF
zU+8W=x*XbXZzAW<Mt&1#$M<jd;PZ1T0goO(MTHKDs0ez_1>S=spBXQFyQ}S80`y;%
zfJfIqJ@<tUmxrO6z;lq~RT$(Cs^~f|2EL_{oWJ#9U$-^RnUfBDB1wLS+vT&-fszuy
z+mYnyy$*%VRy{+ze;`Sc7t9(IkoR+X3hfU*AUFQC#&y07g@UyE&&4G9qpRfT-^j7h
zj{oTUpWwU?BD($?POQ=JvQeO&e`u3ze~pS|c-9e@w=jMllDyI~`P8(MQ+~j=H<0sZ
z5ZUW8lU|GV{6s2AKDv#6epczB>Yv}A7*XU*z@x{XnyyObyIL>y0<TSyPZO2fy>I`k
za^NLN^0pxpqE7dQ)9#;g5b)^wuh}P;IMBD;82q=?lk<Oc$Yk#64=x*lPbA6jpI~>o
zyDYC1csr6j`;KMY`@XvF0bY_MZ>njr(oj9|1n`6R$&Ekt$Xw_0iHbLXFDA)bu8p5_
zCel#@zP}Pkz@x{HP0AlT4!%BU3cMjn{&WmSB|pcFYT$)Q^7EXSJ@&5IO}l?MSVzuZ
znd7x0_Ku+EG=C&{@6B#~vUhylfDa_eyWX2)r1zDHcK)wTk}vm5dSlR|cMaO-A<3UE
zm~+Wq{ksnE?X~3mO<z(vC4r8Cw*OBh$;ZoDKAW?kl6L*UnI!M+pO*A;$$&ldUydZ-
zKUc-#^-E>i^CuLNydba939DsxwEK6J_sID(%Gtm;o40Tk^go;=FMIjngbb^HoIe|q
z<d<(@TABFX<{Y%oN0Q&svFq7$t*f;2m+l&J<8Kbpl1tX<qP?UilO!LQ@Fj+G>x@@$
ze&Ioq??~8v`NzTl+Vy`$lKj23rrveNC$B^MOeFb<+XcG5riOOI{;#fje1GWvH}r|~
zcGdjJ`oJfW<i8Ka$S*d~c?<n_Cg9QI_Y;%VGYuUWouPd>0v_%E`FEU8eQxbz0-lK^
zKh38)zR2^UDD=PO?)d)D{&#ixnVJpi%K@KAlAo<UL1vYapDOTnB>6}2cAXW^wqEej
znP0&&v$t82fFFHpD6~eQ4Bx#QqRm{j9=2aO0v;XzNn7`oi#?@hL_D_}{SFoZkDh<F
zh0Lj^WR}p*pW3U)`FBmPv3>pd*ypY)j(toGN{3Sk_|dmc{$u>1=dI;Vcb|xg$PpR&
z3NaCn_WzQmws)yT{(JBjNYFm&PiuR3e(rTEUf{J!@+qE)4Fz1oPQde!<o928ieAnj
zMtgp>{SG<*PwZNaMWup`p#4;m{LF`pS$D0z((eB`ljNl`lGf`M_O69BDo2uc5(+p~
z8{6u2iobP%)9#*I6apUo{&e)~*s6i#Y2q;c!Af%eJm0J^7E(x82ELdiFEroeN@$0P
z6!3v0d5ZznuzkgIX`f%UN%GdL%9anL7t@Y^JS6!r*C>&P#flNo|MuJD{Hbk9v`D+<
z_!#(9lDyEf(2FxG4!QvEOp=eWc_{XFiA@Sz|B@r%(c{<5UVj~}yPnU1XCle-ef#FU
zR_haO`){cr=a1rf&ZYdwrY0DFB1xX}D|ahv;_K7E+mYq#jXzlJ-&_K`BuRd2v{(7y
zGoxYJ_4o4e$B*v6pO(5Wp0`r*X2b`Dk>ghj0gvAQcd<3dKEldL`&ouc0v_G}51$Yd
zQ4<aD(|N%8^AI#=LO21B_Md-X<AUy_q86R?%Jq3GSt!l~Jo^3rJqI&QOD5l>z5m3J
zfJf)Aq_X6;CmYP&Vg3q}<PQkTKMVT4iFW;X@YeY24{d+S!dSPr?z6L?{YsMjB-Yn_
zd24s@@U)B`L1IbrOl8A;XT+Wa0B=W<*ZA7<F!#*SR+#^C1Ux!_gqL4WO`z~>7<qo>
z*ANJJbp2P%k+2%n4zGacN4m?#_m4im(#Bz7w_rI}9Pq^?`DyzfHf&qeLwkQ2`uhoR
zT!)B`|4?v-l*syHZokI=t8eB6?W5aI`V}8dRrv>xq5p~mJUV`5pKD9hBjsuLFL?-f
zwEx<Rk6As~u5}pJUwi5J{?YY!GvMl(tzQkSp#PNwJlg;J55ngx*j~RA_(YOCM?q}=
z*L4(jn7<wbJUV`Tp}VcOW^lfT^`}U{qwDW=2;K6Q?fv!8e?9^p9lu<MoA$K8`XuQ8
zV9EIY(f)5f-*t7l;7&g1e=z}%_CM^((db<Mms_F#i3B{_fAc$%wl(M13q$`s2za#r
zZIWx-w+{$6ocy>p>G7vU{fY$qKi;1_x<y_}T_9qyz9<Q{PqOU?>U7^ulGZ&@EP0`k
zSFetpsD1SPwR21=zk45AM?3#EB<Mdn{)tzTH8;=5WCMSEB>BEe&7Crwb(0Dm^dzMw
z%L;cFk3WCV{@28v-X&D*Li_#(g=G6Sq8T@Z551f4QlqriJht(8B|-b>=U+!J)_u#>
zS|`jGaX8o4s{E9Qp8_kI8aWFL-Y-m#*%)zFIdZBR3uTa?eRTe-r9GC8c<m|+d<#i_
z#e>-&r5m^E1D{WlzdZ3KGt>NK&w-C6$+tUb#par<`2oBKNxpM!Vp;M7p=RI>N%97Z
z_UcDGt%w3%jwEk)kmp#Kzt1(`c}Vgp?Vo0S57plc+t1+5@#jCf{q23J(I8r0;{$v#
zNnWHq#(v)^deym1Uj(y{bJhhC@aX){IuX*Dp7A6Z+9%@C{<Ct)ztwljraix@P0&8d
z`!V(?v9w;ahW2?#@|Sn_2ypxVkOjW|208z7ix{`=KHx+9{!=PRo;lFAYZki&?f!)`
zN#0@$yD87fW=81097#UxQ)qLns`3!<6q0<8@0@`UJ|-R5tyNwp=Wo&!iQ<eMnzWx~
z2q(#JeQ-r-_my_0`zoV7FeKp7&p(ZxCtgPEu3B<`;pi_z36tbQ8*cTm+_*i^)-`$y
zaj<Co@uTOTGv5romN5Oc1N^rW@aX)Xmcuun(ctH=G*ho%rxNh!_3IL@Q`UCn>%T3D
z&E70LKZYZdfJZ;STUu@5YTV)@1N~1V;L-l4?yq0FxB5etj-T4;?4LhwVMoBD=WlA3
zA0^ri758%_7axui6{%7r;L-7?bjApj7VL`B99TMX3q+NGN7rA|j2YHDo@hiu`;r7a
z+J2sV`|G+nJ{8cu908BEUv$Q30sHlY13JInpX@+S;UnPD^M~ox0b#e)N_WHOZwdjA
zZa+e{X_UDMNA5%Wb%o>4f3*FtT8o$ch&t2^d?rbLi-d(j7T*vj^go<{NBe)o+%U`Z
zBb^28zsw1EbpCF!O)7DJW3CIlFiBpW&C$l-z=yBCUi+SXN+}!azc#)<bp3CwSP)sQ
zr$YPwSqlM=_J7t_PnBc$Z1kc1L;@ad|3prC@Tz%g|9JkBfJfVJ`S4<ObV}PHro~!6
z9GA~ut4+Yeeg=Ght}r=rBsgB%h2B?7w_@M(Is%>xKx({sS~zRs5z&I&bCdXnvu{0;
zBv^mw=eOsFwOCh($(-O{*EF<e(~ovL0v`SSo(J0(1}(bxY7&f#X#S)A*pyG(MH$D}
z1Mfl5KFTw@>}^i*lB0coQY6U-if24j{mS^XzH@0*+@;O!=<kmrx+xq;#txBt=jL|s
zzl8p)l5BtRvQsG<9tE`LCpbv*gOoSA?Vk<jL;Ga6pGJEf_nteN@^Jl>X!}9;KNr5m
zu6E;|?gzXx!Td#eANQtXlh-wQ0<TDtcU*t7bEk_l?fv&0Bzd+R78h5Iqo1Jt_JZ;E
zUugeXn9kcYY}l&+d?ragkyE;{PVK(Vv%~UfsyBx}c@yyH{QH_TTO^KeZyvN?Ou(c4
zpKi5o_}#PY^-s=6Pw5LjCL2z`!*dp}85ABj%`;v8qMr8sAp#!Vemj;r1-kP#(!T#k
zG=7v{;}d)!PBP9Hj=!n|?W4!<B-?jF;buGqFdkt79&P{HH|O*%@|thtxfJ~B5)6;^
z=Z`;s(Ca^Xm0ClBJ8mc%J{aAzG7+?ouD`nV@^`+jY8_^$p4he!w2z*DZmnx75*N0i
zJ%5-<z@y_&?^?V2hrySJu>bKO$qN*+y0uR5X8~T3B=6hHIDgP{;Zfk3Nb<w?+9#FM
z@mzxIuXR_)Uw^2-wDr6EZeJOAviL?Cd+L<Ai&F`B+KY;*6K=iM)d}@Z=FZUnd;%Wz
z|AGC*kaA`n?fVbjBzb?iPYL@s*nNlbqrX26+XX~){3_2I2L+}dqkaF1k7WCgCz?lp
znU@;|<L}NJ-#<G3K6=UiX2FYxVE>azlGnIcU&r;;%K_T=AjzNicjs4%p8XMcMUs5z
z@#)Ngx7X9|KQNKxH+b>3dEOX)0iPf0a>w_F?msr0@EzZwu#fis_C%8W@`WsJYh<39
zp6oIonIg^vJUV}-%SzXD`TTtUM9b(5QzhWh{+m8n7F4tN%UhVgJOn)2etW`&jv#)H
zZ@~BGjPDQSxp^jV85SH?hw)dE<hytV4PQ9*F+ux@BzcA)ZSUwgO_soWkmS!>c@GAu
z?xVdwLYpMNhDXeUBV^44nE%2AJi7fdZ(C+;CEr1Ney;z@`2JCTt&F*-plWO+w4YCs
zpI7xhO8M!!6nOuJHvx~%zXzeZbUKpD=7E200v??|jlsnSPIxub&L4#dc(i@*Mf~>!
zCM=|V|8p>#oWCTU>I?C&KhvH+C??4VDyA8fx1V5x`=5aXJbM21t#R)3jccY4fIm9|
z9`)Ciw(8q!hiV2`|B3`WI)Cg3UK$pD*dYYRHztz2C&$+(Yht@B%m$W@R8f~TzJIj;
z@gHYx=Kr{acKtb(fJgf;_;jcEerreC#{y@PJde%L(4kmEP40$CCt0d5-jyTZ(fcRo
zyZHNBcSUdecX@YFo_5cr+ZkZ{BWfR=|2L~1ua=P*Rso)gp#La8XX}8yCBx2Tz_(<M
zzy46ZLMgfbC|^<q@Tnwud!b#7>gn~g%Q7AWJi7ivjhSr>)s2tB{8c2$rx`AsJuPes
z?fGLSlDv5L(@Y;%wjkL4>MoD(5AFZd+V`c04>;4le-ulSAKGT*;;6om_E@etN#3YO
zHa2>f@A}i!&riZ6`I|b%+N-Rbj)4FEOXSAyEj)Z}(KV&rd)y*!=t;I*%_rc|>zDa@
z&EnF7o5Ml}%tyMANWi1_KVG@*2y#}Mu-!LieQVR4JIlifc=Yqjhgnu%j3U+hVf_=e
zkFNi(76<3E3A84{^$R<K_R;N6V3GfVT-g#8XkU(iN86X?;o{5oVk(37DFi&){-c#E
z56hMd3qbpI8RXW#3+v<gQ{=2^_djDv@?vqb1%i#WY0qDp6YyyN*B>jay4?|b5yme`
zl7B9KKuX@|-AWigg@8x>%MN{B)4N>R7`C6vbaMVa*LAl?W$EtHq`v<yoPbA<zgNGz
z*7{vPQV9LGBjC~g7adm0edIQ^7I;aLyz(_lM#`IrZP5S0i{p<U?Z1F~Ub&2>E$#h3
zbp$-xf9(ZtqTi<PvlCiVefZ3ddf`|C9^HS$Djet5nmg13pWgxrcy#_{IV?IZ7o1iO
z{tO9twErB}W#({Za9#wSk0gK1*umW*Bhd`_?hE7lN88U0aLHF#D*FMppG*QC9e;9a
zMdq`^ENg-HCdtpQDjhg!_FNG9uT8+C{Wpr?+;dx9eSv0!_sFGP9s(Xc{!DroRKF!`
z$&<pJF}uDl%zQ;5;L+npkwc335&Q2~;QM171U&lr!C-@L!y2nS{ILJ%Pb0Vf>P+st
zd3vpH27mb^`S1CH%EjI8wEI8aBzZNSm_6N5beo`kRg(Og<-<Q@WTI*J&p1f(x6Fj~
zcP)HAYzDvon>xNfbpCoDd|j)@KJy#&Kb3$-=ilprInD-BmV>}MljJuEd|0E>w2F5A
zEJu<LIJl}MoW+aw{e22aJ~F4zH2TFHcj$lR`SJas<9}IPd-Fl_;X}ZOljOsh&VDR4
zuv-oLUqb>OU4Pn{!710Lr-}Xi{La?$b0ZQa;L+_b=UCI-?_6~+Vf$ku;L-8l+Fk2o
z>$Yq$e1E4dWqf~V`{fbe6)jj2>0tkvNx-Aym-`l=;>NB^JAd^i;L-j+ky#`;w7*Lo
z)}Ja#o;hae6Z-4HwElAt@M!=0Ss8a85L@pA<8MDVzCV;-z4vK)<g)j)_a|f$@aXvG
zcq;O`tZbrP|MnosH(3YlyQ(TN5&S8V<mH@$o3<59r=9;Wk>u|>uUF*~3JQSs>&}kv
z4;}wf`TJolreZ6Ak0r?$drjwl<UK&!f18u!Hw{%Nu6ER;`4c9|ryIXep;S5*aTUru
z5?y~jt3P@C@uSCo(OmsaTrWPGMVuYo1GEtE=={qn=H?a<G}{IKQVDp}|F^QP9glXa
z!~pM1l3)8|;o-xM^DKauBgt=7ri82Sj;DQoppfKG33Z)V&)-D*{%z%%@%^LY4>>ZZ
z(7nm_2lPLjB!A?6?N`;?cjAFJB*{O!DaWP2<3{txN0PS^-xBBgt(12Evpb30_`R+y
zaZ(hzI}he>CIOGm-^&Y&cGwB=$ie)LCE(Hd>su#d)<Xa675K9w;L-JGrrLg^vUZ9&
z@RB5XpC_kom7kxy0QkW~a{lTvSFUr&EpGt6m?XdUNU5Rkq9oe+Zy-rt_EUn=>8TF1
z`KwKmw`_@Tuho~PJ-^38lJ}%+tvUQ=)=e0H`)P9iG<^GS<~Y{Uo_|Os$!qFO*9zIO
zxDe*AGXamz->X3<46dr3@rL<pNWi1>mvR5X%`c=vBw_r*1Ux!_uXyM5ALD4CeSYsx
zAm=Y=VtZ`!u*VT-Kc6IT^G(ICX46-G;Jr!mgGaeeZ@%%2cKunEB;RShBVlqLGwu0R
z4w5`GQ<}A6mMiV^L(3_0{<N6Vylv{eZDIV0B>A0f{JXmvSR{bABgr=zHcy;b@yr<J
zuOtDF&R<G`^ZN&n8|q>H@(}Ro{MF^KS~qdCferM(JD!}s<PJKwFB5|rfzKq#YkWQ-
z!B*}}+y8rz<P{X0;w%Lw(B`iqNnXQM=grEKwJy+qCX#$)mFnS3Y_?p$*PSHiFMaCW
zr`>OK6{b)x48{`h==DqX{*P%<wV|}@FU|x!y8r3iqrJ~#dg@&0zZ^+k;lnx2i(5q1
zfTxh;6EtVpa_o9a`~Guf965irg_rl)m)$rB?T3@(KShM(ih1o%1m2J&FE4WBlt8ij
zeBk*=@>xaNo43da9@3v3*}IxssJZ*Z_~WPDsH0vm2xNF@bp6NyC)obm33zn-PtRIy
zY$>I|0sYS;;L-Wh6?dWAv-e8^@E#<2w;+?knzUP%z$=pE<<edD?KjSi1D=T_KP@b3
zjqGx#0pROm$M=tpKVBjsO5hD6?fpZsB>CYGnXhsR6DGm-Z%)9Y+yC6N=UQ`?U8k)-
zIRYN-|1G6v!};FtXxC3EB>5TVjhLfrHk<%|l`-V}F(oYEVa~cT2l#N3e9tP+t684n
zuD~0T<lVwQH;8b({{TE6Nxs&;t?#vvi7svXjUIpe==Qr|ziSo$wCks7+b;o+Zof|i
zxwh|jcA_1BG6{He{W~yTUaK2c_Xx)CL6W~+qOn};=|<Z1S4EP1O`&USb!{~5`Bf&8
z{7!$qH?J&L(w?8KJ3hXDbo}Z59G!lpDP=JJSdx75+sc^}rh4axQm_A;6Y%Ky+vJjX
z5r-KoJfMA50v_$Z%T~&gyAvC(1J6N{-?492se6kNZU5JDjGVt4W^S9xH0RN-za*06
zEe5BCoNd}p`~IsPNq+5n@3;0XcAhYPNs@ew%0|_!msXSy4tHa!H$N8}j2eIZ==V3L
zZ=GEJG-MzEwqFWC`{?$&%wyTAW2VfLwo>O$9YOmj|M;-JsF6$dVc-)<@=raMp6i-z
zRG8RoK5|CkOp+JyTkRs|&m;=%E0W|xhWivUH%+Sso`WR6$h_K0B>etG=zn|U`0Ee#
z$5}MNA&>q6?f!2j0grBfdY84i_s`zl0rSs;B+oZ#U7w2T{WI|Vn<4>^_CHjq>2+GO
zl;LdZ=LZe~9_@bs%Th^!b-QWjzbz5t`$PG+y3_dY)7yl=_!CL;e8OTJkL5S80&ho>
z=ZU+f#k^m3Kk$+ydFd|6WwAmrbifaWlN<k~nir21hR=Tg`TVNcuXD3v0v^5p*5=sB
z+jgyM2K;_yA_0%Cf8)vGG0zj*%Yk<$$v>&>V@RH5eFlF2QjsKY8K#?dd%=tO^I-lF
z@aX)BT^o0ij)CzJ_2UesC5)W^<Aqb0PSxG-2R@M`|D<|2Vr5>V9;|;ml04Ha{?A)4
zuIL3`k|ZCeaWSNAqZcP^|AV39j~`wC0gewiEjGS?3)_Ds0gw9MHC^O!h=~sE{3o0w
z|E>6?l~LzaFBrceN&aB|Q}b}WV`qWqBgqTyn8gvPeU<k7MEBA0{h{Me-Ci+8qyH=I
z{!J!H{sdEJ+|t#bonia;AmGvMU*=92#r>e)KG=Q@33zn<f4R_hU&1Zp0Bpa)BzbH3
zE#KpA-QNY<@8A(~{-%7>NI78_oeA4tF-hKZE8E_^H<>>IA4rn-yi_w|+g3W-@kg5^
z-*eL=UgLE_3bfBdlDF*bTI!m-DR2&T|JNQu&fk0&t<8<@-74_?yHt{Vn_|y9?#l_f
zu>PG1cy#_e?Jqu{oua=6ctw)@;`kp0ne$k5Vg7QE<X7*QqP1tXQZVrC!Q=Zw`=6j2
zS-?DNeKPDnG6{He`?t$#nx>_|M|=OU2LX?^&+FIo%CDBS5uP7WCCO7Rs?i6!Mbo~2
z!$ZKM{g3fH9klfvj}^?{_Mq|op?qy&`x;|6zeO;AQ%Uj<kFB~iS@~Ej%pYe09`)z5
z#K!p%i<2R&e?^k~zAqvrxst1rVEuCt@aXujY&kr)Z2xjgSbr^n<NHJV-_dk5o_n><
zUEotm^6Vc}rTCik-6B5h3jI~L2LX>BKfb@XY_CEQ+C+Q*6#<X-pEFMF;wK%=Ue0Fo
zX@dJ%D8d9hdi`;JrptwX_0&x8Pa)t@|17M0=gM?8>$Y{tj8st>Fus3u{O)gB?rs+6
zr#D=<JZ>s;1SOS#r|za<bD<O^be_3!K(Y?{A4|Za{SQ$aWNT-7(*?XaN#1GJtsQOb
zO|<Xd3zOtq&N+%WtT=QKzW>+nKfXV7{VlZdm^#BuZ~l6{BMiqFzt62C$%}O8<Q8oV
zng-)fB;Zkh6J(jy!Z<JL!uhWq0guk#>OO(R&6DMap?x_59&O)dcl_>^8&A{jA5uv2
z$JLfF%(2?`kL%xu$M=u6KlQ?q0@)N@Rp@^>Nj}P;RGQ)HCEE9A3`z3mH`~5&bXq~X
z{?12|f2vS%l=)(u6x_e)_8Wiv==^Kt=3}<qG&2h3UolBux*?EPs=)RN_=_drQU5{A
zroo{?lC<v+nUmy2_H93WXUWTLh6}fkJen^|z@ziGPKwpNaCr5m&EE}zK7Rh5J$Pt*
zf9Unc*!xGW&ffbn0eA{Q`zX)cBvTmWn@ZasG7<2ozXa_?({{Yi+7oeh^!F3%2>Oq%
zf7O#_+gR2Kg~0b0QVDo;|8FRMWXRp}@&s7_fdo9-f9rLv+0V}wI>7wXCg9Qjm&U)p
zlKNep_WYzU0gtvX(Cq)vk4=yE`+5Do<F9{|U$n<+sWad7i!lCtlKfVyM-B>HmOQ|F
zljMCgOX?Y}J$eS)zbXNb`fJTwB)OFNgf95!Bgr41${|yJ^&;*0xj`Rt{w_-G$m%-J
zNxOehOp=!^o*`+MSX2tze;@&mZvS@!r`)p@A9jQ7*N}imw_kd(qUKdqp?iThC&@<#
zdB57g+o=UR06PL6oqv~>#(i9yFPIP8za#;Vu7Bnv`VBL(9!0?R&qTnZ+kaQg@qU{t
z&9v>W+ne0_zrU-?Ns9R&@88KJ$xoOp|Kd>H3EJmR50bpi%90MbiJYl${-#L4qyFA4
zPqE=`l;no(mxq8y*WaqTSLR&Dbj9HML;FE;{+JBcWD0chhS5I%5b)^y=k++9b^W2K
z5%3-)`Ga$_XB8G&cmc0UlD8HARIF-kvl4h7lKj=!hsE#O4PD{<wfn&M{?PH$?GWBU
zZ?{AS_<WN5vyZm7Ji2d+LH`3u@+XUWG#9V^d<u9&l6>2ucqTRF`LxeZ!UQ}z|D^P;
z4AP(NzhyQ}E$)|_{{7?oL+AfiC&dc;co*8&A}a}awEg<@i$RHdPHCAnjP3!$33#-9
ziG(h<NiK8W*EB0fru;kwvLoQp`~R|((B)gsXKBOst4+Y8{TKA)30^KAaUXadl00L^
z#Q98g613;P+r7s3kG8*pJFv(p`|L4jKb0guv142M>}mUQVgKVyl8<hB>Dm<HaTeyU
z908ARfA_;DcN>c5^#IRAlHcj(!Q-=S8}0p_E&Imzhqk}EEL3o)CI2IA|EVPTIg74&
z1s*tN2>tgU$p`p~S;X-!qy2uGDoNg+-*fkwJ?Wca{qqp;==|}WE?7D%S4k7L|8~#u
z{h`~Rmb3|HviyUezu!K({pOS8U4&UaeQe>VgY7q*fJe9AYrS<mj?D=saQ@^$z@y_=
zQ!ewKcer8>@QNgP_xaLUg4J&Nz%!BL*}q(pRARobP5E?i9p_7d4Rw3R_mBR5$sU8Y
z)PQJ3+Vukp$@aZ>*{Ggs3vPq=k5&@2kDmWAELzNIb5@euaN*C3mp}hYCE(HRPcB+T
zU7J0q!JIm=JV^4*?v1;?JiXD$6#MXkX<L7YDgn<5D~cM`7hX|X?%utoI%e%dQ`Nhg
zb_6_n{c@p%sLHnFGcB<F84~d5{7dd1dKA6Fs9k5FNW|IQKi?luz@z?kIIdhUm9wYa
zf2R=eX!}J@-b*~4TDF3gN{{j9AIclcPi@Nz+)sP|NjOP<s}T1IKOecv(7qu_{xu!5
z?S%osDJ@N-Kf%mLz@z&w8wR6P#*?mvCRdh@tinO}@yCzyw{(P6Hj5R#GUT$TKmYUn
z|8*q!(%1tjHa_7!&y+1xv=gGsQwezV{kx%FN8>gn%%FWNEhga6^_L}VP%*7?;s@{_
zNRn5*DzfzEFnh|B(roPjcE3bz0v_Fd2ATSTdi*zc!}Di~1U$O``10VuaG}G7J8gBb
zd)`SjuIC`&(d{Sg(e)`G7p{DJf8pMd{a62<@z+1v{_(y&brI*v#aNVQZ&cr9<x@<+
z(^eE!xKICC(M5eV&!GKE0v>Ijc}dm_v6v@;aQ`WmBp>cPW6>RkO4|9a9RZKdALrVq
z$$QV8vrQFu_`<k*UyCFGj~>4ldAjcUbn~*B!AXzR8J!kic?fuP{#etk|6$rOoDTb6
zCITMq|DB<-19JssB!RDU8-M+yyvVg{9bQ~d+br!J)=3ZVWQs-jaF1iKX^lj5{ClKU
zewmomu#f$0P=G_`EQ&Y6XL|n5OZ`?Gg;L3D*Z#fg;{~1zdCCgiv2^JC@ecc)r@d%|
zT8~)LlKT@j-5+?An6cU3#FdePY(LuZzw>DSKkT2p{?jYnT*;fgx&Fhl?A?g}_EW#}
z==1lK42JdQt66-^!W?6Y3;fyI5#BrTcOHFz<Lvq8=exM7_SNOpS+eEF(WAWc+246|
z|EXf)sbX0oA+Yy?&m{&PZKgq_{kqiOdG!2YfSG>9&e<ZTe*F0Hwt+>Hg$MD+k?}i^
z&Y$&K8v7mz?6EWSQ%n4{ZKM51RyPIR{&`>PUftOlS_XV3(tjcz`U4TlqiM*8=mmdJ
zBfM81en<-V|Mm#OK>La2kCldeh)@rtA)@(cnrykT%0oWHvD!hGLpd~}<<Rs@Y6i*?
zrD1=ImV^5LY((q*chf}ufO@;Xjh2K6`M{&;vGO%&pG2X=_z~(|GJY`%(Q-Zl9@-&_
z+6+)){0gBQL@1r=JNg%z56dC8!vmAl3`i^9TnI(}WrTA7a^cTRSl-W$p6UNi)Y)*1
zWbFAedPahlPc$3-N%i8DJ4ed#J*8cu7)d)nU;JBziN=h-iG%Z0^mv1&p%S#b0=2ey
z^nd{XH3A0_t)GZTsv9%OukrgLNJA{9E`~@M)kpcKh?M)M^3>)3Zg8QBIEYj*K%EW{
zVewh2U+Q$AcvG*0E21Y#0FaEksq0Y);WVlF5MeP~2#BI)K!nK!`&~Hzs3(LlO(Y>d
zpZZH#Or!IhqR2J6M3wppCX-rY3l&K8gDOTd_-;c@IAR0X05(9%0PH@|NUD<mQ5fp^
zA6dWs3CkfaqArEVN8R1Q@e$%zYB|`yLj0}rzfl6t6VM@{`Dl8q@=%VfH{gisg>n#~
zJftE1r}Cj4m_LvnD?&NAZUNUnpx=;2d00MHgz{r8A1nXQa=`!52>tk@<#D<HHwNO7
zYVD}$Sn33ofeS#?d`LT=A-iQG4UtU3_5u-b=>K0Gq5eM`$LiOgtrt9?v6xyhL}&-n
ze^rEf|7?W*!2S**)C*~dcGLxbb%gf*Y#gg!f3{v2KN|mRy_m-a{u>PVQV%C+^rxOE
zK)yHivISf>LF0eJSbp_EhB}^j>h&cwUZmdeggAkE83y{VP5r<U_WRWrSWL-ar2RSa
z2h<O_=yFJ-5z6yX+u@-0+nm}z$cJ(eC8^_r7*4%>1ZgN|f}AEm8sb>xARpo+>WT6J
z>iUQL|5Swa2@!ll8sZ=A50oD(Lj7oj@_)3QvC5&_4VreNf@p+tW7Yd-^P&E+BHABF
zqvgly2b2SkV@1?Eq@g^_Uo@iaLVIXF)Pv^dQMbc`)a?e+veYz0ck2G(E%mxIY^Q0|
z?eZvfzX^U`Q5%9Uq}-skvxb@vr}=1Fms%h66L?75QR{*FA>N?w&(H`Ql!FNQ&|m1^
zSP{4fR4-#iC^uGIv1+tsG<u1Q=8x5XH>wvk>g9AO2jjr;cLOkw(TL8c->H920S_Fc
zp(Nx(`acz6dxi+@LK-6ELxg-Z_D~C;`M^OWS`Ou)zO%^o49ju+-!+g*ZGNoyzuUY2
z|Fw=Dw;}yU<DWGK?La+{{-Y7jOE{_L0q}XEAAL{|8o-g10l1$85cM>K^6y5d2aQl4
zQ9hJ|i0<YgAFT(<q01pnv>ZN<!}WYLqV4_N(=h(O`#ACV{+xjX*ubdO2vPUTb<})#
zt`E{Muf~ed8+1857o<up01@&bLO#?3X^2n`T@LC0RD}KRUws%uJtM1!0{2;{m$@jg
zUxaZ(daMZL$VT*g5$O7bG}(HgJdBHpnn9Enn)tgJNJE5r|I-nkZxf|<FPz!|`2A7U
zK<b4GYCfdVi1r(JG@=}&frm82f8yy!jidR%<M`iYpg@1LKkSC1^Jwve(TP@7F`93&
zVl+Z}`;pPKA@9GAOuD1_XdKO@P|$p|9=n^r*9#nu*udYxz<KH*=D`7#nudHh{=?A-
zA{-APJ(i0F$O1-c8aOywKpH7dOM21%8vO&VqeDN?C`&Dm=EHdnQXMThRy$B1QRJuA
z1l~X^^aI+5@s5=b%V`}W_yg_tSjE8`)IXP65YiA~oREeH^+Lbld<OD~BH4bz*Lk3y
zkcN2!?GvS8JwSx>OBfeXg!<t;5yp?^!*Zw((nMaMK6HM-Jc8w8MYMi6zl44O2lYc5
z{6QKb%0WIvv^|{uYYl*BI3I!YB8ZR==i>{h&BNzMRV0lrhjI|n<$vvHC=_`9mZ)Bs
zpG4)RBL!d_NcNaXv^+ZBAr1QrZfZ@CKW4?$1!L{!{^<S}_H)qQAC1s2*e^jEB3cjR
zj}@)PSODu2>Vy3Vq{nI>t&YeOco=K{5AFQf_(%J_02#pl*7*z^SJ22$?H}aBaUAmL
zsmo!!$Z-D8Ct)7I_+gxo|9^gfcmUYIe~|&$zQ&3~UHx~DFGThJw;Wese>+yBJ{Cn`
zr5-@xd;4g4@QaQc%E9?QMA+ZKaT(GO(R|>b9XP&2g!3&(qx~2w4fVl!DwKmX8W&Ov
zpzUM=_y?mjwVco&EI(E;;2}bPp*(nld`QFjr7E=`q=AD7`C~;W2lav<Xb+80-kUlx
z;Cq+wen2P><<J;T%`itIaIhSWP>(nD1Q*)lV;Nln<)IuJ&8Zn<MQ9(5;05v_4L%_a
z-XI@sAJVWK$^#GQ6YyGv15^NA4r$<_UL40a0Di}cK*MtIjON4ogY`rdp*(sX5A{+v
zBiemP_&hjPgwN&ho-s&6eQ1Psp&Z<Afc+-4PZXg)X#IbeH28ox*0|8)KKgkZc!*FB
znudIs9~9~ZLnw#NKQs+IZ9m`uIivCG?@8KyZ(25#SEjbuN<Cu3dqp5ZK15mtf9wym
zAAgL(rLX~P02}zfYXIF}qv^3m2Ia<zW9{!L4oHneX{0z#VguL!Hh>La1K0pIfDK>+
z*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UP{5b>g+#edzTKSO-
zNTU&o!Sk$8FFf~7HbQ+kVguL!Hh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La
z1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>L`ZvdXxf;fKZv6ljm#<2)^e=EH2Qi57=
zEFRt)2=CR0_r5|t#A0eaXoPyHi~sfk#tRV!4BjC<Rs;^>Smkg&Hh>La1K0pIfDK>+
z*uej71Mt3Y7{xZ~AA<Nq5R~AE4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<
z05*UP&<qrNjXvR`===MH^h9_;60PLuAH_%-C;wgs6hE#WnFuW(M}L{qf9>e_{<k8%
z$nWzKZ2Q6wW<$mp(Yb!{$dUsmXZ%)zLw(jrdaT&(Ia)mOGWE$MI(U=VZ`DvT%ixJG
zB)|CgCz_y~_x>~RsMzlSHKjN!;9urLruV_oUz~;r`C~;z2HufH5XUM9`Q`zfqvg3r
zpMX=OMp)iX{o!kfke^8%FN_oNA)@)I=ec3gzl_c=nMPKaValVC37{JAek2}}HyL@P
z?)l-I5iVVM%5RZ#7T<66?Q|Q}t=Ti0jmB3-qxoq3trDET2L6v4XgU6`_n&{&aAM(y
zI{&H)|Cj2qBWPFAv-7w8cKB0|5wXrJ+#^RKbJ@m`0|6Shrpu1(uUyg>j{Jl;a1fzc
zNJBY@uzakT*f(jkAJpR<S`LnXu>VCPU)!P)WKd^xo`|xH)&TjbNQGmiA^(p?q*|QB
z2L4_Ke!w>fMu!ETui$f4@!xB-cr@4mHh>La1K0pIfDK>+*ueiU3}`d_etiYftW5uU
z_^|x1imU#0GZbk5uZqwNwD(s<_<r<Q5!%HO8^8vz0c-#pzy`1ZYyca;2CxBa02{yt
zuz~-p24as|jC9?+=PKK;KOn+*G(xyW{tVYq8+o9RY=nB24Z~lf5!ywg+UVndl*iJe
z<^EsA-+M!$K)Yx@q+vN4DXR^By8x$nc=iZ_MsJqoBl!@aUgxQ!e--;ML)J)i8+lrX
zLQ#A&nr%jXF6OU}&`ufk=^`QOXdwT$PW_JrEJx%2DDv0*`9)x~M}IJSvyFQEqp^71
zXgB|8q&|L187uxZgZ}ficst0ARDvV+@M|LAd4T5uo(KQD9Vli@8`)3(-DB~!(ZeW?
z*u$?0kLLlN2Y4R*^LC&%ax|b&I8KcI@pq33BcJ*y6dXs_H}-%%{4#*&0iFl{a~}9n
z9}xSy$A_b<odOY#hmb}iwK#=g`snw(Azjuu`d5QX`N$uMEm0%ak6G75jHJ^>zcx+z
zqY>)G@vkvpt3kccPOWZD;OHMEyaz`9Xy;8CIYEA2VLFo5qh6l=qmf!I4%ondm4QT2
zi_sTj_=^12uf&z3p9dk+{73h1FVHX?y$wboiooOe_cSngUEsHYsZ!q$Bdoi4<c=Lr
z!1s}f<gK)HWc~<Cn~bEHj*lMj68Sks_<Rngk>xE)qc{5OvPa+VQt3-SlJA_yK2k2Q
zee^vg99|Db@?ri#echdNN6OVr9o?TpecchGHw=r1M(c(8e(U_tgs}H$J1s5L8;;Zh
z&<;^V>!YO^_R#(u`Q!DP-_w6l$~)rsenYk1YvHedFa8rhK&=NNRQvMx{RTycx&V#T
zY_wi)>gVr28lhQQ9HibDhWcA+OGf{Y99_Q@h?%4Jr;$<=+H!OOjYGysE$96Q--Co!
zOF2W$K|R4~Bod*WvF^K$l@IL_Er)VA{xt?*KGSN0^^N1G66^tc_+{YVoCo2f_WtoN
z)B`!xbTRd{aX5~O!5*-OUk3i&c`#~^LQ$puf#awM>;ZfDW#HeP2k>^&vEry*{4X|u
z4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+
z*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pI
zfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La
z1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23y
zHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1Al=5<q4ye{D-19+h}wDsTfXG
z^q-2X)b_@T)WtYp1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w
z4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+
z*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pI
zfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La
z1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23y
zHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UP
zU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<
z05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w
z4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+
z*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pI
zfDK>+*Z?+w4PXP<05*UPU<23yHh>La1K0pIfDK>+*Z?+w4PXP<05*UPU<23yHh>La
z1AmEu34ci~xDspt8^8vzf&a7tdRC7|cQvc4=_vHP6H=ll#!c{eq#s(sQYy*n|L$ns
zoY`~Fe_BN6RQPqb<D3bO>b&JcA5`w&Un4#=@IqZOKJQfRe9ZurkN(RHeV56rTn&4r
z<9FMpvB|AEf30-FfV$C+yG8;t<-F!BdG)5icT-Sr<rQ@))1~sx{6|*oH{}1)`TA(e
zweYKfYo<%-?(rA#ux5}rc-e%rreg1|S$-!^=6n&^+&1HwT=YpNMzL)^p%ZL99)*Ox
zmv*bVv+>@ZWiB<Wm8`0F=qFTo#Ab#>?3n3mYZo3L5f{&9vmoST%K7NC%K7{~SA@kk
ziuT_T72m}sIgmjwrEv7_)DY7{M>|U{Xt+p+L}@ApE70khZn^8L^z3Ku1d9?$jq{W9
z=sX_f9@BAp%*S;&_aK*p(9^Aj9gC_Aj0BByubb-d-P4yc^p5(_#x8qY<3h@bCXH;5
z_5&+S`<C+@Xycyax#qpMvD0zAZ5MAXDBtLuqI>z)!&%RU8|9~OpzM<4P|9ZP)A44X
zqFKl#%E6!4y2g3-Av2aL4^!b&&sA$rZRTih@42bE)M1K))Pb7aHw#SUd+i32p1%CT
z!e7oUb4h-oLFo@Yt@69k?8dpgi>$>SvPKSC+wEC2xB67)#++!iw4&Qh!i-aw9papj
z5j1n{a<<)N>r|5!q}MX;k<Q!jdSPn$mo8b^Sc8>Q=J&@x%L-{wsZ{1VxTeykymZ@n
z<;<NTolMW=d|01x)Q2wY(|&3ve<N&G=SQBI`kisQ2Wp3tH$CvksCs|voN3FY=2sN4
zw=1-gH6?f>G*TPu+^Y7kjMhranh+^$!@Xi&yUO0nGRK`3M<1P<DPtj%xnfPdC3D%O
z&rPO+Av2a-JuOjcwsWZc+d9!ZJPGIDUoh6YeENyz%a2d`l3u<$#^QEllh`y@&x@z)
z=wE!X`w|;6?d|(C*2toD)kjwNrC;6mB6a8P_fE!N2f43G2Op$7^7>YDe&RuoN9RJb
zSW2~7*S!m?b``!Cm&A0ge_0GigDqQ&L1f}LFZt>8j9bJ_r^N5;Y28#NW3RDCwIxCM
z<ZSMUYH7;Z$%QO?V?+0gEvG!MP_anw$Tfc{z#;n~Y3Q-5#-QovZ+B&?^xrbbI~Ga^
zJ8jpr_-tr%$p6{B{Uv6h*C+G@ZT}Itu$Ix|QHG(T(@9B=rtdm@Z_OS{W*9da9sOi&
zCVFU&ePc;w?Czn@^1MnV=1Lb-)@<+WDv)nGSzB`Ov}~X-KmD{4QK1d4HP+LWC0dJa
zbaZ@_REnQx)1t7dx-~4Rs4n>SIU7#nZ`XP|+Rh8`uh@H3al1p~vbNPsCyLfBPT<z)
zVQQ?8e{nn0XsB))m&UxiqEbycT>7jstEU~lq35w~%OeHrIN^2T3dy}@w<4aD2imRL
z^6AwgUgxudpJ(T&S{?9VV41up_W)!5P~oAr8;dVJjF>!Kr+;3q#4)}VzO(%32e$03
zdbi-qA$R4d8?}l9Q4dZ0roK|WS{<x^ID5V<eV?_Qn&cTFrg;Khg4ZtI^*+UPzkg@c
z?D{zdHM1U7U#`}ao^Q!7Su3MgaEFeblU*aWU~futVP$#3*<dRXp_vD&Wau9YMs}9Z
zx)shfBZ_^epu@As$-&e1RxvcNo<E$wGkwc}c}LtX$cY)wI$^A^k>jPu)iS2d`zNh(
zJ*VyxQt(N-Y?pmzYU(bLr>);YeH<KFEv^QIpSbe4i|%{>rd}&E<MuO0a`}TkNltN<
z4YxViplT^)vQ~CUNci&(P03@-hbD=Ol?Hue`J}jH#r?0jSqD}q7#iH$Xl9-CZT_od
zm9ni}abC4NOZ!uNhvdX#11AeTd&$-}$ytg!|AXDu75PbeEj>=T>XXI3W-0a0p58ZK
zBT3|0{6Z(zYkVKWXYd$ve8|3FG`Hz`N>ilEvmdL(?C9Jgxz}3;Z!TVc`t4&*)1juo
z+CanE;zmonR9Gio52$nQ?R?MFq*?3v!Bb@Jp6|xKMsKQn45#t-da=EpqMNx#qy9|S
z`Af+$?cD;a(p!h7N|g(|xKp+>IC=AMztM%LgV8(_<+dL$%6{%>pWJ3F!?e95W6Ku9
z{7UXayW;c%RyBRSm1%A(sFFP~euC2~qq^{YM>fW|SLRz(&v@7%z5VDhKe}btBNJck
zQxMXSc-i{w&7thPhkGtZKioN7FjZ=~eS<<@GUHA4Z;GGaul!na-b8*={aWjW;|IDb
zj7=Zc3-UHwK0WVYz{tMD{965+ptPJ<>m<q!H=WuhySeB`wWm+O(^(#St_ST=>vk)y
z%l3QY+1n%Np!-UyvrzN=#4wYmOYI-W%^PlbfAkKExc`|&N*Vz>SHE;{S2AwiGyCc{
z+Zp?>x)ruuyXbx+VAl!GrILD+uADZHpK~RoM6aeG<x?s5q|{kXHHVolZRAm_EZo-X
zy!7hD?_Aq>-FIe|PPsc}^>_Y^of#Y@4b`tgd$)u>o;N9;@=|3*-p$3EuKRwulHTdw
zdFhA5L8GB7bg@4Vi@%OMY^tJa_nhI#qfupbB!KxEPeJs25C2JbW~SYFXr8xYs#2@W
z%G`wlrAw#9Y_MXstSyRsaK?Ag`)hSk<hEvtblZm0)z7AG?99H!pGY@R*H`nInnBq1
zD|%W7T$Tktu1TCUG+dy>x>kB}nawj9zSoj2cdONdK5M2|R*Th?r^IpP3Llub*nb5-
z1En_gc*4>pqdgN>7j;?Y!q%^KPeV=3;z&SX{?BfewD_x(rwK5u8)7JDNJ|sBBtmJa
zo+@*RA!4G(qvN_IJInZ38&?ILReS7uH>tiU>0@39!!31f5#{1DZ{Ds~JX)U<wd@XK
zX4}4&+T!7?V~$rBr|Jf)l{d}Uu_?2U*~R*GxGbOFw=-F*tXKMno>W<I-7-8Qr-Jdb
z2;B#TO0C87&V0?iA<-?F@H*ygm*MhF4)i)ovyO<KjGP(qATTH9si&VuQWTTXohdJt
z>rC?zdwz@C=%&T%P1AVI)0cC`dcP>1vr<2NZELO0ilV(IgBaWymLH3)b#0aG%Wq0;
z?kt;YvcWyfc5BK!or44CR>gW>3fO$8IDLuqWL@`NEiDh}FK4qYFzxhS@n-m-KUewD
z`L1b)RhXAQ$T_U}RkCEi-RaHw{T4qM=c!b)xAye2zGn*hdCWf=WwEi0kHf!nwQ-@*
zliSPHOdqH<IUOjF%y*o@IV-Vo==HfKO<BpT?e)j@_3eKv=iOy3WxUTx(Z1tbk(Iqi
zVE)%H;kq;Wi_+(QW`AC`t(EyUf5mIgg|E41hKbKUbn{%u{Zehdq#imW_qk#cJ6Ij*
zWQ{9l<X@SUl(p)8)7gH<<>{w9Hl9=I`10ds<ITn1CY<yNElrFkeeSX<%$S*-I_dq~
zQx{)^=2S_>OgTJJyy;P?zswRX(_JU*uP<luV40F!SzLZ$#;KW3PnLa5H?(yNI1*X(
zj>Y=5f}0_u!;<3TtroKt=Wxx8&B&Ns5N*(XXu-_<E05yD78nmiSv;@|e7pCVm89mD
z#oNtJ=Dl6@iEd}t%&rUK-k-M}GDwLz!Rh(-PIJ-|2c9&)*n~#rGy8uyWjqwr>z4O0
zzoNZ-_3p0ikq-y%w8q7XSJHdfyYe2$m7K7JZZ)5}<0bZGH&ZuVV9k19S)k_iD8Q0a
zwjf!-!p8EHGKc5l&hlyvmz)&|pQ`7)k?0ee5^%!q1?#t;TU?{QW=N?dNBO}A?3y3*
zdsR5nSzl&m#>~&jnsUn^(y+hnaZA~yob<fHcJZRS)qbB}hA<y+P_o%*BP4xz(+Yi_
zG_wU-(|SXS))n=Ii5AhdS!Z}?aoCp6eP%q1a{=cX@f4;zNsI32S4_+NP$c-;;5(bs
z2SxgpchZY8mRwq$UzrnG@%U!=)Rm<ileS&Xnbed0HiUQW?im|5`C4DES?9a9B;ekQ
zuyfPzEfdOEEzk4K;Z=i4o{yD<m$mx2+<x8ZhfJC$SDsGaz<xK>_{FYu2Tz%p?A+|-
z|AX_*rL4ljid)k+AGHW&((lZjy))G5>SB7fcSZYBzJ=|Y(D+om@jO={!_N~LgU6vi
z&m#1H2!{{vxN<3{erIs0dgF``^8iCB9*Zcpp)a8|0_L-`b(4=~zmIpVSS5X=<ltvs
zkzI4s28#wbEhkK78ur<D*J;(YSBD#IKbD;JH2eOX|3>1Tg0j6KmUrYzZbzCq^Dk$y
zw>n+eMz6!UOKWI_2v3B}8avsk#!X6hj8v_UUAipOwCn6{4u+&KGoO`V+G#8n9DDlo
zPnmdGAM0+Fmf3B|X<&53*WloRqrsDQ-8GrFP~UoPh;J%?l~q(nw3h$H?R%Ei+}L>K
zZIpx4^aPQvl4QnhgO~Ioqy$)avs6=8@NJWjusHEGEyJ#+M`PcE{H5Dlc374MTSrd6
zmLRQ=S!-Xv$X%lFzPs#~KIP9Fo0si7SYsmNc<gR=-}Os9N<}pcce(u3{aS@~@3y%8
z_I%Icg1n@oG3EJuPerG17hhQZp7pkiLP_3j1D;m91$0~9CYi{TmdQCV(eo#S@bdf3
zZt?M(>wh!r(8^T$8I+6?>E5c>baEZf3@2ZeoD|Qw``pPajm4$9acY7~npbV!J3qfN
zGT>%_E%$>}A2!V3xRNQeLb$cvIrOIf%~L;Wl)_#<bnbe0qGCpC$52C){EBNzuCG~s
z#0ahbRK>kTb3Kc+uVRJp@$=KRZ3*_57rY*CQd406UHIDZFKwb5M0_9Gte17Nj_WjW
z3uw<jktg_NdRk@N7xB!lxAdmVvh0~o$@`=nsdMe8Bq;7bJB^{-c5A?7hoYr>%a-oR
zw?D?T@UYjrbs-VVOL<)T6;?HyyfW$Qz4mfa#T%usmj-T3^xRQs`R%-zykM>FH%qSY
zCyOlAYy4ei^Q_xvxkm9r&+Si3)7xfdoY<4`B<IcM5-!Oz3uX-7lB-r$O<O<JYxb$U
zFa4j-s74g>el-(aFerU3D@S7sZ|2skrnR>o><jzGFPoq6M!lW$LC(Q9!Eq%K^iO_n
zzitsF_GLdmNIv8(-)h&BWwnaFX_?H`Eq-ySCyU*Vyx_Wa-t1J)ku1X*^M@L0B_^->
zWWRsvu9P=*+r00cQ9Y-*n$fjEGidlb!*mP%2cZj+UpOskrq9@O)jitq=2od#Zuuk*
z&4%gWIvx!Jt&#aFrhdwFTjE!%ps%s%kdVApQufj3Yy+zUK0BU%`Tc|JDFN2Bd-nFZ
zZgx(k^%d{D{BI|B^xF2==MPFvl_@>fF+1<lmb2|iv*K@g_r9OIX=rkZg+`(_edLLE
zJpD@UQmT#*^xm5lWjbFgV;5q-E@`GTde{|F72Dvt%tg%dNPr7#P4G0=$u7E`u6nMW
z>LJq_^tMQMM2ZV9V%x9hIuNpGZAtJ%mqTpNB6I{Pe2jd0?<VH_l;jw`k=<94wY*by
z;zD8DR-ap|m3Nv(OU1PWKF;PobHH<*5{IpX=Hs?~+vi>m-OjBpZqi{oJ<CS)mePS)
z%W8rTN?U|4UdSc3%I9O5*m8wW-NI&{OS9>Z)2XKm)7{|eJHvTec9)tt&l%hI-!1DU
zKBYOVX|ed8%aYtX@qJZ?mI3eES+>T@vnO)D)9bn@Tfm>`UmF|XAiZCDj?ZnsHE-hM
zN|zt9^O*n2;0Lp9U^_!qx6d-~=?x?Mrjnh{Bsm(tb27_>?<moY*rW5H*CID2B1kjK
zdE4bTbtz^y^XSADE_2jpX6~=vmoT$df%p5)$cHH}idyyVO?J5OZOJ-@1%8sB=qj2D
zh3qTmJ$HO~xlgFU=6c<%v(o$_D_5w0=TC|dT2{eg5YEJJc{HUe@l3p8So)#LqNs?E
zfj@TK`jLBM=EDzx$JIM$*EW8UY_Zs7aQ;KU>pMrZ9glUN-8qMM(Y>6LQ(Z(1Ez=9u
zb-Uay+$Vm4ZiQ>8ddxy0gN=J<uRFOpe%sPzp{0dK_@b5K-tu%M7G6tH$zsVn<H%(2
zB=5<aRL|N<r!DmRgidTa6Ro6IH~f0aiWe)=-xhoA5?%1B`lGdpyI*6@eGQqwb=!o~
zwhM$$iK?^^^9*w<V=bF)&|;n=P+}omSTXmOTc2pW*A4p}52M)Z^*N`89*bMaaiK*g
zxwIgf`NL^d`yfVT4$eTalNn+!b&L4qKZNy0d<e8VUfY*h#`uM~x_4^w(rspk>>l6H
zIx1>DF{|OU8Qs0dt&`48|8T23Z{zpgSI+Z4AO1M$o5P;eKvl~~HGzD)gr~QAq?UDG
z3X@PN;5*Q9Zy?cS!V9idE3@x@m^`rZa%PV}s>T9a(>L4Qyk%L#E;KG%@_b6$#@?&1
zbFAm-FY?qA7;@%qo__z-jVzs%Q|5+(8*M(;MP66i9A+!Kp>ZF5u5fdo?V%m^*8G)O
z{n_v9uUEKP*_UNsxZs?8UHA4P?R&-Nd-c=e*D6;=Ru6Dqw94DmSfUfj8~-UX*Y*4S
z*Iq4qw&%R%FHe6GW4os8eZcGNJ$qG!6$VtxCqMIL-`vi^-1BO3yV3U4oM40M9TrYJ
zNu_rbc1K=_yb`?ii+`C~%qL?<w!>`uo0?WC#OQsV*Z1?-!18&6@3E;Y(Kmv11V6m}
zobagg=9^{jUOrx9eUHUQvu%>piJ_hge*8BMTV75oKKbT}oR{*Do=eD&3DNDZFXz(L
zjBJisp}#JExj8-X*Yn}zW<M@`p}S(+iDj)uEZeyYRr^0^C(?zB>O|IlKgIs}@q^jQ
z3ddUHrru%8sVz5M8g}&YC&twUG9n6#qdG4h9vDnG9>W$g{fab0WlIPfi~gy0_jivJ
z)K?j&$g7K8D%#y4!6IsZac$UTE7K_5Bf}YupNhXOZT#lipy>4ZZiNv`=ki%6GZYF!
zG9Rp%9mXW!Tpf6)P;Yf=`K!}x&VI2owmNo8y)Cli`=qyZ$+oDLfWyI4E`<cnX?#Ly
zlaKv;c!G+@BXx1r4WSa1wbhG*Y&Fz0@70P`N@y)zBzZ(uxs$hC`b^cCDsBP68PiKy
z7ggO;74>o5utZmVYDdwBTc&cnf-IEKvy#`QO!s(nafw=}M3peLDn^Qk6+=oRecvx*
zkx%Sz@o}j1@UDwu>vc3qvOdV++RQ5zDpR&0JGHm|>g8D*B4=?Z+1zutk&H0gtlLx4
z{dj+=RFO{8Kvczyf{dGbpHy={y?0fax9W9(OK)n1j`;Q38aHna29Eigt}i_zbffaB
zoM-36&Mg8VHm%Pu-*`9IVCzYh0nPOGljqCKUDmvM>oehUXL7N<EtlxASSe-EJICvU
z=A~ULF}$l^cP>W!DU(x+k|w*6m{~^f;BBj;MH}bRX)Rd$eD(@{_e*}uwpZ-jVE%la
zMlhG-`?MH62a}q~AD)J>Qoer<+pFEj68Q4^+vxAd%!EqoCBID?_&MTpx_5W}JTKk!
zBUOv9!!&c#!np=so!O5n#J6xpR_;k19Ii;J<2WaC?4&?#^}Tzd4hGYFCSB36btt;j
z8e+_Kx@2()Z(l)R^lb(s*?E(9_b|rHXBuK1==b)&%hb(m{FN_ZdV$-dDqokbd1BXB
zWt`<SQ8Vv2p}W*|=(zag*Q*`lOImO2D2oc&G%wd$vX94V+PNL(yF?vd3^mJtf3rYU
z;gs&@)6ObSobPQ5Tj=U;dGl5Mf{RZLuG6>L=NvjY>1!SP(X0N)8XsHmRNUbG6gcgx
zt=)t82&Dk+ZPzYJsHL8KGc6)K-Bpt=?*yCkD=D)b;R;5*6VLrx(P1SlhZI?rd*<mo
zo?F?xl1X3LX>0Uu-VNqD4{sg*zCX9gH-9;O<X&mXYhuZ<Y=+K{49#zpzZ#lzrb=Tt
z@$nL|r|#SCOk>y5RBW96vG26*?e6CiJ1wsm4xM^oFY0^p?YdUuGwO$yOj+?(l_~w6
zBHyiZRiB%Z&nPPECeNG`bz8-mY5w_jOeboWX3H(nEqMCr$&NE~=l2R-{t)bV;oi5^
zyia@-d1n7QEH7ECB_^U;RmsYv${bp2rNKDxY{E`srk1#AP4qu6>*{NUJ^FQ0&B@GB
znI*Q$p^-nt^uktAOWsW9ZHu)yI-1=bZYTxDq~{%X2~?1FdRjCy?9ORxnJrBltmTuq
zQn(+Nw^{lLbeUF3oV~5^Bslno%G21d_6IhYT(8Lxs4(KBpXXUtpFIEY=Ls`JvTi9*
zA}ULRvz6p{BPg4mPX5^25}OpdmUH9J|Az`+gtF)C-nJ#gOYUG=G5=W?nT}F}b32b@
z%$Zxdx!qbtH`!Xpr$8n3l<ODG?Ro1r*L8&|-)CrCJ2zo4MT6OR74JT)?K(`;BaA<r
z)tT~De|d3KMWai_WKD11E-s1k-2%O_CRMA?n>{F)KiT+xq2~>aYPq*ZV}}DRU0Dj1
zgShn_6FtlhUVq59ckOA<d0fIv{U=}5_tZRoe|^rgV%}BmYw1pCq#YN}b5GlxBx0z3
zUg=^(?C_z<Ne)_H=Q44q7X}69c9@>t!0j`sF8>OBdwyi%TIKfPoJp7MtUI+srwe5#
z?UV9rIXj2m<qms=VZNnS>T8}4>#OH3xD>Qi`Dlw)=C>hV`Y+)gGhCuJGR&y<9OP%Z
zF>~v-tzB#}1;XhM7+6?USwf#PT6?mw`MC`*74(wxnVH<U*TiPm&1DVgBCXB}y>vlR
zSFiW&x)!m4^YQb7)D3qkjhh+HTVL@Hk*Mn1TH<q3VUmC5tqsP8^SJ9*oa9)YGgs_n
zgk+ZRyYSi3yw&oL<u`qwBC5)4`Ea7Yj8EkHEmqq$yjy+W?c?RT<mWX>yuK?bK{HmK
z+7l@LC2!H0AhRBgnAWSpA3Q%5y?3|#eE(xlYloS@6x+D`iHScq5Vx8dmP3*p^yXhw
z1V4Q?X4_=9t}-J=;OJz3m1#}4o;|)=uU_&&PI?||>yEsO$+_8UckpuWzWq>VTj1Oa
zCG^Rn#})~{vy%<aG?`f!lIJ+(`mpnQwesw{y%A@Z&N`T-_S#FNz4uw&qPTTmPDrhJ
z&J;Z5<G|^T!>{+VGA+GPA@Qi~<;9t6k8ccCE?Kug+VG>0qt5-v@|;=f;wiHJI~+H&
za(O&jEKwz@rg^to?dZl3M#_9H`u-U+e;y-h)bC1c&^o$NBg|IgaCXDA&I$I7O!Y76
z>VIwZ5jvqiFB2)3M?}xA<Zn5vY98*BQm{WMC~oJYc^=Z<|6e<A0an$vH4M|;UDDkh
zf;3W_l9EmdN$HmEMp`-~1!+VYq(hMIR76l35%t>}-1qEzo^$Rw_uTir|9$_<d|0eG
z#vF6h9COUM)?RDvVP~_*BcL-gj7=543YedvE1ZM-{1rXK{LVyh?jQk;=A7|&yptSe
z!U2vL620L9?e`Dj3@E<BF<U9)IN)&)$RsZ`QoT4PpXPjFqH2$CH1I_{cQ~tul>y)|
z!LWsER+X)lD8%<#@&spv$4~eo?9BZn_X)+Q#|N!;N6f%gl7$bG;j7Vmt&KPr;%3n;
z$aaO|J_X@(#y|42`ql!9Ml=oS7Kwy1!s6JvaD@~asv2M%fFm_(fYL3F1ZV73ELm0C
z6k%JK-#I6;dCC?to|Yr<#X^<zjGEp+ZYYz66OeD_S!aXjqyg=ny_0P1cAU`OtunCs
z2Bjy%DWCc73;LSdYiNA}-z#bL?260USV}qG`_*Q0#oyB>U#h{(@AkaQ!31<X<KWo9
zn4-!kM+tANC9D5uCmt3oGRkts`ldogp5`7wa;Q3I?0yGPASv^RqRI$68<RY51c$Qn
zusmy|C95QkB71*n2fg7FBVC-awDhNlGw`M~<p>8<W%m@F??qACLiwz+P-BBe6S&4R
zvdPDQR%;bz_EF$Ki#sBcD{=vw6y@0lSy^H&0g9zi*vXXnDAJU)_n15GF(n%hJYf!Z
zfe+S(Uena-g@wAvA~{090RA{QsxrVDiwK3(4dX>c3WhmG!!3tHYZ9ZdK3?W~K+U0|
zO(0_f8wWTTf%hMkA`qc)VPNZI*@4!Kj*Td>DJYJ}M{o>sutiw1-o=+w817}((kB~B
zOG!&g%1J>mg@uC2Ba^2DW^Y9mwgDDS;9ezcytmiULc-6&P+kP8BM)^m3|izD3qT40
zjqsmHR(*-0P{62A>d&ND8q5SJ4P>eGkJ9YuWj0|=6B=MFrtgD=vcTi6?||0xn13)N
zkJ3SjC9Ni6J&94$SyI=kszSko6*TwFOLdy_{QaDnKchjwx;UPtq-uoAT^JK|7TPw&
zr0;REUZDZ?CkbCO?H*?8KAWyGY|T@cFcTR=J%+~+HdI){1F8ON$8)d)9e3Xf$;?aw
z_^WE41WE@d5}dfty^B1Va4Jb#>2G2o%dgM?3POmPPox8VSggKZuz4ze@z<(j#pF{}
zpgM(D@t(g+Dhl{WM=wPW_6^g|m;f$ohtBs@;d5WDn*#8Adk>&YvWZKS_<_+qAb|me
zg$CE*u~SSUDJkFh{nLB%=LI(VxbVy201_0<P{G9Sp+2QUMC?m2Q;(oKBPiHtDXt7)
zVP{ep2JRKF0>=_?7nc!a1C}2~GZ}F3Sq1^hqtPlV!y`)3z?fXeBLq74=>p1<JO{8h
zU|>XvmHj&AECFzbhtBFp3JT8H)DfOLMM4oWX*ftRAT>FpZxPZ`{=L7dxaCKOIDo@`
z7atg}Xc8DwxIlT39tBdwUO7~G46$trS_Y`i)vi|MXH0`4g4I7#Blk12nujK%2y2Eq
zvugb_jeL^$dm$Fm@EJb9KRRX#3o~v4ZCaq-pODqd8lcTQ<_%&LQT#d4qz@F<eI)@>
zYz_RcDc5)EWh7d>k4#?Ib_&Jknwpv|<vKSZA~H!2p~gqUE$lHXB8UQ<lap!lxulOP
z_a7sCu{cgjt~|_>+r7x$xt!<;#q<U^;IkWY-n~5mlLJho2JvecU6g3S-K0V_XV&p<
z^R{@Bk3K96H3)V-UNM*#ejgKA$i<Gd?Uv6>L<W;Q+?M!lVmJ`?oKdpP@k#fKtPM_a
z3lwGLwL3urvB@2*2lB*dGa*l%D(aJ-kW>f4P(Ls{3lo3Yp4_VEr}KE9eBSdYFX34!
zPgU7HQb{koz(SEgPrDE$y>HpwirrG(4ViQHlhLjd_J^?T8h#}WaBo1lUR4Jpm=X<L
zI|G#ue^6Xnl^}TmlZJWt@TB3iXh$5ovmDB{G@jWOKmVn31dYTqQr8Y!?ochu(ST**
z<-19Wed>LUIf>5<2lmDIk4(CWiK<rNJzEiGy>AQKnGstP6MkDX@?+;?5GcQGQm&cv
zLF$4*M%8Mwu}S&Ek#kZ$^DDvt(+ml7ypHA9>6(7Xr7;2V&m!_?$PiL1#B;)E>Ap;;
zC5hY`lk86Fl;ccE+47>(?vcf6vT;dG>@Q&Xx~2Le40caqzaH@w)NbwEoqcF)(4wq}
z;ZKPM-{DBd@m8b4pMdv1&dD+JOMfD_y;pu{$W5y~R8sHv5U99<ZVQ~|0*Eah(`tW9
z?D9YGh;Vy5LG~uMjD_XyvE)G`O9~w6%T&>#PjA9`mJHI_veC38O<O7)p~F)2M>T=J
z!vJ$v#Mtl<>i}RlVoY(6QF$cB63~ao!XApmu#NwYuqa4o!$cvWH?p$}s<4mhsS?9g
zp8*!R5xz)Z#(NPNl^_WJCEb(Gv5g7`RX&|cgBVJ?nXHJJ`tRq0$_SerD>HDmyaqA{
z&QHfhYzAB4#oo}El9Ea^DDhhYm<CxDW5!rU27s!t^-;$srl$~$rDf{|R+I?Vc9k?y
z($phSC+Q}n>Eq;J^5e@xRS-a(&@-K35nU<8#RQt`tk<~)5sFU}K?9WG6@d#1j{;yI
z1`!Io3f7C7{7SLEWes2ha0+h`g7U&=HS`x(Sp|sXfJ__!>FcZlorM15*Oq}7Jg{Z<
zvDna8G!U-+8x7F4qv429mJL`9j_MxsN>Pfy<c<b^aJPXFW&Sm$G#eL_$5&nL=gVlr
zsOd--jPM~x@NL$uw=k=yD07U<aMl)(^6&6_=euSqNIt4HM16X(nGAr#Rh#~niW#ZI
zbkYKC3!D=%Y8b#90#Z|?N(%uMPb_q#t)KD2Kk`P|u=%`Wc}H*7BsMGB{-Z5A)%3iG
zy>MXky{MP>?(PVUA&ua&pJclj#2J>LN);o|@CeFma2=U^V(Xb#r1l<d7aP*PH6i62
z^y3Y|E2xQAGGA<^t~?*1GRio}%08f?s5k-~Vnme9q7*_YogyJ2<LB7HIXRgb*+e;M
zsW>_JU`z<{iX;n-VFcf9Z35TqEghyYOne}dAr3Y!Wnf>}iBP5kC{`ADt00>y;9}mY
zH{i6vk5ze@AkOwAwlrAh;l1ajkCdBpDPa;hr4rEO=lt76p_=r1n1$JmSWj$@L;Wb<
zg#Hi-7#VwfdDj_GW@IfhVWF2#-+GBdx00Pr75>(!dfQd%Ir6s)x;w>BCLD}5Q&;uX
z(9|@k41@O05n0tV85AsN#O{<-y$uuV{EEMU8+uRj`IiK*&N9C2Ri2$o>nz3CJ{jTV
z+>x`mlgw{py9Z+ipN5>60t{T4jFrZ;;i?Kttuj^*-jVtts9v%YzxukoNRnYUxXyQh
z%P_F=Sx6VpmN2p*tq`6*ej8m#yChGBUHcWDAogfFU{MZNEx9Xt^WAph`02YHPxwwh
ziKTpYeBA0HJ|Bs6Bs48ihS}=R^s?HCuZZ4OKIi?!m%fGNoUqUk!KiF;gka>gqkO-x
zZ3yN5173!bKy8i4O@BcSCw!)R5>Ez=*<`J?47_)4;djo=UMk;jvcj^rL*P#CGNzN;
z)9u{$Vd}xK@*ZbOZ8nlVu|t7UJ3yBq)?k?}oN09-mB_jrE?!#1Q+o4yvI~IfbenEI
zaH?Y7-V9KKAmMBL)pwDgyU#Z1q)BPBE0kG-FObbzyFS3crn`X_sxC<*kV5}>FT1$7
z^}^7Qplxh<Ke%+Dmw%VO@(xv?L3-X(01wB-PW)x8<`PRTLmTGIkeIB4(T`S<^twoY
zbWTP4Iuib_@vuUR)Yq;<k2ia5mi3(9)<r#cn|XhK?7qgkcZS3;D=65KYmp+Nu86e*
z0SX)Q(x#91CQLpuZyM$41&>kUK)*2BBoO~X9NXafOt1i57+W8DdauSku>qrLxlkrK
zs!|kLRd*9TKOgz2iB32QmX@{Gp0K5PQ2K4Nt_op5OM4|_HHnOA0(>%uH<C0{N+GlN
zAz21eJ#}XQN{TZ=>@+m7+Z!|ncH)A@*i<QwdB@ZYeq?*5_!Hhzt1z!bDxBDcyO>e*
z2q}hDlac)?kBT%kHP-8Vlf#TfT|GUWcVf%<tcO>tJ_JRCcfPc<%#ssf<5aq}=WQqz
zW^9KyHsIfS?+u0ny6uK$3*N@vglvKe`MtIy+0*s1DGTSG`^*VX0+AleG7XT<;u$Ea
z-x&(mFOpGPBN=o-#}wa&owmSu@$@x)7w%HVcKe;B<>e-;A8*vD$=d;#ID5@dQ6qWQ
z97*cwnsV8L$CAE!GOkKx2>Gm;=H;Q!^im$}tXA^&NfIAD&(noEyLH~1rqtYJ@U>n%
z<#xkXA^aw+$>Yy;{m;F18hP}C?6cOtn_y&OFO+jop22+_L_Lv|R&%DxzfI`)K_(Dh
zq%9n4RU!$O=p*rCb(>MGtk(ANAnm1%;BhJmi#03GH}aR1g%kOP(P4bFkAAo?w|e7y
zt8OfRtC}nEIE=11=5C>JCnEQMggpB(VsYvvJRYW`=Y67>H8TlD@?eyjc*M%yplPq#
z0&31&dTWaSLGp0ax+KKseXujm;qUqZP3EJlp^Elfba`V*e8E}*a7V_P+r4GOnVRVw
z<=jSE50)zi$xSp*k;-di?<aq$W<D~z0#r;j2|CJH{WW!<%4;aK9!OLS2HsDGf5D6j
zZ0IRt4cFAcx@rih7=+PDhOc2pHP<BQFJq0@Oh+u|#=K(uN+;R7n)%FBbAP04F;%mf
zquj|sYb&mr`Eju37n+Je-}}j5Ut9qUFPJfnHOV{5MEo^9vC0oAwYGo~gYG9I0vk*<
z$$QE~!mk>{wYGo~VRe!bYnU<3HOc$S7K1dK5w92%Xc_ofUfOJ)<NP?2E_kPW$Pq<5
zYxc-mNp2wtyO^<Y5vP%dru(boq;!{w2fY0;>c^H4O%h#aecSgIgR0gwR4I8gL#&u?
zWXgMdC9f2Y{Ue&OU3u<Duwbr-k!c4v>gz{66GJ+kz$zc&H~AbzC}&u6LWxeVb%bEU
zx;Y6D?r`DoDRJn#U1>Gv;ol*MDUk#<eug!U=|2AcEw9Q@5aBnp`-R)FSh&0OgqsiC
zaGjAO;Onz<=kMjL@t(PxGJlj=OvJIu{4jyHZXYX_JXFu6JEs)##j7!EZSkA%@E*@e
z?gPv-=RRJ8f)+L2p}N#?Wgh(nzn8MiDY&A3lrIv=U5twLrqD!s9*{aVB@@=hIZ5^i
zvhXAsxo+Ul9~`(Hk7J;P(>)EI^7qfIwj;78ICHHNbc9>8T7DzyX_k2>L-F>snoCpr
zhwS;S^;`E}4xMV?+}d{-|F(C(iSkSX#%<Df>$d!2Ow$SDJ9&Vw30hGJ3tAZM{NNl@
zgs1|q{BfO`5U@fo&#U6Gn`lKE=PO3fO$_Cfb>SEsokX{9g9cqENnr8rq?-@5_9*31
zmdR-!zw9knr_+SZbKO-vt&Yf5J%wDmeXrMv{45q9t#Cz$(O>-dBqhSv+xe!H>r^*d
zW+?Sp*5;O2%#M}gEBsL410j{uMmE5EI#7<M2>`oHQH<?bLlnKUx>TuXgIgJLB&FMv
zV?_90F*$TP38~s!h716xD+`o9e%>R3id%~GlhW|Cgz`_NsDsV>{6Df(l7@>?Zi``?
zsc<S1(3n`&vcr`-L32OQOgwGojL((|O*L7v!t#z+)#zX;5S?T9KW#43ZZEs1)Ao`7
zY?QhtX5Y5bh&W|kdOqY0;YTD&6kTOhX3RN#8F!(xwL-d3%#k#POvAV6_OA;ohv=)P
zMsOd>R3;!t+6%eM8OsDIiWe<Cf1Sly!)R7obGiiBrk$!RaQj9H6D9y_G<>O+@I{Im
zv7E|DuM|02gf|r+%x$l;*B3uG4a;K`EcKEl%ob(u7IEeddOgG2QO7jtJyc&FQ^lod
zM>4ZLHd3Pq@-2_0a;Y-YIMN*D_nW59Uq-5zx9*|6*BM<C{g`Na;aa-a@J-NttBz%6
z+<NTIfL-(Q(;rcp?T8VAhJ3d?y>oWtEi6ax2yQ(}AhBIpODkji3VTMgk(3Q>c=c=R
z5kK#vV@KfQQ1Wa}1FQ;4>|DHzpa-(T$A%S$1bCHzyUYj`R%V5YXb#}^*llEZ*gTpc
zcc{OFwVsiulAFAuxrvfXh==2jsMtbswU%NvL5UJnd5lm&Ib9sW_0twtH-;HU5s>0E
zXEYn-%BS}Aj93}?O(+F~0@xlKEl}CQ&=No6pd2O}BhG1lAy!3u{(YBWQ?krbmHYVs
z^;X2XCpGbAy#^irx|09-=ULMCnCGv_{Vx+|4)z1j*Cx+Kb`fa|otb5*nf&kQ?eChQ
z??kfnj!D0QDx#p`c?@46ble-2%NyC@HNV*WL7&9J(&F)(NwWp=N_m?^My%n)l78wr
zd`&j^Axg^ues{QocC%b%G*K>$+|5W|$yT#Rc}}IwXx#6qqRjSS=tI{5jRv$`b}Avs
zTAlPgb<dIy5)Pa?juRDn6sb~UibkKFG?@2J3l^+Gp@sl#MjPk?36b^E(L2kgksXmO
zMUE{gP9%eQS7Zil^aL6o9GSC7QzTU-a=GGF%aYA|Xt%7ZBWC8*lUkrY#Ymo2n$xdA
z(=kuoBqFTDMM5q&)96JRyf{p;jdQBE4^Jlu;b|NW9r>iE{xtTT>N68!b#Zfy5(AT?
zNi1t}lz^i<C6oh#ICH!55}6g-s*SWzMDj^C#}1j3eBZ6H?arIL6J{<dq5OvnLgd4`
z{ToofrbvwP05*v0cj=}k*J<%>$36<gMIm{NGP42T>u>SRQ(N{zyC!|Ilwsa5V;<>g
zZkUa33wrJhSnzmhs7j!z{AvE~BpoN;B7zj6Zd??#zdal(DeuEk_LgoPTqP@B1Mh54
zm6EjQ9mLAjCDmayno<2tblKX1_(!c=DJ=pco~t3zPI3wYjA!nAjJ$p0A-eB-`ZLXO
zh>nuo>>JapdR_xU)|C3@D>9KeZKo_7?N^52R@j*maL406*b8ik=jaEZPpUCK#1u46
z;hGrkesj@W%A2)qrMt^g?$%{u`sOGj%cG0}@jcqOAI5usL|^#cSkG5U2NIE`pX~`O
zT8p%@lqTT6)aSdm3NKdI_$oM@Gcd$6%`mB2YMefiHPsJkhu=HMg+@;(w-XSg?cw9+
zmc(t=Y*D1#mIM8LSAnTD5{@z!=P|FYZkFT~ZV{gH1RzFyhn=8kqRr5I4ZL8e*Ii1=
z<j2bSE=%Cp;Q6u6W!_?&esWjch}WmT0Y_YVRq<nc8w+xDwM50!&2940#qV0>-<Eri
z+qH4NUA&`s#h!MVrI_MQYc;_x_U3fLt>S`BE;8T4cR{tLHfM5wqB=NEOy?9e%Y=Yj
zF`<ZVBqUzOrfCF6S(&ayyG*P$B{E3JMm|)?enDlad1EUD_7x+JsBEn;-Z7)6gdww9
z&80p!^JHMo!sab1W7TK)QUj-*BTN&)X*31;HFah|ripPBhAWJ7L?nh3!Q8S9ql~k4
z6~Y1+hhZ5FS@An>W^n>A5Rc{SZnZ{|0HiVB)fCz}n<i3)AT{#XW*ja~u-thO>CF|D
zPiL{hemo?^X0GdAw|)<0Ad+HGBa(g3!}rp!cqWHx=fqRKdu!LIw7<m?uJ^M~yfdA@
z+<BQnI)C7d0YxiIn!gqHeF@8I`}d!qKLnqrbZ`R9mb1{l`8@w{L_C+(qpe$X0>6H%
zMzgZp&5$JjQ?f$3p>AQMZMeD=i~EWu<<fyFO~j-FyQyADrM%7{&ve9DBv&d!z#4!*
z<K<Q#bMN@4Df~NWEDsruN)_AD2G8CUhIExbk%sM;Z8W!`2$}Bo3zTG8xIH4f`xSZ6
zbv{bVtWe=Ly>3ubRSy<6Amhh<Cbln#A8Jg}U%@}2Aqqt_JUTV!d7FNiJ(XxzT*Rla
zkTMWktome6qrB|6$nxVoxHoyQ5BZrQYS#Owp_nPwpaWu&>~JuVkoYilZ1_T7N653I
zWOpBxnP$BLR9ZBuXPoKD5u(J))K{_lZu=P(Juq6uv%=>(F)N~8Y%C~?(%36GU5le|
z0$`)L?%>~pmoo|)iO|{S?7_%*2=Ai1OGmLV&&TBjKlP5;Y~l<<ZRI=jJ07m*f@Gv}
z=083QNOF00;flCEH}2<NVUu%IbXKNkK|!W$3!84k<#eB_d{~}nx*S8c<=VR?_gIcS
zLorYSj+PCDZqlGvLasrhXj(eh5>TWurOb|=J&Ei}P^;w;WQboMuZdb5C_UkBo8Wb<
zoj}XTkEQd;8o5!cH?zRhvMlw}6Uy0W95kPV#CXnk++x~@Y4acS!yMX)nlw3)c*l3u
zB;7e4q9C8sqC7EdfQ?-m&Ur8wXG&o^!Vvz1J%n4I!kWp+5ve~+QF(HgA5g1RdTNBy
zOYE#+%a2y(-JT_Zs)Q`b;4`p7-C8m`haOX&!?l@2@6>F~-BW1%AoaO(4En7G#D!S(
zVA*y;9mY-h&LIO@Jf`r{A7Rmj2-Ix_?=GC#+NOgF9;{lE`4IDj?}u#4s-6gF%#oIG
z7{1khIz6|RtN$Sjon)BP)iIEJ`mkr|!r5q%Q-;#9b9-N;t`Haa5{UWpYSm;Sg=&J>
zmcTu&O7G`sOw3-N`89N+^0L^-@3=Zn<~Y$?bGZ5?=5NpRW=XA-;8sW8<EUV$KoA~C
z@!ClU#VQe#a&DVd(L1Jcs7yzmvEO%A<FhQGn~r(EV$IH-J&kPNH9ulvy&`u!)2@Ns
z5D^^n@hR&!Y15tfa(+%ASLQ=uJN<jCGoDdH81w{vO%E_x$FX=z3w4La_1-qe^CdNf
zQj)7&%4?Hs(F!XnH^$?-<KD7O*M2P!<!AQZU@*$kLh(Jo_}G^69q(<45=_PQk@dz4
zHvx~AK0=Cg78S&!yC!62hg`{DsQG+z*c~FUsB9`Y!r_&93zS3;p1DdirZm3C$rrsi
zck{q{aIiWxITc{7l5=8}B~zNn!X{eukXoYe<Iqxa36tAkB$A7Z)Z-BRU_tjgsRXdu
zj16KgY~&2?2*XM4+1Ym;+<KQh#mzp6+<rRty>FhA9Z%&fwBHmy+mA*+O_}xakRm{=
zrnhmyJIBv&%eO;%Q8mIwgs5-6`9ro@CE!jwzfYl-m!2GBT+bu#(RuyD;v=YpN1NLN
zxVb80{-PTa8%4Qma6g8{G8=uv_X)n@m_cv)g_(o|mO*1Qwidvds0Q92N-MtWdSqfG
zxPU><{g!IY>T(NuLs^2RhtFy_%}Fd{A{@!jKfS^-MN%*(`V&?wA8ve@)C&@nE?GuD
zTB*I&>9@7vyexPHXjbnQb)sw)40$Hc1HPSF964F(@1|#c$Vm}eVH4ICAUN726gw=R
z;oAt>p)`3ga>v-qh0G}OD`g+<9^Si7i5UU9&n<*<`1vy9ORSZ{5633h0kdY&nN(^U
zEF!4>-tysav!5<M$2WU7+4wGNv_?wdBaz9I1v!S47{f+~V!3vdjR6pDnbI@ccHVnD
z#CNF1^TOI|$|HhmTB#~%R@vEvvt^3-!nPOw#i|Zdhx?P+DTmAVFB|mJ77~P3j?Hm;
z;;`2^`l7qPa_jI;jjZaN*6FrBwUDnA1rWUbz|{9jcP6bOdWxKeK0SKM=BQ|6fx}qC
z{i1QEYWgmW+2OZAWE+~szKj6C-F=3Wy!(QMzL)&7+y@)OwsFpK;h#8V$!Mm3$kr66
zj>3-uZ>=XMj$j0GVg+xIs!0dR((sYsV5|=e6~8EY+pp5l`+k8Gi$=QFDQnoLHWQ7^
zY`wC9RMRmaPx29Wu$%@N5p~OMz2ceLQ$cY82YlwxjL}t<Y1cYVSNNDG1i4BPfJnkP
z7pEbG?eW!oHN*IF7(5HQ*7>x#k$J#Vg39FK^rH5>g|EKp$@54U>W1%&iZ5}{UVd~y
zL$GUIv|@E>&wTZIvJx>=hC<Pc-E<E4$iP;PlHJ=7xc(;7kWg-Tc3PA?_ooxEwCo~K
zZ>?aol?ARJe*E=rTtzWL1-J))Ay*o%GOD7a=saQ`-B&rxT?F$S1M1FaGKw1ccPPM3
zg^r^020vQ%cN(>Z2VZ7)UQXIsoQ^Mgt;tc_@sx+L4D5J4_LcY`Ge?a)IH}H!ED8fB
zDuVQ;y}dPIuj=t7yTa>Tj{I#M#lWMYhq@QF%$`kSIOp}1R?ZwK%hT?+za5=_L3Le4
z#vVc1+x(&8x@OW5RkL-%XI&fhtdo?}1BM3hy2R)9YPDngO4o*w!^$!f@=GZ};iCe@
zZ`AL7rPSXkVTLf4HU$nKHIhYchDmu$s9-!}xib^^<^uw|1Pc}Rk2lk=R_l1!O23H@
z_COzpM~Keru^jrkv56mEB;V?El?<Qhg3TuA+S~Pg^l20O47uzSM!7apg+N+d`*RB7
zNLw&@S1|7xcgtH%CO;=f?Tp)OD2?1m8b#Q49vDBiqq}nE%`ze%oacYIe{dHeO6ys+
zwCK6q99LHWQJ2!v{kN$P-_CR|HgRIb2ofR_lzKNsHC8TSB?IIQ7|ud%@d@;qe|Rt>
zV(2CJbcjU-#<Nbd(`*o)>^&K80HB~b@HI2M;H;{leWs&1g|@%&4UW0Ku42AG$(zWk
zi#wi~F)guv(m%y%sx*D>ExkZA%q`RBwy5vA`95|f&_}mAh!mzsG*qR~_R9>kum(mF
z^JF(7-^t79P~L@_MG#*^H=E<0ax&jfW^0w`T%U6vMbns5=<aVTnPsc88ku9;;AI-?
zd(!M6^K#Rk)g*mD_L+?lR>y5uw(W!fsY*Yo!9KGMmziKkj*tftfLYnZN1w?|?@jDp
z=0<;KnMakz;BH{|T*~cu0Pom;i0>?E?%Mu_uiL}l2_30@GsAGM#wMOV=`*du8+~(&
zmFLA4rZ8u|GP{|@337Y{U2TzODP~@q7OS=O3}dwj`fG1O+<kGiB56aZ?m3IO8FSnp
zS7D(ksIW&N)*#)X?`E^8^b)9hn9lT0-8w%O8jg%R2w)PIRJ`V@sM09Xem4A~9`idU
z@0T-wc0B^OckX4=O4vg*g;N8WZwCCHgel+G&wDa1mQ<l2b5ECkdMn|e7gmxRO0)ly
z0Xie#k^3!Zxckm<5wB_XzdJh<4Ugwu>hcvOd{&h0$@uDH{CvM2t!u_LZj)1Wn4=?H
zYLSXR@fNXp61JfUKcA+1?n&OHq1dq;F=CER<zg@v+>T`0GH*F!mKLdXBniW7hB^b2
zk`($HAvT-tSwNx3Oqmu1PMPm;xmyP|$Gik}Yd7)`Kt!sS=gG-P{>Dp<K4#=6ycdo<
zsjo*;BNUNBn;I+`L(j=fjl-Ya8bUh|qCKU)yDEzm<0m>CZprvDNr<-gEOz&WnLO^v
zbkF-q3T&2>0UF1Pe#3<Y*TLA5-kD(LavaQP-qrVW$)7vbJkIwe=v+TN-FrWGI2V$=
zuv`8W*>2|Bt1rv_y>a3w6dn9p_{c7Dtif{dqj!ckNEV*9Jv6IL4bdUV)-^Zp<Z-Bf
zGMra#g~6m5dEsWve3>=awydWa3%}&m*=D++LZVPJbsn~rBJxD12h;gr--px~_%wK$
z$m8*s!2{KPsexT)u!3w*t;Qc<i(bL?q<d3ot`@yi;fNpBq$!EZ-Zzl0cKz|P*L^Z9
zQhBz4ZfWqO2q1#hSRu!^ChEsN*n7{duIF{rJ8}`dVV$<5lNGpd{#k1ZZZ!ENj;Rfk
z=t(RswocwUDk@s?yS%SrA5l6>5)^X|k#S~{BZMI<?&%Q?`@SZzMf#dQ&Qq;!@=0<M
zrqpI4wzwo}NO4umzpDnuC*=-rW8J{RM|KB9Fcf$@mWe@ey^rAE!(wI(PwMec57iEt
zNVGM2!}(S~`}PH)u}iEDm~|vz8O32KzE=&fWU(5U9#5>yD-uHZ0Zpr?ZC%3C3VPNp
zRl;FX951+6tjs+xfF@reH#uKnv8f`uuPC#Sy(UZi$DM}Be(S>V^u~27>+Q;%J4f=Q
z?NyQoryHqbr4mcag$>Uyc3s<dC*9N<?7nEM+UT}<%P9edzGcb{4v7UWR>iKP&YM2^
zaV{+SWJH~8xqvM*=Y*Ti$?H+_%O;LS<Zh<A9jV5zZ#3;Lruq!jmu9Al5%#i2E(2zc
z0^;1=4VETzsyxK>TH2IKLL7|jFsu4mBJ!d%pOT;BKUY27D&6_vA=*qO&=|3J{yG75
zalbwk;FU)m<hPGhz;Ev7@*vo+dZ?5luI{zp@w~HG)7)x~T>1;s<7bbHwr3ySF8q-h
z^>N(?I&j`USBui>7E%LF@Gt?KBD$n9rlcWu;COJZ2Gx55q+<O{gE8073Cr30uyy?6
zyD(4aJ0@Vw>!G|5jUAwz4l!?kTdl?9`@%^(yDel+zWG{zIm=DTaUR_yyKTDo$f-d|
zmP<^ha=F=hBs20$A)l*|(~qWi)u)r$ld>6+`%d<^Q-?3($Xb4QSsN-uyg*@ix;9~U
z3V53KTw!yXmpL~NhUDkJTo@E)V+nZH5`T33ekpjg68~HH{Sxp_s?g;4SgO$Y_?&N-
zw}tXyK2DP{zY0aE%ImTz`AovRy+dkuo5NCK6CdkV@1;%2+e3nfS(*H=2C{PPYXK4b
zhW@v9A4>>dsN(MXV1WME)4!YppnPtTTI!lsODZ~0=FA-dhG01cMr4h@!;f0gPo}~c
z{Prq8#LUDtFwDg^$T6aL0C48xWgLhDK3*)Zq{8N;WERa((ap=oAeJLnzdcZzE|l)M
z(^H}>;i`zjbvxIdN`Y;WjR|Td$Gm0;bp^OB%9;>E1wKj}W^yT4ujztU$ru==%uaQo
zxYkpcnEj)zwKP0DXux&%Gd-bK+<c|B4wugGK<7EJr}OGs0tet(7w}!F@|x<qEr;{!
z2QEF0y7em&&5bdXW84p&EkCAHM94Zh;R~&YnJe3$80`2KJil<^8VKu`$BbE!$QK<x
z|6rCGWMQE7cu+({FnCML?&8Br44L5tasgZO3cmtX#i>nIg4e2&nIKcvsk$HAM6y&d
z8TVE^i!9;R`+PEkCsHLq(1S%5AapNTDwhmr3yVqirPHe?V$jIs*uzoCuR$gz8lVPp
z65ZXQ*wQvYti%t-@|+ssTu~yh>3XX6{erhEzJol_Ap4zdHI1@0R#gM3o&3vsx0=sU
zQ4X*8BOcD5zEEckSJ(-uigsycqiq?1<1Uk>35k|;GkzEu{f)2PopPv$>*E+4>DD_h
z@w^3fe&4TQi<X?o!a^T6OL)?Db**+EFx@(Zjo{XVuNjhjSYQ`1eyk#Mtcguk&_<n~
zgO6>9-HHFEoVsgyPBS>MI;mSZ_O>j(M3lP>mavAjO8;@z3s&BL7z?~|Y|Mikkt&t_
ztdB;}J}W<mfik{>C36824zxdJYzX){39JwkpTas_N2c3`xpIUC&BT)Q4-1vdGr|WZ
z70El|znxJCdbC8I?ECPh@KT`JY_+6fE(7xAGj8pxaSwS=`Nt98)n8l5*BkB*B`z_~
zKG^d?m8Pptu6R{<9;51#pLHu_fXW6%;oTI@%A%CQ7lp|<RVI}aoQDr`wlE2TLib-1
zrh@L~KT%Qvy^+)_MvcGQKofYFr*x+yMp2`8z``ntSqX8Wiot-G6raU)u(IrMR_k(m
zjbkU!z(8y<55d~ujl$Zxwzlx_+=EzMixfhgFC~fA0T~5u1KWYPxgUejM(!DsU~00t
zVq`oYX<;~?7Fgw<WJ#yQndc0hLRO$;pdO1%46bfwZdMyH_^caMkLQ3RhaU?scfUt`
zn|*_A$xq#;=k+=YpIt;)18rn)iNJ(bBI4SkBsK008iiX&vMw4b3Jhh-dkrJx`$^L1
z!p$O23wsj+s|S>IyBAu?k2ufOQa90F$nE9PheYy!yo6KCp&2cnxB8*-yl^Ys(aHtq
zGj&^;A7W+WY4wCaf_D4|1Lreci>~*BbGm|N&73l8r1wzHQ&dpJ1lMzIiwbQe!cVAr
zF2?J>i!*Dii>C@krw9hilYN(1$D(|MlqeXTBnT%*21C0XgK_!I$C%?0k(-mJpnMb!
zJTcWHqy#}1I%VQh>2*%sbw{mrPObHE1v0Oh#nzM+T4g5j1i_DV7@v`yZVMu9V*~+T
zM=nYlQtsx&lIdlDM=2gc2^5$62E|`MJ7djYN5&FI@VzY*DL7u-d1x?GD4X~zxu=ep
zWz^J05W@L)LvN!Pff2!&m+qRjMQrQpSw@W{(nsAPL_<;9`Il~NFD5xLcn(nGo9)~I
z(jG~?0HffTG0hmZ6l94R0um>db(i?29E7hV$a0^gv7#gdI`#KHFyh4<6sZ@h+WFQW
zaXMrRp(6^#`8vpp94z*s`D|9NIn82GoF|uyIh~_7wE&PSB6PP6rxMfi*_HGHor#|g
zo$u5H<W9kr(_8ULlp<>>JuRjGo<~o_*I9<FtmODGP!qQnkMd!<cg#aS<$yytc*Ek;
zH2iVkik+2g;GEBi7i#$<K@G2UG0x?~>?7f&mgT3&SfA_SIprN)9)Alpp2-i6TV@jZ
zG~n&jPwKIhwEA@eHZr)}sKmoo?(+sVj(K|gym7_j(VYX*SNrZ#l*pz!*`0FXWxQLF
zq73!+stryx8UyR?jsgnAuWJ}tx_5@YW5#<90DPc)r$Y(rCJ#Q0XdoPk%W2x;DiFY<
z7$=0%46*E69~t&2tIK41<;lM?D2Q`#Crxt}iq%&PNk2Js$MMaO&LQ>k*nfGCDM~1p
zQ$(Hh8Ar=k2~#|o)18Ssw7aM_swj+2LjA$9)eUn&Ux(`Z^fK={TX{q-^~x7>LKou+
z@4DX6(?Hx=DCD<A6eghO(bhH7s!s4R_=dX@RrO(|G&fwZKao;+_Qe6*e7>-h#J6m$
z1*-nKojOeY+qD>Ww(i{~^Q-{5fhQ6vK`ha*$Lm3DZ%=u>zMA-LDzM=WYn1VrBtFU`
zdT3vUWB$NaUXJVCTeGiPFCX$Ad!jF_e6IFAWNYqsBA#P6W75n=jPnri%Lw(x_(Inw
zc{at0L;B#+e%9ojS8p^6%|eRODXDo}Ol-xp3XQN@ePxbC4PER|m`!*X{ocv{_=3E<
zp<Z3{qlU7U4BoPgez#Ro(LFYJr_qgursvcgu`I3soELaIax6xv1nZ?wZD?GQv}?bo
zj6JM?QpI_rqejygrw9A%F<Bp9HwOoCSMlPxh}WMNKD?}V$qq(SBWs=@!^tK^_+H-4
zQ>dwzld^<(_Mzqle{;(NMS-?<;LCzrhZl(b+>_yju=BtSY!`o>_3FifGh9A)*hPP)
zQYe{?iApXeuhmF2ZAp4v^(;5Q|J3S>C&e6xh<C02ilO?$gsO0^GPdudlqFK1K1_AL
zpnlVGh&5}cSfcbMoHpD5i>hp)m(Zi3*}wGd{iafKjv0J^M0J9^T_?22>M_74A!Mu2
zY-j0&;n?sDhIaVc+k1U9%LoAMCDXbUm1EpdyzhN`7)MkKh%w&r1&nPO6WyrlsJ_L8
z&xQ+0zgA_=n#h?69~~#+2{HOE7fB!nSj_IlKQMcTyM6gJ&S(`;@H7qXGqgEyd5Kv;
z5$D7UJCc(cEV8{f2-_qSVdQ2%Y9V!a{Dg4!+gVt#TC&p0iwdL+*c2(vX?VY<sy%*^
z1a-}8(f8!CGFf6OEI(1P=zLj_3Z!nrJY+9sDO){fvkH33%6SP>|46&H2XzscpR$tF
z9D;yf1FC(jq17_oM`t!y(-XE=$q|gQZikPSTl(z;R)2yoS!*|QTR6-cQ?_PA_3+{V
zBk|EUgp79tMWG7~RFs`CmEl&+T<5}Hsopo|@pDA%#BA|dta(x|eB2$}2n6up7&doi
z^?e#Q9t!B=w2uu&xLYz^Cy+@(3vE!=c|i_{OERfLnnsXTVmMs>Mv&t{MkN5H*2{^s
z2&LW0k{iSVK=Ll&MG`pY;y+?s8p~I~_QGG4p2(23zo4#`elj@6y)H(81G^|^wx?ch
zjVpBVz(EfcUsr=tXe#^CT#zjTE2l2u<Ld`V0gtHjOYwZN4}GYui^_fcR&7(dZ`X~Y
zFOJ}R`5+@h)!|~LE+ScnmptDrCaSH#<J>5>;UR`87DKq@Fyd-8nAnVe#5^BoBgnTm
zx=BJJEEP<!KP{}=90=nlUiVnqC5`<y$4R>`RJ#)mZo(Vn36OsiuU@K>nG)+lUVl*$
z$)a0W!Ys^BV@AroDr+umy)z?#oQtE-WhQ*vQpEXAwVd1!&x^>rasm<zo<yxY_No2D
ziqc|9Lh+1d0nb+5Mdg%oj1z`Ov*@MP;ifU*%?Xq~*Ofe-wnX}pFdAslxps!{hO-x-
z!@~7M;h{B*%tr+II_9DA9^ueq?x!93nfnC?6H8QRKF{;ehL)el*Vh_#JT+@c2`@;~
z%i?0dTqF1PzTjfnhP(Z>uV>*Qtd^h6iRvA)M&=oW3YIT6E4NRz@Nw`+1{M#zuu@Yi
zYQIuVom8M95fJt6b`eRTxaNgCCnc|;?oQhOI*&eW%#n<$-&T$wGGPT}@KEo0y^u;(
z@tx;<El+ohaS#0;-amTbf%~L<TH<@RSq{e?_p}gU+6gI4c=fF`If{7xIJt#|qV^(6
z0g+@M7Mc2GjxQ}O>k^#6=Rt>=l$3$*bPO=@K_z+)>`*c{^7dgVkV;saVHxOWXrL51
zi@SK~=!ihIyu_E`WCm^WxOpAjFb-ldkAT0aV}4e~;191djSh<nWgyskU?JHfaS!Uz
z8%#GM;D^dU-+qMsc?N&COzu~BP&=p)UZ0?#_^&H8VEE{|Li!UH*SW6z9{+G)Go)O^
zpZ$=2o>c{|D_B3_I-Tn;R3iL@-ydOK)zE&zpNp<5AbFrN{_0v|+G`LBO9bYsM)ngX
zo4Bsr2cE!sfMi1h0nh>elg|G!<+b2n!Qggrc(BFS1Yr0+hz}42(gF^2hDE$G5v<=T
z{<S7x{V3JluNZ*!+a#m9g2D9BZ?E+S)BAk5_7wFM6%<rq$aOo(PuMv4x&qdYmE^je
z{%5-&#x>0F6P8}Q_AL2NxN!KoLh%!ZYQA;@F&O?i{$P3I<k#(Bc^fZ5RzpF7<-OOs
zhQabgmoTo{!ScZRfaUqeT+@T)`8!^bLs0@xAW0y<q5zLy7m&Ze?ckUK(J%rJkj0=j
z&;c$WK9F>BKp5N~d<M~i$3dI}1VKU3UZ0?H-(FY1<3^->4MXYyDepfG|3~(M=Q-G3
zsGsv3Y%h48L;Cl6=3V;%RELDY_Je%#pX`@^WDlg?f0j-VXfHVaz&Y*OL)ZU7K0<~>
z{H*`gew@Jme<TlbT>h$@zuJ!oC>&Bh=wBC5Bd}a&0bs2Bm%*U1K?OMg_HP9Q{Vfks
z{tQC!yu|vsAc5!Q;?H)Xt6or0H}uzz_)quGpP5hKJ<rdfy*mAwe!sO|{$J@Q4zv=S
zFR&pE|5g2O^X6B0aUlF>`~Q}IA@lstRCFZ)BoCaUKnPXf0h)Rsyb$pCR|{zVg84zp
zfy9INq99p<Kw>aGXh(OQJ$}g>P|~2*U-mChHP^kt^TMC-+By*btMXq&5B3}6_(J;m
z+H==#5v2RY&s{*&-?H@o*~+zD;Blw?dHn@mU;Ih0tp~>mrPU2R$OAY2xsHRIc)0e%
ze@Z;$USD4SEk4B`T<Zs(znsAQ1uEeA{=ZFslTU8)CuF?c#KTQI+{DAp{sFum-RvJg
zv*9KlZsOrO4sO=RoAnVC3E=(tO+4Jh!%aNgtdBSA<IVaA^1#jg*y}jBSs$<ca1#$V
z@c{C`f6D#moBis|eiamtH~AUlg`4&I=KkJw9Q@h*{J;Hs+ztQh@c>^>{kwk;z48Bz
z|3MxAuaEyN@gN7Z8MHG39iV6AfRFtG{{zoIAG#|2`P{-E!63hZ`CN0jVsquse+KUX
z!3Xrb-1TF~zv!d>^Pz08KL1nj|CIj!Q+&YV0veNF-iH7|KMO$gszL*X!><Pn{JsYi
z;q@qh^|=~bFfH)>&*CY8N`N?m_&fw2zkWRYe-8!<0~V0Jpwe;uTFec6?T#CN+{D9G
zB;3r8>j`m_AFlmy6A%C1c<={`gIpi4rT_c>gV%Gg4q(ZU`0E|Pb<4kk|Cw^H82u}J
z{-^Z$Ek2-q3g`eAu$~|sr2c|H7_@T&@%X*>0DtQ}9Y}t^C;#7x7l*I|30MagkiFn{
zg2A}oI*S95U_bnS(Vr3MERerI`u^Oy0&6$r*B*e3yPub6S0s@5-;2B7qyJa%kmH62
zDfril|Cht!5b@1^<EMW*8h$Un1%aGE?gZrx#(#qAU+w1zA<y`qkoQ+f|K0LH&IJ1t
zbnEBuuj_xg4);gDwg@yXpz{A0m=b6U*#6(z4?wp6*7pG*+kf6V19JSO{9YW(LHL~)
zq`*!2OCB(W@T1a=AODgM|4}E%`2FR+<lo;<{Js4I<ZwXp`QN}(0*wIi1+5FeH4p!&
z9kiB!`{MxXzgPY&9i+XG*B^fd53&JVAnAV(59v=zU`MbWf0VC&E8juNgB)*2zQ1*S
zBn}~$9a#To%Y9%6u-?-DZ0CPK4`~nNIB-J91ApV_AFzS?XXynY_|yC&#=mNVj4zPx
zzgPY&9i$%AzsKx1@Zvxmcsy8tqy3Lilo0)YE6&6r+W!iF$nm%Z<n>2I4oCpD=jW%h
z{;11uwnOsa`%Q{JhlJz<8l%5jD1jZpcKz0OGe9u}ZvVaf@q75|FH>A=2FVBR8g=zw
z9QYs1pBV!GXRDC?|4JM{>IG>Bh%abe0_lbiJbtf$`ux^<Ar8d<U+I7SCBDD6P!$M*
z$3^7toBk5?-^R}h!hiSwlE?mBCr1c5#(%EMzeGg|><x~KKgt)sxBmapzT&s|{*hck
z2)%xO8Ucv;<MLPgQ36?m{qS4+nLlcW%sWUBYW^Oc5l92hCm^}t0?I#-@SmlFlmnTk
yDSz?<@%?$p4y^rBApJ%43;GXhkp2Fd@qyG6GCxD&A>-`N;34;Me}*2?zyA*tB6@EC

literal 0
HcmV?d00001


From ed1d86ade93181fbfd2ab21a0293512e9f1d0869 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 9 Feb 2026 12:12:16 +0800
Subject: [PATCH 22/30] Merge paired MPI_Allreduce error checks to reduce
 global sync barriers

In the two Step() functions that handle both Patch and Shell Patch,
defer the Patch error check until after Shell Patch computation completes,
then perform a single combined MPI_Allreduce instead of two separate ones.
This eliminates 4 MPI_Allreduce calls per timestep (2 per Step function,
Predictor + Corrector phases each). The optimization is mathematically
equivalent: in normal execution (no NaN) behavior is identical; on error,
both Patch and Shell data are dumped before MPI_Abort.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/bssn_class.C | 119 +++++++++-------------------------
 1 file changed, 31 insertions(+), 88 deletions(-)

diff --git a/AMSS_NCKU_source/bssn_class.C b/AMSS_NCKU_source/bssn_class.C
index fc6c88e..e14092b 100644
--- a/AMSS_NCKU_source/bssn_class.C
+++ b/AMSS_NCKU_source/bssn_class.C
@@ -3158,21 +3158,7 @@ void bssn_class::Step(int lev, int YN)
     }
     Pp = Pp->next;
   }
-  // check error information
-  {
-    int erh = ERROR;
-    MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-  }
-  if (ERROR)
-  {
-    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
-    if (myrank == 0)
-    {
-      if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime << ", lev = " << lev << endl;
-      MPI_Abort(MPI_COMM_WORLD, 1);
-    }
-  }
+  // NOTE: error check deferred to after Shell Patch computation to reduce MPI_Allreduce calls
 
 #ifdef WithShell
   // evolve Shell Patches
@@ -3190,9 +3176,9 @@ void bssn_class::Step(int lev, int YN)
         {
 #if (AGM == 0)
           f_enforce_ga(cg->shape,
-                       cg->fgfs[gxx0->sgfn], cg->fgfs[gxy0->sgfn], cg->fgfs[gxz0->sgfn], 
+                       cg->fgfs[gxx0->sgfn], cg->fgfs[gxy0->sgfn], cg->fgfs[gxz0->sgfn],
                        cg->fgfs[gyy0->sgfn], cg->fgfs[gyz0->sgfn], cg->fgfs[gzz0->sgfn],
-                       cg->fgfs[Axx0->sgfn], cg->fgfs[Axy0->sgfn], cg->fgfs[Axz0->sgfn], 
+                       cg->fgfs[Axx0->sgfn], cg->fgfs[Axy0->sgfn], cg->fgfs[Axz0->sgfn],
                        cg->fgfs[Ayy0->sgfn], cg->fgfs[Ayz0->sgfn], cg->fgfs[Azz0->sgfn]);
 #endif
 
@@ -3316,7 +3302,7 @@ void bssn_class::Step(int lev, int YN)
 #endif
   }
 
-  // check error information
+  // check error information (combined Patch + Shell Patch check)
   {
     int erh = ERROR;
     MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
@@ -3324,11 +3310,12 @@ void bssn_class::Step(int lev, int YN)
 
   if (ERROR)
   {
+    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
     SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
     if (myrank == 0)
     {
       if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables on Shell Patches at t = " << PhysTime << endl;
+        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime << ", lev = " << lev << endl;
       MPI_Abort(MPI_COMM_WORLD, 1);
     }
   }
@@ -3528,24 +3515,7 @@ void bssn_class::Step(int lev, int YN)
       Pp = Pp->next;
     }
 
-    // check error information
-    {
-      int erh = ERROR;
-      MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-    }
-
-    if (ERROR)
-    {
-      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
-      if (myrank == 0)
-      {
-        if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count 
-                                << " variables at t = " << PhysTime 
-                                << ", lev = " << lev << endl;
-        MPI_Abort(MPI_COMM_WORLD, 1);
-      }
-    }
+    // NOTE: error check deferred to after Shell Patch computation to reduce MPI_Allreduce calls
 
 #ifdef WithShell
     // evolve Shell Patches
@@ -3563,9 +3533,9 @@ void bssn_class::Step(int lev, int YN)
           {
 #if (AGM == 0)
             f_enforce_ga(cg->shape,
-                         cg->fgfs[gxx->sgfn], cg->fgfs[gxy->sgfn], cg->fgfs[gxz->sgfn], 
+                         cg->fgfs[gxx->sgfn], cg->fgfs[gxy->sgfn], cg->fgfs[gxz->sgfn],
                          cg->fgfs[gyy->sgfn], cg->fgfs[gyz->sgfn], cg->fgfs[gzz->sgfn],
-                         cg->fgfs[Axx->sgfn], cg->fgfs[Axy->sgfn], cg->fgfs[Axz->sgfn], 
+                         cg->fgfs[Axx->sgfn], cg->fgfs[Axy->sgfn], cg->fgfs[Axz->sgfn],
                          cg->fgfs[Ayy->sgfn], cg->fgfs[Ayz->sgfn], cg->fgfs[Azz->sgfn]);
 #elif (AGM == 1)
             if (iter_count == 3)
@@ -3685,20 +3655,21 @@ void bssn_class::Step(int lev, int YN)
         sPp = sPp->next;
       }
     }
-    // check error information
+    // check error information (combined Patch + Shell Patch check)
     {
       int erh = ERROR;
       MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
     }
     if (ERROR)
     {
+      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
       SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
       if (myrank == 0)
       {
         if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN on Shell Patches in RK4 substep#" 
-                                << iter_count << " variables at t = " 
-                                << PhysTime << endl;
+          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
+                                << " variables at t = " << PhysTime
+                                << ", lev = " << lev << endl;
         MPI_Abort(MPI_COMM_WORLD, 1);
       }
     }
@@ -4034,22 +4005,7 @@ void bssn_class::Step(int lev, int YN)
     }
     Pp = Pp->next;
   }
-  // check error information
-  {
-    int erh = ERROR;
-    MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-  }
-  if (ERROR)
-  {
-    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
-    if (myrank == 0)
-    {
-      if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime 
-                              << ", lev = " << lev << endl;
-      MPI_Abort(MPI_COMM_WORLD, 1);
-    }
-  }
+  // NOTE: error check deferred to after Shell Patch computation to reduce MPI_Allreduce calls
 
 #ifdef WithShell
   // evolve Shell Patches
@@ -4067,15 +4023,15 @@ void bssn_class::Step(int lev, int YN)
         {
 #if (AGM == 0)
           f_enforce_ga(cg->shape,
-                       cg->fgfs[gxx0->sgfn], cg->fgfs[gxy0->sgfn], cg->fgfs[gxz0->sgfn], 
+                       cg->fgfs[gxx0->sgfn], cg->fgfs[gxy0->sgfn], cg->fgfs[gxz0->sgfn],
                        cg->fgfs[gyy0->sgfn], cg->fgfs[gyz0->sgfn], cg->fgfs[gzz0->sgfn],
-                       cg->fgfs[Axx0->sgfn], cg->fgfs[Axy0->sgfn], cg->fgfs[Axz0->sgfn], 
+                       cg->fgfs[Axx0->sgfn], cg->fgfs[Axy0->sgfn], cg->fgfs[Axz0->sgfn],
                        cg->fgfs[Ayy0->sgfn], cg->fgfs[Ayz0->sgfn], cg->fgfs[Azz0->sgfn]);
 #endif
 
           if (f_compute_rhs_bssn_ss(cg->shape, TRK4, cg->X[0], cg->X[1], cg->X[2],
-                                    cg->fgfs[fngfs + ShellPatch::gx], 
-                                    cg->fgfs[fngfs + ShellPatch::gy], 
+                                    cg->fgfs[fngfs + ShellPatch::gx],
+                                    cg->fgfs[fngfs + ShellPatch::gy],
                                     cg->fgfs[fngfs + ShellPatch::gz],
                                     cg->fgfs[fngfs + ShellPatch::drhodx], 
                                     cg->fgfs[fngfs + ShellPatch::drhody], 
@@ -4190,19 +4146,20 @@ void bssn_class::Step(int lev, int YN)
   }
 #endif
   }
-  // check error information
+  // check error information (combined Patch + Shell Patch check)
   {
     int erh = ERROR;
     MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
   }
   if (ERROR)
   {
+    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
     SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
     if (myrank == 0)
     {
       if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables on Shell Patches at t = " 
-                              << PhysTime << endl;
+        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime
+                              << ", lev = " << lev << endl;
       MPI_Abort(MPI_COMM_WORLD, 1);
     }
   }
@@ -4386,23 +4343,7 @@ void bssn_class::Step(int lev, int YN)
       Pp = Pp->next;
     }
 
-    // check error information
-    {
-      int erh = ERROR;
-      MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-    }
-    if (ERROR)
-    {
-      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
-      if (myrank == 0)
-      {
-        if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count 
-                                << " variables at t = " << PhysTime 
-                                << ", lev = " << lev << endl;
-        MPI_Abort(MPI_COMM_WORLD, 1);
-      }
-    }
+    // NOTE: error check deferred to after Shell Patch computation to reduce MPI_Allreduce calls
 
 #ifdef WithShell
     // evolve Shell Patches
@@ -4420,9 +4361,9 @@ void bssn_class::Step(int lev, int YN)
           {
 #if (AGM == 0)
             f_enforce_ga(cg->shape,
-                         cg->fgfs[gxx->sgfn], cg->fgfs[gxy->sgfn], cg->fgfs[gxz->sgfn], 
+                         cg->fgfs[gxx->sgfn], cg->fgfs[gxy->sgfn], cg->fgfs[gxz->sgfn],
                          cg->fgfs[gyy->sgfn], cg->fgfs[gyz->sgfn], cg->fgfs[gzz->sgfn],
-                         cg->fgfs[Axx->sgfn], cg->fgfs[Axy->sgfn], cg->fgfs[Axz->sgfn], 
+                         cg->fgfs[Axx->sgfn], cg->fgfs[Axy->sgfn], cg->fgfs[Axz->sgfn],
                          cg->fgfs[Ayy->sgfn], cg->fgfs[Ayz->sgfn], cg->fgfs[Azz->sgfn]);
 #elif (AGM == 1)
             if (iter_count == 3)
@@ -4542,19 +4483,21 @@ void bssn_class::Step(int lev, int YN)
         sPp = sPp->next;
       }
     }
-    // check error information
+    // check error information (combined Patch + Shell Patch check)
     {
       int erh = ERROR;
       MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
     }
     if (ERROR)
     {
+      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
       SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
       if (myrank == 0)
       {
         if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN on Shell Patches in RK4 substep#" << iter_count 
-                                << " variables at t = " << PhysTime << endl;
+          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
+                                << " variables at t = " << PhysTime
+                                << ", lev = " << lev << endl;
         MPI_Abort(MPI_COMM_WORLD, 1);
       }
     }

From e9d321fd00ff0001061d55ba090e0535d797c489 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 9 Feb 2026 12:39:29 +0800
Subject: [PATCH 23/30] Convert MPI_Allreduce error checks to non-blocking
 MPI_Iallreduce overlapped with Sync

Replace all 8 blocking MPI_Allreduce error-check calls with MPI_Iallreduce,
overlapping the reduction with subsequent Parallel::Sync/SH->Synch operations.
MPI_Wait is called after Sync completes to retrieve the error result.

This hides the Allreduce latency (46.5% of CPU time) behind the ghost zone
exchange communication that must happen anyway. Safe because Sync only copies
existing data to ghost zones and the error check + abort happens before any
further computation uses the synced data.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/bssn_class.C | 264 +++++++++++++++++++---------------
 1 file changed, 147 insertions(+), 117 deletions(-)

diff --git a/AMSS_NCKU_source/bssn_class.C b/AMSS_NCKU_source/bssn_class.C
index e14092b..553cc72 100644
--- a/AMSS_NCKU_source/bssn_class.C
+++ b/AMSS_NCKU_source/bssn_class.C
@@ -3302,22 +3302,11 @@ void bssn_class::Step(int lev, int YN)
 #endif
   }
 
-  // check error information (combined Patch + Shell Patch check)
+  // Non-blocking error reduction overlapped with Sync to hide Allreduce latency
+  MPI_Request err_req;
   {
     int erh = ERROR;
-    MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-  }
-
-  if (ERROR)
-  {
-    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
-    SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
-    if (myrank == 0)
-    {
-      if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime << ", lev = " << lev << endl;
-      MPI_Abort(MPI_COMM_WORLD, 1);
-    }
+    MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD, &err_req);
   }
 #endif
 
@@ -3334,11 +3323,25 @@ void bssn_class::Step(int lev, int YN)
     {
       prev_clock = curr_clock;
       curr_clock = clock();
-      cout << " Shell stuff synchronization used " 
-           << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC) 
+      cout << " Shell stuff synchronization used "
+           << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC)
            << " seconds! " << endl;
     }
   }
+
+  // Complete non-blocking error reduction and check
+  MPI_Wait(&err_req, MPI_STATUS_IGNORE);
+  if (ERROR)
+  {
+    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
+    SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
+    if (myrank == 0)
+    {
+      if (ErrorMonitor->outfile)
+        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime << ", lev = " << lev << endl;
+      MPI_Abort(MPI_COMM_WORLD, 1);
+    }
+  }
 #endif
 
 #if (MAPBH == 0)
@@ -3655,23 +3658,11 @@ void bssn_class::Step(int lev, int YN)
         sPp = sPp->next;
       }
     }
-    // check error information (combined Patch + Shell Patch check)
+    // Non-blocking error reduction overlapped with Sync to hide Allreduce latency
+    MPI_Request err_req_cor;
     {
       int erh = ERROR;
-      MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-    }
-    if (ERROR)
-    {
-      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
-      SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
-      if (myrank == 0)
-      {
-        if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
-                                << " variables at t = " << PhysTime
-                                << ", lev = " << lev << endl;
-        MPI_Abort(MPI_COMM_WORLD, 1);
-      }
+      MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD, &err_req_cor);
     }
 #endif
 
@@ -3688,11 +3679,27 @@ void bssn_class::Step(int lev, int YN)
       {
         prev_clock = curr_clock;
         curr_clock = clock();
-        cout << " Shell stuff synchronization used " 
-             << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC) 
+        cout << " Shell stuff synchronization used "
+             << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC)
              << " seconds! " << endl;
       }
     }
+
+    // Complete non-blocking error reduction and check
+    MPI_Wait(&err_req_cor, MPI_STATUS_IGNORE);
+    if (ERROR)
+    {
+      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
+      SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
+      if (myrank == 0)
+      {
+        if (ErrorMonitor->outfile)
+          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
+                                << " variables at t = " << PhysTime
+                                << ", lev = " << lev << endl;
+        MPI_Abort(MPI_COMM_WORLD, 1);
+      }
+    }
 #endif
 
 #if (MAPBH == 0)
@@ -4146,22 +4153,11 @@ void bssn_class::Step(int lev, int YN)
   }
 #endif
   }
-  // check error information (combined Patch + Shell Patch check)
+  // Non-blocking error reduction overlapped with Sync to hide Allreduce latency
+  MPI_Request err_req;
   {
     int erh = ERROR;
-    MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-  }
-  if (ERROR)
-  {
-    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
-    SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
-    if (myrank == 0)
-    {
-      if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime
-                              << ", lev = " << lev << endl;
-      MPI_Abort(MPI_COMM_WORLD, 1);
-    }
+    MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD, &err_req);
   }
 #endif
 
@@ -4178,9 +4174,24 @@ void bssn_class::Step(int lev, int YN)
     {
       prev_clock = curr_clock;
       curr_clock = clock();
-      cout << " Shell stuff synchronization used " 
-      << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC) 
-      << " seconds! " << endl;
+      cout << " Shell stuff synchronization used "
+           << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC)
+           << " seconds! " << endl;
+    }
+  }
+
+  // Complete non-blocking error reduction and check
+  MPI_Wait(&err_req, MPI_STATUS_IGNORE);
+  if (ERROR)
+  {
+    Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
+    SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
+    if (myrank == 0)
+    {
+      if (ErrorMonitor->outfile)
+        ErrorMonitor->outfile << "find NaN in state variables at t = " << PhysTime
+                              << ", lev = " << lev << endl;
+      MPI_Abort(MPI_COMM_WORLD, 1);
     }
   }
 #endif
@@ -4483,23 +4494,11 @@ void bssn_class::Step(int lev, int YN)
         sPp = sPp->next;
       }
     }
-    // check error information (combined Patch + Shell Patch check)
+    // Non-blocking error reduction overlapped with Sync to hide Allreduce latency
+    MPI_Request err_req_cor;
     {
       int erh = ERROR;
-      MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-    }
-    if (ERROR)
-    {
-      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
-      SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
-      if (myrank == 0)
-      {
-        if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
-                                << " variables at t = " << PhysTime
-                                << ", lev = " << lev << endl;
-        MPI_Abort(MPI_COMM_WORLD, 1);
-      }
+      MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD, &err_req_cor);
     }
 #endif
 
@@ -4516,11 +4515,27 @@ void bssn_class::Step(int lev, int YN)
       {
         prev_clock = curr_clock;
         curr_clock = clock();
-        cout << " Shell stuff synchronization used " 
-             << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC) 
+        cout << " Shell stuff synchronization used "
+             << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC)
              << " seconds! " << endl;
       }
     }
+
+    // Complete non-blocking error reduction and check
+    MPI_Wait(&err_req_cor, MPI_STATUS_IGNORE);
+    if (ERROR)
+    {
+      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
+      SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
+      if (myrank == 0)
+      {
+        if (ErrorMonitor->outfile)
+          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
+                                << " variables at t = " << PhysTime
+                                << ", lev = " << lev << endl;
+        MPI_Abort(MPI_COMM_WORLD, 1);
+      }
+    }
 #endif
     // for black hole position
     if (BH_num > 0 && lev == GH->levels - 1)
@@ -4886,11 +4901,19 @@ void bssn_class::Step(int lev, int YN)
 
   //   misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"after Predictor rhs calculation");
 
-  // check error information
+  // Non-blocking error reduction overlapped with Sync to hide Allreduce latency
+  MPI_Request err_req;
   {
     int erh = ERROR;
-    MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, GH->Commlev[lev]);
+    MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, GH->Commlev[lev], &err_req);
   }
+
+  //   misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Predictor sync");
+
+  Parallel::Sync(GH->PatL[lev], SynchList_pre, Symmetry);
+
+  // Complete non-blocking error reduction and check
+  MPI_Wait(&err_req, MPI_STATUS_IGNORE);
   if (ERROR)
   {
     Parallel::Dump_Data(GH->PatL[lev], StateList, 0, PhysTime, dT_lev);
@@ -4902,10 +4925,6 @@ void bssn_class::Step(int lev, int YN)
     }
   }
 
-  //   misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Predictor sync");
-
-  Parallel::Sync(GH->PatL[lev], SynchList_pre, Symmetry);
-
 #if (MAPBH == 0)
   // for black hole position
   if (BH_num > 0 && lev == GH->levels - 1)
@@ -5083,22 +5102,11 @@ void bssn_class::Step(int lev, int YN)
 
     //   misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Corrector error check");
 
-    // check error information
+    // Non-blocking error reduction overlapped with Sync to hide Allreduce latency
+    MPI_Request err_req_cor;
     {
       int erh = ERROR;
-      MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, GH->Commlev[lev]);
-    }
-    if (ERROR)
-    {
-      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
-      if (myrank == 0)
-      {
-        if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count 
-                                << " variables at t = " << PhysTime 
-                                << ", lev = " << lev << endl;
-        MPI_Abort(MPI_COMM_WORLD, 1);
-      }
+      MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, GH->Commlev[lev], &err_req_cor);
     }
 
     //    misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Corrector sync");
@@ -5107,6 +5115,21 @@ void bssn_class::Step(int lev, int YN)
 
     //    misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"after Corrector sync");
 
+    // Complete non-blocking error reduction and check
+    MPI_Wait(&err_req_cor, MPI_STATUS_IGNORE);
+    if (ERROR)
+    {
+      Parallel::Dump_Data(GH->PatL[lev], SynchList_pre, 0, PhysTime, dT_lev);
+      if (myrank == 0)
+      {
+        if (ErrorMonitor->outfile)
+          ErrorMonitor->outfile << "find NaN in RK4 substep#" << iter_count
+                                << " variables at t = " << PhysTime
+                                << ", lev = " << lev << endl;
+        MPI_Abort(MPI_COMM_WORLD, 1);
+      }
+    }
+
 #if (MAPBH == 0)
     // for black hole position
     if (BH_num > 0 && lev == GH->levels - 1)
@@ -5390,21 +5413,11 @@ void bssn_class::SHStep()
 #if (PSTR == 1 || PSTR == 2)
 //   misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Predictor's error check");
 #endif
-  // check error information
+  // Non-blocking error reduction overlapped with Synch to hide Allreduce latency
+  MPI_Request err_req;
   {
     int erh = ERROR;
-    MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-  }
-
-  if (ERROR)
-  {
-    SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
-    if (myrank == 0)
-    {
-      if (ErrorMonitor->outfile)
-        ErrorMonitor->outfile << "find NaN in state variables on Shell Patches at t = " << PhysTime << endl;
-      MPI_Abort(MPI_COMM_WORLD, 1);
-    }
+    MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD, &err_req);
   }
 
   {
@@ -5416,12 +5429,25 @@ void bssn_class::SHStep()
     {
       prev_clock = curr_clock;
       curr_clock = clock();
-      cout << " Shell stuff synchronization used " 
-           << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC) 
+      cout << " Shell stuff synchronization used "
+           << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC)
            << " seconds! " << endl;
     }
   }
 
+  // Complete non-blocking error reduction and check
+  MPI_Wait(&err_req, MPI_STATUS_IGNORE);
+  if (ERROR)
+  {
+    SH->Dump_Data(StateList, 0, PhysTime, dT_lev);
+    if (myrank == 0)
+    {
+      if (ErrorMonitor->outfile)
+        ErrorMonitor->outfile << "find NaN in state variables on Shell Patches at t = " << PhysTime << endl;
+      MPI_Abort(MPI_COMM_WORLD, 1);
+    }
+  }
+
   // corrector
   for (iter_count = 1; iter_count < 4; iter_count++)
   {
@@ -5564,21 +5590,11 @@ void bssn_class::SHStep()
         sPp = sPp->next;
       }
     }
-    // check error information
+    // Non-blocking error reduction overlapped with Synch to hide Allreduce latency
+    MPI_Request err_req_cor;
     {
       int erh = ERROR;
-      MPI_Allreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-    }
-    if (ERROR)
-    {
-      SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
-      if (myrank == 0)
-      {
-        if (ErrorMonitor->outfile)
-          ErrorMonitor->outfile << "find NaN on Shell Patches in RK4 substep#" << iter_count 
-                                << " variables at t = " << PhysTime << endl;
-        MPI_Abort(MPI_COMM_WORLD, 1);
-      }
+      MPI_Iallreduce(&erh, &ERROR, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD, &err_req_cor);
     }
 
     {
@@ -5590,12 +5606,26 @@ void bssn_class::SHStep()
       {
         prev_clock = curr_clock;
         curr_clock = clock();
-        cout << " Shell stuff synchronization used " 
-             << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC) 
+        cout << " Shell stuff synchronization used "
+             << (double)(curr_clock - prev_clock) / ((double)CLOCKS_PER_SEC)
              << " seconds! " << endl;
       }
     }
 
+    // Complete non-blocking error reduction and check
+    MPI_Wait(&err_req_cor, MPI_STATUS_IGNORE);
+    if (ERROR)
+    {
+      SH->Dump_Data(SynchList_pre, 0, PhysTime, dT_lev);
+      if (myrank == 0)
+      {
+        if (ErrorMonitor->outfile)
+          ErrorMonitor->outfile << "find NaN on Shell Patches in RK4 substep#" << iter_count
+                                << " variables at t = " << PhysTime << endl;
+        MPI_Abort(MPI_COMM_WORLD, 1);
+      }
+    }
+
     sPp = SH->PatL;
     while (sPp)
     {

From 42b9cf1ad9859e86f0e2a29e25dec26d5785b71b Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 9 Feb 2026 21:03:37 +0800
Subject: [PATCH 24/30] Optimize MPI Sync with merged transfers, caching, and
 async overlap

Phase 1: Merge N+1 transfer() calls into a single transfer() per
Sync(PatchList), reducing N+1 MPI_Waitall barriers to 1 via new
Sync_merged() that collects all intra-patch and inter-patch grid
segment lists into combined per-rank arrays.

Phase 2: Cache grid segment lists and reuse grow-only communication
buffers across RK4 substeps via SyncCache struct. Caches are per-level
and per-variable-list (predictor/corrector), invalidated on regrid.
Eliminates redundant build_ghost_gsl/build_owned_gsl0/build_gstl
rebuilds and malloc/free cycles between regrids.

Phase 3: Split Sync into async Sync_start/Sync_finish to overlap
Cartesian ghost zone exchange (MPI_Isend/Irecv) with Shell patch
synchronization. Uses MPI tag 2 to avoid conflicts with SH->Synch()
which uses transfer() with tag 1.

Also updates makefile.inc paths and flags for local build environment.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/Parallel.C   | 478 ++++++++++++++++++++++++++++++++++
 AMSS_NCKU_source/Parallel.h   |  36 +++
 AMSS_NCKU_source/bssn_class.C |  53 +++-
 AMSS_NCKU_source/bssn_class.h |   3 +
 4 files changed, 564 insertions(+), 6 deletions(-)

diff --git a/AMSS_NCKU_source/Parallel.C b/AMSS_NCKU_source/Parallel.C
index 713a6a7..d90cdeb 100644
--- a/AMSS_NCKU_source/Parallel.C
+++ b/AMSS_NCKU_source/Parallel.C
@@ -3756,6 +3756,484 @@ void Parallel::Sync(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry)
   delete[] transfer_src;
   delete[] transfer_dst;
 }
+// Merged Sync: collect all intra-patch and inter-patch grid segment lists,
+// then issue a single transfer() call instead of N+1 separate ones.
+void Parallel::Sync_merged(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry)
+{
+  int cpusize;
+  MPI_Comm_size(MPI_COMM_WORLD, &cpusize);
+
+  MyList<Parallel::gridseg> **combined_src = new MyList<Parallel::gridseg> *[cpusize];
+  MyList<Parallel::gridseg> **combined_dst = new MyList<Parallel::gridseg> *[cpusize];
+  for (int node = 0; node < cpusize; node++)
+    combined_src[node] = combined_dst[node] = 0;
+
+  // Phase A: Intra-patch ghost exchange segments
+  MyList<Patch> *Pp = PatL;
+  while (Pp)
+  {
+    Patch *Pat = Pp->data;
+    MyList<Parallel::gridseg> *dst_ghost = build_ghost_gsl(Pat);
+
+    for (int node = 0; node < cpusize; node++)
+    {
+      MyList<Parallel::gridseg> *src_owned = build_owned_gsl0(Pat, node);
+      MyList<Parallel::gridseg> *tsrc = 0, *tdst = 0;
+      build_gstl(src_owned, dst_ghost, &tsrc, &tdst);
+
+      if (tsrc)
+      {
+        if (combined_src[node])
+          combined_src[node]->catList(tsrc);
+        else
+          combined_src[node] = tsrc;
+      }
+      if (tdst)
+      {
+        if (combined_dst[node])
+          combined_dst[node]->catList(tdst);
+        else
+          combined_dst[node] = tdst;
+      }
+
+      if (src_owned)
+        src_owned->destroyList();
+    }
+
+    if (dst_ghost)
+      dst_ghost->destroyList();
+
+    Pp = Pp->next;
+  }
+
+  // Phase B: Inter-patch buffer exchange segments
+  MyList<Parallel::gridseg> *dst_buffer = build_buffer_gsl(PatL);
+  for (int node = 0; node < cpusize; node++)
+  {
+    MyList<Parallel::gridseg> *src_owned = build_owned_gsl(PatL, node, 5, Symmetry);
+    MyList<Parallel::gridseg> *tsrc = 0, *tdst = 0;
+    build_gstl(src_owned, dst_buffer, &tsrc, &tdst);
+
+    if (tsrc)
+    {
+      if (combined_src[node])
+        combined_src[node]->catList(tsrc);
+      else
+        combined_src[node] = tsrc;
+    }
+    if (tdst)
+    {
+      if (combined_dst[node])
+        combined_dst[node]->catList(tdst);
+      else
+        combined_dst[node] = tdst;
+    }
+
+    if (src_owned)
+      src_owned->destroyList();
+  }
+  if (dst_buffer)
+    dst_buffer->destroyList();
+
+  // Phase C: Single transfer
+  transfer(combined_src, combined_dst, VarList, VarList, Symmetry);
+
+  // Phase D: Cleanup
+  for (int node = 0; node < cpusize; node++)
+  {
+    if (combined_src[node])
+      combined_src[node]->destroyList();
+    if (combined_dst[node])
+      combined_dst[node]->destroyList();
+  }
+  delete[] combined_src;
+  delete[] combined_dst;
+}
+// SyncCache constructor
+Parallel::SyncCache::SyncCache()
+    : valid(false), cpusize(0), combined_src(0), combined_dst(0),
+      send_lengths(0), recv_lengths(0), send_bufs(0), recv_bufs(0),
+      send_buf_caps(0), recv_buf_caps(0), reqs(0), stats(0), max_reqs(0)
+{
+}
+// SyncCache invalidate: free grid segment lists but keep buffers
+void Parallel::SyncCache::invalidate()
+{
+  if (!valid)
+    return;
+  for (int i = 0; i < cpusize; i++)
+  {
+    if (combined_src[i])
+      combined_src[i]->destroyList();
+    if (combined_dst[i])
+      combined_dst[i]->destroyList();
+    combined_src[i] = combined_dst[i] = 0;
+    send_lengths[i] = recv_lengths[i] = 0;
+  }
+  valid = false;
+}
+// SyncCache destroy: free everything
+void Parallel::SyncCache::destroy()
+{
+  invalidate();
+  if (combined_src) delete[] combined_src;
+  if (combined_dst) delete[] combined_dst;
+  if (send_lengths) delete[] send_lengths;
+  if (recv_lengths) delete[] recv_lengths;
+  if (send_buf_caps) delete[] send_buf_caps;
+  if (recv_buf_caps) delete[] recv_buf_caps;
+  for (int i = 0; i < cpusize; i++)
+  {
+    if (send_bufs && send_bufs[i]) delete[] send_bufs[i];
+    if (recv_bufs && recv_bufs[i]) delete[] recv_bufs[i];
+  }
+  if (send_bufs) delete[] send_bufs;
+  if (recv_bufs) delete[] recv_bufs;
+  if (reqs) delete[] reqs;
+  if (stats) delete[] stats;
+  combined_src = combined_dst = 0;
+  send_lengths = recv_lengths = 0;
+  send_buf_caps = recv_buf_caps = 0;
+  send_bufs = recv_bufs = 0;
+  reqs = 0; stats = 0;
+  cpusize = 0; max_reqs = 0;
+}
+// transfer_cached: reuse pre-allocated buffers from SyncCache
+void Parallel::transfer_cached(MyList<Parallel::gridseg> **src, MyList<Parallel::gridseg> **dst,
+                               MyList<var> *VarList1, MyList<var> *VarList2,
+                               int Symmetry, SyncCache &cache)
+{
+  int myrank;
+  MPI_Comm_size(MPI_COMM_WORLD, &cache.cpusize);
+  MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
+  int cpusize = cache.cpusize;
+
+  int req_no = 0;
+  int node;
+
+  for (node = 0; node < cpusize; node++)
+  {
+    if (node == myrank)
+    {
+      int length = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+      cache.recv_lengths[node] = length;
+      if (length > 0)
+      {
+        if (length > cache.recv_buf_caps[node])
+        {
+          if (cache.recv_bufs[node]) delete[] cache.recv_bufs[node];
+          cache.recv_bufs[node] = new double[length];
+          cache.recv_buf_caps[node] = length;
+        }
+        data_packer(cache.recv_bufs[node], src[myrank], dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+      }
+    }
+    else
+    {
+      // send
+      int slength = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+      cache.send_lengths[node] = slength;
+      if (slength > 0)
+      {
+        if (slength > cache.send_buf_caps[node])
+        {
+          if (cache.send_bufs[node]) delete[] cache.send_bufs[node];
+          cache.send_bufs[node] = new double[slength];
+          cache.send_buf_caps[node] = slength;
+        }
+        data_packer(cache.send_bufs[node], src[myrank], dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+        MPI_Isend((void *)cache.send_bufs[node], slength, MPI_DOUBLE, node, 1, MPI_COMM_WORLD, cache.reqs + req_no++);
+      }
+      // recv
+      int rlength = data_packer(0, src[node], dst[node], node, UNPACK, VarList1, VarList2, Symmetry);
+      cache.recv_lengths[node] = rlength;
+      if (rlength > 0)
+      {
+        if (rlength > cache.recv_buf_caps[node])
+        {
+          if (cache.recv_bufs[node]) delete[] cache.recv_bufs[node];
+          cache.recv_bufs[node] = new double[rlength];
+          cache.recv_buf_caps[node] = rlength;
+        }
+        MPI_Irecv((void *)cache.recv_bufs[node], rlength, MPI_DOUBLE, node, 1, MPI_COMM_WORLD, cache.reqs + req_no++);
+      }
+    }
+  }
+
+  MPI_Waitall(req_no, cache.reqs, cache.stats);
+
+  for (node = 0; node < cpusize; node++)
+    if (cache.recv_bufs[node] && cache.recv_lengths[node] > 0)
+      data_packer(cache.recv_bufs[node], src[node], dst[node], node, UNPACK, VarList1, VarList2, Symmetry);
+}
+// Sync_cached: build grid segment lists on first call, reuse on subsequent calls
+void Parallel::Sync_cached(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry, SyncCache &cache)
+{
+  if (!cache.valid)
+  {
+    int cpusize;
+    MPI_Comm_size(MPI_COMM_WORLD, &cpusize);
+    cache.cpusize = cpusize;
+
+    // Allocate cache arrays if needed
+    if (!cache.combined_src)
+    {
+      cache.combined_src = new MyList<Parallel::gridseg> *[cpusize];
+      cache.combined_dst = new MyList<Parallel::gridseg> *[cpusize];
+      cache.send_lengths = new int[cpusize];
+      cache.recv_lengths = new int[cpusize];
+      cache.send_bufs = new double *[cpusize];
+      cache.recv_bufs = new double *[cpusize];
+      cache.send_buf_caps = new int[cpusize];
+      cache.recv_buf_caps = new int[cpusize];
+      for (int i = 0; i < cpusize; i++)
+      {
+        cache.send_bufs[i] = cache.recv_bufs[i] = 0;
+        cache.send_buf_caps[i] = cache.recv_buf_caps[i] = 0;
+      }
+      cache.max_reqs = 2 * cpusize;
+      cache.reqs = new MPI_Request[cache.max_reqs];
+      cache.stats = new MPI_Status[cache.max_reqs];
+    }
+
+    for (int node = 0; node < cpusize; node++)
+    {
+      cache.combined_src[node] = cache.combined_dst[node] = 0;
+      cache.send_lengths[node] = cache.recv_lengths[node] = 0;
+    }
+
+    // Build intra-patch segments (same as Sync_merged Phase A)
+    MyList<Patch> *Pp = PatL;
+    while (Pp)
+    {
+      Patch *Pat = Pp->data;
+      MyList<Parallel::gridseg> *dst_ghost = build_ghost_gsl(Pat);
+      for (int node = 0; node < cpusize; node++)
+      {
+        MyList<Parallel::gridseg> *src_owned = build_owned_gsl0(Pat, node);
+        MyList<Parallel::gridseg> *tsrc = 0, *tdst = 0;
+        build_gstl(src_owned, dst_ghost, &tsrc, &tdst);
+        if (tsrc)
+        {
+          if (cache.combined_src[node])
+            cache.combined_src[node]->catList(tsrc);
+          else
+            cache.combined_src[node] = tsrc;
+        }
+        if (tdst)
+        {
+          if (cache.combined_dst[node])
+            cache.combined_dst[node]->catList(tdst);
+          else
+            cache.combined_dst[node] = tdst;
+        }
+        if (src_owned) src_owned->destroyList();
+      }
+      if (dst_ghost) dst_ghost->destroyList();
+      Pp = Pp->next;
+    }
+
+    // Build inter-patch segments (same as Sync_merged Phase B)
+    MyList<Parallel::gridseg> *dst_buffer = build_buffer_gsl(PatL);
+    for (int node = 0; node < cpusize; node++)
+    {
+      MyList<Parallel::gridseg> *src_owned = build_owned_gsl(PatL, node, 5, Symmetry);
+      MyList<Parallel::gridseg> *tsrc = 0, *tdst = 0;
+      build_gstl(src_owned, dst_buffer, &tsrc, &tdst);
+      if (tsrc)
+      {
+        if (cache.combined_src[node])
+          cache.combined_src[node]->catList(tsrc);
+        else
+          cache.combined_src[node] = tsrc;
+      }
+      if (tdst)
+      {
+        if (cache.combined_dst[node])
+          cache.combined_dst[node]->catList(tdst);
+        else
+          cache.combined_dst[node] = tdst;
+      }
+      if (src_owned) src_owned->destroyList();
+    }
+    if (dst_buffer) dst_buffer->destroyList();
+
+    cache.valid = true;
+  }
+
+  // Use cached lists with buffer-reusing transfer
+  transfer_cached(cache.combined_src, cache.combined_dst, VarList, VarList, Symmetry, cache);
+}
+// Sync_start: pack and post MPI_Isend/Irecv, return immediately
+void Parallel::Sync_start(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry,
+                          SyncCache &cache, AsyncSyncState &state)
+{
+  // Ensure cache is built
+  if (!cache.valid)
+  {
+    // Build cache (same logic as Sync_cached)
+    int cpusize;
+    MPI_Comm_size(MPI_COMM_WORLD, &cpusize);
+    cache.cpusize = cpusize;
+
+    if (!cache.combined_src)
+    {
+      cache.combined_src = new MyList<Parallel::gridseg> *[cpusize];
+      cache.combined_dst = new MyList<Parallel::gridseg> *[cpusize];
+      cache.send_lengths = new int[cpusize];
+      cache.recv_lengths = new int[cpusize];
+      cache.send_bufs = new double *[cpusize];
+      cache.recv_bufs = new double *[cpusize];
+      cache.send_buf_caps = new int[cpusize];
+      cache.recv_buf_caps = new int[cpusize];
+      for (int i = 0; i < cpusize; i++)
+      {
+        cache.send_bufs[i] = cache.recv_bufs[i] = 0;
+        cache.send_buf_caps[i] = cache.recv_buf_caps[i] = 0;
+      }
+      cache.max_reqs = 2 * cpusize;
+      cache.reqs = new MPI_Request[cache.max_reqs];
+      cache.stats = new MPI_Status[cache.max_reqs];
+    }
+
+    for (int node = 0; node < cpusize; node++)
+    {
+      cache.combined_src[node] = cache.combined_dst[node] = 0;
+      cache.send_lengths[node] = cache.recv_lengths[node] = 0;
+    }
+
+    MyList<Patch> *Pp = PatL;
+    while (Pp)
+    {
+      Patch *Pat = Pp->data;
+      MyList<Parallel::gridseg> *dst_ghost = build_ghost_gsl(Pat);
+      for (int node = 0; node < cpusize; node++)
+      {
+        MyList<Parallel::gridseg> *src_owned = build_owned_gsl0(Pat, node);
+        MyList<Parallel::gridseg> *tsrc = 0, *tdst = 0;
+        build_gstl(src_owned, dst_ghost, &tsrc, &tdst);
+        if (tsrc)
+        {
+          if (cache.combined_src[node])
+            cache.combined_src[node]->catList(tsrc);
+          else
+            cache.combined_src[node] = tsrc;
+        }
+        if (tdst)
+        {
+          if (cache.combined_dst[node])
+            cache.combined_dst[node]->catList(tdst);
+          else
+            cache.combined_dst[node] = tdst;
+        }
+        if (src_owned) src_owned->destroyList();
+      }
+      if (dst_ghost) dst_ghost->destroyList();
+      Pp = Pp->next;
+    }
+
+    MyList<Parallel::gridseg> *dst_buffer = build_buffer_gsl(PatL);
+    for (int node = 0; node < cpusize; node++)
+    {
+      MyList<Parallel::gridseg> *src_owned = build_owned_gsl(PatL, node, 5, Symmetry);
+      MyList<Parallel::gridseg> *tsrc = 0, *tdst = 0;
+      build_gstl(src_owned, dst_buffer, &tsrc, &tdst);
+      if (tsrc)
+      {
+        if (cache.combined_src[node])
+          cache.combined_src[node]->catList(tsrc);
+        else
+          cache.combined_src[node] = tsrc;
+      }
+      if (tdst)
+      {
+        if (cache.combined_dst[node])
+          cache.combined_dst[node]->catList(tdst);
+        else
+          cache.combined_dst[node] = tdst;
+      }
+      if (src_owned) src_owned->destroyList();
+    }
+    if (dst_buffer) dst_buffer->destroyList();
+    cache.valid = true;
+  }
+
+  // Now pack and post async MPI operations
+  int myrank;
+  MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
+  int cpusize = cache.cpusize;
+  state.req_no = 0;
+  state.active = true;
+
+  MyList<Parallel::gridseg> **src = cache.combined_src;
+  MyList<Parallel::gridseg> **dst = cache.combined_dst;
+
+  for (int node = 0; node < cpusize; node++)
+  {
+    if (node == myrank)
+    {
+      int length = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
+      cache.recv_lengths[node] = length;
+      if (length > 0)
+      {
+        if (length > cache.recv_buf_caps[node])
+        {
+          if (cache.recv_bufs[node]) delete[] cache.recv_bufs[node];
+          cache.recv_bufs[node] = new double[length];
+          cache.recv_buf_caps[node] = length;
+        }
+        data_packer(cache.recv_bufs[node], src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
+      }
+    }
+    else
+    {
+      int slength = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
+      cache.send_lengths[node] = slength;
+      if (slength > 0)
+      {
+        if (slength > cache.send_buf_caps[node])
+        {
+          if (cache.send_bufs[node]) delete[] cache.send_bufs[node];
+          cache.send_bufs[node] = new double[slength];
+          cache.send_buf_caps[node] = slength;
+        }
+        data_packer(cache.send_bufs[node], src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
+        MPI_Isend((void *)cache.send_bufs[node], slength, MPI_DOUBLE, node, 2, MPI_COMM_WORLD, cache.reqs + state.req_no++);
+      }
+      int rlength = data_packer(0, src[node], dst[node], node, UNPACK, VarList, VarList, Symmetry);
+      cache.recv_lengths[node] = rlength;
+      if (rlength > 0)
+      {
+        if (rlength > cache.recv_buf_caps[node])
+        {
+          if (cache.recv_bufs[node]) delete[] cache.recv_bufs[node];
+          cache.recv_bufs[node] = new double[rlength];
+          cache.recv_buf_caps[node] = rlength;
+        }
+        MPI_Irecv((void *)cache.recv_bufs[node], rlength, MPI_DOUBLE, node, 2, MPI_COMM_WORLD, cache.reqs + state.req_no++);
+      }
+    }
+  }
+}
+// Sync_finish: wait for async MPI operations and unpack
+void Parallel::Sync_finish(SyncCache &cache, AsyncSyncState &state,
+                           MyList<var> *VarList, int Symmetry)
+{
+  if (!state.active)
+    return;
+
+  MPI_Waitall(state.req_no, cache.reqs, cache.stats);
+
+  int cpusize = cache.cpusize;
+  MyList<Parallel::gridseg> **src = cache.combined_src;
+  MyList<Parallel::gridseg> **dst = cache.combined_dst;
+
+  for (int node = 0; node < cpusize; node++)
+    if (cache.recv_bufs[node] && cache.recv_lengths[node] > 0)
+      data_packer(cache.recv_bufs[node], src[node], dst[node], node, UNPACK, VarList, VarList, Symmetry);
+
+  state.active = false;
+}
 // collect buffer grid segments or blocks for the periodic boundary condition of given patch
 // ---------------------------------------------------
 // |con |                                       |con |
diff --git a/AMSS_NCKU_source/Parallel.h b/AMSS_NCKU_source/Parallel.h
index 12fc356..7935727 100644
--- a/AMSS_NCKU_source/Parallel.h
+++ b/AMSS_NCKU_source/Parallel.h
@@ -81,6 +81,42 @@ namespace Parallel
                    int Symmetry);
   void Sync(Patch *Pat, MyList<var> *VarList, int Symmetry);
   void Sync(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry);
+  void Sync_merged(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry);
+
+  struct SyncCache {
+    bool valid;
+    int cpusize;
+    MyList<gridseg> **combined_src;
+    MyList<gridseg> **combined_dst;
+    int *send_lengths;
+    int *recv_lengths;
+    double **send_bufs;
+    double **recv_bufs;
+    int *send_buf_caps;
+    int *recv_buf_caps;
+    MPI_Request *reqs;
+    MPI_Status *stats;
+    int max_reqs;
+    SyncCache();
+    void invalidate();
+    void destroy();
+  };
+
+  void Sync_cached(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry, SyncCache &cache);
+  void transfer_cached(MyList<gridseg> **src, MyList<gridseg> **dst,
+                       MyList<var> *VarList1, MyList<var> *VarList2,
+                       int Symmetry, SyncCache &cache);
+
+  struct AsyncSyncState {
+    int req_no;
+    bool active;
+    AsyncSyncState() : req_no(0), active(false) {}
+  };
+
+  void Sync_start(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetry,
+                  SyncCache &cache, AsyncSyncState &state);
+  void Sync_finish(SyncCache &cache, AsyncSyncState &state,
+                   MyList<var> *VarList, int Symmetry);
   void OutBdLow2Hi(Patch *Patc, Patch *Patf,
                    MyList<var> *VarList1 /* source */, MyList<var> *VarList2 /* target */,
                    int Symmetry);
diff --git a/AMSS_NCKU_source/bssn_class.C b/AMSS_NCKU_source/bssn_class.C
index 553cc72..7a1400e 100644
--- a/AMSS_NCKU_source/bssn_class.C
+++ b/AMSS_NCKU_source/bssn_class.C
@@ -730,6 +730,10 @@ void bssn_class::Initialize()
     PhysTime = StartTime;
     Setup_Black_Hole_position();
   }
+
+  // Initialize sync caches (per-level, for predictor and corrector)
+  sync_cache_pre = new Parallel::SyncCache[GH->levels];
+  sync_cache_cor = new Parallel::SyncCache[GH->levels];
 }
 
 //================================================================================================
@@ -981,6 +985,20 @@ bssn_class::~bssn_class()
   delete Azzz;
 #endif
 
+  // Destroy sync caches before GH
+  if (sync_cache_pre)
+  {
+    for (int i = 0; i < GH->levels; i++)
+      sync_cache_pre[i].destroy();
+    delete[] sync_cache_pre;
+  }
+  if (sync_cache_cor)
+  {
+    for (int i = 0; i < GH->levels; i++)
+      sync_cache_cor[i].destroy();
+    delete[] sync_cache_cor;
+  }
+
   delete GH;
 #ifdef WithShell
   delete SH;
@@ -2181,6 +2199,7 @@ void bssn_class::Evolve(int Steps)
     GH->Regrid(Symmetry, BH_num, Porgbr, Porg0,
                SynchList_cor, OldStateList, StateList, SynchList_pre,
                fgt(PhysTime - dT_mon, StartTime, dT_mon / 2), ErrorMonitor);
+    for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 #endif
 
 #if (REGLEV == 0 && (PSTR == 1 || PSTR == 2))
@@ -2396,6 +2415,7 @@ void bssn_class::RecursiveStep(int lev)
   GH->Regrid_Onelevel(lev, Symmetry, BH_num, Porgbr, Porg0,
                       SynchList_cor, OldStateList, StateList, SynchList_pre,
                       fgt(PhysTime - dT_lev, StartTime, dT_lev / 2), ErrorMonitor);
+  for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 #endif
 }
 
@@ -2574,6 +2594,7 @@ void bssn_class::ParallelStep()
   GH->Regrid_Onelevel(GH->mylev, Symmetry, BH_num, Porgbr, Porg0,
                       SynchList_cor, OldStateList, StateList, SynchList_pre,
                       fgt(PhysTime - dT_lev, StartTime, dT_lev / 2), ErrorMonitor);
+  for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 #endif
 }
 
@@ -2740,6 +2761,7 @@ void bssn_class::ParallelStep()
         GH->Regrid_Onelevel(lev + 1, Symmetry, BH_num, Porgbr, Porg0,
                             SynchList_cor, OldStateList, StateList, SynchList_pre,
                             fgt(PhysTime - dT_levp1, StartTime, dT_levp1 / 2), ErrorMonitor);
+        for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 
         //               a_stream.clear();
         //               a_stream.str("");
@@ -2754,6 +2776,7 @@ void bssn_class::ParallelStep()
       GH->Regrid_Onelevel(lev, Symmetry, BH_num, Porgbr, Porg0,
                           SynchList_cor, OldStateList, StateList, SynchList_pre,
                           fgt(PhysTime - dT_lev, StartTime, dT_lev / 2), ErrorMonitor);
+      for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 
       //               a_stream.clear();
       //               a_stream.str("");
@@ -2772,6 +2795,7 @@ void bssn_class::ParallelStep()
           GH->Regrid_Onelevel(lev - 1, Symmetry, BH_num, Porgbr, Porg0,
                               SynchList_cor, OldStateList, StateList, SynchList_pre,
                               fgt(PhysTime - dT_lev, StartTime, dT_levm1 / 2), ErrorMonitor);
+          for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 
           //               a_stream.clear();
           //               a_stream.str("");
@@ -2787,6 +2811,7 @@ void bssn_class::ParallelStep()
           GH->Regrid_Onelevel(lev - 1, Symmetry, BH_num, Porgbr, Porg0,
                               SynchList_cor, OldStateList, StateList, SynchList_pre,
                               fgt(PhysTime - dT_lev, StartTime, dT_levm1 / 2), ErrorMonitor);
+          for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
 
           //               a_stream.clear();
           //               a_stream.str("");
@@ -3310,7 +3335,8 @@ void bssn_class::Step(int lev, int YN)
   }
 #endif
 
-  Parallel::Sync(GH->PatL[lev], SynchList_pre, Symmetry);
+  Parallel::AsyncSyncState async_pre;
+  Parallel::Sync_start(GH->PatL[lev], SynchList_pre, Symmetry, sync_cache_pre[lev], async_pre);
 
 #ifdef WithShell
   if (lev == 0)
@@ -3328,7 +3354,10 @@ void bssn_class::Step(int lev, int YN)
            << " seconds! " << endl;
     }
   }
+#endif
+  Parallel::Sync_finish(sync_cache_pre[lev], async_pre, SynchList_pre, Symmetry);
 
+#ifdef WithShell
   // Complete non-blocking error reduction and check
   MPI_Wait(&err_req, MPI_STATUS_IGNORE);
   if (ERROR)
@@ -3666,7 +3695,8 @@ void bssn_class::Step(int lev, int YN)
     }
 #endif
 
-    Parallel::Sync(GH->PatL[lev], SynchList_cor, Symmetry);
+    Parallel::AsyncSyncState async_cor;
+    Parallel::Sync_start(GH->PatL[lev], SynchList_cor, Symmetry, sync_cache_cor[lev], async_cor);
 
 #ifdef WithShell
     if (lev == 0)
@@ -3684,7 +3714,10 @@ void bssn_class::Step(int lev, int YN)
              << " seconds! " << endl;
       }
     }
+#endif
+    Parallel::Sync_finish(sync_cache_cor[lev], async_cor, SynchList_cor, Symmetry);
 
+#ifdef WithShell
     // Complete non-blocking error reduction and check
     MPI_Wait(&err_req_cor, MPI_STATUS_IGNORE);
     if (ERROR)
@@ -4161,7 +4194,8 @@ void bssn_class::Step(int lev, int YN)
   }
 #endif
 
-  Parallel::Sync(GH->PatL[lev], SynchList_pre, Symmetry);
+  Parallel::AsyncSyncState async_pre;
+  Parallel::Sync_start(GH->PatL[lev], SynchList_pre, Symmetry, sync_cache_pre[lev], async_pre);
 
 #ifdef WithShell
   if (lev == 0)
@@ -4179,7 +4213,10 @@ void bssn_class::Step(int lev, int YN)
            << " seconds! " << endl;
     }
   }
+#endif
+  Parallel::Sync_finish(sync_cache_pre[lev], async_pre, SynchList_pre, Symmetry);
 
+#ifdef WithShell
   // Complete non-blocking error reduction and check
   MPI_Wait(&err_req, MPI_STATUS_IGNORE);
   if (ERROR)
@@ -4502,7 +4539,8 @@ void bssn_class::Step(int lev, int YN)
     }
 #endif
 
-    Parallel::Sync(GH->PatL[lev], SynchList_cor, Symmetry);
+    Parallel::AsyncSyncState async_cor;
+    Parallel::Sync_start(GH->PatL[lev], SynchList_cor, Symmetry, sync_cache_cor[lev], async_cor);
 
 #ifdef WithShell
     if (lev == 0)
@@ -4520,7 +4558,10 @@ void bssn_class::Step(int lev, int YN)
              << " seconds! " << endl;
       }
     }
+#endif
+    Parallel::Sync_finish(sync_cache_cor[lev], async_cor, SynchList_cor, Symmetry);
 
+#ifdef WithShell
     // Complete non-blocking error reduction and check
     MPI_Wait(&err_req_cor, MPI_STATUS_IGNORE);
     if (ERROR)
@@ -4910,7 +4951,7 @@ void bssn_class::Step(int lev, int YN)
 
   //   misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Predictor sync");
 
-  Parallel::Sync(GH->PatL[lev], SynchList_pre, Symmetry);
+  Parallel::Sync_cached(GH->PatL[lev], SynchList_pre, Symmetry, sync_cache_pre[lev]);
 
   // Complete non-blocking error reduction and check
   MPI_Wait(&err_req, MPI_STATUS_IGNORE);
@@ -5111,7 +5152,7 @@ void bssn_class::Step(int lev, int YN)
 
     //    misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"before Corrector sync");
 
-    Parallel::Sync(GH->PatL[lev], SynchList_cor, Symmetry);
+    Parallel::Sync_cached(GH->PatL[lev], SynchList_cor, Symmetry, sync_cache_cor[lev]);
 
     //    misc::tillherecheck(GH->Commlev[lev],GH->start_rank[lev],"after Corrector sync");
 
diff --git a/AMSS_NCKU_source/bssn_class.h b/AMSS_NCKU_source/bssn_class.h
index 740d3aa..fe3618b 100644
--- a/AMSS_NCKU_source/bssn_class.h
+++ b/AMSS_NCKU_source/bssn_class.h
@@ -126,6 +126,9 @@ public:
        MyList<var> *OldStateList, *DumpList;
        MyList<var> *ConstraintList;
 
+       Parallel::SyncCache *sync_cache_pre;  // per-level cache for predictor sync
+       Parallel::SyncCache *sync_cache_cor;  // per-level cache for corrector sync
+
        monitor *ErrorMonitor, *Psi4Monitor, *BHMonitor, *MAPMonitor;
        monitor *ConVMonitor;
        surface_integral *Waveshell;

From 738498cb28674a445b5103f28fb894af87193179 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 9 Feb 2026 22:07:12 +0800
Subject: [PATCH 25/30] Optimize MPI communication in RestrictProlong and
 surface_integral

Cache Sync in RestrictProlong: replace 11 basic Parallel::Sync() calls
with Parallel::Sync_cached() across RestrictProlong, RestrictProlong_aux,
and ProlongRestrict to avoid rebuilding grid segment lists every call.

Merge paired MPI_Allreduce in surface_integral: combine 9 pairs of
consecutive RP/IP Allreduce calls into single calls with count=2*NN.

Merge scalar MPI_Allreduce in surf_MassPAng: combine 3 groups of 7
scalar Allreduce calls (mass + angular/linear momentum) into single
calls with count=7.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/bssn_class.C       |  50 ++++++---
 AMSS_NCKU_source/bssn_class.h       |   2 +
 AMSS_NCKU_source/surface_integral.C | 165 ++++++++++++++++++++--------
 3 files changed, 154 insertions(+), 63 deletions(-)

diff --git a/AMSS_NCKU_source/bssn_class.C b/AMSS_NCKU_source/bssn_class.C
index 7a1400e..927bff5 100644
--- a/AMSS_NCKU_source/bssn_class.C
+++ b/AMSS_NCKU_source/bssn_class.C
@@ -734,6 +734,8 @@ void bssn_class::Initialize()
   // Initialize sync caches (per-level, for predictor and corrector)
   sync_cache_pre = new Parallel::SyncCache[GH->levels];
   sync_cache_cor = new Parallel::SyncCache[GH->levels];
+  sync_cache_rp_coarse = new Parallel::SyncCache[GH->levels];
+  sync_cache_rp_fine = new Parallel::SyncCache[GH->levels];
 }
 
 //================================================================================================
@@ -998,6 +1000,18 @@ bssn_class::~bssn_class()
       sync_cache_cor[i].destroy();
     delete[] sync_cache_cor;
   }
+  if (sync_cache_rp_coarse)
+  {
+    for (int i = 0; i < GH->levels; i++)
+      sync_cache_rp_coarse[i].destroy();
+    delete[] sync_cache_rp_coarse;
+  }
+  if (sync_cache_rp_fine)
+  {
+    for (int i = 0; i < GH->levels; i++)
+      sync_cache_rp_fine[i].destroy();
+    delete[] sync_cache_rp_fine;
+  }
 
   delete GH;
 #ifdef WithShell
@@ -2199,7 +2213,7 @@ void bssn_class::Evolve(int Steps)
     GH->Regrid(Symmetry, BH_num, Porgbr, Porg0,
                SynchList_cor, OldStateList, StateList, SynchList_pre,
                fgt(PhysTime - dT_mon, StartTime, dT_mon / 2), ErrorMonitor);
-    for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+    for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 #endif
 
 #if (REGLEV == 0 && (PSTR == 1 || PSTR == 2))
@@ -2415,7 +2429,7 @@ void bssn_class::RecursiveStep(int lev)
   GH->Regrid_Onelevel(lev, Symmetry, BH_num, Porgbr, Porg0,
                       SynchList_cor, OldStateList, StateList, SynchList_pre,
                       fgt(PhysTime - dT_lev, StartTime, dT_lev / 2), ErrorMonitor);
-  for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+  for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 #endif
 }
 
@@ -2594,7 +2608,7 @@ void bssn_class::ParallelStep()
   GH->Regrid_Onelevel(GH->mylev, Symmetry, BH_num, Porgbr, Porg0,
                       SynchList_cor, OldStateList, StateList, SynchList_pre,
                       fgt(PhysTime - dT_lev, StartTime, dT_lev / 2), ErrorMonitor);
-  for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+  for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 #endif
 }
 
@@ -2761,7 +2775,7 @@ void bssn_class::ParallelStep()
         GH->Regrid_Onelevel(lev + 1, Symmetry, BH_num, Porgbr, Porg0,
                             SynchList_cor, OldStateList, StateList, SynchList_pre,
                             fgt(PhysTime - dT_levp1, StartTime, dT_levp1 / 2), ErrorMonitor);
-        for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+        for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 
         //               a_stream.clear();
         //               a_stream.str("");
@@ -2776,7 +2790,7 @@ void bssn_class::ParallelStep()
       GH->Regrid_Onelevel(lev, Symmetry, BH_num, Porgbr, Porg0,
                           SynchList_cor, OldStateList, StateList, SynchList_pre,
                           fgt(PhysTime - dT_lev, StartTime, dT_lev / 2), ErrorMonitor);
-      for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+      for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 
       //               a_stream.clear();
       //               a_stream.str("");
@@ -2795,7 +2809,7 @@ void bssn_class::ParallelStep()
           GH->Regrid_Onelevel(lev - 1, Symmetry, BH_num, Porgbr, Porg0,
                               SynchList_cor, OldStateList, StateList, SynchList_pre,
                               fgt(PhysTime - dT_lev, StartTime, dT_levm1 / 2), ErrorMonitor);
-          for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+          for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 
           //               a_stream.clear();
           //               a_stream.str("");
@@ -2811,7 +2825,7 @@ void bssn_class::ParallelStep()
           GH->Regrid_Onelevel(lev - 1, Symmetry, BH_num, Porgbr, Porg0,
                               SynchList_cor, OldStateList, StateList, SynchList_pre,
                               fgt(PhysTime - dT_lev, StartTime, dT_levm1 / 2), ErrorMonitor);
-          for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); }
+          for (int il = 0; il < GH->levels; il++) { sync_cache_pre[il].invalidate(); sync_cache_cor[il].invalidate(); sync_cache_rp_coarse[il].invalidate(); sync_cache_rp_fine[il].invalidate(); }
 
           //               a_stream.clear();
           //               a_stream.str("");
@@ -5795,7 +5809,7 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB,
 //       misc::tillherecheck(GH->Commlev[GH->mylev],GH->start_rank[GH->mylev],a_stream.str());
 #endif
 
-      Parallel::Sync(GH->PatL[lev - 1], SynchList_pre, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], SynchList_pre, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (PSTR == 1 || PSTR == 2)
 //       a_stream.clear();
@@ -5856,7 +5870,7 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB,
 //       misc::tillherecheck(GH->Commlev[GH->mylev],GH->start_rank[GH->mylev],a_stream.str());
 #endif
 
-      Parallel::Sync(GH->PatL[lev - 1], SL, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], SL, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (PSTR == 1 || PSTR == 2)
 //       a_stream.clear();
@@ -5894,7 +5908,7 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB,
 #endif
     }
 
-    Parallel::Sync(GH->PatL[lev], SL, Symmetry);
+    Parallel::Sync_cached(GH->PatL[lev], SL, Symmetry, sync_cache_rp_fine[lev]);
 
 #if (PSTR == 1 || PSTR == 2)
 //    a_stream.clear();
@@ -5952,7 +5966,7 @@ void bssn_class::RestrictProlong_aux(int lev, int YN, bool BB,
       Parallel::Restrict_bam(GH->PatL[lev - 1], GH->PatL[lev], SL, SynchList_pre, GH->rsul[lev], Symmetry);
 #endif
 
-      Parallel::Sync(GH->PatL[lev - 1], SynchList_pre, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], SynchList_pre, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
       Ppc = GH->PatL[lev - 1];
@@ -5984,7 +5998,7 @@ void bssn_class::RestrictProlong_aux(int lev, int YN, bool BB,
       Parallel::Restrict_bam(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, GH->rsul[lev], Symmetry);
 #endif
 
-      Parallel::Sync(GH->PatL[lev - 1], SL, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], SL, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
       Ppc = GH->PatL[lev - 1];
@@ -6008,7 +6022,7 @@ void bssn_class::RestrictProlong_aux(int lev, int YN, bool BB,
 #endif
     }
 
-    Parallel::Sync(GH->PatL[lev], SL, Symmetry);
+    Parallel::Sync_cached(GH->PatL[lev], SL, Symmetry, sync_cache_rp_fine[lev]);
   }
 }
 
@@ -6059,7 +6073,7 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB)
       Parallel::Restrict_bam(GH->PatL[lev - 1], GH->PatL[lev], SynchList_cor, SynchList_pre, GH->rsul[lev], Symmetry);
 #endif
 
-      Parallel::Sync(GH->PatL[lev - 1], SynchList_pre, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], SynchList_pre, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
       Ppc = GH->PatL[lev - 1];
@@ -6093,7 +6107,7 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB)
       Parallel::Restrict_bam(GH->PatL[lev - 1], GH->PatL[lev], SynchList_cor, StateList, GH->rsul[lev], Symmetry);
 #endif
 
-      Parallel::Sync(GH->PatL[lev - 1], StateList, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], StateList, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
       Ppc = GH->PatL[lev - 1];
@@ -6117,7 +6131,7 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB)
 #endif
     }
 
-    Parallel::Sync(GH->PatL[lev], SynchList_cor, Symmetry);
+    Parallel::Sync_cached(GH->PatL[lev], SynchList_cor, Symmetry, sync_cache_rp_fine[lev]);
   }
 }
 
@@ -6200,10 +6214,10 @@ void bssn_class::ProlongRestrict(int lev, int YN, bool BB)
 #else
       Parallel::Restrict_after(GH->PatL[lev - 1], GH->PatL[lev], SynchList_cor, StateList, Symmetry);
 #endif
-      Parallel::Sync(GH->PatL[lev - 1], StateList, Symmetry);
+      Parallel::Sync_cached(GH->PatL[lev - 1], StateList, Symmetry, sync_cache_rp_coarse[lev]);
     }
 
-    Parallel::Sync(GH->PatL[lev], SynchList_cor, Symmetry);
+    Parallel::Sync_cached(GH->PatL[lev], SynchList_cor, Symmetry, sync_cache_rp_fine[lev]);
   }
 }
 #undef MIXOUTB
diff --git a/AMSS_NCKU_source/bssn_class.h b/AMSS_NCKU_source/bssn_class.h
index fe3618b..db434e2 100644
--- a/AMSS_NCKU_source/bssn_class.h
+++ b/AMSS_NCKU_source/bssn_class.h
@@ -128,6 +128,8 @@ public:
 
        Parallel::SyncCache *sync_cache_pre;  // per-level cache for predictor sync
        Parallel::SyncCache *sync_cache_cor;  // per-level cache for corrector sync
+       Parallel::SyncCache *sync_cache_rp_coarse;  // RestrictProlong sync on PatL[lev-1]
+       Parallel::SyncCache *sync_cache_rp_fine;    // RestrictProlong sync on PatL[lev]
 
        monitor *ErrorMonitor, *Psi4Monitor, *BHMonitor, *MAPMonitor;
        monitor *ConVMonitor;
diff --git a/AMSS_NCKU_source/surface_integral.C b/AMSS_NCKU_source/surface_integral.C
index 410aee2..e725ae0 100644
--- a/AMSS_NCKU_source/surface_integral.C
+++ b/AMSS_NCKU_source/surface_integral.C
@@ -363,8 +363,17 @@ void surface_integral::surf_Wave(double rex, int lev, cgh *GH, var *Rpsi4, var *
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -556,8 +565,17 @@ void surface_integral::surf_Wave(double rex, int lev, cgh *GH, var *Rpsi4, var *
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, Comm_here);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, Comm_here);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, Comm_here);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -735,8 +753,17 @@ void surface_integral::surf_Wave(double rex, int lev, ShellPatch *GH, var *Rpsi4
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -984,8 +1011,17 @@ void surface_integral::surf_Wave(double rex, int lev, ShellPatch *GH,
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -1419,8 +1455,17 @@ void surface_integral::surf_Wave(double rex, int lev, ShellPatch *GH,
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -1854,8 +1899,17 @@ void surface_integral::surf_Wave(double rex, int lev, cgh *GH,
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -2040,8 +2094,17 @@ void surface_integral::surf_Wave(double rex, int lev, NullShellPatch2 *GH, var *
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -2226,8 +2289,17 @@ void surface_integral::surf_Wave(double rex, int lev, NullShellPatch *GH, var *R
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 
@@ -2464,15 +2536,13 @@ void surface_integral::surf_MassPAng(double rex, int lev, cgh *GH, var *chi, var
     }
   }
 
-  MPI_Allreduce(&Mass_out, &mass, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-
-  MPI_Allreduce(&ang_outx, &sx, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&ang_outy, &sy, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&ang_outz, &sz, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-
-  MPI_Allreduce(&p_outx, &px, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&p_outy, &py, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&p_outz, &pz, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double scalar_out[7] = {Mass_out, ang_outx, ang_outy, ang_outz, p_outx, p_outy, p_outz};
+    double scalar_in[7];
+    MPI_Allreduce(scalar_out, scalar_in, 7, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    mass = scalar_in[0]; sx = scalar_in[1]; sy = scalar_in[2]; sz = scalar_in[3];
+    px = scalar_in[4]; py = scalar_in[5]; pz = scalar_in[6];
+  }
 
 #ifdef GaussInt
   mass = mass * rex * rex * dphi * factor;
@@ -2735,15 +2805,13 @@ void surface_integral::surf_MassPAng(double rex, int lev, cgh *GH, var *chi, var
     }
   }
 
-  MPI_Allreduce(&Mass_out, &mass, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
-
-  MPI_Allreduce(&ang_outx, &sx, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
-  MPI_Allreduce(&ang_outy, &sy, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
-  MPI_Allreduce(&ang_outz, &sz, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
-
-  MPI_Allreduce(&p_outx, &px, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
-  MPI_Allreduce(&p_outy, &py, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
-  MPI_Allreduce(&p_outz, &pz, 1, MPI_DOUBLE, MPI_SUM, Comm_here);
+  {
+    double scalar_out[7] = {Mass_out, ang_outx, ang_outy, ang_outz, p_outx, p_outy, p_outz};
+    double scalar_in[7];
+    MPI_Allreduce(scalar_out, scalar_in, 7, MPI_DOUBLE, MPI_SUM, Comm_here);
+    mass = scalar_in[0]; sx = scalar_in[1]; sy = scalar_in[2]; sz = scalar_in[3];
+    px = scalar_in[4]; py = scalar_in[5]; pz = scalar_in[6];
+  }
 
 #ifdef GaussInt
   mass = mass * rex * rex * dphi * factor;
@@ -3020,15 +3088,13 @@ void surface_integral::surf_MassPAng(double rex, int lev, ShellPatch *GH, var *c
     }
   }
 
-  MPI_Allreduce(&Mass_out, &mass, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-
-  MPI_Allreduce(&ang_outx, &sx, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&ang_outy, &sy, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&ang_outz, &sz, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-
-  MPI_Allreduce(&p_outx, &px, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&p_outy, &py, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(&p_outz, &pz, 1, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double scalar_out[7] = {Mass_out, ang_outx, ang_outy, ang_outz, p_outx, p_outy, p_outz};
+    double scalar_in[7];
+    MPI_Allreduce(scalar_out, scalar_in, 7, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    mass = scalar_in[0]; sx = scalar_in[1]; sy = scalar_in[2]; sz = scalar_in[3];
+    px = scalar_in[4]; py = scalar_in[5]; pz = scalar_in[6];
+  }
 
 #ifdef GaussInt
   mass = mass * rex * rex * dphi * factor;
@@ -3607,8 +3673,17 @@ void surface_integral::surf_Wave(double rex, cgh *GH, ShellPatch *SH,
   }
   //|------+  Communicate and sum the results from each processor.
 
-  MPI_Allreduce(RP_out, RP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  MPI_Allreduce(IP_out, IP, NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+  {
+    double *RPIP_out = new double[2 * NN];
+    double *RPIP = new double[2 * NN];
+    memcpy(RPIP_out, RP_out, NN * sizeof(double));
+    memcpy(RPIP_out + NN, IP_out, NN * sizeof(double));
+    MPI_Allreduce(RPIP_out, RPIP, 2 * NN, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
+    memcpy(RP, RPIP, NN * sizeof(double));
+    memcpy(IP, RPIP + NN, NN * sizeof(double));
+    delete[] RPIP_out;
+    delete[] RPIP;
+  }
 
   //|------= Free memory.
 

From 50e2a845f8c3e936e334514a66051082dcc41505 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Mon, 9 Feb 2026 22:39:18 +0800
Subject: [PATCH 26/30] Replace MPI_Allreduce with owner-rank MPI_Bcast in
 Patch::Interp_Points

The two MPI_Allreduce calls (data + weight) were the #1 hotspot at 38.5%
CPU time. Since all ranks traverse the same block list and agree on point
ownership, we replace the global reduction with targeted MPI_Bcast from
each owner rank. This also eliminates the weight array/Allreduce entirely,
removes redundant heap allocations (shellf, weight, DH, llb, uub), and
writes interpolation results directly into the output buffer.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
---
 AMSS_NCKU_source/MPatch.C | 301 +++++++++++---------------------------
 1 file changed, 87 insertions(+), 214 deletions(-)

diff --git a/AMSS_NCKU_source/MPatch.C b/AMSS_NCKU_source/MPatch.C
index f0deb56..54652a0 100644
--- a/AMSS_NCKU_source/MPatch.C
+++ b/AMSS_NCKU_source/MPatch.C
@@ -341,8 +341,9 @@ void Patch::Interp_Points(MyList<var> *VarList,
                           double *Shellf, int Symmetry)
 {
   // NOTE: we do not Synchnize variables here, make sure of that before calling this routine
-  int myrank;
+  int myrank, nprocs;
   MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
+  MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
 
   int ordn = 2 * ghost_width;
   MyList<var> *varl;
@@ -354,24 +355,18 @@ void Patch::Interp_Points(MyList<var> *VarList,
     varl = varl->next;
   }
 
-  double *shellf;
-  shellf = new double[NN * num_var];
-  memset(shellf, 0, sizeof(double) * NN * num_var);
+  memset(Shellf, 0, sizeof(double) * NN * num_var);
 
-  // we use weight to monitor code, later some day we can move it for optimization
-  int *weight;
-  weight = new int[NN];
-  memset(weight, 0, sizeof(int) * NN);
-
-  double *DH, *llb, *uub;
-  DH = new double[dim];
+  // owner_rank[j] records which MPI rank owns point j
+  // All ranks traverse the same block list so they all agree on ownership
+  int *owner_rank;
+  owner_rank = new int[NN];
+  for (int j = 0; j < NN; j++)
+    owner_rank[j] = -1;
 
+  double DH[dim], llb[dim], uub[dim];
   for (int i = 0; i < dim; i++)
-  {
     DH[i] = getdX(i);
-  }
-  llb = new double[dim];
-  uub = new double[dim];
 
   for (int j = 0; j < NN; j++) // run along points
   {
@@ -403,12 +398,6 @@ void Patch::Interp_Points(MyList<var> *VarList,
       bool flag = true;
       for (int i = 0; i < dim; i++)
       {
-// NOTE: our dividing structure is (exclude ghost)
-// -1 0
-//       1  2
-// so (0,1) does not belong to any part for vertex structure
-// here we put (0,0.5) to left part and (0.5,1) to right part
-// BUT for cell structure the bbox is (-1.5,0.5) and (0.5,2.5), there is no missing region at all
 #ifdef Vertex
 #ifdef Cell
 #error Both Cell and Vertex are defined
@@ -433,6 +422,7 @@ void Patch::Interp_Points(MyList<var> *VarList,
       if (flag)
       {
         notfind = false;
+        owner_rank[j] = BP->rank;
         if (myrank == BP->rank)
         {
           //---> interpolation
@@ -440,14 +430,11 @@ void Patch::Interp_Points(MyList<var> *VarList,
           int k = 0;
           while (varl) // run along variables
           {
-            //              shellf[j*num_var+k] = Parallel::global_interp(dim,BP->shape,BP->X,BP->fgfs[varl->data->sgfn],
-            //	  		                                    pox,ordn,varl->data->SoA,Symmetry);
-            f_global_interp(BP->shape, BP->X[0], BP->X[1], BP->X[2], BP->fgfs[varl->data->sgfn], shellf[j * num_var + k],
+            f_global_interp(BP->shape, BP->X[0], BP->X[1], BP->X[2], BP->fgfs[varl->data->sgfn], Shellf[j * num_var + k],
                             pox[0], pox[1], pox[2], ordn, varl->data->SoA, Symmetry);
             varl = varl->next;
             k++;
           }
-          weight[j] = 1;
         }
       }
       if (Bp == ble)
@@ -456,103 +443,61 @@ void Patch::Interp_Points(MyList<var> *VarList,
     }
   }
 
-  MPI_Allreduce(shellf, Shellf, NN * num_var, MPI_DOUBLE, MPI_SUM, MPI_COMM_WORLD);
-  int *Weight;
-  Weight = new int[NN];
-  MPI_Allreduce(weight, Weight, NN, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
-
-  //  misc::tillherecheck("print me");
-
-  for (int i = 0; i < NN; i++)
+  // Replace MPI_Allreduce with per-owner MPI_Bcast:
+  // Group consecutive points by owner rank and broadcast each group.
+  // Since each point's data is non-zero only on the owner rank,
+  // Bcast from owner is equivalent to Allreduce(MPI_SUM) but much cheaper.
   {
-    if (Weight[i] > 1)
+    int j = 0;
+    while (j < NN)
     {
-      if (myrank == 0)
-        cout << "WARNING: Patch::Interp_Points meets multiple weight" << endl;
-      for (int j = 0; j < num_var; j++)
-        Shellf[j + i * num_var] = Shellf[j + i * num_var] / Weight[i];
-    }
-    else if (Weight[i] == 0 && myrank == 0)
-    {
-      cout << "ERROR: Patch::Interp_Points fails to find point (";
-      for (int j = 0; j < dim; j++)
+      int cur_owner = owner_rank[j];
+      if (cur_owner < 0)
       {
-        cout << XX[j][i];
-        if (j < dim - 1)
-          cout << ",";
-        else
-          cout << ")";
-      }
-      cout << " on Patch (";
-      for (int j = 0; j < dim; j++)
-      {
-        cout << bbox[j] << "+" << lli[j] * getdX(j);
-        if (j < dim - 1)
-          cout << ",";
-        else
-          cout << ")--";
-      }
-      cout << "(";
-      for (int j = 0; j < dim; j++)
-      {
-        cout << bbox[dim + j] << "-" << uui[j] * getdX(j);
-        if (j < dim - 1)
-          cout << ",";
-        else
-          cout << ")" << endl;
-      }
-#if 0
-       checkBlock();
-#else
-      cout << "splited domains:" << endl;
-      {
-        MyList<Block> *Bp = blb;
-        while (Bp)
+        if (myrank == 0)
         {
-          Block *BP = Bp->data;
-
-          for (int i = 0; i < dim; i++)
+          cout << "ERROR: Patch::Interp_Points fails to find point (";
+          for (int d = 0; d < dim; d++)
           {
-#ifdef Vertex
-#ifdef Cell
-#error Both Cell and Vertex are defined
-#endif
-            llb[i] = (feq(BP->bbox[i], bbox[i], DH[i] / 2)) ? BP->bbox[i] + lli[i] * DH[i] : BP->bbox[i] + (ghost_width - 0.5) * DH[i];
-            uub[i] = (feq(BP->bbox[dim + i], bbox[dim + i], DH[i] / 2)) ? BP->bbox[dim + i] - uui[i] * DH[i] : BP->bbox[dim + i] - (ghost_width - 0.5) * DH[i];
-#else
-#ifdef Cell
-            llb[i] = (feq(BP->bbox[i], bbox[i], DH[i] / 2)) ? BP->bbox[i] + lli[i] * DH[i] : BP->bbox[i] + ghost_width * DH[i];
-            uub[i] = (feq(BP->bbox[dim + i], bbox[dim + i], DH[i] / 2)) ? BP->bbox[dim + i] - uui[i] * DH[i] : BP->bbox[dim + i] - ghost_width * DH[i];
-#else
-#error Not define Vertex nor Cell
-#endif
-#endif
+            cout << XX[d][j];
+            if (d < dim - 1)
+              cout << ",";
+            else
+              cout << ")";
+          }
+          cout << " on Patch (";
+          for (int d = 0; d < dim; d++)
+          {
+            cout << bbox[d] << "+" << lli[d] * DH[d];
+            if (d < dim - 1)
+              cout << ",";
+            else
+              cout << ")--";
           }
           cout << "(";
-          for (int j = 0; j < dim; j++)
+          for (int d = 0; d < dim; d++)
           {
-            cout << llb[j] << ":" << uub[j];
-            if (j < dim - 1)
+            cout << bbox[dim + d] << "-" << uui[d] * DH[d];
+            if (d < dim - 1)
               cout << ",";
             else
               cout << ")" << endl;
           }
-          if (Bp == ble)
-            break;
-          Bp = Bp->next;
+          MPI_Abort(MPI_COMM_WORLD, 1);
         }
+        j++;
+        continue;
       }
-#endif
-      MPI_Abort(MPI_COMM_WORLD, 1);
+      // Find contiguous run of points with the same owner
+      int jstart = j;
+      while (j < NN && owner_rank[j] == cur_owner)
+        j++;
+      int count = (j - jstart) * num_var;
+      MPI_Bcast(Shellf + jstart * num_var, count, MPI_DOUBLE, cur_owner, MPI_COMM_WORLD);
     }
   }
 
-  delete[] shellf;
-  delete[] weight;
-  delete[] Weight;
-  delete[] DH;
-  delete[] llb;
-  delete[] uub;
+  delete[] owner_rank;
 }
 void Patch::Interp_Points(MyList<var> *VarList,
                           int NN, double **XX,
@@ -573,24 +518,22 @@ void Patch::Interp_Points(MyList<var> *VarList,
     varl = varl->next;
   }
 
-  double *shellf;
-  shellf = new double[NN * num_var];
-  memset(shellf, 0, sizeof(double) * NN * num_var);
+  memset(Shellf, 0, sizeof(double) * NN * num_var);
 
-  // we use weight to monitor code, later some day we can move it for optimization
-  int *weight;
-  weight = new int[NN];
-  memset(weight, 0, sizeof(int) * NN);
+  // owner_rank[j] stores the global rank that owns point j
+  int *owner_rank;
+  owner_rank = new int[NN];
+  for (int j = 0; j < NN; j++)
+    owner_rank[j] = -1;
 
-  double *DH, *llb, *uub;
-  DH = new double[dim];
+  // Build global-to-local rank translation for Comm_here
+  MPI_Group world_group, local_group;
+  MPI_Comm_group(MPI_COMM_WORLD, &world_group);
+  MPI_Comm_group(Comm_here, &local_group);
 
+  double DH[dim], llb[dim], uub[dim];
   for (int i = 0; i < dim; i++)
-  {
     DH[i] = getdX(i);
-  }
-  llb = new double[dim];
-  uub = new double[dim];
 
   for (int j = 0; j < NN; j++) // run along points
   {
@@ -622,12 +565,6 @@ void Patch::Interp_Points(MyList<var> *VarList,
       bool flag = true;
       for (int i = 0; i < dim; i++)
       {
-// NOTE: our dividing structure is (exclude ghost)
-// -1 0
-//       1  2
-// so (0,1) does not belong to any part for vertex structure
-// here we put (0,0.5) to left part and (0.5,1) to right part
-// BUT for cell structure the bbox is (-1.5,0.5) and (0.5,2.5), there is no missing region at all
 #ifdef Vertex
 #ifdef Cell
 #error Both Cell and Vertex are defined
@@ -652,6 +589,7 @@ void Patch::Interp_Points(MyList<var> *VarList,
       if (flag)
       {
         notfind = false;
+        owner_rank[j] = BP->rank;
         if (myrank == BP->rank)
         {
           //---> interpolation
@@ -659,14 +597,11 @@ void Patch::Interp_Points(MyList<var> *VarList,
           int k = 0;
           while (varl) // run along variables
           {
-            //              shellf[j*num_var+k] = Parallel::global_interp(dim,BP->shape,BP->X,BP->fgfs[varl->data->sgfn],
-            //	  		                                    pox,ordn,varl->data->SoA,Symmetry);
-            f_global_interp(BP->shape, BP->X[0], BP->X[1], BP->X[2], BP->fgfs[varl->data->sgfn], shellf[j * num_var + k],
+            f_global_interp(BP->shape, BP->X[0], BP->X[1], BP->X[2], BP->fgfs[varl->data->sgfn], Shellf[j * num_var + k],
                             pox[0], pox[1], pox[2], ordn, varl->data->SoA, Symmetry);
             varl = varl->next;
             k++;
           }
-          weight[j] = 1;
         }
       }
       if (Bp == ble)
@@ -675,97 +610,35 @@ void Patch::Interp_Points(MyList<var> *VarList,
     }
   }
 
-  MPI_Allreduce(shellf, Shellf, NN * num_var, MPI_DOUBLE, MPI_SUM, Comm_here);
-  int *Weight;
-  Weight = new int[NN];
-  MPI_Allreduce(weight, Weight, NN, MPI_INT, MPI_SUM, Comm_here);
-
-  //  misc::tillherecheck("print me");
-  //  if(lmyrank == 0) cout<<"myrank = "<<myrank<<"print me"<<endl;
-
-  for (int i = 0; i < NN; i++)
+  // Collect unique global owner ranks and translate to local ranks in Comm_here
+  // Then broadcast each owner's points via MPI_Bcast on Comm_here
   {
-    if (Weight[i] > 1)
+    int j = 0;
+    while (j < NN)
     {
-      if (lmyrank == 0)
-        cout << "WARNING: Patch::Interp_Points meets multiple weight" << endl;
-      for (int j = 0; j < num_var; j++)
-        Shellf[j + i * num_var] = Shellf[j + i * num_var] / Weight[i];
+      int cur_owner_global = owner_rank[j];
+      if (cur_owner_global < 0)
+      {
+        // Point not found — skip (error check disabled for sub-communicator levels)
+        j++;
+        continue;
+      }
+      // Translate global rank to local rank in Comm_here
+      int cur_owner_local;
+      MPI_Group_translate_ranks(world_group, 1, &cur_owner_global, local_group, &cur_owner_local);
+
+      // Find contiguous run of points with the same owner
+      int jstart = j;
+      while (j < NN && owner_rank[j] == cur_owner_global)
+        j++;
+      int count = (j - jstart) * num_var;
+      MPI_Bcast(Shellf + jstart * num_var, count, MPI_DOUBLE, cur_owner_local, Comm_here);
     }
-#if 0 // for not involved levels, this may fail     
-     else if(Weight[i] == 0 && lmyrank == 0)
-     {
-       cout<<"ERROR: Patch::Interp_Points fails to find point (";
-       for(int j=0;j<dim;j++)
-       {
-	  cout<<XX[j][i];
-	  if(j<dim-1) cout<<",";
-	  else        cout<<")";
-       }
-       cout<<" on Patch (";
-       for(int j=0;j<dim;j++)
-       {
-	  cout<<bbox[j]<<"+"<<lli[j]*getdX(j);
-	  if(j<dim-1) cout<<",";
-	  else        cout<<")--";
-       }
-       cout<<"(";
-       for(int j=0;j<dim;j++)
-       {
-	  cout<<bbox[dim+j]<<"-"<<uui[j]*getdX(j);
-	  if(j<dim-1) cout<<",";
-	  else        cout<<")"<<endl;
-       }
-#if 0
-       checkBlock();
-#else
-  cout<<"splited domains:"<<endl;
-  {
-     MyList<Block> *Bp=blb;
-     while(Bp)
-     {
-	Block *BP=Bp->data;
-
-	for(int i=0;i<dim;i++)
-	{
-#ifdef Vertex
-#ifdef Cell
-#error Both Cell and Vertex are defined
-#endif    
-          llb[i] = (feq(BP->bbox[i]    ,bbox[i]    ,DH[i]/2)) ? BP->bbox[i]+lli[i]*DH[i]     : BP->bbox[i]    +(ghost_width-0.5)*DH[i];
-          uub[i] = (feq(BP->bbox[dim+i],bbox[dim+i],DH[i]/2)) ? BP->bbox[dim+i]-uui[i]*DH[i] : BP->bbox[dim+i]-(ghost_width-0.5)*DH[i];
-#else
-#ifdef Cell
-          llb[i] = (feq(BP->bbox[i]    ,bbox[i]    ,DH[i]/2)) ? BP->bbox[i]+lli[i]*DH[i]     : BP->bbox[i]    +ghost_width*DH[i];
-          uub[i] = (feq(BP->bbox[dim+i],bbox[dim+i],DH[i]/2)) ? BP->bbox[dim+i]-uui[i]*DH[i] : BP->bbox[dim+i]-ghost_width*DH[i];
-#else
-#error Not define Vertex nor Cell
-#endif
-#endif 
-	}       
-       cout<<"(";
-       for(int j=0;j<dim;j++)
-       {
-	  cout<<llb[j]<<":"<<uub[j];
-	  if(j<dim-1) cout<<",";
-	  else        cout<<")"<<endl;
-       }
-	if(Bp == ble) break;
-	Bp=Bp->next;
-     }
-  }
-#endif       
-       MPI_Abort(MPI_COMM_WORLD,1);
-     }
-#endif
   }
 
-  delete[] shellf;
-  delete[] weight;
-  delete[] Weight;
-  delete[] DH;
-  delete[] llb;
-  delete[] uub;
+  MPI_Group_free(&world_group);
+  MPI_Group_free(&local_group);
+  delete[] owner_rank;
 }
 void Patch::checkBlock()
 {

From d06d5b4db80660e3e277667f08b93f6149af1c7f Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Tue, 10 Feb 2026 19:18:56 +0800
Subject: [PATCH 27/30] Add targeted point-to-point Interp_Points overload for
 surface_integral

Instead of broadcasting all interpolated point data to every MPI rank,
the new overload sends each point only to the one rank that needs it
for integration, reducing communication volume by ~nprocs times.

The consumer rank is computed deterministically using the same Nmin/Nmax
work distribution formula used by surface_integral callers. Two active
call sites (surf_Wave and surf_MassPAng with MPI_COMM_WORLD) now use
the new overload. Other callers (ShellPatch, Comm_here variants, etc.)
remain unchanged.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 AMSS_NCKU_source/MPatch.C           | 266 ++++++++++++++++++++++++++++
 AMSS_NCKU_source/MPatch.h           |   4 +
 AMSS_NCKU_source/surface_integral.C |  42 ++---
 3 files changed, 289 insertions(+), 23 deletions(-)

diff --git a/AMSS_NCKU_source/MPatch.C b/AMSS_NCKU_source/MPatch.C
index 54652a0..91ead8a 100644
--- a/AMSS_NCKU_source/MPatch.C
+++ b/AMSS_NCKU_source/MPatch.C
@@ -499,6 +499,272 @@ void Patch::Interp_Points(MyList<var> *VarList,
 
   delete[] owner_rank;
 }
+void Patch::Interp_Points(MyList<var> *VarList,
+                          int NN, double **XX,
+                          double *Shellf, int Symmetry,
+                          int Nmin_consumer, int Nmax_consumer)
+{
+  // Targeted point-to-point overload: each owner sends each point only to
+  // the one rank that needs it for integration (consumer), reducing
+  // communication volume by ~nprocs times compared to the Bcast version.
+  int myrank, nprocs;
+  MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
+  MPI_Comm_size(MPI_COMM_WORLD, &nprocs);
+
+  int ordn = 2 * ghost_width;
+  MyList<var> *varl;
+  int num_var = 0;
+  varl = VarList;
+  while (varl)
+  {
+    num_var++;
+    varl = varl->next;
+  }
+
+  memset(Shellf, 0, sizeof(double) * NN * num_var);
+
+  // owner_rank[j] records which MPI rank owns point j
+  int *owner_rank;
+  owner_rank = new int[NN];
+  for (int j = 0; j < NN; j++)
+    owner_rank[j] = -1;
+
+  double DH[dim], llb[dim], uub[dim];
+  for (int i = 0; i < dim; i++)
+    DH[i] = getdX(i);
+
+  // --- Interpolation phase (identical to original) ---
+  for (int j = 0; j < NN; j++)
+  {
+    double pox[dim];
+    for (int i = 0; i < dim; i++)
+    {
+      pox[i] = XX[i][j];
+      if (myrank == 0 && (XX[i][j] < bbox[i] + lli[i] * DH[i] || XX[i][j] > bbox[dim + i] - uui[i] * DH[i]))
+      {
+        cout << "Patch::Interp_Points: point (";
+        for (int k = 0; k < dim; k++)
+        {
+          cout << XX[k][j];
+          if (k < dim - 1)
+            cout << ",";
+          else
+            cout << ") is out of current Patch." << endl;
+        }
+        MPI_Abort(MPI_COMM_WORLD, 1);
+      }
+    }
+
+    MyList<Block> *Bp = blb;
+    bool notfind = true;
+    while (notfind && Bp)
+    {
+      Block *BP = Bp->data;
+
+      bool flag = true;
+      for (int i = 0; i < dim; i++)
+      {
+#ifdef Vertex
+#ifdef Cell
+#error Both Cell and Vertex are defined
+#endif
+        llb[i] = (feq(BP->bbox[i], bbox[i], DH[i] / 2)) ? BP->bbox[i] + lli[i] * DH[i] : BP->bbox[i] + (ghost_width - 0.5) * DH[i];
+        uub[i] = (feq(BP->bbox[dim + i], bbox[dim + i], DH[i] / 2)) ? BP->bbox[dim + i] - uui[i] * DH[i] : BP->bbox[dim + i] - (ghost_width - 0.5) * DH[i];
+#else
+#ifdef Cell
+        llb[i] = (feq(BP->bbox[i], bbox[i], DH[i] / 2)) ? BP->bbox[i] + lli[i] * DH[i] : BP->bbox[i] + ghost_width * DH[i];
+        uub[i] = (feq(BP->bbox[dim + i], bbox[dim + i], DH[i] / 2)) ? BP->bbox[dim + i] - uui[i] * DH[i] : BP->bbox[dim + i] - ghost_width * DH[i];
+#else
+#error Not define Vertex nor Cell
+#endif
+#endif
+        if (XX[i][j] - llb[i] < -DH[i] / 2 || XX[i][j] - uub[i] > DH[i] / 2)
+        {
+          flag = false;
+          break;
+        }
+      }
+
+      if (flag)
+      {
+        notfind = false;
+        owner_rank[j] = BP->rank;
+        if (myrank == BP->rank)
+        {
+          varl = VarList;
+          int k = 0;
+          while (varl)
+          {
+            f_global_interp(BP->shape, BP->X[0], BP->X[1], BP->X[2], BP->fgfs[varl->data->sgfn], Shellf[j * num_var + k],
+                            pox[0], pox[1], pox[2], ordn, varl->data->SoA, Symmetry);
+            varl = varl->next;
+            k++;
+          }
+        }
+      }
+      if (Bp == ble)
+        break;
+      Bp = Bp->next;
+    }
+  }
+
+  // --- Error check for unfound points ---
+  for (int j = 0; j < NN; j++)
+  {
+    if (owner_rank[j] < 0 && myrank == 0)
+    {
+      cout << "ERROR: Patch::Interp_Points fails to find point (";
+      for (int d = 0; d < dim; d++)
+      {
+        cout << XX[d][j];
+        if (d < dim - 1)
+          cout << ",";
+        else
+          cout << ")";
+      }
+      cout << " on Patch (";
+      for (int d = 0; d < dim; d++)
+      {
+        cout << bbox[d] << "+" << lli[d] * DH[d];
+        if (d < dim - 1)
+          cout << ",";
+        else
+          cout << ")--";
+      }
+      cout << "(";
+      for (int d = 0; d < dim; d++)
+      {
+        cout << bbox[dim + d] << "-" << uui[d] * DH[d];
+        if (d < dim - 1)
+          cout << ",";
+        else
+          cout << ")" << endl;
+      }
+      MPI_Abort(MPI_COMM_WORLD, 1);
+    }
+  }
+
+  // --- Targeted point-to-point communication phase ---
+  // Compute consumer_rank[j] using the same deterministic formula as surface_integral
+  int *consumer_rank = new int[NN];
+  {
+    int mp = NN / nprocs;
+    int Lp = NN - nprocs * mp;
+    for (int j = 0; j < NN; j++)
+    {
+      if (j < Lp * (mp + 1))
+        consumer_rank[j] = j / (mp + 1);
+      else
+        consumer_rank[j] = Lp + (j - Lp * (mp + 1)) / mp;
+    }
+  }
+
+  // Count sends and recvs per rank
+  int *send_count = new int[nprocs];
+  int *recv_count = new int[nprocs];
+  memset(send_count, 0, sizeof(int) * nprocs);
+  memset(recv_count, 0, sizeof(int) * nprocs);
+
+  for (int j = 0; j < NN; j++)
+  {
+    int own = owner_rank[j];
+    int con = consumer_rank[j];
+    if (own == con)
+      continue; // local — no communication needed
+    if (own == myrank)
+      send_count[con]++;
+    if (con == myrank)
+      recv_count[own]++;
+  }
+
+  // Build send buffers: for each destination rank, pack (index, data) pairs
+  // Each entry: 1 int (point index j) + num_var doubles
+  int total_send = 0, total_recv = 0;
+  int *send_offset = new int[nprocs];
+  int *recv_offset = new int[nprocs];
+  for (int r = 0; r < nprocs; r++)
+  {
+    send_offset[r] = total_send;
+    total_send += send_count[r];
+    recv_offset[r] = total_recv;
+    total_recv += recv_count[r];
+  }
+
+  // Pack send buffers: each message contains (j, data[0..num_var-1]) per point
+  int stride = 1 + num_var; // 1 double for index + num_var doubles for data
+  double *sendbuf = new double[total_send * stride];
+  double *recvbuf = new double[total_recv * stride];
+
+  // Temporary counters for packing
+  int *pack_pos = new int[nprocs];
+  memset(pack_pos, 0, sizeof(int) * nprocs);
+
+  for (int j = 0; j < NN; j++)
+  {
+    int own = owner_rank[j];
+    int con = consumer_rank[j];
+    if (own != myrank || con == myrank)
+      continue;
+    int pos = (send_offset[con] + pack_pos[con]) * stride;
+    sendbuf[pos] = (double)j; // point index
+    for (int v = 0; v < num_var; v++)
+      sendbuf[pos + 1 + v] = Shellf[j * num_var + v];
+    pack_pos[con]++;
+  }
+
+  // Post non-blocking recvs and sends
+  int n_req = 0;
+  for (int r = 0; r < nprocs; r++)
+  {
+    if (recv_count[r] > 0) n_req++;
+    if (send_count[r] > 0) n_req++;
+  }
+
+  MPI_Request *reqs = new MPI_Request[n_req];
+  int req_idx = 0;
+
+  for (int r = 0; r < nprocs; r++)
+  {
+    if (recv_count[r] > 0)
+    {
+      MPI_Irecv(recvbuf + recv_offset[r] * stride,
+                recv_count[r] * stride, MPI_DOUBLE,
+                r, 0, MPI_COMM_WORLD, &reqs[req_idx++]);
+    }
+  }
+  for (int r = 0; r < nprocs; r++)
+  {
+    if (send_count[r] > 0)
+    {
+      MPI_Isend(sendbuf + send_offset[r] * stride,
+                send_count[r] * stride, MPI_DOUBLE,
+                r, 0, MPI_COMM_WORLD, &reqs[req_idx++]);
+    }
+  }
+
+  if (n_req > 0)
+    MPI_Waitall(n_req, reqs, MPI_STATUSES_IGNORE);
+
+  // Unpack recv buffers into Shellf
+  for (int i = 0; i < total_recv; i++)
+  {
+    int pos = i * stride;
+    int j = (int)recvbuf[pos];
+    for (int v = 0; v < num_var; v++)
+      Shellf[j * num_var + v] = recvbuf[pos + 1 + v];
+  }
+
+  delete[] reqs;
+  delete[] sendbuf;
+  delete[] recvbuf;
+  delete[] pack_pos;
+  delete[] send_offset;
+  delete[] recv_offset;
+  delete[] send_count;
+  delete[] recv_count;
+  delete[] consumer_rank;
+  delete[] owner_rank;
+}
 void Patch::Interp_Points(MyList<var> *VarList,
                           int NN, double **XX,
                           double *Shellf, int Symmetry, MPI_Comm Comm_here)
diff --git a/AMSS_NCKU_source/MPatch.h b/AMSS_NCKU_source/MPatch.h
index ca19ca5..b993be6 100644
--- a/AMSS_NCKU_source/MPatch.h
+++ b/AMSS_NCKU_source/MPatch.h
@@ -39,6 +39,10 @@ public:
 
    bool Find_Point(double *XX);
 
+   void Interp_Points(MyList<var> *VarList,
+                      int NN, double **XX,
+                      double *Shellf, int Symmetry,
+                      int Nmin_consumer, int Nmax_consumer);
    void Interp_Points(MyList<var> *VarList,
                       int NN, double **XX,
                       double *Shellf, int Symmetry, MPI_Comm Comm_here);
diff --git a/AMSS_NCKU_source/surface_integral.C b/AMSS_NCKU_source/surface_integral.C
index e725ae0..c2b7b67 100644
--- a/AMSS_NCKU_source/surface_integral.C
+++ b/AMSS_NCKU_source/surface_integral.C
@@ -220,16 +220,9 @@ void surface_integral::surf_Wave(double rex, int lev, cgh *GH, var *Rpsi4, var *
     pox[2][n] = rex * nz_g[n];
   }
 
-  double *shellf;
-  shellf = new double[n_tot * InList];
-
-  GH->PatL[lev]->data->Interp_Points(DG_List, n_tot, pox, shellf, Symmetry);
-
   int mp, Lp, Nmin, Nmax;
-
   mp = n_tot / cpusize;
   Lp = n_tot - cpusize * mp;
-
   if (Lp > myrank)
   {
     Nmin = myrank * mp + myrank;
@@ -241,6 +234,11 @@ void surface_integral::surf_Wave(double rex, int lev, cgh *GH, var *Rpsi4, var *
     Nmax = Nmin + mp - 1;
   }
 
+  double *shellf;
+  shellf = new double[n_tot * InList];
+
+  GH->PatL[lev]->data->Interp_Points(DG_List, n_tot, pox, shellf, Symmetry, Nmin, Nmax);
+
   //|~~~~~> Integrate the dot product of Dphi with the surface normal.
 
   double *RP_out, *IP_out;
@@ -2386,25 +2384,9 @@ void surface_integral::surf_MassPAng(double rex, int lev, cgh *GH, var *chi, var
     pox[2][n] = rex * nz_g[n];
   }
 
-  double *shellf;
-  shellf = new double[n_tot * InList];
-
-  // we have assumed there is only one box on this level,
-  // so we do not need loop boxes
-  GH->PatL[lev]->data->Interp_Points(DG_List, n_tot, pox, shellf, Symmetry);
-
-  double Mass_out = 0;
-  double ang_outx, ang_outy, ang_outz;
-  double p_outx, p_outy, p_outz;
-  ang_outx = ang_outy = ang_outz = 0.0;
-  p_outx = p_outy = p_outz = 0.0;
-  const double f1o8 = 0.125;
-
   int mp, Lp, Nmin, Nmax;
-
   mp = n_tot / cpusize;
   Lp = n_tot - cpusize * mp;
-
   if (Lp > myrank)
   {
     Nmin = myrank * mp + myrank;
@@ -2416,6 +2398,20 @@ void surface_integral::surf_MassPAng(double rex, int lev, cgh *GH, var *chi, var
     Nmax = Nmin + mp - 1;
   }
 
+  double *shellf;
+  shellf = new double[n_tot * InList];
+
+  // we have assumed there is only one box on this level,
+  // so we do not need loop boxes
+  GH->PatL[lev]->data->Interp_Points(DG_List, n_tot, pox, shellf, Symmetry, Nmin, Nmax);
+
+  double Mass_out = 0;
+  double ang_outx, ang_outy, ang_outz;
+  double p_outx, p_outy, p_outz;
+  ang_outx = ang_outy = ang_outz = 0.0;
+  p_outx = p_outy = p_outz = 0.0;
+  const double f1o8 = 0.125;
+
   double Chi, Psi;
   double Gxx, Gxy, Gxz, Gyy, Gyz, Gzz;
   double gupxx, gupxy, gupxz, gupyy, gupyz, gupzz;

From e09ae438a2434a2b77fbf1d5cecfd537160e2fa2 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Tue, 10 Feb 2026 21:39:22 +0800
Subject: [PATCH 28/30] Cache data_packer lengths in Sync_start to skip
 redundant buffer-size traversals
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

The data_packer(NULL, ...) calls that compute send/recv buffer lengths
traverse all grid segments × variables × nprocs on every Sync_start
invocation, even though lengths never change once the cache is built.
Add a lengths_valid flag to SyncCache so these length computations are
done once and reused on subsequent calls (4× per RK4 step).

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 AMSS_NCKU_source/Parallel.C | 32 +++++++++++++++++++++++++-------
 AMSS_NCKU_source/Parallel.h |  1 +
 2 files changed, 26 insertions(+), 7 deletions(-)

diff --git a/AMSS_NCKU_source/Parallel.C b/AMSS_NCKU_source/Parallel.C
index d90cdeb..0cd50a2 100644
--- a/AMSS_NCKU_source/Parallel.C
+++ b/AMSS_NCKU_source/Parallel.C
@@ -3853,7 +3853,8 @@ void Parallel::Sync_merged(MyList<Patch> *PatL, MyList<var> *VarList, int Symmet
 Parallel::SyncCache::SyncCache()
     : valid(false), cpusize(0), combined_src(0), combined_dst(0),
       send_lengths(0), recv_lengths(0), send_bufs(0), recv_bufs(0),
-      send_buf_caps(0), recv_buf_caps(0), reqs(0), stats(0), max_reqs(0)
+      send_buf_caps(0), recv_buf_caps(0), reqs(0), stats(0), max_reqs(0),
+      lengths_valid(false)
 {
 }
 // SyncCache invalidate: free grid segment lists but keep buffers
@@ -3871,6 +3872,7 @@ void Parallel::SyncCache::invalidate()
     send_lengths[i] = recv_lengths[i] = 0;
   }
   valid = false;
+  lengths_valid = false;
 }
 // SyncCache destroy: free everything
 void Parallel::SyncCache::destroy()
@@ -4172,8 +4174,13 @@ void Parallel::Sync_start(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetr
   {
     if (node == myrank)
     {
-      int length = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
-      cache.recv_lengths[node] = length;
+      int length;
+      if (!cache.lengths_valid) {
+        length = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
+        cache.recv_lengths[node] = length;
+      } else {
+        length = cache.recv_lengths[node];
+      }
       if (length > 0)
       {
         if (length > cache.recv_buf_caps[node])
@@ -4187,8 +4194,13 @@ void Parallel::Sync_start(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetr
     }
     else
     {
-      int slength = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
-      cache.send_lengths[node] = slength;
+      int slength;
+      if (!cache.lengths_valid) {
+        slength = data_packer(0, src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
+        cache.send_lengths[node] = slength;
+      } else {
+        slength = cache.send_lengths[node];
+      }
       if (slength > 0)
       {
         if (slength > cache.send_buf_caps[node])
@@ -4200,8 +4212,13 @@ void Parallel::Sync_start(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetr
         data_packer(cache.send_bufs[node], src[myrank], dst[myrank], node, PACK, VarList, VarList, Symmetry);
         MPI_Isend((void *)cache.send_bufs[node], slength, MPI_DOUBLE, node, 2, MPI_COMM_WORLD, cache.reqs + state.req_no++);
       }
-      int rlength = data_packer(0, src[node], dst[node], node, UNPACK, VarList, VarList, Symmetry);
-      cache.recv_lengths[node] = rlength;
+      int rlength;
+      if (!cache.lengths_valid) {
+        rlength = data_packer(0, src[node], dst[node], node, UNPACK, VarList, VarList, Symmetry);
+        cache.recv_lengths[node] = rlength;
+      } else {
+        rlength = cache.recv_lengths[node];
+      }
       if (rlength > 0)
       {
         if (rlength > cache.recv_buf_caps[node])
@@ -4214,6 +4231,7 @@ void Parallel::Sync_start(MyList<Patch> *PatL, MyList<var> *VarList, int Symmetr
       }
     }
   }
+  cache.lengths_valid = true;
 }
 // Sync_finish: wait for async MPI operations and unpack
 void Parallel::Sync_finish(SyncCache &cache, AsyncSyncState &state,
diff --git a/AMSS_NCKU_source/Parallel.h b/AMSS_NCKU_source/Parallel.h
index 7935727..6ab22af 100644
--- a/AMSS_NCKU_source/Parallel.h
+++ b/AMSS_NCKU_source/Parallel.h
@@ -97,6 +97,7 @@ namespace Parallel
     MPI_Request *reqs;
     MPI_Status *stats;
     int max_reqs;
+    bool lengths_valid;
     SyncCache();
     void invalidate();
     void destroy();

From 5c1790277bf6eaf6c6cd2d881385b6aff03a661c Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Wed, 11 Feb 2026 16:09:08 +0800
Subject: [PATCH 29/30] Replace nested OutBdLow2Hi loops with batch calls in
 RestrictProlong
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

The 8 nested while(Ppc){while(Pp){OutBdLow2Hi(single,single,...)}}
loops across RestrictProlong (3 overloads) and ProlongRestrict each
produced N_c × N_f separate transfer() → MPI_Waitall barriers.
Replace with the existing batch OutBdLow2Hi(MyList<Patch>*,...) which
merges all patch pairs into a single transfer() call with 1 MPI_Waitall.

Also add Restrict_cached, OutBdLow2Hi_cached, OutBdLow2Himix_cached
to Parallel (unused for now — kept as infrastructure for future use).

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
---
 AMSS_NCKU_source/Parallel.C   | 197 ++++++++++++++++++++++++++++++++++
 AMSS_NCKU_source/Parallel.h   |   9 ++
 AMSS_NCKU_source/bssn_class.C | 112 +++----------------
 3 files changed, 222 insertions(+), 96 deletions(-)

diff --git a/AMSS_NCKU_source/Parallel.C b/AMSS_NCKU_source/Parallel.C
index 0cd50a2..a9fb3cd 100644
--- a/AMSS_NCKU_source/Parallel.C
+++ b/AMSS_NCKU_source/Parallel.C
@@ -5286,6 +5286,203 @@ void Parallel::OutBdLow2Himix(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
   delete[] transfer_src;
   delete[] transfer_dst;
 }
+
+// Restrict_cached: cache grid segment lists, reuse buffers via transfer_cached
+void Parallel::Restrict_cached(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
+                               MyList<var> *VarList1, MyList<var> *VarList2,
+                               int Symmetry, SyncCache &cache)
+{
+  if (!cache.valid)
+  {
+    int cpusize;
+    MPI_Comm_size(MPI_COMM_WORLD, &cpusize);
+    cache.cpusize = cpusize;
+
+    if (!cache.combined_src)
+    {
+      cache.combined_src = new MyList<Parallel::gridseg> *[cpusize];
+      cache.combined_dst = new MyList<Parallel::gridseg> *[cpusize];
+      cache.send_lengths = new int[cpusize];
+      cache.recv_lengths = new int[cpusize];
+      cache.send_bufs = new double *[cpusize];
+      cache.recv_bufs = new double *[cpusize];
+      cache.send_buf_caps = new int[cpusize];
+      cache.recv_buf_caps = new int[cpusize];
+      for (int i = 0; i < cpusize; i++)
+      {
+        cache.send_bufs[i] = cache.recv_bufs[i] = 0;
+        cache.send_buf_caps[i] = cache.recv_buf_caps[i] = 0;
+      }
+      cache.max_reqs = 2 * cpusize;
+      cache.reqs = new MPI_Request[cache.max_reqs];
+      cache.stats = new MPI_Status[cache.max_reqs];
+    }
+
+    MyList<Parallel::gridseg> *dst = build_complete_gsl(PatcL);
+    for (int node = 0; node < cpusize; node++)
+    {
+      MyList<Parallel::gridseg> *src_owned = build_owned_gsl(PatfL, node, 2, Symmetry);
+      build_gstl(src_owned, dst, &cache.combined_src[node], &cache.combined_dst[node]);
+      if (src_owned) src_owned->destroyList();
+    }
+    if (dst) dst->destroyList();
+
+    cache.valid = true;
+  }
+
+  transfer_cached(cache.combined_src, cache.combined_dst, VarList1, VarList2, Symmetry, cache);
+}
+
+// OutBdLow2Hi_cached: cache grid segment lists, reuse buffers via transfer_cached
+void Parallel::OutBdLow2Hi_cached(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
+                                  MyList<var> *VarList1, MyList<var> *VarList2,
+                                  int Symmetry, SyncCache &cache)
+{
+  if (!cache.valid)
+  {
+    int cpusize;
+    MPI_Comm_size(MPI_COMM_WORLD, &cpusize);
+    cache.cpusize = cpusize;
+
+    if (!cache.combined_src)
+    {
+      cache.combined_src = new MyList<Parallel::gridseg> *[cpusize];
+      cache.combined_dst = new MyList<Parallel::gridseg> *[cpusize];
+      cache.send_lengths = new int[cpusize];
+      cache.recv_lengths = new int[cpusize];
+      cache.send_bufs = new double *[cpusize];
+      cache.recv_bufs = new double *[cpusize];
+      cache.send_buf_caps = new int[cpusize];
+      cache.recv_buf_caps = new int[cpusize];
+      for (int i = 0; i < cpusize; i++)
+      {
+        cache.send_bufs[i] = cache.recv_bufs[i] = 0;
+        cache.send_buf_caps[i] = cache.recv_buf_caps[i] = 0;
+      }
+      cache.max_reqs = 2 * cpusize;
+      cache.reqs = new MPI_Request[cache.max_reqs];
+      cache.stats = new MPI_Status[cache.max_reqs];
+    }
+
+    MyList<Parallel::gridseg> *dst = build_buffer_gsl(PatfL);
+    for (int node = 0; node < cpusize; node++)
+    {
+      MyList<Parallel::gridseg> *src_owned = build_owned_gsl(PatcL, node, 4, Symmetry);
+      build_gstl(src_owned, dst, &cache.combined_src[node], &cache.combined_dst[node]);
+      if (src_owned) src_owned->destroyList();
+    }
+    if (dst) dst->destroyList();
+
+    cache.valid = true;
+  }
+
+  transfer_cached(cache.combined_src, cache.combined_dst, VarList1, VarList2, Symmetry, cache);
+}
+
+// OutBdLow2Himix_cached: same as OutBdLow2Hi_cached but uses transfermix for unpacking
+void Parallel::OutBdLow2Himix_cached(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
+                                     MyList<var> *VarList1, MyList<var> *VarList2,
+                                     int Symmetry, SyncCache &cache)
+{
+  if (!cache.valid)
+  {
+    int cpusize;
+    MPI_Comm_size(MPI_COMM_WORLD, &cpusize);
+    cache.cpusize = cpusize;
+
+    if (!cache.combined_src)
+    {
+      cache.combined_src = new MyList<Parallel::gridseg> *[cpusize];
+      cache.combined_dst = new MyList<Parallel::gridseg> *[cpusize];
+      cache.send_lengths = new int[cpusize];
+      cache.recv_lengths = new int[cpusize];
+      cache.send_bufs = new double *[cpusize];
+      cache.recv_bufs = new double *[cpusize];
+      cache.send_buf_caps = new int[cpusize];
+      cache.recv_buf_caps = new int[cpusize];
+      for (int i = 0; i < cpusize; i++)
+      {
+        cache.send_bufs[i] = cache.recv_bufs[i] = 0;
+        cache.send_buf_caps[i] = cache.recv_buf_caps[i] = 0;
+      }
+      cache.max_reqs = 2 * cpusize;
+      cache.reqs = new MPI_Request[cache.max_reqs];
+      cache.stats = new MPI_Status[cache.max_reqs];
+    }
+
+    MyList<Parallel::gridseg> *dst = build_buffer_gsl(PatfL);
+    for (int node = 0; node < cpusize; node++)
+    {
+      MyList<Parallel::gridseg> *src_owned = build_owned_gsl(PatcL, node, 4, Symmetry);
+      build_gstl(src_owned, dst, &cache.combined_src[node], &cache.combined_dst[node]);
+      if (src_owned) src_owned->destroyList();
+    }
+    if (dst) dst->destroyList();
+
+    cache.valid = true;
+  }
+
+  // Use transfermix instead of transfer for mix-mode interpolation
+  int myrank;
+  MPI_Comm_size(MPI_COMM_WORLD, &cache.cpusize);
+  MPI_Comm_rank(MPI_COMM_WORLD, &myrank);
+  int cpusize = cache.cpusize;
+
+  int req_no = 0;
+  for (int node = 0; node < cpusize; node++)
+  {
+    if (node == myrank)
+    {
+      int length = data_packermix(0, cache.combined_src[myrank], cache.combined_dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+      cache.recv_lengths[node] = length;
+      if (length > 0)
+      {
+        if (length > cache.recv_buf_caps[node])
+        {
+          if (cache.recv_bufs[node]) delete[] cache.recv_bufs[node];
+          cache.recv_bufs[node] = new double[length];
+          cache.recv_buf_caps[node] = length;
+        }
+        data_packermix(cache.recv_bufs[node], cache.combined_src[myrank], cache.combined_dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+      }
+    }
+    else
+    {
+      int slength = data_packermix(0, cache.combined_src[myrank], cache.combined_dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+      cache.send_lengths[node] = slength;
+      if (slength > 0)
+      {
+        if (slength > cache.send_buf_caps[node])
+        {
+          if (cache.send_bufs[node]) delete[] cache.send_bufs[node];
+          cache.send_bufs[node] = new double[slength];
+          cache.send_buf_caps[node] = slength;
+        }
+        data_packermix(cache.send_bufs[node], cache.combined_src[myrank], cache.combined_dst[myrank], node, PACK, VarList1, VarList2, Symmetry);
+        MPI_Isend((void *)cache.send_bufs[node], slength, MPI_DOUBLE, node, 1, MPI_COMM_WORLD, cache.reqs + req_no++);
+      }
+      int rlength = data_packermix(0, cache.combined_src[node], cache.combined_dst[node], node, UNPACK, VarList1, VarList2, Symmetry);
+      cache.recv_lengths[node] = rlength;
+      if (rlength > 0)
+      {
+        if (rlength > cache.recv_buf_caps[node])
+        {
+          if (cache.recv_bufs[node]) delete[] cache.recv_bufs[node];
+          cache.recv_bufs[node] = new double[rlength];
+          cache.recv_buf_caps[node] = rlength;
+        }
+        MPI_Irecv((void *)cache.recv_bufs[node], rlength, MPI_DOUBLE, node, 1, MPI_COMM_WORLD, cache.reqs + req_no++);
+      }
+    }
+  }
+
+  MPI_Waitall(req_no, cache.reqs, cache.stats);
+
+  for (int node = 0; node < cpusize; node++)
+    if (cache.recv_bufs[node] && cache.recv_lengths[node] > 0)
+      data_packermix(cache.recv_bufs[node], cache.combined_src[node], cache.combined_dst[node], node, UNPACK, VarList1, VarList2, Symmetry);
+}
+
 // collect all buffer grid segments or blocks for given patch
 MyList<Parallel::gridseg> *Parallel::build_buffer_gsl(Patch *Pat)
 {
diff --git a/AMSS_NCKU_source/Parallel.h b/AMSS_NCKU_source/Parallel.h
index 6ab22af..a6ef351 100644
--- a/AMSS_NCKU_source/Parallel.h
+++ b/AMSS_NCKU_source/Parallel.h
@@ -130,6 +130,15 @@ namespace Parallel
   void OutBdLow2Himix(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
                       MyList<var> *VarList1 /* source */, MyList<var> *VarList2 /* target */,
                       int Symmetry);
+  void Restrict_cached(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
+                       MyList<var> *VarList1, MyList<var> *VarList2,
+                       int Symmetry, SyncCache &cache);
+  void OutBdLow2Hi_cached(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
+                          MyList<var> *VarList1, MyList<var> *VarList2,
+                          int Symmetry, SyncCache &cache);
+  void OutBdLow2Himix_cached(MyList<Patch> *PatcL, MyList<Patch> *PatfL,
+                             MyList<var> *VarList1, MyList<var> *VarList2,
+                             int Symmetry, SyncCache &cache);
   void Prolong(Patch *Patc, Patch *Patf,
                MyList<var> *VarList1 /* source */, MyList<var> *VarList2 /* target */,
                int Symmetry);
diff --git a/AMSS_NCKU_source/bssn_class.C b/AMSS_NCKU_source/bssn_class.C
index 927bff5..18f1388 100644
--- a/AMSS_NCKU_source/bssn_class.C
+++ b/AMSS_NCKU_source/bssn_class.C
@@ -5819,21 +5819,11 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB,
 #endif
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, SynchList_pre, SL, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SL, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, SynchList_pre, SL, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SL, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],SynchList_pre,SL,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SL, GH->bdsul[lev], Symmetry);
@@ -5880,21 +5870,11 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB,
 #endif
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, SL, SL, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, SL, SL, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],SL,SL,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, GH->bdsul[lev], Symmetry);
@@ -5969,21 +5949,11 @@ void bssn_class::RestrictProlong_aux(int lev, int YN, bool BB,
       Parallel::Sync_cached(GH->PatL[lev - 1], SynchList_pre, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, SynchList_pre, SL, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SL, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, SynchList_pre, SL, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SL, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],SynchList_pre,SL,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SL, GH->bdsul[lev], Symmetry);
@@ -6001,21 +5971,11 @@ void bssn_class::RestrictProlong_aux(int lev, int YN, bool BB,
       Parallel::Sync_cached(GH->PatL[lev - 1], SL, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, SL, SL, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, SL, SL, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],SL,SL,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], SL, SL, GH->bdsul[lev], Symmetry);
@@ -6076,21 +6036,11 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB)
       Parallel::Sync_cached(GH->PatL[lev - 1], SynchList_pre, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, SynchList_pre, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SynchList_cor, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, SynchList_pre, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SynchList_cor, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],SynchList_pre,SynchList_cor,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SynchList_cor, GH->bdsul[lev], Symmetry);
@@ -6110,21 +6060,11 @@ void bssn_class::RestrictProlong(int lev, int YN, bool BB)
       Parallel::Sync_cached(GH->PatL[lev - 1], StateList, Symmetry, sync_cache_rp_coarse[lev]);
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, StateList, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], StateList, SynchList_cor, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, StateList, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], StateList, SynchList_cor, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],StateList,SynchList_cor,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], StateList, SynchList_cor, GH->bdsul[lev], Symmetry);
@@ -6161,21 +6101,11 @@ void bssn_class::ProlongRestrict(int lev, int YN, bool BB)
       }
 
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, SynchList_pre, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SynchList_cor, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, SynchList_pre, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SynchList_cor, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],SynchList_pre,SynchList_cor,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], SynchList_pre, SynchList_cor, GH->bdsul[lev], Symmetry);
@@ -6184,21 +6114,11 @@ void bssn_class::ProlongRestrict(int lev, int YN, bool BB)
     else // no time refinement levels and for all same time levels
     {
 #if (RPB == 0)
-      Ppc = GH->PatL[lev - 1];
-      while (Ppc)
-      {
-        Pp = GH->PatL[lev];
-        while (Pp)
-        {
 #if (MIXOUTB == 0)
-          Parallel::OutBdLow2Hi(Ppc->data, Pp->data, StateList, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Hi(GH->PatL[lev - 1], GH->PatL[lev], StateList, SynchList_cor, Symmetry);
 #elif (MIXOUTB == 1)
-          Parallel::OutBdLow2Himix(Ppc->data, Pp->data, StateList, SynchList_cor, Symmetry);
+      Parallel::OutBdLow2Himix(GH->PatL[lev - 1], GH->PatL[lev], StateList, SynchList_cor, Symmetry);
 #endif
-          Pp = Pp->next;
-        }
-        Ppc = Ppc->next;
-      }
 #elif (RPB == 1)
       //       Parallel::OutBdLow2Hi_bam(GH->PatL[lev-1],GH->PatL[lev],StateList,SynchList_cor,Symmetry);
       Parallel::OutBdLow2Hi_bam(GH->PatL[lev - 1], GH->PatL[lev], StateList, SynchList_cor, GH->bdsul[lev], Symmetry);

From 85afe00fc5a92eb7ce53a14bb5a732a95d6aecd5 Mon Sep 17 00:00:00 2001
From: CGH0S7 <776459475@qq.com>
Date: Wed, 11 Feb 2026 16:19:17 +0800
Subject: [PATCH 30/30] Merge plotting optimizations from chb-copilot-test

- Implement multiprocessing-based parallel plotting
- Add parallel_plot_helper.py for concurrent plot task execution
- Use matplotlib 'Agg' backend for multiprocessing safety
- Set OMP_NUM_THREADS=1 to prevent BLAS thread explosion
- Use subprocess for binary data plots to avoid thread conflicts
- Add fork bomb protection in main program

This merge only includes plotting improvements and excludes
MPI communication changes to preserve existing optimizations.

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
---
 AMSS_NCKU_Program.py               | 27 +++++++++++++++------
 parallel_plot_helper.py            | 29 ++++++++++++++++++++++
 plot_GW_strain_amplitude_xiaoqu.py |  2 ++
 plot_binary_data.py                | 27 +++++++++++++++++++--
 plot_xiaoqu.py                     | 39 ++++++++++++++++++++++++++++--
 5 files changed, 113 insertions(+), 11 deletions(-)
 create mode 100644 parallel_plot_helper.py

diff --git a/AMSS_NCKU_Program.py b/AMSS_NCKU_Program.py
index 46d15f1..6a7952a 100755
--- a/AMSS_NCKU_Program.py
+++ b/AMSS_NCKU_Program.py
@@ -8,6 +8,14 @@
 ##
 ##################################################################
 
+## Guard against re-execution by multiprocessing child processes.
+## Without this, using 'spawn' or 'forkserver' context would cause every
+## worker to re-run the entire script, spawning exponentially more
+## workers (fork bomb).
+if __name__ != '__main__':
+    import sys as _sys
+    _sys.exit(0)
+
 
 ##################################################################
 
@@ -424,26 +432,31 @@ print(
 
 import plot_xiaoqu
 import plot_GW_strain_amplitude_xiaoqu
+from parallel_plot_helper import run_plot_tasks_parallel
+
+plot_tasks = []
 
 ## Plot black hole trajectory
-plot_xiaoqu.generate_puncture_orbit_plot(   binary_results_directory, figure_directory )
-plot_xiaoqu.generate_puncture_orbit_plot3D( binary_results_directory, figure_directory )
+plot_tasks.append( ( plot_xiaoqu.generate_puncture_orbit_plot,   (binary_results_directory, figure_directory) ) )
+plot_tasks.append( ( plot_xiaoqu.generate_puncture_orbit_plot3D, (binary_results_directory, figure_directory) ) )
 
 ## Plot black hole separation vs. time
-plot_xiaoqu.generate_puncture_distence_plot( binary_results_directory, figure_directory )
+plot_tasks.append( ( plot_xiaoqu.generate_puncture_distence_plot, (binary_results_directory, figure_directory) ) )
 
 ## Plot gravitational waveforms (psi4 and strain amplitude)
 for i in range(input_data.Detector_Number):
-    plot_xiaoqu.generate_gravitational_wave_psi4_plot( binary_results_directory, figure_directory, i )
-    plot_GW_strain_amplitude_xiaoqu.generate_gravitational_wave_amplitude_plot( binary_results_directory, figure_directory, i )
+    plot_tasks.append( ( plot_xiaoqu.generate_gravitational_wave_psi4_plot, (binary_results_directory, figure_directory, i) ) )
+    plot_tasks.append( ( plot_GW_strain_amplitude_xiaoqu.generate_gravitational_wave_amplitude_plot, (binary_results_directory, figure_directory, i) ) )
 
 ## Plot ADM mass evolution
 for i in range(input_data.Detector_Number):
-    plot_xiaoqu.generate_ADMmass_plot( binary_results_directory, figure_directory, i )
+    plot_tasks.append( ( plot_xiaoqu.generate_ADMmass_plot, (binary_results_directory, figure_directory, i) ) )
 
 ## Plot Hamiltonian constraint violation over time
 for i in range(input_data.grid_level):
-    plot_xiaoqu.generate_constraint_check_plot( binary_results_directory, figure_directory, i )
+    plot_tasks.append( ( plot_xiaoqu.generate_constraint_check_plot, (binary_results_directory, figure_directory, i) ) )
+
+run_plot_tasks_parallel(plot_tasks)
 
 ## Plot stored binary data
 plot_xiaoqu.generate_binary_data_plot( binary_results_directory, figure_directory )
diff --git a/parallel_plot_helper.py b/parallel_plot_helper.py
new file mode 100644
index 0000000..c1168fa
--- /dev/null
+++ b/parallel_plot_helper.py
@@ -0,0 +1,29 @@
+import multiprocessing
+
+def run_plot_task(task):
+    """Execute a single plotting task.
+    
+    Parameters
+    ----------
+    task : tuple
+        A tuple of (function, args_tuple) where function is a callable
+        plotting function and args_tuple contains its arguments.
+    """
+    func, args = task
+    return func(*args)
+
+
+def run_plot_tasks_parallel(plot_tasks):
+    """Execute a list of independent plotting tasks in parallel.
+
+    Uses the 'fork' context to create worker processes so that the main
+    script is NOT re-imported/re-executed in child processes.
+
+    Parameters
+    ----------
+    plot_tasks : list of tuples
+        Each element is (function, args_tuple).
+    """
+    ctx = multiprocessing.get_context('fork')
+    with ctx.Pool() as pool:
+        pool.map(run_plot_task, plot_tasks)
diff --git a/plot_GW_strain_amplitude_xiaoqu.py b/plot_GW_strain_amplitude_xiaoqu.py
index 739f3d4..cf7b098 100755
--- a/plot_GW_strain_amplitude_xiaoqu.py
+++ b/plot_GW_strain_amplitude_xiaoqu.py
@@ -11,6 +11,8 @@
 import numpy                               ## numpy for array operations
 import scipy                               ## scipy for interpolation and signal processing
 import math
+import matplotlib
+matplotlib.use('Agg')                      ## use non-interactive backend for multiprocessing safety
 import matplotlib.pyplot    as     plt     ## matplotlib for plotting
 import os                                  ## os for system/file operations
 
diff --git a/plot_binary_data.py b/plot_binary_data.py
index 0694f4f..2aca1c7 100755
--- a/plot_binary_data.py
+++ b/plot_binary_data.py
@@ -8,16 +8,23 @@
 ##
 #################################################
 
+## Restrict OpenMP to one thread per process so that running
+## many workers in parallel does not create an O(workers * BLAS_threads)
+## thread explosion.  The variable MUST be set before numpy/scipy
+## are imported, because the BLAS library reads them only at load time.
+import os
+os.environ.setdefault("OMP_NUM_THREADS",        "1")
+
 import numpy
 import scipy
+import matplotlib
+matplotlib.use('Agg')                      ## use non-interactive backend for multiprocessing safety
 import matplotlib.pyplot    as     plt
 from   matplotlib.colors    import LogNorm
 from   mpl_toolkits.mplot3d import Axes3D
 ## import torch
 import AMSS_NCKU_Input      as input_data
 
-import os
-
 
 #########################################################################################
 
@@ -192,3 +199,19 @@ def get_data_xy( Rmin, Rmax, n, data0, time, figure_title, figure_outdir ):
 
 ####################################################################################
 
+
+####################################################################################
+## Allow this module to be run as a standalone script so that each
+## binary-data plot can be executed in a fresh subprocess whose BLAS
+## environment variables (set above) take effect before numpy loads.
+##
+## Usage:  python3 plot_binary_data.py <filename> <binary_outdir> <figure_outdir>
+####################################################################################
+
+if __name__ == '__main__':
+    import sys
+    if len(sys.argv) != 4:
+        print(f"Usage: {sys.argv[0]} <filename> <binary_outdir> <figure_outdir>")
+        sys.exit(1)
+    plot_binary_data(sys.argv[1], sys.argv[2], sys.argv[3])
+
diff --git a/plot_xiaoqu.py b/plot_xiaoqu.py
index 7711d5a..47970cf 100755
--- a/plot_xiaoqu.py
+++ b/plot_xiaoqu.py
@@ -8,6 +8,8 @@
 #################################################
 
 import numpy                               ## numpy for array operations
+import matplotlib
+matplotlib.use('Agg')                      ## use non-interactive backend for multiprocessing safety
 import matplotlib.pyplot    as     plt     ## matplotlib for plotting
 from   mpl_toolkits.mplot3d import Axes3D  ## needed for 3D plots
 import glob
@@ -15,6 +17,9 @@ import os                                  ## operating system utilities
 
 import plot_binary_data
 import AMSS_NCKU_Input as input_data
+import subprocess
+import sys
+import multiprocessing
 
 # plt.rcParams['text.usetex'] = True  ## enable LaTeX fonts in plots
 
@@ -50,10 +55,40 @@ def generate_binary_data_plot( binary_outdir, figure_outdir ):
         file_list.append(x)
         print(x)
 
-    ## Plot each file in the list
+    ## Plot each file in parallel using subprocesses.
+    ## Each subprocess is a fresh Python process where the BLAS thread-count
+    ## environment variables (set at the top of plot_binary_data.py) take
+    ## effect before numpy is imported.  This avoids the thread explosion
+    ## that occurs when multiprocessing.Pool with 'fork' context inherits
+    ## already-initialized multi-threaded BLAS from the parent.
+    script = os.path.join( os.path.dirname(__file__), "plot_binary_data.py" )
+    max_workers = min( multiprocessing.cpu_count(), len(file_list) ) if file_list else 0
+
+    running = []
+    failed  = []
     for filename in file_list:
         print(filename)
-        plot_binary_data.plot_binary_data(filename, binary_outdir, figure_outdir)
+        proc = subprocess.Popen(
+            [sys.executable, script, filename, binary_outdir, figure_outdir],
+        )
+        running.append( (proc, filename) )
+        ## Keep at most max_workers subprocesses active at a time
+        if len(running) >= max_workers:
+            p, fn = running.pop(0)
+            p.wait()
+            if p.returncode != 0:
+                failed.append(fn)
+
+    ## Wait for all remaining subprocesses to finish
+    for p, fn in running:
+        p.wait()
+        if p.returncode != 0:
+            failed.append(fn)
+
+    if failed:
+        print( " WARNING: the following binary data plots failed:" )
+        for fn in failed:
+            print( "   ", fn )
 
     print(                        )
     print( " Binary Data Plot Has been Finished " )