d7/d78/bse__iterative_8F_source.html

!--------------------------------------------------------------------------------------------------!

!   CP2K: A general program to perform molecular dynamics simulations                              !

!   Copyright 2000-2025 CP2K developers group <https://cp2k.org>                                   !

!                                                                                                  !

!   SPDX-License-Identifier: GPL-2.0-or-later                                                      !

!--------------------------------------------------------------------------------------------------!


! **************************************************************************************************

!> \brief Iterative routines for GW + Bethe-Salpeter for computing electronic excitations

!> \par History

!>      04.2017 created [Jan Wilhelm]

!>      11.2023 Davidson solver implemented [Maximilian Graml]

! **************************************************************************************************

MODULE bse_iterative

   USE cp_fm_types,                     ONLY: cp_fm_get_info,&

                                              cp_fm_type

   USE group_dist_types,                ONLY: get_group_dist,&

                                              group_dist_d1_type

   USE input_constants,                 ONLY: bse_singlet,&

                                              bse_triplet

   USE kinds,                           ONLY: dp

   USE message_passing,                 ONLY: mp_para_env_type,&

                                              mp_request_type

   USE mp2_types,                       ONLY: integ_mat_buffer_type,&

                                              mp2_type

   USE physcon,                         ONLY: evolt

   USE rpa_communication,               ONLY: communicate_buffer

#include "./base/base_uses.f90"


   IMPLICIT NONE


   PRIVATE


   CHARACTER(len=*), PARAMETER, PRIVATE :: moduleN = 'bse_iterative'


   PUBLIC :: fill_local_3c_arrays, do_subspace_iterations


CONTAINS


! **************************************************************************************************

!> \brief ...

!> \param B_bar_ijQ_bse_local ...

!> \param B_abQ_bse_local ...

!> \param B_bar_iaQ_bse_local ...

!> \param B_iaQ_bse_local ...

!> \param homo ...

!> \param virtual ...

!> \param bse_spin_config ...

!> \param unit_nr ...

!> \param Eigenval ...

!> \param para_env ...

!> \param mp2_env ...

! **************************************************************************************************


   SUBROUTINE do_subspace_iterations(B_bar_ijQ_bse_local, B_abQ_bse_local, B_bar_iaQ_bse_local, &

                                     B_iaQ_bse_local, homo, virtual, bse_spin_config, unit_nr, &

                                     Eigenval, para_env, mp2_env)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: b_bar_ijq_bse_local, b_abq_bse_local, &

                                                            b_bar_iaq_bse_local, b_iaq_bse_local

      INTEGER                                            :: homo, virtual, bse_spin_config, unit_nr

      REAL(kind=dp), DIMENSION(:)                        :: eigenval

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env

      TYPE(mp2_type)                                     :: mp2_env


      CHARACTER(LEN=*), PARAMETER :: routinen = 'do_subspace_iterations'


      CHARACTER(LEN=10)                                  :: bse_davidson_abort_cond_string, &

                                                            success_abort_string

      INTEGER :: bse_davidson_abort_cond, davidson_converged, fac_max_z_space, handle, i_iter, &

         j_print, local_ri_size, num_add_start_z_space, num_davidson_iter, num_en_unconverged, &

         num_exact_en_unconverged, num_exc_en, num_max_z_space, num_new_t, num_res_unconverged, &

         num_z_vectors, num_z_vectors_init

      LOGICAL                                            :: bse_full_diag_debug

      REAL(kind=dp)                                      :: eps_exc_en, eps_res, max_en_diff, &

                                                            max_res_norm, z_space_energy_cutoff

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:) :: en_diffs, en_diffs_exact, full_exc_spectrum, &

         res_norms, subspace_full_eigenval, subspace_new_eigenval, subspace_prev_eigenval

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :) :: az_reshaped, m_ia_tmp, m_ji_tmp, ri_vector, &

         subspace_new_eigenvec, subspace_residuals_reshaped, z_vectors_reshaped

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: az, bz, subspace_add_dir, &

                                                            subspace_ritzvec, w_vectors, z_vectors


      CALL timeset(routinen, handle)


      !MG to del

      !Debug flag for exact diagonalization (only using lapack!!!)

      bse_full_diag_debug = .true.

      num_en_unconverged = -1

      num_res_unconverged = -1

      num_exact_en_unconverged = -1


      bse_davidson_abort_cond = mp2_env%bse%davidson_abort_cond

      num_exc_en = mp2_env%bse%num_exc_en

      num_add_start_z_space = mp2_env%bse%num_add_start_z_space

      fac_max_z_space = mp2_env%bse%fac_max_z_space

      num_new_t = mp2_env%bse%num_new_t

      num_davidson_iter = mp2_env%bse%num_davidson_iter

      eps_res = mp2_env%bse%eps_res

      eps_exc_en = mp2_env%bse%eps_exc_en

      z_space_energy_cutoff = mp2_env%bse%z_space_energy_cutoff


      num_z_vectors_init = num_exc_en + num_add_start_z_space


      IF (unit_nr > 0) THEN

         WRITE (unit_nr, *) "bse_spin_config", bse_spin_config

         WRITE (unit_nr, *) "num_exc_en", num_exc_en

         WRITE (unit_nr, *) "num_add_start_z_space", num_add_start_z_space

         WRITE (unit_nr, *) "num_Z_vectors_init", num_z_vectors_init

         WRITE (unit_nr, *) "fac_max_z_space", fac_max_z_space

         WRITE (unit_nr, *) "num_new_t", num_new_t

         WRITE (unit_nr, *) "eps_res", eps_res

         WRITE (unit_nr, *) "num_davidson_iter", num_davidson_iter

         WRITE (unit_nr, *) "eps_exc_en", eps_exc_en

         WRITE (unit_nr, *) "bse_davidson_abort_cond", bse_davidson_abort_cond

         WRITE (unit_nr, *) "z_space_energy_cutoff", z_space_energy_cutoff

         WRITE (unit_nr, *) "Printing B_bar_iaQ_bse_local of shape", shape(b_bar_iaq_bse_local)

      END IF


      local_ri_size = SIZE(b_iaq_bse_local, 3)


      num_z_vectors = num_z_vectors_init

      num_max_z_space = num_z_vectors_init*fac_max_z_space


      !Check input parameters and correct them if necessary

      IF (num_new_t > num_z_vectors_init) THEN

         num_new_t = num_z_vectors_init

         IF (unit_nr > 0) THEN

            CALL cp_warn(__location__, "Number of added directions has to be smaller/equals than "// &

                         "initial dimension. Corrected num_new_t accordingly.")

         END IF

      END IF

      IF (unit_nr > 0) THEN

         WRITE (unit_nr, *) "Between BSE correction Warnings"

      END IF

      !If initial number is too big, already the first iteration causes trouble in LAPACK diagonal. (DORGQR)

      IF (2*num_z_vectors_init > homo*virtual) THEN

         CALL cp_abort(__location__, "Initial dimension was too large and could not be corrected. "// &

                       "Choose another num_exc_en and num_add_start_z_space or adapt your basis set.")

      END IF

      IF (num_max_z_space >= homo*virtual) THEN

         fac_max_z_space = homo*virtual/num_z_vectors_init

         num_max_z_space = num_z_vectors_init*fac_max_z_space


         IF (fac_max_z_space == 0) THEN

            CALL cp_abort(__location__, "Maximal dimension was too large and could not be corrected. "// &

                          "Choose another fac_max_z_space and num_Z_vectors_init or adapt your basis set.")

         ELSE

            IF (unit_nr > 0) THEN

               CALL cp_warn(__location__, "Maximal dimension of Z space has to be smaller than homo*virtual. "// &

                            "Corrected fac_max_z_space accordingly.")

            END IF

         END IF

      END IF


      DO i_iter = 1, num_davidson_iter

         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) "Allocating Z_vec,AZ,BZ with dimensions (homo,virt,num_Z)", homo, virtual, num_z_vectors

            WRITE (unit_nr, *) 'ProcNr', para_env%mepos, 'you really enter here for i_iter', i_iter

         END IF

         ALLOCATE (z_vectors(homo, virtual, num_z_vectors))

         z_vectors = 0.0_dp


         !Dellocation procedures are a bit intricate, W_/Z_vectors and eigenvalues are needed for the next iteration,

         !  therefore we have to deallocate them separately from the other quantities

         IF (i_iter == 1) THEN

            CALL initial_guess_z_vectors(z_vectors, eigenval, num_z_vectors, homo, virtual)

            ALLOCATE (subspace_prev_eigenval(num_exc_en))

            subspace_prev_eigenval = 0.0_dp

         ELSE

            z_vectors(:, :, :) = w_vectors(:, :, :)

            DEALLOCATE (w_vectors)

         END IF

         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) 'ProcNr', para_env%mepos, "Allocated/rewritten Z arrays"

         END IF


         CALL create_bse_work_arrays(az, z_vectors_reshaped, az_reshaped, bz, m_ia_tmp, m_ji_tmp, &

                                     ri_vector, subspace_new_eigenval, subspace_full_eigenval, subspace_new_eigenvec, &

                                     subspace_residuals_reshaped, subspace_ritzvec, subspace_add_dir, w_vectors, &

                                     homo, virtual, num_z_vectors, local_ri_size, num_new_t)

         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) 'ProcNr', para_env%mepos, "Allocated Work arrays"

         END IF


         CALL compute_az(az, z_vectors, b_iaq_bse_local, b_bar_ijq_bse_local, b_abq_bse_local, &

                         m_ia_tmp, ri_vector, eigenval, homo, virtual, num_z_vectors, local_ri_size, &

                         para_env, bse_spin_config, z_space_energy_cutoff, i_iter, bse_full_diag_debug, &

                         full_exc_spectrum, unit_nr)


         !MG: functionality of BZ not checked (issue with fm_mat_Q_static_bse_gemm in rpa_util needs to be checked!)

         !CALL compute_BZ(BZ, Z_vectors, B_iaQ_bse_local, B_bar_iaQ_bse_local, &

         !                M_ji_tmp, homo, virtual, num_Z_vectors, local_RI_size, &

         !                para_env)


         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) 'ProcNr', para_env%mepos, "Computed AZ"

         END IF


         !MG to check: Reshaping correct?

         az_reshaped(:, :) = reshape(az, [homo*virtual, num_z_vectors])

         z_vectors_reshaped(:, :) = reshape(z_vectors, [homo*virtual, num_z_vectors])


         ! Diagonalize M and extract smallest eigenvalues/corresponding eigenvector

         CALL compute_diagonalize_zaz(az_reshaped, z_vectors_reshaped, num_z_vectors, subspace_new_eigenval, &

                                      subspace_new_eigenvec, num_new_t, subspace_full_eigenval, para_env, unit_nr)

         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) "Eigenval (eV) in iter=", i_iter, " is:", subspace_new_eigenval(:6)*evolt

         END IF


         ! Threshold in energies

         CALL check_en_convergence(subspace_full_eigenval, subspace_prev_eigenval, eps_exc_en, num_en_unconverged, &

                                   num_exc_en, max_en_diff, en_diffs)

         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) "Largest change of desired exc ens =", max_en_diff

         END IF

         ! Compute residuals

         CALL compute_residuals(az_reshaped, z_vectors_reshaped, subspace_new_eigenval, subspace_new_eigenvec, &

                                subspace_residuals_reshaped, homo, virtual, num_new_t, num_z_vectors, subspace_ritzvec)


         !Abort, if residuals are small enough w.r.t threshold

         CALL check_res_convergence(subspace_residuals_reshaped, num_new_t, eps_res, num_res_unconverged, &

                                    i_iter, max_res_norm, unit_nr, res_norms)


         davidson_converged = -1

         IF (num_res_unconverged == 0 .AND. bse_davidson_abort_cond /= 0) THEN

            davidson_converged = 1

            success_abort_string = "RESIDUALS"

         ELSE IF (num_en_unconverged == 0 .AND. (bse_davidson_abort_cond /= 1)) THEN

            davidson_converged = 1

            success_abort_string = "ENERGIES"

         ELSE IF (i_iter == num_davidson_iter) THEN

            davidson_converged = -100

            success_abort_string = "-----"

         ELSE

            davidson_converged = -1

         END IF


         IF (bse_davidson_abort_cond == 0) THEN

            bse_davidson_abort_cond_string = "ENERGY"

         ELSE IF (bse_davidson_abort_cond == 1) THEN

            bse_davidson_abort_cond_string = "RESIDUAL"

         ELSE

            bse_davidson_abort_cond_string = "EITHER"

         END IF


         IF (davidson_converged == 1) THEN

            CALL postprocess_bse(subspace_full_eigenval, num_new_t, eps_res, num_res_unconverged, &

                                 bse_spin_config, unit_nr, num_exc_en, num_z_vectors_init, &

                                 num_davidson_iter, i_iter, num_z_vectors, num_max_z_space, max_res_norm, &

                                 max_en_diff, num_en_unconverged, bse_davidson_abort_cond_string, &

                                 eps_exc_en, success_abort_string, z_space_energy_cutoff)


            !Deallocate matrices, which are otherwise not cleared due to exiting the loop

            DEALLOCATE (az, bz, &

                        z_vectors, m_ia_tmp, m_ji_tmp, ri_vector, subspace_prev_eigenval, &

                        subspace_new_eigenval, subspace_new_eigenvec, subspace_residuals_reshaped, &

                        subspace_add_dir, az_reshaped, z_vectors_reshaped, subspace_ritzvec, subspace_full_eigenval)


            EXIT

         ELSE IF (davidson_converged < -1) THEN

            CALL print_davidson_parameter(i_iter, num_davidson_iter, num_z_vectors, num_res_unconverged, max_res_norm, &

                                          eps_res, num_en_unconverged, max_en_diff, eps_exc_en, num_exc_en, &

                                          num_z_vectors_init, num_max_z_space, num_new_t, unit_nr, &

                                          success_abort_string, bse_davidson_abort_cond_string, z_space_energy_cutoff)


            CALL cp_abort(__location__, "BSE/TDA-Davidson did not converge using "// &

                          bse_davidson_abort_cond_string//" threshold condition!")

         END IF


         ! Calculate and add next orthonormal vector and update num_Z_vectors

         CALL compute_new_directions(homo, virtual, subspace_residuals_reshaped, subspace_new_eigenval, eigenval, &

                                     num_new_t, subspace_add_dir)


         !If exact-diag: compute difference to exact eigenvalues

         IF (bse_full_diag_debug) THEN

            ALLOCATE (en_diffs_exact(num_exc_en))

            num_exact_en_unconverged = 0

            DO j_print = 1, num_exc_en

               en_diffs_exact(j_print) = abs(subspace_full_eigenval(j_print) - full_exc_spectrum(j_print))

               IF (en_diffs_exact(j_print) > eps_exc_en) num_exact_en_unconverged = num_exact_en_unconverged + 1

            END DO

         END IF


         !Check dimensions and orthonormalize vector system, depending on dimensionality

         CALL check_z_space_dimension(w_vectors, z_vectors, subspace_add_dir, subspace_ritzvec, &

                                      num_z_vectors, num_new_t, num_max_z_space, homo, virtual, i_iter, unit_nr)


         !Copy eigenvalues for threshold

         subspace_prev_eigenval(:) = subspace_full_eigenval(:num_exc_en)


         DEALLOCATE (az, & !BZ,

                     z_vectors, m_ia_tmp, m_ji_tmp, ri_vector, &

                     subspace_new_eigenval, subspace_new_eigenvec, subspace_residuals_reshaped, &

                     subspace_add_dir, az_reshaped, z_vectors_reshaped, subspace_ritzvec, subspace_full_eigenval, &

                     res_norms, en_diffs)


         IF (bse_full_diag_debug) THEN

            DEALLOCATE (en_diffs_exact)

         END IF


         !Orthonorm:

         CALL orthonormalize_w(w_vectors, num_z_vectors, homo, virtual)


      END DO


      CALL timestop(handle)


   END SUBROUTINE do_subspace_iterations


! **************************************************************************************************

!> \brief ...

!> \param W_vectors ...

!> \param Z_vectors ...

!> \param Subspace_add_dir ...

!> \param Subspace_ritzvec ...

!> \param num_Z_vectors ...

!> \param num_new_t ...

!> \param num_max_z_space ...

!> \param homo ...

!> \param virtual ...

!> \param i_iter ...

!> \param unit_nr ...

! **************************************************************************************************

   SUBROUTINE check_z_space_dimension(W_vectors, Z_vectors, Subspace_add_dir, Subspace_ritzvec, &

                                      num_Z_vectors, num_new_t, num_max_z_space, homo, virtual, i_iter, unit_nr)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: w_vectors, z_vectors, subspace_add_dir, &

                                                            subspace_ritzvec

      INTEGER                                            :: num_z_vectors, num_new_t, &

                                                            num_max_z_space, homo, virtual, &

                                                            i_iter, unit_nr


      CHARACTER(LEN=*), PARAMETER :: routinen = 'check_Z_space_dimension'


      INTEGER                                            :: handle


      CALL timeset(routinen, handle)


      IF (num_z_vectors + num_new_t <= num_max_z_space) THEN

         w_vectors(:, :, :num_z_vectors) = z_vectors(:, :, :)

         w_vectors(:, :, num_z_vectors + 1:) = subspace_add_dir

         num_z_vectors = num_z_vectors + num_new_t

      ELSE

         IF (unit_nr > 0) THEN

            WRITE (unit_nr, *) "Resetting dimension in i_iter=", i_iter

         END IF

         DEALLOCATE (w_vectors)

         ALLOCATE (w_vectors(homo, virtual, 2*num_new_t))

         w_vectors(:, :, :num_new_t) = subspace_ritzvec(:, :, :)

         w_vectors(:, :, num_new_t + 1:) = subspace_add_dir

         num_z_vectors = 2*num_new_t

      END IF


      CALL timestop(handle)


   END SUBROUTINE check_z_space_dimension


! **************************************************************************************************

!> \brief ...

!> \param AZ ...

!> \param Z_vectors_reshaped ...

!> \param AZ_reshaped ...

!> \param BZ ...

!> \param M_ia_tmp ...

!> \param M_ji_tmp ...

!> \param RI_vector ...

!> \param Subspace_new_eigenval ...

!> \param Subspace_full_eigenval ...

!> \param Subspace_new_eigenvec ...

!> \param Subspace_residuals_reshaped ...

!> \param Subspace_ritzvec ...

!> \param Subspace_add_dir ...

!> \param W_vectors ...

!> \param homo ...

!> \param virtual ...

!> \param num_Z_vectors ...

!> \param local_RI_size ...

!> \param num_new_t ...

! **************************************************************************************************

   SUBROUTINE create_bse_work_arrays(AZ, Z_vectors_reshaped, AZ_reshaped, BZ, M_ia_tmp, M_ji_tmp, &

                                     RI_vector, Subspace_new_eigenval, Subspace_full_eigenval, Subspace_new_eigenvec, &

                                     Subspace_residuals_reshaped, Subspace_ritzvec, Subspace_add_dir, W_vectors, &

                                     homo, virtual, num_Z_vectors, local_RI_size, num_new_t)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: az

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: z_vectors_reshaped, az_reshaped

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: bz

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: m_ia_tmp, m_ji_tmp, ri_vector

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_new_eigenval, &

                                                            subspace_full_eigenval

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_new_eigenvec, &

                                                            subspace_residuals_reshaped

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: subspace_ritzvec, subspace_add_dir, &

                                                            w_vectors

      INTEGER                                            :: homo, virtual, num_z_vectors, &

                                                            local_ri_size, num_new_t


      CHARACTER(LEN=*), PARAMETER :: routinen = 'create_bse_work_arrays'


      INTEGER                                            :: handle


      CALL timeset(routinen, handle)


      ALLOCATE (az(homo, virtual, num_z_vectors))

      az = 0.0_dp


      ALLOCATE (z_vectors_reshaped(homo*virtual, num_z_vectors))

      z_vectors_reshaped = 0.0_dp


      ALLOCATE (az_reshaped(homo*virtual, num_z_vectors))

      az_reshaped = 0.0_dp


      ALLOCATE (bz(homo, virtual, num_z_vectors))

      bz = 0.0_dp


      ALLOCATE (m_ia_tmp(homo, virtual))

      m_ia_tmp = 0.0_dp


      ALLOCATE (m_ji_tmp(homo, homo))

      m_ji_tmp = 0.0_dp


      ALLOCATE (ri_vector(local_ri_size, num_z_vectors))

      ri_vector = 0.0_dp


      ALLOCATE (subspace_new_eigenval(num_new_t))

      subspace_new_eigenval = 0.0_dp


      ALLOCATE (subspace_full_eigenval(num_z_vectors))

      subspace_full_eigenval = 0.0_dp


      ALLOCATE (subspace_new_eigenvec(num_z_vectors, num_new_t))

      subspace_new_eigenvec = 0.0_dp


      ALLOCATE (subspace_residuals_reshaped(homo*virtual, num_new_t))

      subspace_residuals_reshaped = 0.0_dp


      ALLOCATE (subspace_ritzvec(homo, virtual, num_new_t))

      subspace_ritzvec = 0.0_dp


      ALLOCATE (subspace_add_dir(homo, virtual, num_new_t))

      subspace_add_dir = 0.0_dp


      ALLOCATE (w_vectors(homo, virtual, num_z_vectors + num_new_t))

      w_vectors = 0.0_dp


      CALL timestop(handle)


   END SUBROUTINE create_bse_work_arrays


! **************************************************************************************************

!> \brief ...

!> \param Subspace_full_eigenval ...

!> \param num_new_t ...

!> \param eps_res ...

!> \param num_res_unconverged ...

!> \param bse_spin_config ...

!> \param unit_nr ...

!> \param num_exc_en ...

!> \param num_Z_vectors_init ...

!> \param num_davidson_iter ...

!> \param i_iter ...

!> \param num_Z_vectors ...

!> \param num_max_z_space ...

!> \param max_res_norm ...

!> \param max_en_diff ...

!> \param num_en_unconverged ...

!> \param bse_davidson_abort_cond_string ...

!> \param eps_exc_en ...

!> \param success_abort_string ...

!> \param z_space_energy_cutoff ...

! **************************************************************************************************

   SUBROUTINE postprocess_bse(Subspace_full_eigenval, num_new_t, eps_res, num_res_unconverged, &

                              bse_spin_config, unit_nr, num_exc_en, num_Z_vectors_init, &

                              num_davidson_iter, i_iter, num_Z_vectors, num_max_z_space, max_res_norm, &

                              max_en_diff, num_en_unconverged, bse_davidson_abort_cond_string, &

                              eps_exc_en, success_abort_string, z_space_energy_cutoff)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_full_eigenval

      INTEGER                                            :: num_new_t

      REAL(kind=dp)                                      :: eps_res

      INTEGER :: num_res_unconverged, bse_spin_config, unit_nr, num_exc_en, num_z_vectors_init, &

         num_davidson_iter, i_iter, num_z_vectors, num_max_z_space

      REAL(kind=dp)                                      :: max_res_norm, max_en_diff

      INTEGER                                            :: num_en_unconverged

      CHARACTER(LEN=10)                                  :: bse_davidson_abort_cond_string

      REAL(kind=dp)                                      :: eps_exc_en

      CHARACTER(LEN=10)                                  :: success_abort_string

      REAL(kind=dp)                                      :: z_space_energy_cutoff


      CHARACTER(LEN=*), PARAMETER                        :: routinen = 'postprocess_bse'


      CHARACTER(LEN=10)                                  :: multiplet

      INTEGER                                            :: handle, i

      REAL(kind=dp)                                      :: alpha


      CALL timeset(routinen, handle)


      !Prepare variables for printing

      SELECT CASE (bse_spin_config)

      CASE (bse_singlet)

         alpha = 2.0_dp

         multiplet = "Singlet"

      CASE (bse_triplet)

         alpha = 0.0_dp

         multiplet = "Triplet"

      END SELECT


      IF (unit_nr > 0) THEN

         WRITE (unit_nr, *) ' '

         WRITE (unit_nr, '(T3,A)') '******************************************************************************'

         WRITE (unit_nr, '(T3,A)') '**                                                                          **'

         WRITE (unit_nr, '(T3,A)') '**                        BSE-TDA EXCITONIC ENERGIES                        **'

         WRITE (unit_nr, '(T3,A)') '**                                                                          **'

         WRITE (unit_nr, '(T3,A)') '******************************************************************************'

         WRITE (unit_nr, '(T3,A)') ' '

         WRITE (unit_nr, '(T3,A)') ' '

         WRITE (unit_nr, '(T3,A)') ' The excitation energies are calculated by iteratively diagonalizing: '

         WRITE (unit_nr, '(T3,A)') ' '

         WRITE (unit_nr, '(T3,A)') '    A_iajb   =  (E_a-E_i) delta_ij delta_ab   +  alpha * v_iajb   -  W_ijab   '

         WRITE (unit_nr, '(T3,A)') ' '

         WRITE (unit_nr, '(T3,A48,A7,A12,F3.1)') &

            ' The spin-dependent factor for the requested ', multiplet, " is alpha = ", alpha

         WRITE (unit_nr, '(T3,A)') ' '

         WRITE (unit_nr, '(T3,A16,T50,A22)') &

            ' Excitonic level', 'Excitation energy (eV)'

         !prints actual energies values

         DO i = 1, num_exc_en

            WRITE (unit_nr, '(T3,I16,T50,F22.3)') i, subspace_full_eigenval(i)*evolt

         END DO


         WRITE (unit_nr, '(T3,A)') ' '


         !prints parameters of Davidson algorithm

         CALL print_davidson_parameter(i_iter, num_davidson_iter, num_z_vectors, num_res_unconverged, max_res_norm, &

                                       eps_res, num_en_unconverged, max_en_diff, eps_exc_en, num_exc_en, &

                                       num_z_vectors_init, num_max_z_space, num_new_t, unit_nr, &

                                       success_abort_string, bse_davidson_abort_cond_string, z_space_energy_cutoff)


         !Insert warning if energies are not converged (could probably be the case if one uses residual threshold)

         IF (num_en_unconverged > 0) THEN

            WRITE (unit_nr, '(T3,A)') '!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!'

            WRITE (unit_nr, '(T3,A2,T79,A2)') '!!', "!!"

            WRITE (unit_nr, '(T3,A2,T8,A65,T79,A2)') '!!', "THERE ARE UNCONVERGED ENERGIES PRINTED OUT, SOMETHING WENT WRONG!", "!!"

            WRITE (unit_nr, '(T3,A2,T79,A2)') '!!', "!!"

            WRITE (unit_nr, '(T3,A)') '!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!'

         END IF

      END IF


      CALL timestop(handle)


   END SUBROUTINE postprocess_bse


! **************************************************************************************************

!> \brief ...

!> \param i_iter ...

!> \param num_davidson_iter ...

!> \param num_Z_vectors ...

!> \param num_res_unconverged ...

!> \param max_res_norm ...

!> \param eps_res ...

!> \param num_en_unconverged ...

!> \param max_en_diff ...

!> \param eps_exc_en ...

!> \param num_exc_en ...

!> \param num_Z_vectors_init ...

!> \param num_max_z_space ...

!> \param num_new_t ...

!> \param unit_nr ...

!> \param success_abort_string ...

!> \param bse_davidson_abort_cond_string ...

!> \param z_space_energy_cutoff ...

! **************************************************************************************************

   SUBROUTINE print_davidson_parameter(i_iter, num_davidson_iter, num_Z_vectors, num_res_unconverged, max_res_norm, &

                                       eps_res, num_en_unconverged, max_en_diff, eps_exc_en, num_exc_en, &

                                       num_Z_vectors_init, num_max_z_space, num_new_t, unit_nr, &

                                       success_abort_string, bse_davidson_abort_cond_string, z_space_energy_cutoff)


      INTEGER                                            :: i_iter, num_davidson_iter, &

                                                            num_z_vectors, num_res_unconverged

      REAL(kind=dp)                                      :: max_res_norm, eps_res

      INTEGER                                            :: num_en_unconverged

      REAL(kind=dp)                                      :: max_en_diff, eps_exc_en

      INTEGER                                            :: num_exc_en, num_z_vectors_init, &

                                                            num_max_z_space, num_new_t, unit_nr

      CHARACTER(LEN=10)                                  :: success_abort_string, &

                                                            bse_davidson_abort_cond_string

      REAL(kind=dp)                                      :: z_space_energy_cutoff


      CHARACTER(LEN=*), PARAMETER :: routinen = 'print_davidson_parameter'


      INTEGER                                            :: handle


      CALL timeset(routinen, handle)


      WRITE (unit_nr, '(T3,A)') '******************************************************************************'

      WRITE (unit_nr, '(T3,A2,T15,A49,T79,A2)') &

         '**', "Parameters of the BSE-Davidson solver:", "**"

      WRITE (unit_nr, '(T3,A2,T79,A2)') &

         '**', "**"

      WRITE (unit_nr, '(T3,A2,T79,A2)') &

         '**', "**"

      WRITE (unit_nr, '(T3,A2,T10,A16,I5,A12,I5,A8,T79,A2)') &

         '**', "Converged after ", i_iter, " of maximal ", num_davidson_iter, " cycles,", "**"

      WRITE (unit_nr, '(T3,A2,T20,A11,A9,A7,A8,A20,T79,A2)') &

         '**', "because of ", success_abort_string, " using ", &

         bse_davidson_abort_cond_string, " threshold condition", "**"

      WRITE (unit_nr, '(T3,A2,T79,A2)') &

         '**', "**"

      WRITE (unit_nr, '(T3,A2,T10,A32,T65,I11,T79,A2)') &

         '**', "The Z space has at the end dim. ", num_z_vectors, "**"

      WRITE (unit_nr, '(T3,A2,T10,A45,T65,I11,T79,A2)') &

         '**', "Number of unconverged residuals in subspace: ", num_res_unconverged, "**"

      WRITE (unit_nr, '(T3,A2,T10,A35,T65,E11.4,T79,A2)') &

         '**', "largest unconverged residual (eV): ", max_res_norm*evolt, "**"

      WRITE (unit_nr, '(T3,A2,T10,A45,T65,E11.4,T79,A2)') &

         '**', "threshold for convergence of residuals (eV): ", eps_res*evolt, "**"

      WRITE (unit_nr, '(T3,A2,T10,A45,T65,I11,T79,A2)') &

         '**', "Number of desired, but unconverged energies: ", num_en_unconverged, "**"

      WRITE (unit_nr, '(T3,A2,T10,A44,T65,E11.4,T79,A2)') &

         '**', "largest unconverged energy difference (eV): ", max_en_diff*evolt, "**"

      WRITE (unit_nr, '(T3,A2,T10,A44,T65,E11.4,T79,A2)') &

         '**', "threshold for convergence of energies (eV): ", eps_exc_en*evolt, "**"

      WRITE (unit_nr, '(T3,A2,T10,A40,T65,I11,T79,A2)') &

         '**', "number of computed excitation energies: ", num_exc_en, "**"


      IF (z_space_energy_cutoff > 0) THEN

         WRITE (unit_nr, '(T3,A2,T10,A37,T65,E11.4,T79,A2)') &

            '**', "cutoff for excitation energies (eV): ", z_space_energy_cutoff*evolt, "**"

      END IF


      WRITE (unit_nr, '(T3,A2,T10,A36,T65,I11,T79,A2)') &

         '**', "number of Z space at the beginning: ", num_z_vectors_init, "**"

      WRITE (unit_nr, '(T3,A2,T10,A30,T65,I11,T79,A2)') &

         '**', "maximal dimension of Z space: ", num_max_z_space, "**"

      WRITE (unit_nr, '(T3,A2,T10,A31,T65,I11,T79,A2)') &

         '**', "added directions per iteration: ", num_new_t, "**"

      WRITE (unit_nr, '(T3,A2,T79,A2)') &

         '**', "**"

      WRITE (unit_nr, '(T3,A2,T79,A2)') &

         '**', "**"

      WRITE (unit_nr, '(T3,A)') '******************************************************************************'

      WRITE (unit_nr, '(T3,A)') ' '


      CALL timestop(handle)


   END SUBROUTINE print_davidson_parameter


! **************************************************************************************************

!> \brief ...

!> \param Subspace_full_eigenval ...

!> \param Subspace_prev_eigenval ...

!> \param eps_exc_en ...

!> \param num_en_unconverged ...

!> \param num_exc_en ...

!> \param max_en_diff ...

!> \param En_diffs ...

! **************************************************************************************************

   SUBROUTINE check_en_convergence(Subspace_full_eigenval, Subspace_prev_eigenval, eps_exc_en, num_en_unconverged, &

                                   num_exc_en, max_en_diff, En_diffs)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_full_eigenval, &

                                                            subspace_prev_eigenval

      REAL(kind=dp)                                      :: eps_exc_en

      INTEGER                                            :: num_en_unconverged, num_exc_en

      REAL(kind=dp)                                      :: max_en_diff

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: en_diffs


      CHARACTER(LEN=*), PARAMETER :: routinen = 'check_en_convergence'


      INTEGER                                            :: handle, mu_l


      CALL timeset(routinen, handle)


      num_en_unconverged = 0

      ALLOCATE (en_diffs(num_exc_en))

      DO mu_l = 1, num_exc_en

         en_diffs(mu_l) = abs(subspace_full_eigenval(mu_l) - subspace_prev_eigenval(mu_l))

         IF (en_diffs(mu_l) > eps_exc_en) num_en_unconverged = num_en_unconverged + 1

      END DO

      max_en_diff = maxval(en_diffs)


      CALL timestop(handle)


   END SUBROUTINE check_en_convergence


! **************************************************************************************************

!> \brief ...

!> \param Subspace_residuals_reshaped ...

!> \param num_new_t ...

!> \param eps_res ...

!> \param num_res_unconverged ...

!> \param i_iter ...

!> \param max_res_norm ...

!> \param unit_nr ...

!> \param Res_norms ...

! **************************************************************************************************

   SUBROUTINE check_res_convergence(Subspace_residuals_reshaped, num_new_t, eps_res, num_res_unconverged, &

                                    i_iter, max_res_norm, unit_nr, Res_norms)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_residuals_reshaped

      INTEGER                                            :: num_new_t

      REAL(kind=dp)                                      :: eps_res

      INTEGER                                            :: num_res_unconverged, i_iter

      REAL(kind=dp)                                      :: max_res_norm

      INTEGER                                            :: unit_nr

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: res_norms


      CHARACTER(LEN=*), PARAMETER :: routinen = 'check_res_convergence'


      INTEGER                                            :: handle, mu_l


      CALL timeset(routinen, handle)


      num_res_unconverged = 0

      ALLOCATE (res_norms(num_new_t))

      DO mu_l = 1, num_new_t

         res_norms(mu_l) = norm2(subspace_residuals_reshaped(:, mu_l))

         IF (res_norms(mu_l) > eps_res) THEN

            num_res_unconverged = num_res_unconverged + 1

            IF (unit_nr > 0) THEN

               WRITE (unit_nr, *) "Unconverged res in i_iter=", i_iter, "is:", res_norms(mu_l)

            END IF

         END IF

      END DO

      max_res_norm = maxval(res_norms)

      IF (unit_nr > 0) THEN

         WRITE (unit_nr, *) "Maximal unconverged res (of ", num_res_unconverged, &

            " unconverged res in this step) in i_iter=", i_iter, "is:", max_res_norm

      END IF


      CALL timestop(handle)


   END SUBROUTINE check_res_convergence


! **************************************************************************************************

!> \brief ...

!> \param W_vectors ...

!> \param num_Z_vectors ...

!> \param homo ...

!> \param virtual ...

! **************************************************************************************************

   SUBROUTINE orthonormalize_w(W_vectors, num_Z_vectors, homo, virtual)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: w_vectors

      INTEGER                                            :: num_z_vectors, homo, virtual


      CHARACTER(LEN=*), PARAMETER                        :: routinen = 'orthonormalize_W'


      INTEGER                                            :: handle, info_dor, info_orth, lwork_dor, &

                                                            lwork_w

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: tau_w, work_w, work_w_dor

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: w_vectors_reshaped


      CALL timeset(routinen, handle)


      ALLOCATE (w_vectors_reshaped(homo*virtual, num_z_vectors))

      w_vectors_reshaped(:, :) = reshape(w_vectors, [homo*virtual, num_z_vectors])


      ALLOCATE (tau_w(min(homo*virtual, num_z_vectors)))

      tau_w = 0.0_dp


      ALLOCATE (work_w(1))

      work_w = 0.0_dp


      ALLOCATE (work_w_dor(1))

      work_w_dor = 0.0_dp


      CALL dgeqrf(homo*virtual, num_z_vectors, w_vectors_reshaped, homo*virtual, tau_w, work_w, -1, info_orth)

      lwork_w = int(work_w(1))

      DEALLOCATE (work_w)

      ALLOCATE (work_w(lwork_w))

      work_w = 0.0_dp

      CALL dgeqrf(homo*virtual, num_z_vectors, w_vectors_reshaped, homo*virtual, tau_w, work_w, lwork_w, info_orth)

      IF (info_orth /= 0) THEN

         cpabort("QR Decomp Step 1 doesnt work")

      END IF

      CALL dorgqr(homo*virtual, num_z_vectors, min(homo*virtual, num_z_vectors), w_vectors_reshaped, homo*virtual, &

                  tau_w, work_w_dor, -1, info_dor)

      lwork_dor = int(work_w_dor(1))

      DEALLOCATE (work_w_dor)

      ALLOCATE (work_w_dor(lwork_dor))

      work_w_dor = 0.0_dp

      CALL dorgqr(homo*virtual, num_z_vectors, min(homo*virtual, num_z_vectors), w_vectors_reshaped, homo*virtual, &

                  tau_w, work_w_dor, lwork_dor, info_dor)

      IF (info_orth /= 0) THEN

         cpabort("QR Decomp Step 2 doesnt work")

      END IF


      w_vectors(:, :, :) = reshape(w_vectors_reshaped, [homo, virtual, num_z_vectors])


      DEALLOCATE (work_w, work_w_dor, tau_w, w_vectors_reshaped)


      CALL timestop(handle)


   END SUBROUTINE orthonormalize_w


! **************************************************************************************************

!> \brief ...

!> \param homo ...

!> \param virtual ...

!> \param Subspace_residuals_reshaped ...

!> \param Subspace_new_eigenval ...

!> \param Eigenval ...

!> \param num_new_t ...

!> \param Subspace_add_dir ...

! **************************************************************************************************

   SUBROUTINE compute_new_directions(homo, virtual, Subspace_residuals_reshaped, Subspace_new_eigenval, Eigenval, &

                                     num_new_t, Subspace_add_dir)


      INTEGER                                            :: homo, virtual

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_residuals_reshaped

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_new_eigenval

      REAL(kind=dp), DIMENSION(:)                        :: eigenval

      INTEGER                                            :: num_new_t

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: subspace_add_dir


      CHARACTER(LEN=*), PARAMETER :: routinen = 'compute_new_directions'


      INTEGER                                            :: a_virt, handle, i_occ, mu_subspace, &

                                                            prec_neg

      REAL(kind=dp)                                      :: prec_scalar

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_add_dir_reshaped


      CALL timeset(routinen, handle)


      ALLOCATE (subspace_add_dir_reshaped(homo*virtual, num_new_t))


      prec_neg = 0

      DO mu_subspace = 1, num_new_t

         DO i_occ = 1, homo

            DO a_virt = 1, virtual

               !MG to check: Indexorder and range of indices

               prec_scalar = -1/(subspace_new_eigenval(mu_subspace) - (eigenval(a_virt + homo) - eigenval(i_occ)))

               IF (prec_scalar < 0) THEN

                  prec_neg = prec_neg + 1

                  !prec_scalar = - prec_scalar

               END IF

               subspace_add_dir_reshaped((i_occ - 1)*virtual + a_virt, mu_subspace) = prec_scalar* &

                                                              subspace_residuals_reshaped((i_occ - 1)*virtual + a_virt, mu_subspace)

            END DO

         END DO

      END DO


      subspace_add_dir(:, :, :) = reshape(subspace_add_dir_reshaped, [homo, virtual, num_new_t])


      DEALLOCATE (subspace_add_dir_reshaped)

      CALL timestop(handle)


   END SUBROUTINE compute_new_directions


! **************************************************************************************************

!> \brief ...

!> \param AZ_reshaped ...

!> \param Z_vectors_reshaped ...

!> \param Subspace_new_eigenval ...

!> \param Subspace_new_eigenvec ...

!> \param Subspace_residuals_reshaped ...

!> \param homo ...

!> \param virtual ...

!> \param num_new_t ...

!> \param num_Z_vectors ...

!> \param Subspace_ritzvec ...

! **************************************************************************************************

   SUBROUTINE compute_residuals(AZ_reshaped, Z_vectors_reshaped, Subspace_new_eigenval, Subspace_new_eigenvec, &

                                Subspace_residuals_reshaped, homo, virtual, num_new_t, num_Z_vectors, Subspace_ritzvec)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: az_reshaped, z_vectors_reshaped

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_new_eigenval

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_new_eigenvec, &

                                                            subspace_residuals_reshaped

      INTEGER                                            :: homo, virtual, num_new_t, num_z_vectors

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: subspace_ritzvec


      CHARACTER(LEN=*), PARAMETER                        :: routinen = 'compute_residuals'


      INTEGER                                            :: handle, mu_subspace

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_res_a, subspace_res_ev


      CALL timeset(routinen, handle)


      ALLOCATE (subspace_res_ev(homo*virtual, num_new_t))

      subspace_res_ev = 0.0_dp


      ALLOCATE (subspace_res_a(homo*virtual, num_new_t))

      subspace_res_a = 0.0_dp


      !Compute all residuals in one loop, iterating over number of new/added t per iteration

      DO mu_subspace = 1, num_new_t


         CALL dgemm("N", "N", homo*virtual, 1, num_z_vectors, 1.0_dp, z_vectors_reshaped, homo*virtual, &

                    subspace_new_eigenvec(:, mu_subspace), num_z_vectors, 0.0_dp, subspace_res_ev(:, mu_subspace), homo*virtual)


         CALL dgemm("N", "N", homo*virtual, 1, num_z_vectors, 1.0_dp, az_reshaped, homo*virtual, &

                    subspace_new_eigenvec(:, mu_subspace), num_z_vectors, 0.0_dp, subspace_res_a(:, mu_subspace), homo*virtual)


         subspace_residuals_reshaped(:, mu_subspace) = subspace_new_eigenval(mu_subspace)*subspace_res_ev(:, mu_subspace) &

                                                       - subspace_res_a(:, mu_subspace)


      END DO

      subspace_ritzvec(:, :, :) = reshape(subspace_res_ev, [homo, virtual, num_new_t])

      DEALLOCATE (subspace_res_ev, subspace_res_a)


      CALL timestop(handle)


   END SUBROUTINE compute_residuals


! **************************************************************************************************

!> \brief ...

!> \param AZ_reshaped ...

!> \param Z_vectors_reshaped ...

!> \param num_Z_vectors ...

!> \param Subspace_new_eigenval ...

!> \param Subspace_new_eigenvec ...

!> \param num_new_t ...

!> \param Subspace_full_eigenval ...

!> \param para_env ...

!> \param unit_nr ...

! **************************************************************************************************

   SUBROUTINE compute_diagonalize_zaz(AZ_reshaped, Z_vectors_reshaped, num_Z_vectors, Subspace_new_eigenval, &

                                      Subspace_new_eigenvec, num_new_t, Subspace_full_eigenval, para_env, unit_nr)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: az_reshaped, z_vectors_reshaped

      INTEGER, INTENT(in)                                :: num_z_vectors

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_new_eigenval

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: subspace_new_eigenvec

      INTEGER, INTENT(in)                                :: num_new_t

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: subspace_full_eigenval

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env

      INTEGER, INTENT(in)                                :: unit_nr


      CHARACTER(LEN=*), PARAMETER :: routinen = 'compute_diagonalize_ZAZ'


      INTEGER                                            :: handle, i_z_vector, j_z_vector, lwork, &

                                                            zaz_diag_info

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: work

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: zaz


      CALL timeset(routinen, handle)


      ALLOCATE (zaz(num_z_vectors, num_z_vectors))

      zaz(:, :) = 0.0_dp


      !Flatten AZ and Z matrices of a certain j_Z_vector w.r.t. occ and virt indices

      !Multiply for each j_Z_vec and write into matrix of dim (num_Z_vec, num_Z_vec)

      DO i_z_vector = 1, num_z_vectors

         DO j_z_vector = 1, num_z_vectors

            zaz(j_z_vector, i_z_vector) = dot_product(z_vectors_reshaped(:, j_z_vector), az_reshaped(:, i_z_vector))

         END DO

      END DO

      IF (unit_nr > 0) THEN

         WRITE (unit_nr, *) 'ProcNr', para_env%mepos, "Before Diag"

      END IF


      !MG to do: Check for symmetry of ZAZ!

      ALLOCATE (work(1))

      work = 0.0_dp

      CALL dsyev("V", "U", num_z_vectors, zaz, num_z_vectors, subspace_full_eigenval, work, -1, zaz_diag_info)

      lwork = int(work(1))

      DEALLOCATE (work)

      ALLOCATE (work(lwork))

      work = 0.0_dp

      !MG to check: Usage of symmetric routine okay? (Correct LWORK?)

      CALL dsyev("V", "U", num_z_vectors, zaz, num_z_vectors, subspace_full_eigenval, work, lwork, zaz_diag_info)


      IF (zaz_diag_info /= 0) THEN

         cpabort("ZAZ could not be diagonalized successfully.")

      END IF


      IF (unit_nr > 0) THEN

         WRITE (unit_nr, *) 'ProcNr', para_env%mepos, "After Diag"

      END IF


      subspace_new_eigenval(1:num_new_t) = subspace_full_eigenval(1:num_new_t)

      subspace_new_eigenvec(:, 1:num_new_t) = zaz(:, 1:num_new_t)

      DEALLOCATE (work)

      DEALLOCATE (zaz)


      CALL timestop(handle)


   END SUBROUTINE compute_diagonalize_zaz


! **************************************************************************************************

!> \brief ...

!> \param BZ ...

!> \param Z_vectors ...

!> \param B_iaQ_bse_local ...

!> \param B_bar_iaQ_bse_local ...

!> \param M_ji_tmp ...

!> \param homo ...

!> \param virtual ...

!> \param num_Z_vectors ...

!> \param local_RI_size ...

!> \param para_env ...

! **************************************************************************************************

   SUBROUTINE compute_bz(BZ, Z_vectors, B_iaQ_bse_local, B_bar_iaQ_bse_local, &

                         M_ji_tmp, homo, virtual, num_Z_vectors, local_RI_size, para_env)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: bz, z_vectors, b_iaq_bse_local, &

                                                            b_bar_iaq_bse_local

      REAL(kind=dp), DIMENSION(:, :)                     :: m_ji_tmp

      INTEGER                                            :: homo, virtual, num_z_vectors, &

                                                            local_ri_size

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env


      INTEGER                                            :: i_z_vector, lll


      bz(:, :, :) = 0.0_dp


      !CALL compute_v_ia_jb_part(BZ, Z_vectors, B_iaQ_bse_local, RI_vector, local_RI_size, &

      !                          num_Z_vectors, homo, virtual)


      DO i_z_vector = 1, num_z_vectors


         DO lll = 1, local_ri_size


            ! M_ji^P = sum_b Z_jb*B_bi^P

            CALL dgemm("N", "T", homo, homo, virtual, 1.0_dp, z_vectors(:, :, i_z_vector), homo, &

                       b_iaq_bse_local(:, :, lll), homo, 0.0_dp, m_ji_tmp, homo)

            ! (BZ)_ia = sum_jP M_ij^P*B^bar_ja^P

            CALL dgemm("T", "N", homo, virtual, homo, 1.0_dp, m_ji_tmp, homo, &

                       b_bar_iaq_bse_local, homo, 1.0_dp, bz(:, :, i_z_vector), homo)


         END DO


      END DO


      ! we make the sum to sum over all RI basis functions

      CALL para_env%sum(bz)


   END SUBROUTINE compute_bz


! **************************************************************************************************

!> \brief ...

!> \param AZ ...

!> \param Z_vectors ...

!> \param B_iaQ_bse_local ...

!> \param B_bar_ijQ_bse_local ...

!> \param B_abQ_bse_local ...

!> \param M_ia_tmp ...

!> \param RI_vector ...

!> \param Eigenval ...

!> \param homo ...

!> \param virtual ...

!> \param num_Z_vectors ...

!> \param local_RI_size ...

!> \param para_env ...

!> \param bse_spin_config ...

!> \param z_space_energy_cutoff ...

!> \param i_iter ...

!> \param bse_full_diag_debug ...

!> \param Full_exc_spectrum ...

!> \param unit_nr ...

! **************************************************************************************************

   SUBROUTINE compute_az(AZ, Z_vectors, B_iaQ_bse_local, B_bar_ijQ_bse_local, B_abQ_bse_local, M_ia_tmp, &

                         RI_vector, Eigenval, homo, virtual, num_Z_vectors, local_RI_size, &

                         para_env, bse_spin_config, z_space_energy_cutoff, i_iter, bse_full_diag_debug, &

                         Full_exc_spectrum, unit_nr)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :)     :: az, z_vectors, b_iaq_bse_local, &

                                                            b_bar_ijq_bse_local, b_abq_bse_local

      REAL(kind=dp), DIMENSION(:, :)                     :: m_ia_tmp, ri_vector

      REAL(kind=dp), DIMENSION(:)                        :: eigenval

      INTEGER                                            :: homo, virtual, num_z_vectors, &

                                                            local_ri_size

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env

      INTEGER                                            :: bse_spin_config

      REAL(kind=dp)                                      :: z_space_energy_cutoff

      INTEGER                                            :: i_iter

      LOGICAL                                            :: bse_full_diag_debug

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: full_exc_spectrum

      INTEGER                                            :: unit_nr


      CHARACTER(LEN=*), PARAMETER                        :: routinen = 'compute_AZ'


      INTEGER                                            :: a, a_virt, b, diag_info, handle, i, &

                                                            i_occ, i_z_vector, j, lll, lwork, m, n

      REAL(kind=dp)                                      :: eigen_diff

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:)           :: work

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: a_full_reshaped

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :, :)  :: a_full, v_iajb, w_ijab


      CALL timeset(routinen, handle)

      az(:, :, :) = 0.0_dp


      IF (i_iter == 1 .AND. bse_full_diag_debug) THEN

         ALLOCATE (w_ijab(homo, homo, virtual, virtual))

         ALLOCATE (a_full(homo, virtual, homo, virtual))

         ALLOCATE (a_full_reshaped(homo*virtual, homo*virtual))

         ALLOCATE (full_exc_spectrum(homo*virtual))

         w_ijab = 0.0_dp

         a_full = 0.0_dp

         a_full_reshaped = 0.0_dp

         full_exc_spectrum = 0.0_dp

      END IF


      CALL compute_v_ia_jb_part(az, z_vectors, b_iaq_bse_local, ri_vector, local_ri_size, &

                                num_z_vectors, homo, virtual, bse_spin_config, v_iajb, bse_full_diag_debug, i_iter, &

                                para_env)


      DO i_z_vector = 1, num_z_vectors


         DO lll = 1, local_ri_size


            ! M_ja^P = sum_b Z_jb*B_ba^P

            CALL dgemm("N", "N", homo, virtual, virtual, 1.0_dp, z_vectors(:, :, i_z_vector), homo, &

                       b_abq_bse_local(:, :, lll), virtual, 0.0_dp, m_ia_tmp, homo)


            ! (AZ)_ia = sum_jP B_bar_ij^P*M_ja^P

            CALL dgemm("N", "N", homo, virtual, homo, -1.0_dp, b_bar_ijq_bse_local(:, :, lll), homo, &

                       m_ia_tmp, homo, 1.0_dp, az(:, :, i_z_vector), homo)


         END DO

      END DO


      IF (i_iter == 1 .AND. bse_full_diag_debug) THEN

         w_ijab = 0.0_dp

         !Create screened 4c integrals for check

         DO lll = 1, local_ri_size

            DO i = 1, homo

               DO j = 1, homo

                  DO a = 1, virtual

                     DO b = 1, virtual

                        w_ijab(i, j, a, b) = w_ijab(i, j, a, b) + b_bar_ijq_bse_local(i, j, lll)*b_abq_bse_local(a, b, lll)

                     END DO

                  END DO

               END DO

            END DO

         END DO

         ! we make the mp_sum to sum over all RI basis functions

         CALL para_env%sum(w_ijab)

      END IF


      ! we make the mp_sum to sum over all RI basis functions

      CALL para_env%sum(az)


      ! add (e_a-e_i)*Z_ia

      DO i_occ = 1, homo

         DO a_virt = 1, virtual


            eigen_diff = eigenval(a_virt + homo) - eigenval(i_occ)

            IF (unit_nr > 0 .AND. i_iter == 1) THEN

               WRITE (unit_nr, *) "Ediff at (i_occ,a_virt)=", i_occ, a_virt, " is: ", eigen_diff

            END IF


            az(i_occ, a_virt, :) = az(i_occ, a_virt, :) + z_vectors(i_occ, a_virt, :)*eigen_diff


         END DO

      END DO


      !cut off contributions, which are too high in the excitation spectrum

      IF (z_space_energy_cutoff > 0) THEN

         DO i_occ = 1, homo

            DO a_virt = 1, virtual


               IF (eigenval(a_virt + homo) > z_space_energy_cutoff .OR. -eigenval(i_occ) > z_space_energy_cutoff) THEN

                  az(i_occ, a_virt, :) = 0

               END IF


            END DO

         END DO

      END IF


      !Debugging purposes: full diagonalization of A

      IF (i_iter == 1 .AND. bse_full_diag_debug) THEN

         n = 0

         DO i = 1, homo

            DO a = 1, virtual

               n = n + 1

               m = 0

               DO j = 1, homo

                  DO b = 1, virtual

                     m = m + 1

                     IF (a == b .AND. i == j) THEN

                        eigen_diff = eigenval(a + homo) - eigenval(i)

                     ELSE

                        eigen_diff = 0

                     END IF

                     a_full_reshaped(n, m) = eigen_diff + 2*v_iajb(i, a, j, b) - w_ijab(i, j, a, b)

                     a_full(i, a, j, b) = eigen_diff + 2*v_iajb(i, a, j, b) - w_ijab(i, j, a, b)

                  END DO

               END DO

            END DO

         END DO


         !MG to do: Check for symmetry of ZAZ!

         ALLOCATE (work(1))

         work = 0.0_dp

         CALL dsyev("N", "U", homo*virtual, a_full_reshaped, homo*virtual, full_exc_spectrum, work, -1, diag_info)

         lwork = int(work(1))

         DEALLOCATE (work)

         ALLOCATE (work(lwork))

         work = 0.0_dp

         !MG to check: Usage of symmetric routine okay? (Correct LWORK?)

         CALL dsyev("N", "U", homo*virtual, a_full_reshaped, homo*virtual, full_exc_spectrum, work, lwork, diag_info)


         DEALLOCATE (work)


         DEALLOCATE (w_ijab, v_iajb, a_full, a_full_reshaped)

      END IF


      CALL timestop(handle)


   END SUBROUTINE compute_az


! **************************************************************************************************

!> \brief ...

!> \param AZ ...

!> \param Z_vectors ...

!> \param B_iaQ_bse_local ...

!> \param RI_vector ...

!> \param local_RI_size ...

!> \param num_Z_vectors ...

!> \param homo ...

!> \param virtual ...

!> \param bse_spin_config ...

!> \param v_iajb ...

!> \param bse_full_diag_debug ...

!> \param i_iter ...

!> \param para_env ...

! **************************************************************************************************

   SUBROUTINE compute_v_ia_jb_part(AZ, Z_vectors, B_iaQ_bse_local, RI_vector, local_RI_size, &

                                   num_Z_vectors, homo, virtual, bse_spin_config, v_iajb, bse_full_diag_debug, i_iter, &

                                   para_env)


      REAL(kind=dp), DIMENSION(:, :, :), INTENT(INOUT)   :: az, z_vectors, b_iaq_bse_local

      REAL(kind=dp), DIMENSION(:, :), INTENT(INOUT)      :: ri_vector

      INTEGER, INTENT(IN)                                :: local_ri_size, num_z_vectors, homo, &

                                                            virtual, bse_spin_config

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :, :)  :: v_iajb

      LOGICAL                                            :: bse_full_diag_debug

      INTEGER, INTENT(IN)                                :: i_iter

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env


      CHARACTER(LEN=*), PARAMETER :: routinen = 'compute_v_ia_jb_part'


      INTEGER                                            :: a, a_virt, b, handle, i, i_occ, &

                                                            i_z_vector, j, lll

      REAL(kind=dp)                                      :: alpha


!debugging:


      CALL timeset(routinen, handle)


      !Determines factor of exchange term, depending on requested spin configuration (cf. input_constants.F)

      SELECT CASE (bse_spin_config)

      CASE (bse_singlet)

         alpha = 2.0_dp

      CASE (bse_triplet)

         alpha = 0.0_dp

      END SELECT


      ri_vector = 0.0_dp


      ! v_P = sum_jb B_jb^P Z_jb

      DO lll = 1, local_ri_size

         DO i_z_vector = 1, num_z_vectors

            DO i_occ = 1, homo

               DO a_virt = 1, virtual


                  ri_vector(lll, i_z_vector) = ri_vector(lll, i_z_vector) + &

                                               z_vectors(i_occ, a_virt, i_z_vector)* &

                                               b_iaq_bse_local(i_occ, a_virt, lll)


               END DO

            END DO

         END DO

      END DO


      ! AZ = sum_P B_ia^P*v_P + ...

      DO lll = 1, local_ri_size

         DO i_z_vector = 1, num_z_vectors

            DO i_occ = 1, homo

               DO a_virt = 1, virtual

                  !MG to check: Minus sign at v oder W? Factor for triplet/singlet

                  az(i_occ, a_virt, i_z_vector) = az(i_occ, a_virt, i_z_vector) + &

                                                  alpha*ri_vector(lll, i_z_vector)* &

                                                  b_iaq_bse_local(i_occ, a_virt, lll)


               END DO

            END DO

         END DO

      END DO

      IF (i_iter == 1 .AND. bse_full_diag_debug) THEN

         ALLOCATE (v_iajb(homo, virtual, homo, virtual))

         v_iajb = 0.0_dp

         !Create unscreened 4c integrals for check

         DO lll = 1, local_ri_size

            DO i = 1, homo

               DO j = 1, homo

                  DO a = 1, virtual

                     DO b = 1, virtual

                        v_iajb(i, a, j, b) = v_iajb(i, a, j, b) + b_iaq_bse_local(i, a, lll)*b_iaq_bse_local(j, b, lll)

                     END DO

                  END DO

               END DO

            END DO

         END DO

         ! we make the mp_sum to sum over all RI basis functions

         CALL para_env%sum(v_iajb)

      END IF


      CALL timestop(handle)


   END SUBROUTINE compute_v_ia_jb_part


! **************************************************************************************************

!> \brief ...Eigenval

!> \param Z_vectors ...

!> \param Eigenval ...

!> \param num_Z_vectors ...

!> \param homo ...

!> \param virtual ...

! **************************************************************************************************

   SUBROUTINE initial_guess_z_vectors(Z_vectors, Eigenval, num_Z_vectors, homo, virtual)


      REAL(kind=dp), DIMENSION(:, :, :), INTENT(INOUT)   :: z_vectors

      REAL(kind=dp), DIMENSION(:), INTENT(IN)            :: eigenval

      INTEGER, INTENT(IN)                                :: num_z_vectors, homo, virtual


      CHARACTER(LEN=*), PARAMETER :: routinen = 'initial_guess_Z_vectors'


      INTEGER                                            :: a_virt, handle, i_occ, i_z_vector, &

                                                            min_loc(2)

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :)        :: eigen_diff_ia


      CALL timeset(routinen, handle)


      ALLOCATE (eigen_diff_ia(homo, virtual))


      DO i_occ = 1, homo

         DO a_virt = 1, virtual

            eigen_diff_ia(i_occ, a_virt) = eigenval(a_virt + homo) - eigenval(i_occ)

         END DO

      END DO


      DO i_z_vector = 1, num_z_vectors


         min_loc = minloc(eigen_diff_ia)


         z_vectors(min_loc(1), min_loc(2), i_z_vector) = 1.0_dp


         eigen_diff_ia(min_loc(1), min_loc(2)) = 1.0e20_dp


      END DO


      DEALLOCATE (eigen_diff_ia)


      CALL timestop(handle)


   END SUBROUTINE initial_guess_z_vectors


   ! **************************************************************************************************

!> \brief ...

!> \param fm_mat_S_ab_bse ...

!> \param fm_mat_S ...

!> \param fm_mat_S_bar_ia_bse ...

!> \param fm_mat_S_bar_ij_bse ...

!> \param B_bar_ijQ_bse_local ...

!> \param B_abQ_bse_local ...

!> \param B_bar_iaQ_bse_local ...

!> \param B_iaQ_bse_local ...

!> \param dimen_RI ...

!> \param homo ...

!> \param virtual ...

!> \param gd_array ...

!> \param color_sub ...

!> \param para_env ...

! **************************************************************************************************


   SUBROUTINE fill_local_3c_arrays(fm_mat_S_ab_bse, fm_mat_S, &

                                   fm_mat_S_bar_ia_bse, fm_mat_S_bar_ij_bse, &

                                   B_bar_ijQ_bse_local, B_abQ_bse_local, B_bar_iaQ_bse_local, &

                                   B_iaQ_bse_local, dimen_RI, homo, virtual, &

                                   gd_array, color_sub, para_env)


      TYPE(cp_fm_type), INTENT(IN)                       :: fm_mat_s_ab_bse, fm_mat_s, &

                                                            fm_mat_s_bar_ia_bse, &

                                                            fm_mat_s_bar_ij_bse

      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :), &

         INTENT(OUT)                                     :: b_bar_ijq_bse_local, b_abq_bse_local, &

                                                            b_bar_iaq_bse_local, b_iaq_bse_local

      INTEGER, INTENT(IN)                                :: dimen_ri, homo, virtual

      TYPE(group_dist_d1_type), INTENT(IN)               :: gd_array

      INTEGER, INTENT(IN)                                :: color_sub

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env


      CHARACTER(LEN=*), PARAMETER :: routinen = 'fill_local_3c_arrays'


      INTEGER                                            :: handle


      CALL timeset(routinen, handle)


      CALL allocate_and_fill_local_array(b_iaq_bse_local, fm_mat_s, gd_array, color_sub, homo, virtual, dimen_ri, para_env)


      CALL allocate_and_fill_local_array(b_bar_iaq_bse_local, fm_mat_s_bar_ia_bse, gd_array, color_sub, homo, virtual, &

                                         dimen_ri, para_env)


      CALL allocate_and_fill_local_array(b_bar_ijq_bse_local, fm_mat_s_bar_ij_bse, gd_array, color_sub, homo, homo, &

                                         dimen_ri, para_env)


      CALL allocate_and_fill_local_array(b_abq_bse_local, fm_mat_s_ab_bse, gd_array, color_sub, virtual, virtual, &

                                         dimen_ri, para_env)


      CALL timestop(handle)


   END SUBROUTINE fill_local_3c_arrays


! **************************************************************************************************

!> \brief ...

!> \param B_local ...

!> \param fm_mat_S ...

!> \param gd_array ...

!> \param color_sub ...

!> \param small_size ...

!> \param big_size ...

!> \param dimen_RI ...

!> \param para_env ...

! **************************************************************************************************

   SUBROUTINE allocate_and_fill_local_array(B_local, fm_mat_S, gd_array, &

                                            color_sub, small_size, big_size, dimen_RI, para_env)


      REAL(kind=dp), ALLOCATABLE, DIMENSION(:, :, :), &

         INTENT(OUT)                                     :: b_local

      TYPE(cp_fm_type), INTENT(IN)                       :: fm_mat_s

      TYPE(group_dist_d1_type), INTENT(IN)               :: gd_array

      INTEGER, INTENT(IN)                                :: color_sub, small_size, big_size, dimen_ri

      TYPE(mp_para_env_type), INTENT(IN)                 :: para_env


      CHARACTER(LEN=*), PARAMETER :: routinen = 'allocate_and_fill_local_array'


      INTEGER :: combi_index, end_ri, handle, handle1, i_comm, i_entry, iib, imepos, jjb, &

         level_big_size, level_small_size, ncol_local, nrow_local, num_comm_cycles, ri_index, &

         size_ri, start_ri

      INTEGER, ALLOCATABLE, DIMENSION(:)                 :: entry_counter, mepos_from_ri_index, &

                                                            num_entries_rec, num_entries_send

      INTEGER, DIMENSION(:), POINTER                     :: col_indices, row_indices

      REAL(kind=dp)                                      :: matrix_el

      TYPE(integ_mat_buffer_type), ALLOCATABLE, &

         DIMENSION(:)                                    :: buffer_rec, buffer_send

      TYPE(mp_request_type), DIMENSION(:, :), POINTER    :: req_array


      CALL timeset(routinen, handle)


      ALLOCATE (mepos_from_ri_index(dimen_ri))

      mepos_from_ri_index = 0


      DO imepos = 0, para_env%num_pe - 1


         CALL get_group_dist(gd_array, pos=imepos, starts=start_ri, ends=end_ri)


         mepos_from_ri_index(start_ri:end_ri) = imepos


      END DO


      ! color_sub is automatically the number of the process since every subgroup has only one MPI rank

      CALL get_group_dist(gd_array, color_sub, start_ri, end_ri, size_ri)


      ALLOCATE (b_local(small_size, big_size, 1:size_ri))


      ALLOCATE (num_entries_send(0:para_env%num_pe - 1))

      ALLOCATE (num_entries_rec(0:para_env%num_pe - 1))


      ALLOCATE (req_array(1:para_env%num_pe, 4))


      ALLOCATE (entry_counter(0:para_env%num_pe - 1))


      CALL cp_fm_get_info(matrix=fm_mat_s, &

                          nrow_local=nrow_local, &

                          ncol_local=ncol_local, &

                          row_indices=row_indices, &

                          col_indices=col_indices)


      num_comm_cycles = 10


      ! communicate not all due to huge memory overhead, since for every number in fm_mat_S, we store

      ! three additional ones (RI index, first MO index, second MO index!!)

      DO i_comm = 0, num_comm_cycles - 1


         num_entries_send = 0

         num_entries_rec = 0


         ! loop over RI index to get the number of sent entries

         DO jjb = 1, nrow_local


            ri_index = row_indices(jjb)


            IF (modulo(ri_index, num_comm_cycles) /= i_comm) cycle


            imepos = mepos_from_ri_index(ri_index)


            num_entries_send(imepos) = num_entries_send(imepos) + ncol_local


         END DO


         CALL para_env%alltoall(num_entries_send, num_entries_rec, 1)


         ALLOCATE (buffer_rec(0:para_env%num_pe - 1))

         ALLOCATE (buffer_send(0:para_env%num_pe - 1))


         ! allocate data message and corresponding indices

         DO imepos = 0, para_env%num_pe - 1


            ALLOCATE (buffer_rec(imepos)%msg(num_entries_rec(imepos)))

            buffer_rec(imepos)%msg = 0.0_dp


            ALLOCATE (buffer_send(imepos)%msg(num_entries_send(imepos)))

            buffer_send(imepos)%msg = 0.0_dp


            ALLOCATE (buffer_rec(imepos)%indx(num_entries_rec(imepos), 3))

            buffer_rec(imepos)%indx = 0


            ALLOCATE (buffer_send(imepos)%indx(num_entries_send(imepos), 3))

            buffer_send(imepos)%indx = 0


         END DO


         entry_counter(:) = 0


         ! loop over RI index for filling the send-buffer

         DO jjb = 1, nrow_local


            ri_index = row_indices(jjb)


            IF (modulo(ri_index, num_comm_cycles) /= i_comm) cycle


            imepos = mepos_from_ri_index(ri_index)


            DO iib = 1, ncol_local


               combi_index = col_indices(iib)

               level_small_size = max(1, combi_index - 1)/max(big_size, 2) + 1

               level_big_size = combi_index - (level_small_size - 1)*big_size


               entry_counter(imepos) = entry_counter(imepos) + 1


               buffer_send(imepos)%msg(entry_counter(imepos)) = fm_mat_s%local_data(jjb, iib)


               buffer_send(imepos)%indx(entry_counter(imepos), 1) = ri_index

               buffer_send(imepos)%indx(entry_counter(imepos), 2) = level_small_size

               buffer_send(imepos)%indx(entry_counter(imepos), 3) = level_big_size


            END DO


         END DO


         CALL timeset("BSE_comm_data", handle1)


         CALL communicate_buffer(para_env, num_entries_rec, num_entries_send, buffer_rec, buffer_send, req_array)


         CALL timestop(handle1)


         ! fill B_local

         DO imepos = 0, para_env%num_pe - 1


            DO i_entry = 1, num_entries_rec(imepos)


               ri_index = buffer_rec(imepos)%indx(i_entry, 1) - start_ri + 1

               level_small_size = buffer_rec(imepos)%indx(i_entry, 2)

               level_big_size = buffer_rec(imepos)%indx(i_entry, 3)


               matrix_el = buffer_rec(imepos)%msg(i_entry)


               b_local(level_small_size, level_big_size, ri_index) = matrix_el


            END DO


         END DO


         DO imepos = 0, para_env%num_pe - 1

            DEALLOCATE (buffer_send(imepos)%msg)

            DEALLOCATE (buffer_send(imepos)%indx)

            DEALLOCATE (buffer_rec(imepos)%msg)

            DEALLOCATE (buffer_rec(imepos)%indx)

         END DO


         DEALLOCATE (buffer_rec, buffer_send)


      END DO


      DEALLOCATE (num_entries_send, num_entries_rec)


      DEALLOCATE (mepos_from_ri_index)


      DEALLOCATE (entry_counter, req_array)


      CALL timestop(handle)


   END SUBROUTINE allocate_and_fill_local_array


END MODULE bse_iterative

modulo
static GRID_HOST_DEVICE int modulo(int a, int m)
Equivalent of Fortran's MODULO, which always return a positive number. https://gcc....
Definition grid_common.h:120

dgemm
static void dgemm(const char transa, const char transb, const int m, const int n, const int k, const double alpha, const double *a, const int lda, const double *b, const int ldb, const double beta, double *c, const int ldc)
Convenient wrapper to hide Fortran nature of dgemm_, swapping a and b.
Definition grid_cpu_task_list.c:214

group_dist_types::get_group_dist
Definition group_dist_types.F:47

bse_iterative
Iterative routines for GW + Bethe-Salpeter for computing electronic excitations.
Definition bse_iterative.F:14

bse_iterative::do_subspace_iterations
subroutine, public do_subspace_iterations(b_bar_ijq_bse_local, b_abq_bse_local, b_bar_iaq_bse_local, b_iaq_bse_local, homo, virtual, bse_spin_config, unit_nr, eigenval, para_env, mp2_env)
...
Definition bse_iterative.F:57

bse_iterative::fill_local_3c_arrays
subroutine, public fill_local_3c_arrays(fm_mat_s_ab_bse, fm_mat_s, fm_mat_s_bar_ia_bse, fm_mat_s_bar_ij_bse, b_bar_ijq_bse_local, b_abq_bse_local, b_bar_iaq_bse_local, b_iaq_bse_local, dimen_ri, homo, virtual, gd_array, color_sub, para_env)
...
Definition bse_iterative.F:1374

cp_fm_types
represent a full matrix distributed on many processors
Definition cp_fm_types.F:15

cp_fm_types::cp_fm_get_info
subroutine, public cp_fm_get_info(matrix, name, nrow_global, ncol_global, nrow_block, ncol_block, nrow_local, ncol_local, row_indices, col_indices, local_data, context, nrow_locals, ncol_locals, matrix_struct, para_env)
returns all kind of information about the full matrix
Definition cp_fm_types.F:1087

group_dist_types
Types to describe group distributions.
Definition group_dist_types.F:14

input_constants
collects all constants needed in input so that they can be used without circular dependencies
Definition input_constants.F:17

input_constants::bse_singlet
integer, parameter, public bse_singlet
Definition input_constants.F:1316

input_constants::bse_triplet
integer, parameter, public bse_triplet
Definition input_constants.F:1316

kinds
Defines the basic variable types.
Definition kinds.F:23

kinds::dp
integer, parameter, public dp
Definition kinds.F:34

message_passing
Interface to the message passing library MPI.
Definition message_passing.F:23

mp2_types
Types needed for MP2 calculations.
Definition mp2_types.F:14

physcon
Definition of physical constants:
Definition physcon.F:68

physcon::evolt
real(kind=dp), parameter, public evolt
Definition physcon.F:183

rpa_communication
Auxiliary routines necessary to redistribute an fm_matrix from a given blacs_env to another.
Definition rpa_communication.F:14

rpa_communication::communicate_buffer
subroutine, public communicate_buffer(para_env, num_entries_rec, num_entries_send, buffer_rec, buffer_send, req_array, do_indx, do_msg)
...
Definition rpa_communication.F:434

cp_fm_types::cp_fm_type
represent a full matrix
Definition cp_fm_types.F:115

group_dist_types::group_dist_d1_type
Definition group_dist_types.F:35

message_passing::mp_para_env_type
stores all the informations relevant to an mpi environment
Definition message_passing.F:721

message_passing::mp_request_type
Definition message_passing.F:581

mp2_types::integ_mat_buffer_type
Definition mp2_types.F:409

mp2_types::mp2_type
Definition mp2_types.F:345