d8/d51/dbt__reshape__ops_8F_source.html

!--------------------------------------------------------------------------------------------------!

!   CP2K: A general program to perform molecular dynamics simulations                              !

!   Copyright 2000-2026 CP2K developers group <https://cp2k.org>                                   !

!                                                                                                  !

!   SPDX-License-Identifier: GPL-2.0-or-later                                                      !

!--------------------------------------------------------------------------------------------------!


! **************************************************************************************************

!> \brief Routines to reshape / redistribute tensors

!> \author Patrick Seewald

! **************************************************************************************************

MODULE dbt_reshape_ops


   USE dbt_allocate_wrap, ONLY: allocate_any

   USE dbt_tas_base, ONLY: dbt_tas_copy, dbt_tas_get_info, dbt_tas_info

   USE dbt_block, ONLY: &

      block_nd, create_block, destroy_block, dbt_iterator_type, dbt_iterator_next_block, &

      dbt_iterator_blocks_left, dbt_iterator_start, dbt_iterator_stop, dbt_get_block, &

      dbt_reserve_blocks, dbt_put_block

   USE dbt_types, ONLY: dbt_blk_sizes, &

                        dbt_create, &

                        dbt_type, &

                        ndims_tensor, &

                        dbt_get_stored_coordinates, &

                        dbt_clear

   USE kinds, ONLY: default_string_length

   USE kinds, ONLY: dp, dp

   USE message_passing, ONLY: &

      mp_waitall, mp_comm_type, mp_request_type


#include "../base/base_uses.f90"


   IMPLICIT NONE

   PRIVATE

   CHARACTER(len=*), PARAMETER, PRIVATE :: moduleN = 'dbt_reshape_ops'


   PUBLIC :: dbt_reshape


   TYPE block_buffer_type

      INTEGER, DIMENSION(:, :), ALLOCATABLE      :: blocks

      REAL(dp), DIMENSION(:), ALLOCATABLE        :: data

   END TYPE block_buffer_type


CONTAINS


! **************************************************************************************************

!> \brief copy data (involves reshape)

!>        tensor_out = tensor_out + tensor_in move_data memory optimization:

!>        transfer data from tensor_in to tensor_out s.t. tensor_in is empty on return

!> \author Ole Schuett

! **************************************************************************************************


   SUBROUTINE dbt_reshape(tensor_in, tensor_out, summation, move_data)


      TYPE(dbt_type), INTENT(INOUT)               :: tensor_in, tensor_out

      LOGICAL, INTENT(IN), OPTIONAL                    :: summation

      LOGICAL, INTENT(IN), OPTIONAL                    :: move_data


      CHARACTER(LEN=*), PARAMETER :: routinen = 'dbt_reshape'


      INTEGER                                            :: iproc, numnodes, &

                                                            handle, iblk, jblk, offset, ndata, &

                                                            nblks_recv_mythread

      INTEGER, ALLOCATABLE, DIMENSION(:, :)              :: blks_to_allocate

      TYPE(dbt_iterator_type)                            :: iter

      TYPE(block_nd)                                     :: blk_data

      TYPE(block_buffer_type), ALLOCATABLE, DIMENSION(:) :: buffer_recv, buffer_send

      INTEGER, DIMENSION(ndims_tensor(tensor_in))        :: blk_size, ind_nd

      LOGICAL :: found, summation_prv, move_prv


      INTEGER, ALLOCATABLE, DIMENSION(:)                 :: nblks_send_total, ndata_send_total, &

                                                            nblks_recv_total, ndata_recv_total, &

                                                            nblks_send_mythread, ndata_send_mythread

      TYPE(mp_comm_type) :: mp_comm


      CALL timeset(routinen, handle)


      IF (PRESENT(summation)) THEN

         summation_prv = summation

      ELSE

         summation_prv = .false.

      END IF


      IF (PRESENT(move_data)) THEN

         move_prv = move_data

      ELSE

         move_prv = .false.

      END IF


      cpassert(tensor_out%valid)


      IF (.NOT. summation_prv) CALL dbt_clear(tensor_out)


      mp_comm = tensor_in%pgrid%mp_comm_2d

      numnodes = mp_comm%num_pe

      ALLOCATE (buffer_send(0:numnodes - 1), buffer_recv(0:numnodes - 1))

      ALLOCATE (nblks_send_total(0:numnodes - 1), ndata_send_total(0:numnodes - 1), source=0)

      ALLOCATE (nblks_recv_total(0:numnodes - 1), ndata_recv_total(0:numnodes - 1), source=0)


!$OMP PARALLEL DEFAULT(OMP_DEFAULT_NONE_WITH_OOP) &

!$OMP SHARED(tensor_in,tensor_out,summation) &

!$OMP SHARED(buffer_send,buffer_recv,mp_comm,numnodes) &

!$OMP SHARED(nblks_send_total,ndata_send_total,nblks_recv_total,ndata_recv_total) &

!$OMP PRIVATE(nblks_send_mythread,ndata_send_mythread,nblks_recv_mythread) &

!$OMP PRIVATE(iter,ind_nd,blk_size,blk_data,found,iproc) &

!$OMP PRIVATE(blks_to_allocate,offset,ndata,iblk,jblk)

      ALLOCATE (nblks_send_mythread(0:numnodes - 1), ndata_send_mythread(0:numnodes - 1), source=0)


      CALL dbt_iterator_start(iter, tensor_in)

      DO WHILE (dbt_iterator_blocks_left(iter))

         CALL dbt_iterator_next_block(iter, ind_nd, blk_size=blk_size)

         CALL dbt_get_stored_coordinates(tensor_out, ind_nd, iproc)

         nblks_send_mythread(iproc) = nblks_send_mythread(iproc) + 1

         ndata_send_mythread(iproc) = ndata_send_mythread(iproc) + product(blk_size)

      END DO

      CALL dbt_iterator_stop(iter)

!$OMP CRITICAL(omp_dbt_reshape)

      nblks_send_total(:) = nblks_send_total(:) + nblks_send_mythread(:)

      ndata_send_total(:) = ndata_send_total(:) + ndata_send_mythread(:)

      nblks_send_mythread(:) = nblks_send_total(:) ! current totals indicate slot for this thread

      ndata_send_mythread(:) = ndata_send_total(:)

!$OMP END CRITICAL(omp_dbt_reshape)

!$OMP BARRIER


!$OMP MASTER

      CALL mp_comm%alltoall(nblks_send_total, nblks_recv_total, 1)

      CALL mp_comm%alltoall(ndata_send_total, ndata_recv_total, 1)

!$OMP END MASTER

!$OMP BARRIER


!$OMP DO

      DO iproc = 0, numnodes - 1

         ALLOCATE (buffer_send(iproc)%data(ndata_send_total(iproc)))

         ALLOCATE (buffer_recv(iproc)%data(ndata_recv_total(iproc)))

         ! going to use buffer%blocks(:,0) to store data offsets

         ALLOCATE (buffer_send(iproc)%blocks(nblks_send_total(iproc), 0:ndims_tensor(tensor_in)))

         ALLOCATE (buffer_recv(iproc)%blocks(nblks_recv_total(iproc), 0:ndims_tensor(tensor_in)))

      END DO

!$OMP END DO

!$OMP BARRIER


      CALL dbt_iterator_start(iter, tensor_in)

      DO WHILE (dbt_iterator_blocks_left(iter))

         CALL dbt_iterator_next_block(iter, ind_nd, blk_size=blk_size)

         CALL dbt_get_stored_coordinates(tensor_out, ind_nd, iproc)

         CALL dbt_get_block(tensor_in, ind_nd, blk_data, found)

         cpassert(found)

         ! insert block data

         ndata = product(blk_size)

         ndata_send_mythread(iproc) = ndata_send_mythread(iproc) - ndata

         offset = ndata_send_mythread(iproc)

         buffer_send(iproc)%data(offset + 1:offset + ndata) = blk_data%blk(:)

         ! insert block index

         nblks_send_mythread(iproc) = nblks_send_mythread(iproc) - 1

         iblk = nblks_send_mythread(iproc) + 1

         buffer_send(iproc)%blocks(iblk, 1:) = ind_nd(:)

         buffer_send(iproc)%blocks(iblk, 0) = offset

         CALL destroy_block(blk_data)

      END DO

      CALL dbt_iterator_stop(iter)

      DEALLOCATE (nblks_send_mythread, ndata_send_mythread)

!$OMP BARRIER


      CALL dbt_communicate_buffer(mp_comm, buffer_recv, buffer_send)

!$OMP BARRIER


!$OMP DO

      DO iproc = 0, numnodes - 1

         DEALLOCATE (buffer_send(iproc)%blocks, buffer_send(iproc)%data)

      END DO

!$OMP END DO NOWAIT


      nblks_recv_mythread = 0

      DO iproc = 0, numnodes - 1

!$OMP DO

         DO iblk = 1, nblks_recv_total(iproc)

            nblks_recv_mythread = nblks_recv_mythread + 1

         END DO

!$OMP END DO

      END DO

      ALLOCATE (blks_to_allocate(nblks_recv_mythread, ndims_tensor(tensor_in)))


      jblk = 0

      DO iproc = 0, numnodes - 1

!$OMP DO

         DO iblk = 1, nblks_recv_total(iproc)

            jblk = jblk + 1

            blks_to_allocate(jblk, :) = buffer_recv(iproc)%blocks(iblk, 1:)

         END DO

!$OMP END DO

      END DO

      cpassert(jblk == nblks_recv_mythread)

      CALL dbt_reserve_blocks(tensor_out, blks_to_allocate)

      DEALLOCATE (blks_to_allocate)


      DO iproc = 0, numnodes - 1

!$OMP DO

         DO iblk = 1, nblks_recv_total(iproc)

            ind_nd(:) = buffer_recv(iproc)%blocks(iblk, 1:)

            CALL dbt_blk_sizes(tensor_out, ind_nd, blk_size)

            offset = buffer_recv(iproc)%blocks(iblk, 0)

            ndata = product(blk_size)

            CALL create_block(blk_data, blk_size, &

                              array=buffer_recv(iproc)%data(offset + 1:offset + ndata))

            CALL dbt_put_block(tensor_out, ind_nd, blk_data, summation=summation)

            CALL destroy_block(blk_data)

         END DO

!$OMP END DO

      END DO


!$OMP DO

      DO iproc = 0, numnodes - 1

         DEALLOCATE (buffer_recv(iproc)%blocks, buffer_recv(iproc)%data)

      END DO

!$OMP END DO

!$OMP END PARALLEL


      DEALLOCATE (nblks_recv_total, ndata_recv_total)

      DEALLOCATE (nblks_send_total, ndata_send_total)

      DEALLOCATE (buffer_send, buffer_recv)


      IF (move_prv) CALL dbt_clear(tensor_in)


      CALL timestop(handle)


   END SUBROUTINE dbt_reshape


! **************************************************************************************************

!> \brief communicate buffer

!> \author Patrick Seewald

! **************************************************************************************************

   SUBROUTINE dbt_communicate_buffer(mp_comm, buffer_recv, buffer_send)

      TYPE(mp_comm_type), INTENT(IN)                        :: mp_comm

      TYPE(block_buffer_type), DIMENSION(0:), INTENT(INOUT) :: buffer_recv, buffer_send


      CHARACTER(LEN=*), PARAMETER :: routinen = 'dbt_communicate_buffer'


      INTEGER                                               :: iproc, numnodes, &

                                                               rec_counter, send_counter, i

      TYPE(mp_request_type), ALLOCATABLE, DIMENSION(:, :)   :: req_array

      INTEGER                                               :: handle


      CALL timeset(routinen, handle)

      numnodes = mp_comm%num_pe


      IF (numnodes > 1) THEN

!$OMP MASTER

         send_counter = 0

         rec_counter = 0


         ALLOCATE (req_array(1:numnodes, 4))


         DO iproc = 0, numnodes - 1

            IF (SIZE(buffer_recv(iproc)%blocks) > 0) THEN

               rec_counter = rec_counter + 1

               CALL mp_comm%irecv(buffer_recv(iproc)%blocks, iproc, req_array(rec_counter, 3), tag=4)

               CALL mp_comm%irecv(buffer_recv(iproc)%data, iproc, req_array(rec_counter, 4), tag=7)

            END IF

         END DO


         DO iproc = 0, numnodes - 1

            IF (SIZE(buffer_send(iproc)%blocks) > 0) THEN

               send_counter = send_counter + 1

               CALL mp_comm%isend(buffer_send(iproc)%blocks, iproc, req_array(send_counter, 1), tag=4)

               CALL mp_comm%isend(buffer_send(iproc)%data, iproc, req_array(send_counter, 2), tag=7)

            END IF

         END DO


         IF (send_counter > 0) THEN

            CALL mp_waitall(req_array(1:send_counter, 1:2))

         END IF

         IF (rec_counter > 0) THEN

            CALL mp_waitall(req_array(1:rec_counter, 3:4))

         END IF

!$OMP END MASTER


      ELSE

!$OMP DO SCHEDULE(static)

         DO i = 1, SIZE(buffer_send(0)%blocks, 1)

            buffer_recv(0)%blocks(i, :) = buffer_send(0)%blocks(i, :)

         END DO

!$OMP END DO NOWAIT

!$OMP DO SCHEDULE(static)

         DO i = 1, SIZE(buffer_send(0)%data)

            buffer_recv(0)%data(i) = buffer_send(0)%data(i)

         END DO

!$OMP END DO

      END IF

      CALL timestop(handle)


   END SUBROUTINE dbt_communicate_buffer


END MODULE dbt_reshape_ops

dbt_allocate_wrap::allocate_any
Definition dbt_allocate_wrap.F:26

dbt_block::create_block
Definition dbt_block.F:73

dbt_block::dbt_get_block
Definition dbt_block.F:85

dbt_block::dbt_put_block
Definition dbt_block.F:78

dbt_block::dbt_reserve_blocks
Definition dbt_block.F:95

dbt_types::dbt_create
Definition dbt_types.F:166

message_passing::mp_waitall
Definition message_passing.F:836

dbt_allocate_wrap
Wrapper for allocating, copying and reshaping arrays.
Definition dbt_allocate_wrap.F:15

dbt_block
Methods to operate on n-dimensional tensor blocks.
Definition dbt_block.F:12

dbt_block::dbt_iterator_blocks_left
logical function, public dbt_iterator_blocks_left(iterator)
Generalization of block_iterator_blocks_left for tensors.
Definition dbt_block.F:197

dbt_block::destroy_block
subroutine, public destroy_block(block)
Definition dbt_block.F:435

dbt_block::dbt_iterator_stop
subroutine, public dbt_iterator_stop(iterator)
Generalization of block_iterator_stop for tensors.
Definition dbt_block.F:134

dbt_block::dbt_iterator_start
subroutine, public dbt_iterator_start(iterator, tensor)
Generalization of block_iterator_start for tensors.
Definition dbt_block.F:121

dbt_block::dbt_iterator_next_block
subroutine, public dbt_iterator_next_block(iterator, ind_nd, blk_size, blk_offset)
iterate over nd blocks of an nd rank tensor, index only (blocks must be retrieved by calling dbt_get_...
Definition dbt_block.F:161

dbt_reshape_ops
Routines to reshape / redistribute tensors.
Definition dbt_reshape_ops.F:12

dbt_reshape_ops::dbt_reshape
subroutine, public dbt_reshape(tensor_in, tensor_out, summation, move_data)
copy data (involves reshape) tensor_out = tensor_out + tensor_in move_data memory optimization: trans...
Definition dbt_reshape_ops.F:54

dbt_tas_base
Tall-and-skinny matrices: base routines similar to DBM API, mostly wrappers around existing DBM routi...
Definition dbt_tas_base.F:13

dbt_tas_base::dbt_tas_get_info
subroutine, public dbt_tas_get_info(matrix, nblkrows_total, nblkcols_total, local_rows, local_cols, proc_row_dist, proc_col_dist, row_blk_size, col_blk_size, distribution, name)
...
Definition dbt_tas_base.F:1002

dbt_tas_base::dbt_tas_copy
subroutine, public dbt_tas_copy(matrix_b, matrix_a, summation)
Copy matrix_a to matrix_b.
Definition dbt_tas_base.F:250

dbt_tas_base::dbt_tas_info
type(dbt_tas_split_info) function, pointer, public dbt_tas_info(matrix)
get info on mpi grid splitting
Definition dbt_tas_base.F:825

dbt_types
DBT tensor framework for block-sparse tensor contraction: Types and create/destroy routines.
Definition dbt_types.F:12

dbt_types::dbt_blk_sizes
subroutine, public dbt_blk_sizes(tensor, ind, blk_size)
Size of tensor block.
Definition dbt_types.F:1468

dbt_types::ndims_tensor
pure integer function, public ndims_tensor(tensor)
tensor rank
Definition dbt_types.F:1216

dbt_types::dbt_clear
subroutine, public dbt_clear(tensor)
Clear tensor (s.t. it does not contain any blocks)
Definition dbt_types.F:1768

dbt_types::dbt_get_stored_coordinates
subroutine, public dbt_get_stored_coordinates(tensor, ind_nd, processor)
Generalization of block_get_stored_coordinates for tensors.
Definition dbt_types.F:1499

kinds
Defines the basic variable types.
Definition kinds.F:23

kinds::dp
integer, parameter, public dp
Definition kinds.F:34

kinds::default_string_length
integer, parameter, public default_string_length
Definition kinds.F:57

message_passing
Interface to the message passing library MPI.
Definition message_passing.F:23

dbt_block::block_nd
Definition dbt_block.F:68

dbt_block::dbt_iterator_type
Definition dbt_block.F:63

dbt_types::dbt_type
Definition dbt_types.F:110

message_passing::mp_comm_type
Definition message_passing.F:155

message_passing::mp_request_type
Definition message_passing.F:589