db/daa/grid__dgemm__context_8c_source.html

 /*----------------------------------------------------------------------------*/

 /*  CP2K: A general program to perform molecular dynamics simulations         */

 /*  Copyright 2000-2024 CP2K developers group <https://cp2k.org>              */

 /*                                                                            */

 /*  SPDX-License-Identifier: BSD-3-Clause                                     */

 /*----------------------------------------------------------------------------*/


 #include <math.h>

 #include <omp.h>

 #include <stdio.h>

 #include <stdlib.h>

 #include <string.h>


 #include "../common/grid_library.h"

 #include "grid_dgemm_collocate.h"

 #include "grid_dgemm_collocation_integration.h"

 #include "grid_dgemm_context.h"

 #include "grid_dgemm_private_header.h"

 #include "grid_dgemm_task_list.h"

 #include "grid_dgemm_tensor_local.h"

 #include "grid_dgemm_utils.h"


 void return_dh(void *const ptr, const int level, double *const dh) {

   grid_context *const ctx = (grid_context *)ptr;


   assert(ctx->checksum == ctx_checksum);

   dh[0] = ctx->grid[level].dh[0][0];

   dh[1] = ctx->grid[level].dh[0][1];

   dh[2] = ctx->grid[level].dh[0][2];

   dh[3] = ctx->grid[level].dh[1][0];

   dh[4] = ctx->grid[level].dh[1][1];

   dh[5] = ctx->grid[level].dh[1][2];

   dh[6] = ctx->grid[level].dh[2][0];

   dh[7] = ctx->grid[level].dh[2][1];

   dh[8] = ctx->grid[level].dh[2][2];

 }


 void return_dh_inv(void *const ptr, const int level, double *const dh_inv) {

   grid_context *const ctx = (grid_context *)ptr;


   assert(ctx->checksum == ctx_checksum);

   dh_inv[0] = ctx->grid[level].dh_inv[0][0];

   dh_inv[1] = ctx->grid[level].dh_inv[0][1];

   dh_inv[2] = ctx->grid[level].dh_inv[0][2];

   dh_inv[3] = ctx->grid[level].dh_inv[1][0];

   dh_inv[4] = ctx->grid[level].dh_inv[1][1];

   dh_inv[5] = ctx->grid[level].dh_inv[1][2];

   dh_inv[6] = ctx->grid[level].dh_inv[2][0];

   dh_inv[7] = ctx->grid[level].dh_inv[2][1];

   dh_inv[8] = ctx->grid[level].dh_inv[2][2];

 }


 int return_num_devs(void *const ptr) {

   grid_context *const ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);


   return ctx->number_of_devices;

 }


 int return_device_id(void *const ptr, const int device) {

   grid_context *const ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);


   return ctx->device_id[device];

 }


 int is_grid_orthorhombic(void *const ptr) {

   grid_context *const ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);

   return ctx->orthorhombic;

 }


 void update_queue_length(void *const ptr, const int queue_length) {

   grid_context *const ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);

   ctx->queue_length = queue_length;

 }


 void update_atoms_position(const int natoms,

                            const double atoms_positions[natoms][3],

                            grid_context *data) {

   assert(data != NULL);


   if (natoms == 0)

     return;


   if (data->atom_positions == NULL) {

     data->atom_positions = malloc(3 * natoms * sizeof(double));

   } else {

     if (natoms > data->natoms) {

       data->atom_positions =

           realloc(data->atom_positions, 3 * natoms * sizeof(double));

     }

   }


   data->natoms = natoms;


   if (data->atom_positions) {

     for (int i = 0; i < natoms; i++) {

       data->atom_positions[3 * i] = atoms_positions[i][0];

       data->atom_positions[3 * i + 1] = atoms_positions[i][1];

       data->atom_positions[3 * i + 2] = atoms_positions[i][2];

     }

   }

 }


 void update_atoms_kinds(const int natoms, const int *atoms_kinds,

                         grid_context *data) {

   assert(data != NULL);


   // data->atom_kinds is a table that give the type of a given atom.

   if (natoms == 0)

     return;


   if (data->atom_kinds == NULL) {

     data->atom_kinds = malloc(natoms * sizeof(int));

   } else {

     if ((natoms > data->natoms) && (data->natoms > 0)) {

       data->atom_kinds = realloc(data->atom_kinds, natoms * sizeof(int));

     }

   }

   // data->natoms is initialized before calling this function

   if (data->natoms)

     memcpy(data->atom_kinds, atoms_kinds, sizeof(int) * natoms);


   for (int i = 0; i < natoms; i++) {

     data->atom_kinds[i] -= 1;

   }

 }


 void update_block_offsets(const int nblocks, const int *const block_offsets,

                           grid_context *data) {

   assert(data != NULL);


   if (nblocks == 0)

     return;


   if (data->block_offsets == NULL) {

     data->block_offsets = malloc(nblocks * sizeof(int));

   } else {

     if ((nblocks > data->nblocks_total) && (data->nblocks_total > 0)) {

       data->block_offsets = realloc(data->block_offsets, sizeof(int) * nblocks);

     }

   }


   data->nblocks = nblocks;

   data->nblocks_total = imax(data->nblocks_total, nblocks);

   if (nblocks)

     memcpy(data->block_offsets, block_offsets, nblocks * sizeof(int));

 }


 void update_basis_set(const int nkinds, const grid_basis_set **const basis_sets,

                       grid_context *data) {

   if (nkinds > data->nkinds_total) {

     if (data->basis_sets == NULL) {

       data->basis_sets = malloc(nkinds * sizeof(grid_basis_set *));

     } else {

       data->basis_sets =

           realloc(data->basis_sets, nkinds * sizeof(grid_basis_set *));

     }

   }

   data->nkinds = nkinds;

   data->nkinds_total = imax(data->nkinds_total, nkinds);

   memcpy(data->basis_sets, basis_sets, nkinds * sizeof(grid_basis_set *));

 }


 void update_task_lists(const int nlevels, const int ntasks,

                        const int *const level_list, const int *const iatom_list,

                        const int *const jatom_list, const int *const iset_list,

                        const int *const jset_list, const int *const ipgf_list,

                        const int *const jpgf_list,

                        const int *const border_mask_list,

                        const int *block_num_list,

                        const double *const radius_list,

                        const double rab_list[ntasks][3], grid_context *ctx) {


   assert(ctx->checksum == ctx_checksum);


   if (nlevels == 0)

     return;


   if (ctx->ntasks == 0) {

     // Count tasks per level.

     size_t size = nlevels * sizeof(int);

     ctx->tasks_per_level = malloc(size);

     ctx->tasks = malloc(nlevels * sizeof(_task *));

     /* memset(ctx->tasks, 0, nlevels * sizeof(_task *)); */

     if (ntasks)

       ctx->tasks[0] = malloc(ntasks * sizeof(_task));

     else

       ctx->tasks[0] = NULL;

   } else {

     if (ctx->nlevels_total < nlevels) {

       /* save the address of the full task list. NULL when completly empty */

       ctx->tasks = realloc(ctx->tasks, nlevels * sizeof(_task *));

     }

     if (ctx->ntasks_total < ntasks) {

       ctx->tasks[0] = realloc(ctx->tasks[0], ntasks * sizeof(_task));

     }

   }


   memset(ctx->tasks_per_level, 0, nlevels * sizeof(int));

   ctx->nlevels = nlevels;

   ctx->nlevels_total = imax(ctx->nlevels_total, nlevels);

   ctx->ntasks_total = imax(ctx->ntasks_total, ntasks);

   ctx->ntasks = ntasks;


   for (int i = 0; i < ntasks; i++) {

     ctx->tasks_per_level[level_list[i] - 1]++;

     assert(i == 0 || level_list[i] >= level_list[i - 1]); // expect ordered list

   }


   for (int i = 1; i < ctx->nlevels; i++) {

     ctx->tasks[i] = ctx->tasks[i - 1] + ctx->tasks_per_level[i - 1];

   }


   int prev_block_num = -1;

   int prev_iset = -1;

   int prev_jset = -1;

   int prev_level = -1;

   _task *task = ctx->tasks[0];

   for (int i = 0; i < ntasks; i++) {

     if (prev_level != (level_list[i] - 1)) {

       prev_level = level_list[i] - 1;

       prev_block_num = -1;

       prev_iset = -1;

       prev_jset = -1;

     }

     task->level = level_list[i] - 1;

     task->iatom = iatom_list[i] - 1;

     task->jatom = jatom_list[i] - 1;

     task->iset = iset_list[i] - 1;

     task->jset = jset_list[i] - 1;

     task->ipgf = ipgf_list[i] - 1;

     task->jpgf = jpgf_list[i] - 1;

     task->border_mask = border_mask_list[i];

     task->block_num = block_num_list[i] - 1;

     task->radius = radius_list[i];

     task->rab[0] = rab_list[i][0];

     task->rab[1] = rab_list[i][1];

     task->rab[2] = rab_list[i][2];

     const int iatom = task->iatom;

     const int jatom = task->jatom;

     const int iset = task->iset;

     const int jset = task->jset;

     const int ipgf = task->ipgf;

     const int jpgf = task->jpgf;

     const int ikind = ctx->atom_kinds[iatom];

     const int jkind = ctx->atom_kinds[jatom];

     const grid_basis_set *ibasis = ctx->basis_sets[ikind];

     const grid_basis_set *jbasis = ctx->basis_sets[jkind];

     const int ncoseta = ncoset(ibasis->lmax[iset]);

     const int ncosetb = ncoset(jbasis->lmax[jset]);


     task->zeta[0] = ibasis->zet[iset * ibasis->maxpgf + ipgf];

     task->zeta[1] = jbasis->zet[jset * jbasis->maxpgf + jpgf];


     const double *ra = &ctx->atom_positions[3 * iatom];

     const double zetp = task->zeta[0] + task->zeta[1];

     const double f = task->zeta[1] / zetp;

     const double rab2 = task->rab[0] * task->rab[0] +

                         task->rab[1] * task->rab[1] +

                         task->rab[2] * task->rab[2];


     task->prefactor = exp(-task->zeta[0] * f * rab2);

     task->zetp = zetp;


     const int block_num = task->block_num;


     for (int i = 0; i < 3; i++) {

       task->ra[i] = ra[i];

       task->rp[i] = ra[i] + f * task->rab[i];

       task->rb[i] = ra[i] + task->rab[i];

     }


     task->lmax[0] = ibasis->lmax[iset];

     task->lmax[1] = jbasis->lmax[jset];

     task->lmin[0] = ibasis->lmin[iset];

     task->lmin[1] = jbasis->lmin[jset];


     if ((block_num != prev_block_num) || (iset != prev_iset) ||

         (jset != prev_jset)) {

       task->update_block_ = true;

       prev_block_num = block_num;

       prev_iset = iset;

       prev_jset = jset;

     } else {

       task->update_block_ = false;

     }


     task->offset[0] = ipgf * ncoseta;

     task->offset[1] = jpgf * ncosetb;

     task++;

   }


   // Find largest Cartesian subblock size.

   ctx->maxco = 0;

   for (int i = 0; i < ctx->nkinds; i++) {

     ctx->maxco = imax(ctx->maxco, ctx->basis_sets[i]->maxco);

   }

 }


 void update_layouts(const int nlevels, const int npts_global[nlevels][3],

                     const int npts_local[nlevels][3],

                     const int shift_local[nlevels][3],

                     const int border_width[nlevels][3],

                     const double dh[nlevels][3][3],

                     const double dh_inv[nlevels][3][3], grid_context *ctx) {


   assert(ctx != NULL);

   assert(ctx->checksum == ctx_checksum);


   if (ctx->layouts != NULL) {

     free(ctx->layouts);

   }


   ctx->layouts = malloc(sizeof(_layout) * nlevels);


   for (int level = 0; level < nlevels; level++) {

     for (int i = 0; i < 3; i++) {

       ctx->layouts[level].npts_global[i] = npts_global[level][i];

       ctx->layouts[level].npts_local[i] = npts_local[level][i];

       ctx->layouts[level].shift_local[i] = shift_local[level][i];

       ctx->layouts[level].border_width[i] = border_width[level][i];

       for (int j = 0; j < 3; j++) {

         ctx->layouts[level].dh[i][j] = dh[level][i][j];

         ctx->layouts[level].dh_inv[i][j] = dh_inv[level][i][j];

       }

     }

   }

 }


 void update_grid(const int nlevels, grid_context *ctx) {

   assert(ctx != NULL);

   assert(ctx->checksum == ctx_checksum);


   if (nlevels == 0)

     return;


   if (ctx->grid == NULL) {

     ctx->grid = malloc(sizeof(tensor) * nlevels);

   } else {

     if (ctx->nlevels_total < nlevels) {

       ctx->grid = realloc(ctx->grid, sizeof(tensor) * nlevels);

     }

   }


   ctx->nlevels_total = imax(ctx->nlevels_total, nlevels);

   ctx->nlevels = nlevels;

 }


 void *create_grid_context_dgemm(

     const bool orthorhombic, const int ntasks, const int nlevels,

     const int natoms, const int nkinds, const int nblocks,

     const int *block_offsets, const double atom_positions[natoms][3],

     const int *const atom_kinds, const grid_basis_set **const basis_sets,

     const int *const level_list, const int *const iatom_list,

     const int *jatom_list, const int *const iset_list,

     const int *const jset_list, const int *const ipgf_list,

     const int *const jpgf_list, const int *const border_mask_list,

     const int *block_num_list, const double *const radius_list,

     const double rab_list[ntasks][3], const int npts_global[nlevels][3],

     const int npts_local[nlevels][3], const int shift_local[nlevels][3],

     const int border_width[nlevels][3], const double dh[nlevels][3][3],

     const double dh_inv[nlevels][3][3]) {


   grid_context *ctx = malloc(sizeof(grid_context));


   memset(ctx, 0, sizeof(grid_context));


   ctx->checksum = ctx_checksum;

   ctx->orthorhombic = orthorhombic;

   update_block_offsets(nblocks, block_offsets, ctx);

   update_atoms_position(natoms, atom_positions, ctx);

   update_atoms_kinds(natoms, atom_kinds, ctx);

   update_basis_set(nkinds, basis_sets, ctx);

   update_task_lists(nlevels, ntasks, level_list, iatom_list, jatom_list,

                     iset_list, jset_list, ipgf_list, jpgf_list,

                     border_mask_list, block_num_list, radius_list, rab_list,

                     ctx);

   update_layouts(nlevels, npts_global, npts_local, shift_local, border_width,

                  dh, dh_inv, ctx);

   update_grid(nlevels, ctx);


   const int max_threads = omp_get_max_threads();


   ctx->handler =

       malloc(sizeof(struct collocation_integration_ *) * max_threads);


   for (int i = 0; i < max_threads; i++) {

     ctx->handler[i] = collocate_create_handle();

   }


   ctx->number_of_handler = max_threads;


   return ctx;

 }


 void update_grid_context_dgemm(

     const bool orthorhombic, const int ntasks, const int nlevels,

     const int natoms, const int nkinds, const int nblocks,

     const int *block_offsets, const double atom_positions[natoms][3],

     const int *const atom_kinds, const grid_basis_set **const basis_sets,

     const int *const level_list, const int *const iatom_list,

     const int *jatom_list, const int *const iset_list,

     const int *const jset_list, const int *const ipgf_list,

     const int *const jpgf_list, const int *const border_mask_list,

     const int *block_num_list, const double *const radius_list,

     const double rab_list[ntasks][3], const int npts_global[nlevels][3],

     const int npts_local[nlevels][3], const int shift_local[nlevels][3],

     const int border_width[nlevels][3], const double dh[nlevels][3][3],

     const double dh_inv[nlevels][3][3], void *ptr) {


   assert(ptr != NULL);

   grid_context *ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);


   ctx->orthorhombic = orthorhombic;

   update_block_offsets(nblocks, block_offsets, ctx);

   update_atoms_position(natoms, atom_positions, ctx);

   update_atoms_kinds(natoms, atom_kinds, ctx);

   update_basis_set(nkinds, basis_sets, ctx);

   update_task_lists(nlevels, ntasks, level_list, iatom_list, jatom_list,

                     iset_list, jset_list, ipgf_list, jpgf_list,

                     border_mask_list, block_num_list, radius_list, rab_list,

                     ctx);

   update_layouts(nlevels, npts_global, npts_local, shift_local, border_width,

                  dh, dh_inv, ctx);

   update_grid(nlevels, ctx);


   // Find largest Cartesian subblock size.

   ctx->maxco = 0;

   for (int i = 0; i < nkinds; i++) {

     ctx->maxco = imax(ctx->maxco, ctx->basis_sets[i]->maxco);

   }

 }


 void initialize_grid_context_on_gpu(void *ptr, const int number_of_devices,

                                     const int *device_id) {

   assert(ptr != NULL);

   grid_context *ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);

   ctx->work_on_gpu = false;

   if (number_of_devices <= 0) {

     return;

   }


   ctx->number_of_devices = number_of_devices;

   ctx->queue_length = 8192;

   if (ctx->device_id == NULL)

     ctx->device_id = malloc(sizeof(int) * number_of_devices);

   else

     ctx->device_id = realloc(ctx->device_id, sizeof(int) * number_of_devices);


   memcpy(ctx->device_id, device_id, sizeof(int) * number_of_devices);

 }


 void destroy_grid_context_dgemm(void *ptr) {

   assert(ptr);

   grid_context *ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);

   free(ctx->block_offsets);

   free(ctx->atom_positions);

   free(ctx->atom_kinds);

   free(ctx->basis_sets);

   free(ctx->tasks[0]);

   free(ctx->tasks);

   free(ctx->tasks_per_level);

   free(ctx->layouts);

   free(ctx->grid);

   if (ctx->device_id)

     free(ctx->device_id);


   if (ctx->handler) {

     for (int i = 0; i < ctx->number_of_handler; i++) {

       collocate_destroy_handle(ctx->handler[i]);

     }

     free(ctx->handler);

   }


   free(ctx);

 }


 void apply_cutoff(void *ptr) {

   assert(ptr);

   grid_context *ctx = (grid_context *)ptr;

   assert(ctx->checksum == ctx_checksum);

   ctx->apply_cutoff = true;

 }


 void set_grid_parameters(

     tensor *grid, const bool orthorhombic,

     const int grid_full_size[3],  /* size of the full grid */

     const int grid_local_size[3], /* size of the local grid block */

     const int shift_local[3],     /* coordinates of the lower coordinates of the

                                      local grid window */

     const int border_width[3],    /* width of the borders */

     const double

         dh[3][3], /* displacement vectors of the grid (cartesian) -> (ijk) */

     const double dh_inv[3][3], /* (ijk) -> (x,y,z) */

     offload_buffer *grid_) {

   memset(grid, 0, sizeof(tensor));

   initialize_tensor_3(grid, grid_local_size[2], grid_local_size[1],

                       grid_local_size[0]);


   grid->data = grid_->host_buffer;

   grid->ld_ = grid_local_size[0];


   setup_global_grid_size(grid, &grid_full_size[0]);


   /* the grid is divided over several ranks or not periodic */

   if ((grid_local_size[0] != grid_full_size[0]) ||

       (grid_local_size[1] != grid_full_size[1]) ||

       (grid_local_size[2] != grid_full_size[2])) {

     setup_grid_window(grid, shift_local, border_width, 0);

   } else {

     grid->window_shift[0] = 0;

     grid->window_shift[1] = 0;

     grid->window_shift[2] = 0;


     grid->window_size[0] = grid->size[0];

     grid->window_size[1] = grid->size[1];

     grid->window_size[2] = grid->size[2];

   }


   grid->dh[0][0] = dh[0][0];

   grid->dh[0][1] = dh[0][1];

   grid->dh[0][2] = dh[0][2];

   grid->dh[1][0] = dh[1][0];

   grid->dh[1][1] = dh[1][1];

   grid->dh[1][2] = dh[1][2];

   grid->dh[2][0] = dh[2][0];

   grid->dh[2][1] = dh[2][1];

   grid->dh[2][2] = dh[2][2];


   grid->dh_inv[0][0] = dh_inv[0][0];

   grid->dh_inv[0][1] = dh_inv[0][1];

   grid->dh_inv[0][2] = dh_inv[0][2];

   grid->dh_inv[1][0] = dh_inv[1][0];

   grid->dh_inv[1][1] = dh_inv[1][1];

   grid->dh_inv[1][2] = dh_inv[1][2];

   grid->dh_inv[2][0] = dh_inv[2][0];

   grid->dh_inv[2][1] = dh_inv[2][1];

   grid->dh_inv[2][2] = dh_inv[2][2];


   verify_orthogonality(dh, grid->orthogonal);


   if (orthorhombic) {

     grid->orthogonal[0] = true;

     grid->orthogonal[1] = true;

     grid->orthogonal[2] = true;

   }

 }


 /*******************************************************************************

  * \brief Allocates a task list for the dgemm backend.

  *        See grid_task_list.h for details.

  ******************************************************************************/

 void grid_dgemm_create_task_list(

     const bool orthorhombic, const int ntasks, const int nlevels,

     const int natoms, const int nkinds, const int nblocks,

     const int block_offsets[nblocks], const double atom_positions[natoms][3],

     const int atom_kinds[natoms], const grid_basis_set *basis_sets[nkinds],

     const int level_list[ntasks], const int iatom_list[ntasks],

     const int jatom_list[ntasks], const int iset_list[ntasks],

     const int jset_list[ntasks], const int ipgf_list[ntasks],

     const int jpgf_list[ntasks], const int border_mask_list[ntasks],

     const int block_num_list[ntasks], const double radius_list[ntasks],

     const double rab_list[ntasks][3], const int npts_global[nlevels][3],

     const int npts_local[nlevels][3], const int shift_local[nlevels][3],

     const int border_width[nlevels][3], const double dh[nlevels][3][3],

     const double dh_inv[nlevels][3][3], grid_dgemm_task_list **task_list) {


   if (*task_list == NULL) {

     *task_list = create_grid_context_dgemm(

         orthorhombic, ntasks, nlevels, natoms, nkinds, nblocks, block_offsets,

         atom_positions, atom_kinds, basis_sets, level_list, iatom_list,

         jatom_list, iset_list, jset_list, ipgf_list, jpgf_list,

         border_mask_list, block_num_list, radius_list, rab_list, npts_global,

         npts_local, shift_local, border_width, dh, dh_inv);

   } else {

     update_grid_context_dgemm(

         orthorhombic, ntasks, nlevels, natoms, nkinds, nblocks, block_offsets,

         atom_positions, atom_kinds, basis_sets, level_list, iatom_list,

         jatom_list, iset_list, jset_list, ipgf_list, jpgf_list,

         border_mask_list, block_num_list, radius_list, rab_list, npts_global,

         npts_local, shift_local, border_width, dh, dh_inv, *task_list);

   }


   const grid_library_config config = grid_library_get_config();

   if (config.apply_cutoff) {

     apply_cutoff(*task_list);

   }

 }


 /*******************************************************************************

  * \brief Deallocates given task list, basis_sets have to be freed separately.

  ******************************************************************************/

 void grid_dgemm_free_task_list(grid_dgemm_task_list *task_list) {

   destroy_grid_context_dgemm(task_list);

 }

imax
static int imax(int x, int y)
Returns the larger of two given integer (missing from the C standard)
Definition: dbm_distribution.c:73

max_threads
static int max_threads
Definition: dbm_library.c:24

ncoset
static GRID_HOST_DEVICE int ncoset(const int l)
Number of Cartesian orbitals up to given angular momentum quantum.
Definition: grid_common.h:73

grid
static void const int const int const int const int const int const double const int const int const int int GRID_CONST_WHEN_COLLOCATE double GRID_CONST_WHEN_INTEGRATE double * grid
Definition: grid_cpu_collint.h:169

i
static void const int const int i
Definition: grid_cpu_collint.h:38

npts_local
static void const int const int const int const int const int const double const int const int const int npts_local[3]
Definition: grid_cpu_collint.h:167

grid_dgemm_collocate.h

collocate_create_handle
struct collocation_integration_ * collocate_create_handle(void)
Definition: grid_dgemm_collocation_integration.c:20

collocate_destroy_handle
void collocate_destroy_handle(void *gaussian_handle)
Definition: grid_dgemm_collocation_integration.c:60

grid_dgemm_collocation_integration.h

update_layouts
void update_layouts(const int nlevels, const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3], grid_context *ctx)
Definition: grid_dgemm_context.c:303

update_grid
void update_grid(const int nlevels, grid_context *ctx)
Definition: grid_dgemm_context.c:333

update_atoms_kinds
void update_atoms_kinds(const int natoms, const int *atoms_kinds, grid_context *data)
Definition: grid_dgemm_context.c:107

update_grid_context_dgemm
void update_grid_context_dgemm(const bool orthorhombic, const int ntasks, const int nlevels, const int natoms, const int nkinds, const int nblocks, const int *block_offsets, const double atom_positions[natoms][3], const int *const atom_kinds, const grid_basis_set **const basis_sets, const int *const level_list, const int *const iatom_list, const int *jatom_list, const int *const iset_list, const int *const jset_list, const int *const ipgf_list, const int *const jpgf_list, const int *const border_mask_list, const int *block_num_list, const double *const radius_list, const double rab_list[ntasks][3], const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3], void *ptr)
Definition: grid_dgemm_context.c:399

is_grid_orthorhombic
int is_grid_orthorhombic(void *const ptr)
Definition: grid_dgemm_context.c:67

update_block_offsets
void update_block_offsets(const int nblocks, const int *const block_offsets, grid_context *data)
Definition: grid_dgemm_context.c:131

return_device_id
int return_device_id(void *const ptr, const int device)
Definition: grid_dgemm_context.c:60

destroy_grid_context_dgemm
void destroy_grid_context_dgemm(void *ptr)
Definition: grid_dgemm_context.c:458

return_dh
void return_dh(void *const ptr, const int level, double *const dh)
Definition: grid_dgemm_context.c:23

update_task_lists
void update_task_lists(const int nlevels, const int ntasks, const int *const level_list, const int *const iatom_list, const int *const jatom_list, const int *const iset_list, const int *const jset_list, const int *const ipgf_list, const int *const jpgf_list, const int *const border_mask_list, const int *block_num_list, const double *const radius_list, const double rab_list[ntasks][3], grid_context *ctx)
Definition: grid_dgemm_context.c:167

apply_cutoff
void apply_cutoff(void *ptr)
Definition: grid_dgemm_context.c:484

return_num_devs
int return_num_devs(void *const ptr)
Definition: grid_dgemm_context.c:53

return_dh_inv
void return_dh_inv(void *const ptr, const int level, double *const dh_inv)
Definition: grid_dgemm_context.c:38

update_basis_set
void update_basis_set(const int nkinds, const grid_basis_set **const basis_sets, grid_context *data)
Definition: grid_dgemm_context.c:152

grid_dgemm_create_task_list
void grid_dgemm_create_task_list(const bool orthorhombic, const int ntasks, const int nlevels, const int natoms, const int nkinds, const int nblocks, const int block_offsets[nblocks], const double atom_positions[natoms][3], const int atom_kinds[natoms], const grid_basis_set *basis_sets[nkinds], const int level_list[ntasks], const int iatom_list[ntasks], const int jatom_list[ntasks], const int iset_list[ntasks], const int jset_list[ntasks], const int ipgf_list[ntasks], const int jpgf_list[ntasks], const int border_mask_list[ntasks], const int block_num_list[ntasks], const double radius_list[ntasks], const double rab_list[ntasks][3], const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3], grid_dgemm_task_list **task_list)
Allocates a task list for the dgemm backend. See grid_task_list.h for details.
Definition: grid_dgemm_context.c:559

update_atoms_position
void update_atoms_position(const int natoms, const double atoms_positions[natoms][3], grid_context *data)
Definition: grid_dgemm_context.c:79

grid_dgemm_free_task_list
void grid_dgemm_free_task_list(grid_dgemm_task_list *task_list)
Deallocates given task list, basis_sets have to be freed separately.
Definition: grid_dgemm_context.c:599

create_grid_context_dgemm
void * create_grid_context_dgemm(const bool orthorhombic, const int ntasks, const int nlevels, const int natoms, const int nkinds, const int nblocks, const int *block_offsets, const double atom_positions[natoms][3], const int *const atom_kinds, const grid_basis_set **const basis_sets, const int *const level_list, const int *const iatom_list, const int *jatom_list, const int *const iset_list, const int *const jset_list, const int *const ipgf_list, const int *const jpgf_list, const int *const border_mask_list, const int *block_num_list, const double *const radius_list, const double rab_list[ntasks][3], const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3])
Definition: grid_dgemm_context.c:352

update_queue_length
void update_queue_length(void *const ptr, const int queue_length)
Definition: grid_dgemm_context.c:73

set_grid_parameters
void set_grid_parameters(tensor *grid, const bool orthorhombic, const int grid_full_size[3], const int grid_local_size[3], const int shift_local[3], const int border_width[3], const double dh[3][3], const double dh_inv[3][3], offload_buffer *grid_)
Definition: grid_dgemm_context.c:491

initialize_grid_context_on_gpu
void initialize_grid_context_on_gpu(void *ptr, const int number_of_devices, const int *device_id)
Definition: grid_dgemm_context.c:438

grid_dgemm_context.h

grid_dgemm_private_header.h

ctx_checksum
@ ctx_checksum
Definition: grid_dgemm_private_header.h:19

grid_dgemm_task_list.h

grid_dgemm_tensor_local.h

setup_grid_window
static void setup_grid_window(tensor *const grid, const int *const shift_local, const int *const border_width, const int border_mask)
Definition: grid_dgemm_tensor_local.h:220

setup_global_grid_size
static void setup_global_grid_size(tensor *const grid, const int *const full_size)
Definition: grid_dgemm_tensor_local.h:198

initialize_tensor_3
static void initialize_tensor_3(struct tensor_ *a, int n1, int n2, int n3)
Definition: grid_dgemm_tensor_local.h:91

verify_orthogonality
void verify_orthogonality(const double dh[3][3], bool orthogonal[3])
Definition: grid_dgemm_utils.c:372

grid_dgemm_utils.h

config
static grid_library_config config
Definition: grid_library.c:33

grid_library_get_config
grid_library_config grid_library_get_config(void)
Returns the library config.
Definition: grid_library.c:123

_layout
Definition: grid_dgemm_private_header.h:51

_layout::shift_local
int shift_local[3]
Definition: grid_dgemm_private_header.h:54

_layout::border_width
int border_width[3]
Definition: grid_dgemm_private_header.h:55

_layout::npts_global
int npts_global[3]
Definition: grid_dgemm_private_header.h:52

_layout::npts_local
int npts_local[3]
Definition: grid_dgemm_private_header.h:53

_layout::dh
double dh[3][3]
Definition: grid_dgemm_private_header.h:56

_layout::dh_inv
double dh_inv[3][3]
Definition: grid_dgemm_private_header.h:57

_task
Definition: grid_dgemm_private_header.h:25

_task::prefactor
double prefactor
Definition: grid_dgemm_private_header.h:47

_task::rp
double rp[3]
Definition: grid_dgemm_private_header.h:40

_task::rab
double rab[3]
Definition: grid_dgemm_private_header.h:46

_task::radius
double radius
Definition: grid_dgemm_private_header.h:35

_task::ipgf
int ipgf
Definition: grid_dgemm_private_header.h:31

_task::lmin
int lmin[2]
Definition: grid_dgemm_private_header.h:42

_task::iset
int iset
Definition: grid_dgemm_private_header.h:29

_task::zeta
double zeta[2]
Definition: grid_dgemm_private_header.h:37

_task::ra
double ra[3]
Definition: grid_dgemm_private_header.h:38

_task::border_mask
int border_mask
Definition: grid_dgemm_private_header.h:33

_task::zetp
double zetp
Definition: grid_dgemm_private_header.h:36

_task::offset
int offset[2]
Definition: grid_dgemm_private_header.h:44

_task::update_block_
bool update_block_
Definition: grid_dgemm_private_header.h:45

_task::level
int level
Definition: grid_dgemm_private_header.h:26

_task::lmax
int lmax[2]
Definition: grid_dgemm_private_header.h:41

_task::block_num
int block_num
Definition: grid_dgemm_private_header.h:34

_task::jpgf
int jpgf
Definition: grid_dgemm_private_header.h:32

_task::iatom
int iatom
Definition: grid_dgemm_private_header.h:27

_task::rb
double rb[3]
Definition: grid_dgemm_private_header.h:39

_task::jset
int jset
Definition: grid_dgemm_private_header.h:30

_task::jatom
int jatom
Definition: grid_dgemm_private_header.h:28

collocation_integration_
Definition: grid_dgemm_collocation_integration.h:22

grid_basis_set
Internal representation of a basis set.
Definition: grid_basis_set.h:14

grid_basis_set::maxco
int maxco
Definition: grid_basis_set.h:17

grid_basis_set::lmax
int * lmax
Definition: grid_basis_set.h:20

grid_basis_set::zet
double * zet
Definition: grid_basis_set.h:25

grid_basis_set::maxpgf
int maxpgf
Definition: grid_basis_set.h:18

grid_basis_set::lmin
int * lmin
Definition: grid_basis_set.h:19

grid_context_
Definition: grid_dgemm_private_header.h:60

grid_context_::nkinds
int nkinds
Definition: grid_dgemm_private_header.h:64

grid_context_::basis_sets
grid_basis_set ** basis_sets
Definition: grid_dgemm_private_header.h:73

grid_context_::checksum
enum checksum_ checksum
Definition: grid_dgemm_private_header.h:88

grid_context_::queue_length
int queue_length
Definition: grid_dgemm_private_header.h:82

grid_context_::nblocks
int nblocks
Definition: grid_dgemm_private_header.h:65

grid_context_::nkinds_total
int nkinds_total
Definition: grid_dgemm_private_header.h:67

grid_context_::nlevels_total
int nlevels_total
Definition: grid_dgemm_private_header.h:68

grid_context_::device_id
int * device_id
Definition: grid_dgemm_private_header.h:81

grid_context_::number_of_devices
int number_of_devices
Definition: grid_dgemm_private_header.h:80

grid_context_::apply_cutoff
bool apply_cutoff
Definition: grid_dgemm_private_header.h:78

grid_context_::nlevels
int nlevels
Definition: grid_dgemm_private_header.h:62

grid_context_::atom_positions
double * atom_positions
Definition: grid_dgemm_private_header.h:71

grid_context_::orthorhombic
bool orthorhombic
Definition: grid_dgemm_private_header.h:87

grid_context_::tasks
_task ** tasks
Definition: grid_dgemm_private_header.h:74

grid_context_::handler
struct collocation_integration_ ** handler
Definition: grid_dgemm_private_header.h:83

grid_context_::work_on_gpu
bool work_on_gpu
Definition: grid_dgemm_private_header.h:79

grid_context_::maxco
int maxco
Definition: grid_dgemm_private_header.h:77

grid_context_::number_of_handler
int number_of_handler
Definition: grid_dgemm_private_header.h:84

grid_context_::layouts
_layout * layouts
Definition: grid_dgemm_private_header.h:75

grid_context_::grid
tensor * grid
Definition: grid_dgemm_private_header.h:85

grid_context_::ntasks_total
int ntasks_total
Definition: grid_dgemm_private_header.h:69

grid_context_::nblocks_total
int nblocks_total
Definition: grid_dgemm_private_header.h:66

grid_context_::atom_kinds
int * atom_kinds
Definition: grid_dgemm_private_header.h:72

grid_context_::natoms
int natoms
Definition: grid_dgemm_private_header.h:63

grid_context_::tasks_per_level
int * tasks_per_level
Definition: grid_dgemm_private_header.h:76

grid_context_::block_offsets
int * block_offsets
Definition: grid_dgemm_private_header.h:70

grid_context_::ntasks
int ntasks
Definition: grid_dgemm_private_header.h:61

grid_library_config
Configuration of the grid library.
Definition: grid_library.h:34

grid_library_config::apply_cutoff
bool apply_cutoff
Definition: grid_library.h:38

offload_buffer
Internal representation of a buffer.
Definition: offload_buffer.h:16

offload_buffer::host_buffer
double * host_buffer
Definition: offload_buffer.h:18

tensor_
Definition: grid_dgemm_tensor_local.h:17

tensor_::dh
double dh[3][3]
Definition: grid_dgemm_tensor_local.h:36

tensor_::dh_inv
double dh_inv[3][3]
Definition: grid_dgemm_tensor_local.h:37