db/daa/grid__dgemm__context_8c_source.html

/*----------------------------------------------------------------------------*/

/*  CP2K: A general program to perform molecular dynamics simulations         */

/*  Copyright 2000-2024 CP2K developers group <https://cp2k.org>              */

/*                                                                            */

/*  SPDX-License-Identifier: BSD-3-Clause                                     */

/*----------------------------------------------------------------------------*/


#include <math.h>

#include <omp.h>

#include <stdio.h>

#include <stdlib.h>

#include <string.h>


#include "../common/grid_library.h"

#include "grid_dgemm_collocate.h"

#include "grid_dgemm_collocation_integration.h"

#include "grid_dgemm_context.h"

#include "grid_dgemm_private_header.h"

#include "grid_dgemm_task_list.h"

#include "grid_dgemm_tensor_local.h"

#include "grid_dgemm_utils.h"


void return_dh(void *const ptr, const int level, double *const dh) {

  grid_context *const ctx = (grid_context *)ptr;


  assert(ctx->checksum == ctx_checksum);

  dh[0] = ctx->grid[level].dh[0][0];

  dh[1] = ctx->grid[level].dh[0][1];

  dh[2] = ctx->grid[level].dh[0][2];

  dh[3] = ctx->grid[level].dh[1][0];

  dh[4] = ctx->grid[level].dh[1][1];

  dh[5] = ctx->grid[level].dh[1][2];

  dh[6] = ctx->grid[level].dh[2][0];

  dh[7] = ctx->grid[level].dh[2][1];

  dh[8] = ctx->grid[level].dh[2][2];

}


void return_dh_inv(void *const ptr, const int level, double *const dh_inv) {

  grid_context *const ctx = (grid_context *)ptr;


  assert(ctx->checksum == ctx_checksum);

  dh_inv[0] = ctx->grid[level].dh_inv[0][0];

  dh_inv[1] = ctx->grid[level].dh_inv[0][1];

  dh_inv[2] = ctx->grid[level].dh_inv[0][2];

  dh_inv[3] = ctx->grid[level].dh_inv[1][0];

  dh_inv[4] = ctx->grid[level].dh_inv[1][1];

  dh_inv[5] = ctx->grid[level].dh_inv[1][2];

  dh_inv[6] = ctx->grid[level].dh_inv[2][0];

  dh_inv[7] = ctx->grid[level].dh_inv[2][1];

  dh_inv[8] = ctx->grid[level].dh_inv[2][2];

}


int return_num_devs(void *const ptr) {

  grid_context *const ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);


  return ctx->number_of_devices;

}


int return_device_id(void *const ptr, const int device) {

  grid_context *const ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);


  return ctx->device_id[device];

}


int is_grid_orthorhombic(void *const ptr) {

  grid_context *const ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);

  return ctx->orthorhombic;

}


void update_queue_length(void *const ptr, const int queue_length) {

  grid_context *const ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);

  ctx->queue_length = queue_length;

}


void update_atoms_position(const int natoms,

                           const double atoms_positions[natoms][3],

                           grid_context *data) {

  assert(data != NULL);


  if (natoms == 0)

    return;


  if (data->atom_positions == NULL) {

    data->atom_positions = malloc(3 * natoms * sizeof(double));

  } else {

    if (natoms > data->natoms) {

      data->atom_positions =

          realloc(data->atom_positions, 3 * natoms * sizeof(double));

    }

  }


  data->natoms = natoms;


  if (data->atom_positions) {

    for (int i = 0; i < natoms; i++) {

      data->atom_positions[3 * i] = atoms_positions[i][0];

      data->atom_positions[3 * i + 1] = atoms_positions[i][1];

      data->atom_positions[3 * i + 2] = atoms_positions[i][2];

    }

  }

}


void update_atoms_kinds(const int natoms, const int *atoms_kinds,

                        grid_context *data) {

  assert(data != NULL);


  // data->atom_kinds is a table that give the type of a given atom.

  if (natoms == 0)

    return;


  if (data->atom_kinds == NULL) {

    data->atom_kinds = malloc(natoms * sizeof(int));

  } else {

    if ((natoms > data->natoms) && (data->natoms > 0)) {

      data->atom_kinds = realloc(data->atom_kinds, natoms * sizeof(int));

    }

  }

  // data->natoms is initialized before calling this function

  if (data->natoms)

    memcpy(data->atom_kinds, atoms_kinds, sizeof(int) * natoms);


  for (int i = 0; i < natoms; i++) {

    data->atom_kinds[i] -= 1;

  }

}


void update_block_offsets(const int nblocks, const int *const block_offsets,

                          grid_context *data) {

  assert(data != NULL);


  if (nblocks == 0)

    return;


  if (data->block_offsets == NULL) {

    data->block_offsets = malloc(nblocks * sizeof(int));

  } else {

    if ((nblocks > data->nblocks_total) && (data->nblocks_total > 0)) {

      data->block_offsets = realloc(data->block_offsets, sizeof(int) * nblocks);

    }

  }


  data->nblocks = nblocks;

  data->nblocks_total = imax(data->nblocks_total, nblocks);

  if (nblocks)

    memcpy(data->block_offsets, block_offsets, nblocks * sizeof(int));

}


void update_basis_set(const int nkinds, const grid_basis_set **const basis_sets,

                      grid_context *data) {

  if (nkinds > data->nkinds_total) {

    if (data->basis_sets == NULL) {

      data->basis_sets = malloc(nkinds * sizeof(grid_basis_set *));

    } else {

      data->basis_sets =

          realloc(data->basis_sets, nkinds * sizeof(grid_basis_set *));

    }

  }

  data->nkinds = nkinds;

  data->nkinds_total = imax(data->nkinds_total, nkinds);

  memcpy(data->basis_sets, basis_sets, nkinds * sizeof(grid_basis_set *));

}


void update_task_lists(const int nlevels, const int ntasks,

                       const int *const level_list, const int *const iatom_list,

                       const int *const jatom_list, const int *const iset_list,

                       const int *const jset_list, const int *const ipgf_list,

                       const int *const jpgf_list,

                       const int *const border_mask_list,

                       const int *block_num_list,

                       const double *const radius_list,

                       const double rab_list[ntasks][3], grid_context *ctx) {


  assert(ctx->checksum == ctx_checksum);


  if (nlevels == 0)

    return;


  if (ctx->ntasks == 0) {

    // Count tasks per level.

    size_t size = nlevels * sizeof(int);

    ctx->tasks_per_level = malloc(size);

    ctx->tasks = malloc(nlevels * sizeof(_task *));

    /* memset(ctx->tasks, 0, nlevels * sizeof(_task *)); */

    if (ntasks)

      ctx->tasks[0] = malloc(ntasks * sizeof(_task));

    else

      ctx->tasks[0] = NULL;

  } else {

    if (ctx->nlevels_total < nlevels) {

      /* save the address of the full task list. NULL when completly empty */

      ctx->tasks = realloc(ctx->tasks, nlevels * sizeof(_task *));

    }

    if (ctx->ntasks_total < ntasks) {

      ctx->tasks[0] = realloc(ctx->tasks[0], ntasks * sizeof(_task));

    }

  }


  memset(ctx->tasks_per_level, 0, nlevels * sizeof(int));

  ctx->nlevels = nlevels;

  ctx->nlevels_total = imax(ctx->nlevels_total, nlevels);

  ctx->ntasks_total = imax(ctx->ntasks_total, ntasks);

  ctx->ntasks = ntasks;


  for (int i = 0; i < ntasks; i++) {

    ctx->tasks_per_level[level_list[i] - 1]++;

    assert(i == 0 || level_list[i] >= level_list[i - 1]); // expect ordered list

  }


  for (int i = 1; i < ctx->nlevels; i++) {

    ctx->tasks[i] = ctx->tasks[i - 1] + ctx->tasks_per_level[i - 1];

  }


  int prev_block_num = -1;

  int prev_iset = -1;

  int prev_jset = -1;

  int prev_level = -1;

  _task *task = ctx->tasks[0];

  for (int i = 0; i < ntasks; i++) {

    if (prev_level != (level_list[i] - 1)) {

      prev_level = level_list[i] - 1;

      prev_block_num = -1;

      prev_iset = -1;

      prev_jset = -1;

    }

    task->level = level_list[i] - 1;

    task->iatom = iatom_list[i] - 1;

    task->jatom = jatom_list[i] - 1;

    task->iset = iset_list[i] - 1;

    task->jset = jset_list[i] - 1;

    task->ipgf = ipgf_list[i] - 1;

    task->jpgf = jpgf_list[i] - 1;

    task->border_mask = border_mask_list[i];

    task->block_num = block_num_list[i] - 1;

    task->radius = radius_list[i];

    task->rab[0] = rab_list[i][0];

    task->rab[1] = rab_list[i][1];

    task->rab[2] = rab_list[i][2];

    const int iatom = task->iatom;

    const int jatom = task->jatom;

    const int iset = task->iset;

    const int jset = task->jset;

    const int ipgf = task->ipgf;

    const int jpgf = task->jpgf;

    const int ikind = ctx->atom_kinds[iatom];

    const int jkind = ctx->atom_kinds[jatom];

    const grid_basis_set *ibasis = ctx->basis_sets[ikind];

    const grid_basis_set *jbasis = ctx->basis_sets[jkind];

    const int ncoseta = ncoset(ibasis->lmax[iset]);

    const int ncosetb = ncoset(jbasis->lmax[jset]);


    task->zeta[0] = ibasis->zet[iset * ibasis->maxpgf + ipgf];

    task->zeta[1] = jbasis->zet[jset * jbasis->maxpgf + jpgf];


    const double *ra = &ctx->atom_positions[3 * iatom];

    const double zetp = task->zeta[0] + task->zeta[1];

    const double f = task->zeta[1] / zetp;

    const double rab2 = task->rab[0] * task->rab[0] +

                        task->rab[1] * task->rab[1] +

                        task->rab[2] * task->rab[2];


    task->prefactor = exp(-task->zeta[0] * f * rab2);

    task->zetp = zetp;


    const int block_num = task->block_num;


    for (int i = 0; i < 3; i++) {

      task->ra[i] = ra[i];

      task->rp[i] = ra[i] + f * task->rab[i];

      task->rb[i] = ra[i] + task->rab[i];

    }


    task->lmax[0] = ibasis->lmax[iset];

    task->lmax[1] = jbasis->lmax[jset];

    task->lmin[0] = ibasis->lmin[iset];

    task->lmin[1] = jbasis->lmin[jset];


    if ((block_num != prev_block_num) || (iset != prev_iset) ||

        (jset != prev_jset)) {

      task->update_block_ = true;

      prev_block_num = block_num;

      prev_iset = iset;

      prev_jset = jset;

    } else {

      task->update_block_ = false;

    }


    task->offset[0] = ipgf * ncoseta;

    task->offset[1] = jpgf * ncosetb;

    task++;

  }


  // Find largest Cartesian subblock size.

  ctx->maxco = 0;

  for (int i = 0; i < ctx->nkinds; i++) {

    ctx->maxco = imax(ctx->maxco, ctx->basis_sets[i]->maxco);

  }

}


void update_layouts(const int nlevels, const int npts_global[nlevels][3],

                    const int npts_local[nlevels][3],

                    const int shift_local[nlevels][3],

                    const int border_width[nlevels][3],

                    const double dh[nlevels][3][3],

                    const double dh_inv[nlevels][3][3], grid_context *ctx) {


  assert(ctx != NULL);

  assert(ctx->checksum == ctx_checksum);


  if (ctx->layouts != NULL) {

    free(ctx->layouts);

  }


  ctx->layouts = malloc(sizeof(_layout) * nlevels);


  for (int level = 0; level < nlevels; level++) {

    for (int i = 0; i < 3; i++) {

      ctx->layouts[level].npts_global[i] = npts_global[level][i];

      ctx->layouts[level].npts_local[i] = npts_local[level][i];

      ctx->layouts[level].shift_local[i] = shift_local[level][i];

      ctx->layouts[level].border_width[i] = border_width[level][i];

      for (int j = 0; j < 3; j++) {

        ctx->layouts[level].dh[i][j] = dh[level][i][j];

        ctx->layouts[level].dh_inv[i][j] = dh_inv[level][i][j];

      }

    }

  }

}


void update_grid(const int nlevels, grid_context *ctx) {

  assert(ctx != NULL);

  assert(ctx->checksum == ctx_checksum);


  if (nlevels == 0)

    return;


  if (ctx->grid == NULL) {

    ctx->grid = malloc(sizeof(tensor) * nlevels);

  } else {

    if (ctx->nlevels_total < nlevels) {

      ctx->grid = realloc(ctx->grid, sizeof(tensor) * nlevels);

    }

  }


  ctx->nlevels_total = imax(ctx->nlevels_total, nlevels);

  ctx->nlevels = nlevels;

}


void *create_grid_context_dgemm(

    const bool orthorhombic, const int ntasks, const int nlevels,

    const int natoms, const int nkinds, const int nblocks,

    const int *block_offsets, const double atom_positions[natoms][3],

    const int *const atom_kinds, const grid_basis_set **const basis_sets,

    const int *const level_list, const int *const iatom_list,

    const int *jatom_list, const int *const iset_list,

    const int *const jset_list, const int *const ipgf_list,

    const int *const jpgf_list, const int *const border_mask_list,

    const int *block_num_list, const double *const radius_list,

    const double rab_list[ntasks][3], const int npts_global[nlevels][3],

    const int npts_local[nlevels][3], const int shift_local[nlevels][3],

    const int border_width[nlevels][3], const double dh[nlevels][3][3],

    const double dh_inv[nlevels][3][3]) {


  grid_context *ctx = malloc(sizeof(grid_context));


  memset(ctx, 0, sizeof(grid_context));


  ctx->checksum = ctx_checksum;

  ctx->orthorhombic = orthorhombic;

  update_block_offsets(nblocks, block_offsets, ctx);

  update_atoms_position(natoms, atom_positions, ctx);

  update_atoms_kinds(natoms, atom_kinds, ctx);

  update_basis_set(nkinds, basis_sets, ctx);

  update_task_lists(nlevels, ntasks, level_list, iatom_list, jatom_list,

                    iset_list, jset_list, ipgf_list, jpgf_list,

                    border_mask_list, block_num_list, radius_list, rab_list,

                    ctx);

  update_layouts(nlevels, npts_global, npts_local, shift_local, border_width,

                 dh, dh_inv, ctx);

  update_grid(nlevels, ctx);


  const int max_threads = omp_get_max_threads();


  ctx->handler =

      malloc(sizeof(struct collocation_integration_ *) * max_threads);


  for (int i = 0; i < max_threads; i++) {

    ctx->handler[i] = collocate_create_handle();

  }


  ctx->number_of_handler = max_threads;


  return ctx;

}


void update_grid_context_dgemm(

    const bool orthorhombic, const int ntasks, const int nlevels,

    const int natoms, const int nkinds, const int nblocks,

    const int *block_offsets, const double atom_positions[natoms][3],

    const int *const atom_kinds, const grid_basis_set **const basis_sets,

    const int *const level_list, const int *const iatom_list,

    const int *jatom_list, const int *const iset_list,

    const int *const jset_list, const int *const ipgf_list,

    const int *const jpgf_list, const int *const border_mask_list,

    const int *block_num_list, const double *const radius_list,

    const double rab_list[ntasks][3], const int npts_global[nlevels][3],

    const int npts_local[nlevels][3], const int shift_local[nlevels][3],

    const int border_width[nlevels][3], const double dh[nlevels][3][3],

    const double dh_inv[nlevels][3][3], void *ptr) {


  assert(ptr != NULL);

  grid_context *ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);


  ctx->orthorhombic = orthorhombic;

  update_block_offsets(nblocks, block_offsets, ctx);

  update_atoms_position(natoms, atom_positions, ctx);

  update_atoms_kinds(natoms, atom_kinds, ctx);

  update_basis_set(nkinds, basis_sets, ctx);

  update_task_lists(nlevels, ntasks, level_list, iatom_list, jatom_list,

                    iset_list, jset_list, ipgf_list, jpgf_list,

                    border_mask_list, block_num_list, radius_list, rab_list,

                    ctx);

  update_layouts(nlevels, npts_global, npts_local, shift_local, border_width,

                 dh, dh_inv, ctx);

  update_grid(nlevels, ctx);


  // Find largest Cartesian subblock size.

  ctx->maxco = 0;

  for (int i = 0; i < nkinds; i++) {

    ctx->maxco = imax(ctx->maxco, ctx->basis_sets[i]->maxco);

  }

}


void initialize_grid_context_on_gpu(void *ptr, const int number_of_devices,

                                    const int *device_id) {

  assert(ptr != NULL);

  grid_context *ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);

  ctx->work_on_gpu = false;

  if (number_of_devices <= 0) {

    return;

  }


  ctx->number_of_devices = number_of_devices;

  ctx->queue_length = 8192;

  if (ctx->device_id == NULL)

    ctx->device_id = malloc(sizeof(int) * number_of_devices);

  else

    ctx->device_id = realloc(ctx->device_id, sizeof(int) * number_of_devices);


  memcpy(ctx->device_id, device_id, sizeof(int) * number_of_devices);

}


void destroy_grid_context_dgemm(void *ptr) {

  assert(ptr);

  grid_context *ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);

  free(ctx->block_offsets);

  free(ctx->atom_positions);

  free(ctx->atom_kinds);

  free(ctx->basis_sets);

  free(ctx->tasks[0]);

  free(ctx->tasks);

  free(ctx->tasks_per_level);

  free(ctx->layouts);

  free(ctx->grid);

  if (ctx->device_id)

    free(ctx->device_id);


  if (ctx->handler) {

    for (int i = 0; i < ctx->number_of_handler; i++) {

      collocate_destroy_handle(ctx->handler[i]);

    }

    free(ctx->handler);

  }


  free(ctx);

}


void apply_cutoff(void *ptr) {

  assert(ptr);

  grid_context *ctx = (grid_context *)ptr;

  assert(ctx->checksum == ctx_checksum);

  ctx->apply_cutoff = true;

}


void set_grid_parameters(

    tensor *grid, const bool orthorhombic,

    const int grid_full_size[3],  /* size of the full grid */

    const int grid_local_size[3], /* size of the local grid block */

    const int shift_local[3],     /* coordinates of the lower coordinates of the

                                     local grid window */

    const int border_width[3],    /* width of the borders */

    const double

        dh[3][3], /* displacement vectors of the grid (cartesian) -> (ijk) */

    const double dh_inv[3][3], /* (ijk) -> (x,y,z) */

    offload_buffer *grid_) {

  memset(grid, 0, sizeof(tensor));

  initialize_tensor_3(grid, grid_local_size[2], grid_local_size[1],

                      grid_local_size[0]);


  grid->data = grid_->host_buffer;

  grid->ld_ = grid_local_size[0];


  setup_global_grid_size(grid, &grid_full_size[0]);


  /* the grid is divided over several ranks or not periodic */

  if ((grid_local_size[0] != grid_full_size[0]) ||

      (grid_local_size[1] != grid_full_size[1]) ||

      (grid_local_size[2] != grid_full_size[2])) {

    setup_grid_window(grid, shift_local, border_width, 0);

  } else {

    grid->window_shift[0] = 0;

    grid->window_shift[1] = 0;

    grid->window_shift[2] = 0;


    grid->window_size[0] = grid->size[0];

    grid->window_size[1] = grid->size[1];

    grid->window_size[2] = grid->size[2];

  }


  grid->dh[0][0] = dh[0][0];

  grid->dh[0][1] = dh[0][1];

  grid->dh[0][2] = dh[0][2];

  grid->dh[1][0] = dh[1][0];

  grid->dh[1][1] = dh[1][1];

  grid->dh[1][2] = dh[1][2];

  grid->dh[2][0] = dh[2][0];

  grid->dh[2][1] = dh[2][1];

  grid->dh[2][2] = dh[2][2];


  grid->dh_inv[0][0] = dh_inv[0][0];

  grid->dh_inv[0][1] = dh_inv[0][1];

  grid->dh_inv[0][2] = dh_inv[0][2];

  grid->dh_inv[1][0] = dh_inv[1][0];

  grid->dh_inv[1][1] = dh_inv[1][1];

  grid->dh_inv[1][2] = dh_inv[1][2];

  grid->dh_inv[2][0] = dh_inv[2][0];

  grid->dh_inv[2][1] = dh_inv[2][1];

  grid->dh_inv[2][2] = dh_inv[2][2];


  verify_orthogonality(dh, grid->orthogonal);


  if (orthorhombic) {

    grid->orthogonal[0] = true;

    grid->orthogonal[1] = true;

    grid->orthogonal[2] = true;

  }

}


/*******************************************************************************

 * \brief Allocates a task list for the dgemm backend.

 *        See grid_task_list.h for details.

 ******************************************************************************/


void grid_dgemm_create_task_list(

    const bool orthorhombic, const int ntasks, const int nlevels,

    const int natoms, const int nkinds, const int nblocks,

    const int block_offsets[nblocks], const double atom_positions[natoms][3],

    const int atom_kinds[natoms], const grid_basis_set *basis_sets[nkinds],

    const int level_list[ntasks], const int iatom_list[ntasks],

    const int jatom_list[ntasks], const int iset_list[ntasks],

    const int jset_list[ntasks], const int ipgf_list[ntasks],

    const int jpgf_list[ntasks], const int border_mask_list[ntasks],

    const int block_num_list[ntasks], const double radius_list[ntasks],

    const double rab_list[ntasks][3], const int npts_global[nlevels][3],

    const int npts_local[nlevels][3], const int shift_local[nlevels][3],

    const int border_width[nlevels][3], const double dh[nlevels][3][3],

    const double dh_inv[nlevels][3][3], grid_dgemm_task_list **task_list) {


  if (*task_list == NULL) {

    *task_list = create_grid_context_dgemm(

        orthorhombic, ntasks, nlevels, natoms, nkinds, nblocks, block_offsets,

        atom_positions, atom_kinds, basis_sets, level_list, iatom_list,

        jatom_list, iset_list, jset_list, ipgf_list, jpgf_list,

        border_mask_list, block_num_list, radius_list, rab_list, npts_global,

        npts_local, shift_local, border_width, dh, dh_inv);

  } else {

    update_grid_context_dgemm(

        orthorhombic, ntasks, nlevels, natoms, nkinds, nblocks, block_offsets,

        atom_positions, atom_kinds, basis_sets, level_list, iatom_list,

        jatom_list, iset_list, jset_list, ipgf_list, jpgf_list,

        border_mask_list, block_num_list, radius_list, rab_list, npts_global,

        npts_local, shift_local, border_width, dh, dh_inv, *task_list);

  }


  const grid_library_config config = grid_library_get_config();

  if (config.apply_cutoff) {

    apply_cutoff(*task_list);

  }

}


/*******************************************************************************

 * \brief Deallocates given task list, basis_sets have to be freed separately.

 ******************************************************************************/


void grid_dgemm_free_task_list(grid_dgemm_task_list *task_list) {

  destroy_grid_context_dgemm(task_list);

}


imax
static int imax(int x, int y)
Returns the larger of two given integer (missing from the C standard)
Definition dbm_distribution.c:73

max_threads
static int max_threads
Definition dbm_library.c:24

grid
static void const int const int const int const int const int const double const int const int const int int GRID_CONST_WHEN_COLLOCATE double GRID_CONST_WHEN_INTEGRATE double * grid
Definition grid_cpu_collint.h:169

i
static void const int const int i
Definition grid_cpu_collint.h:38

npts_local
static void const int const int const int const int const int const double const int const int const int npts_local[3]
Definition grid_cpu_collint.h:167

grid_dgemm_collocate.h

collocate_destroy_handle
void collocate_destroy_handle(void *gaussian_handle)
Definition grid_dgemm_collocation_integration.c:60

collocate_create_handle
struct collocation_integration_ * collocate_create_handle(void)
Definition grid_dgemm_collocation_integration.c:20

grid_dgemm_collocation_integration.h

update_layouts
void update_layouts(const int nlevels, const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3], grid_context *ctx)
Definition grid_dgemm_context.c:303

update_grid
void update_grid(const int nlevels, grid_context *ctx)
Definition grid_dgemm_context.c:333

update_atoms_kinds
void update_atoms_kinds(const int natoms, const int *atoms_kinds, grid_context *data)
Definition grid_dgemm_context.c:107

update_grid_context_dgemm
void update_grid_context_dgemm(const bool orthorhombic, const int ntasks, const int nlevels, const int natoms, const int nkinds, const int nblocks, const int *block_offsets, const double atom_positions[natoms][3], const int *const atom_kinds, const grid_basis_set **const basis_sets, const int *const level_list, const int *const iatom_list, const int *jatom_list, const int *const iset_list, const int *const jset_list, const int *const ipgf_list, const int *const jpgf_list, const int *const border_mask_list, const int *block_num_list, const double *const radius_list, const double rab_list[ntasks][3], const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3], void *ptr)
Definition grid_dgemm_context.c:399

create_grid_context_dgemm
void * create_grid_context_dgemm(const bool orthorhombic, const int ntasks, const int nlevels, const int natoms, const int nkinds, const int nblocks, const int *block_offsets, const double atom_positions[natoms][3], const int *const atom_kinds, const grid_basis_set **const basis_sets, const int *const level_list, const int *const iatom_list, const int *jatom_list, const int *const iset_list, const int *const jset_list, const int *const ipgf_list, const int *const jpgf_list, const int *const border_mask_list, const int *block_num_list, const double *const radius_list, const double rab_list[ntasks][3], const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3])
Definition grid_dgemm_context.c:352

is_grid_orthorhombic
int is_grid_orthorhombic(void *const ptr)
Definition grid_dgemm_context.c:67

update_block_offsets
void update_block_offsets(const int nblocks, const int *const block_offsets, grid_context *data)
Definition grid_dgemm_context.c:131

return_device_id
int return_device_id(void *const ptr, const int device)
Definition grid_dgemm_context.c:60

destroy_grid_context_dgemm
void destroy_grid_context_dgemm(void *ptr)
Definition grid_dgemm_context.c:458

return_dh
void return_dh(void *const ptr, const int level, double *const dh)
Definition grid_dgemm_context.c:23

update_task_lists
void update_task_lists(const int nlevels, const int ntasks, const int *const level_list, const int *const iatom_list, const int *const jatom_list, const int *const iset_list, const int *const jset_list, const int *const ipgf_list, const int *const jpgf_list, const int *const border_mask_list, const int *block_num_list, const double *const radius_list, const double rab_list[ntasks][3], grid_context *ctx)
Definition grid_dgemm_context.c:167

apply_cutoff
void apply_cutoff(void *ptr)
Definition grid_dgemm_context.c:484

return_num_devs
int return_num_devs(void *const ptr)
Definition grid_dgemm_context.c:53

return_dh_inv
void return_dh_inv(void *const ptr, const int level, double *const dh_inv)
Definition grid_dgemm_context.c:38

update_basis_set
void update_basis_set(const int nkinds, const grid_basis_set **const basis_sets, grid_context *data)
Definition grid_dgemm_context.c:152

grid_dgemm_create_task_list
void grid_dgemm_create_task_list(const bool orthorhombic, const int ntasks, const int nlevels, const int natoms, const int nkinds, const int nblocks, const int block_offsets[nblocks], const double atom_positions[natoms][3], const int atom_kinds[natoms], const grid_basis_set *basis_sets[nkinds], const int level_list[ntasks], const int iatom_list[ntasks], const int jatom_list[ntasks], const int iset_list[ntasks], const int jset_list[ntasks], const int ipgf_list[ntasks], const int jpgf_list[ntasks], const int border_mask_list[ntasks], const int block_num_list[ntasks], const double radius_list[ntasks], const double rab_list[ntasks][3], const int npts_global[nlevels][3], const int npts_local[nlevels][3], const int shift_local[nlevels][3], const int border_width[nlevels][3], const double dh[nlevels][3][3], const double dh_inv[nlevels][3][3], grid_dgemm_task_list **task_list)
Allocates a task list for the dgemm backend. See grid_task_list.h for details.
Definition grid_dgemm_context.c:559

update_atoms_position
void update_atoms_position(const int natoms, const double atoms_positions[natoms][3], grid_context *data)
Definition grid_dgemm_context.c:79

grid_dgemm_free_task_list
void grid_dgemm_free_task_list(grid_dgemm_task_list *task_list)
Deallocates given task list, basis_sets have to be freed separately.
Definition grid_dgemm_context.c:599

update_queue_length
void update_queue_length(void *const ptr, const int queue_length)
Definition grid_dgemm_context.c:73

set_grid_parameters
void set_grid_parameters(tensor *grid, const bool orthorhombic, const int grid_full_size[3], const int grid_local_size[3], const int shift_local[3], const int border_width[3], const double dh[3][3], const double dh_inv[3][3], offload_buffer *grid_)
Definition grid_dgemm_context.c:491

initialize_grid_context_on_gpu
void initialize_grid_context_on_gpu(void *ptr, const int number_of_devices, const int *device_id)
Definition grid_dgemm_context.c:438

grid_dgemm_context.h

grid_dgemm_private_header.h

ctx_checksum
@ ctx_checksum
Definition grid_dgemm_private_header.h:19

grid_dgemm_task_list.h

grid_dgemm_tensor_local.h

setup_grid_window
static void setup_grid_window(tensor *const grid, const int *const shift_local, const int *const border_width, const int border_mask)
Definition grid_dgemm_tensor_local.h:220

setup_global_grid_size
static void setup_global_grid_size(tensor *const grid, const int *const full_size)
Definition grid_dgemm_tensor_local.h:198

initialize_tensor_3
static void initialize_tensor_3(struct tensor_ *a, int n1, int n2, int n3)
Definition grid_dgemm_tensor_local.h:91

verify_orthogonality
void verify_orthogonality(const double dh[3][3], bool orthogonal[3])
Definition grid_dgemm_utils.c:372

grid_dgemm_utils.h

config
static grid_library_config config
Definition grid_library.c:33

grid_library_get_config
grid_library_config grid_library_get_config(void)
Returns the library config.
Definition grid_library.c:123

_layout
Definition grid_dgemm_private_header.h:51

_layout::shift_local
int shift_local[3]
Definition grid_dgemm_private_header.h:54

_layout::border_width
int border_width[3]
Definition grid_dgemm_private_header.h:55

_layout::npts_global
int npts_global[3]
Definition grid_dgemm_private_header.h:52

_layout::npts_local
int npts_local[3]
Definition grid_dgemm_private_header.h:53

_layout::dh
double dh[3][3]
Definition grid_dgemm_private_header.h:56

_layout::dh_inv
double dh_inv[3][3]
Definition grid_dgemm_private_header.h:57

_task
Definition grid_dgemm_private_header.h:25

_task::prefactor
double prefactor
Definition grid_dgemm_private_header.h:47

_task::rp
double rp[3]
Definition grid_dgemm_private_header.h:40

_task::rab
double rab[3]
Definition grid_dgemm_private_header.h:46

_task::radius
double radius
Definition grid_dgemm_private_header.h:35

_task::ipgf
int ipgf
Definition grid_dgemm_private_header.h:31

_task::lmin
int lmin[2]
Definition grid_dgemm_private_header.h:42

_task::iset
int iset
Definition grid_dgemm_private_header.h:29

_task::zeta
double zeta[2]
Definition grid_dgemm_private_header.h:37

_task::ra
double ra[3]
Definition grid_dgemm_private_header.h:38

_task::border_mask
int border_mask
Definition grid_dgemm_private_header.h:33

_task::zetp
double zetp
Definition grid_dgemm_private_header.h:36

_task::offset
int offset[2]
Definition grid_dgemm_private_header.h:44

_task::update_block_
bool update_block_
Definition grid_dgemm_private_header.h:45

_task::level
int level
Definition grid_dgemm_private_header.h:26

_task::lmax
int lmax[2]
Definition grid_dgemm_private_header.h:41

_task::block_num
int block_num
Definition grid_dgemm_private_header.h:34

_task::jpgf
int jpgf
Definition grid_dgemm_private_header.h:32

_task::iatom
int iatom
Definition grid_dgemm_private_header.h:27

_task::rb
double rb[3]
Definition grid_dgemm_private_header.h:39

_task::jset
int jset
Definition grid_dgemm_private_header.h:30

_task::jatom
int jatom
Definition grid_dgemm_private_header.h:28

collocation_integration_
Definition grid_dgemm_collocation_integration.h:22

grid_basis_set
Internal representation of a basis set.
Definition grid_basis_set.h:14

grid_basis_set::maxco
int maxco
Definition grid_basis_set.h:17

grid_basis_set::lmax
int * lmax
Definition grid_basis_set.h:20

grid_basis_set::zet
double * zet
Definition grid_basis_set.h:25

grid_basis_set::maxpgf
int maxpgf
Definition grid_basis_set.h:18

grid_basis_set::lmin
int * lmin
Definition grid_basis_set.h:19

grid_context_
Definition grid_dgemm_private_header.h:60

grid_context_::nkinds
int nkinds
Definition grid_dgemm_private_header.h:64

grid_context_::basis_sets
grid_basis_set ** basis_sets
Definition grid_dgemm_private_header.h:73

grid_context_::checksum
enum checksum_ checksum
Definition grid_dgemm_private_header.h:88

grid_context_::queue_length
int queue_length
Definition grid_dgemm_private_header.h:82

grid_context_::nblocks
int nblocks
Definition grid_dgemm_private_header.h:65

grid_context_::nkinds_total
int nkinds_total
Definition grid_dgemm_private_header.h:67

grid_context_::nlevels_total
int nlevels_total
Definition grid_dgemm_private_header.h:68

grid_context_::device_id
int * device_id
Definition grid_dgemm_private_header.h:81

grid_context_::number_of_devices
int number_of_devices
Definition grid_dgemm_private_header.h:80

grid_context_::apply_cutoff
bool apply_cutoff
Definition grid_dgemm_private_header.h:78

grid_context_::nlevels
int nlevels
Definition grid_dgemm_private_header.h:62

grid_context_::atom_positions
double * atom_positions
Definition grid_dgemm_private_header.h:71

grid_context_::orthorhombic
bool orthorhombic
Definition grid_dgemm_private_header.h:87

grid_context_::tasks
_task ** tasks
Definition grid_dgemm_private_header.h:74

grid_context_::handler
struct collocation_integration_ ** handler
Definition grid_dgemm_private_header.h:83

grid_context_::work_on_gpu
bool work_on_gpu
Definition grid_dgemm_private_header.h:79

grid_context_::maxco
int maxco
Definition grid_dgemm_private_header.h:77

grid_context_::number_of_handler
int number_of_handler
Definition grid_dgemm_private_header.h:84

grid_context_::layouts
_layout * layouts
Definition grid_dgemm_private_header.h:75

grid_context_::grid
tensor * grid
Definition grid_dgemm_private_header.h:85

grid_context_::ntasks_total
int ntasks_total
Definition grid_dgemm_private_header.h:69

grid_context_::nblocks_total
int nblocks_total
Definition grid_dgemm_private_header.h:66

grid_context_::atom_kinds
int * atom_kinds
Definition grid_dgemm_private_header.h:72

grid_context_::natoms
int natoms
Definition grid_dgemm_private_header.h:63

grid_context_::tasks_per_level
int * tasks_per_level
Definition grid_dgemm_private_header.h:76

grid_context_::block_offsets
int * block_offsets
Definition grid_dgemm_private_header.h:70

grid_context_::ntasks
int ntasks
Definition grid_dgemm_private_header.h:61

grid_library_config
Configuration of the grid library.
Definition grid_library.h:34

grid_library_config::apply_cutoff
bool apply_cutoff
Definition grid_library.h:38

offload_buffer
Internal representation of a buffer.
Definition offload_buffer.h:16

offload_buffer::host_buffer
double * host_buffer
Definition offload_buffer.h:18

tensor_
Definition grid_dgemm_tensor_local.h:17

tensor_::dh
double dh[3][3]
Definition grid_dgemm_tensor_local.h:36

tensor_::dh_inv
double dh_inv[3][3]
Definition grid_dgemm_tensor_local.h:37