d2/d2a/pao__ml_8F_source.html

!--------------------------------------------------------------------------------------------------!

!   CP2K: A general program to perform molecular dynamics simulations                              !

!   Copyright 2000-2025 CP2K developers group <https://cp2k.org>                                   !

!                                                                                                  !

!   SPDX-License-Identifier: GPL-2.0-or-later                                                      !

!--------------------------------------------------------------------------------------------------!


! **************************************************************************************************

!> \brief Main module for PAO Machine Learning

!> \author Ole Schuett

! **************************************************************************************************

MODULE pao_ml

   USE atomic_kind_types,               ONLY: atomic_kind_type,&

                                              get_atomic_kind

   USE basis_set_types,                 ONLY: gto_basis_set_type

   USE cell_methods,                    ONLY: cell_create

   USE cell_types,                      ONLY: cell_type

   USE cp_dbcsr_api,                    ONLY: dbcsr_iterator_blocks_left,&

                                              dbcsr_iterator_next_block,&

                                              dbcsr_iterator_start,&

                                              dbcsr_iterator_stop,&

                                              dbcsr_iterator_type,&

                                              dbcsr_type

   USE kinds,                           ONLY: default_path_length,&

                                              default_string_length,&

                                              dp

   USE machine,                         ONLY: m_flush

   USE message_passing,                 ONLY: mp_para_env_type

   USE pao_input,                       ONLY: id2str,&

                                              pao_ml_gp,&

                                              pao_ml_lazy,&

                                              pao_ml_nn,&

                                              pao_ml_prior_mean,&

                                              pao_ml_prior_zero,&

                                              pao_rotinv_param

   USE pao_io,                          ONLY: pao_ioblock_type,&

                                              pao_iokind_type,&

                                              pao_kinds_ensure_equal,&

                                              pao_read_raw

   USE pao_ml_descriptor,               ONLY: pao_ml_calc_descriptor

   USE pao_ml_gaussprocess,             ONLY: pao_ml_gp_gradient,&

                                              pao_ml_gp_predict,&

                                              pao_ml_gp_train

   USE pao_ml_neuralnet,                ONLY: pao_ml_nn_gradient,&

                                              pao_ml_nn_predict,&

                                              pao_ml_nn_train

   USE pao_types,                       ONLY: pao_env_type,&

                                              training_matrix_type

   USE particle_types,                  ONLY: particle_type

   USE qs_environment_types,            ONLY: get_qs_env,&

                                              qs_environment_type

   USE qs_kind_types,                   ONLY: get_qs_kind,&

                                              qs_kind_type

#include "./base/base_uses.f90"


   IMPLICIT NONE


   PRIVATE


   CHARACTER(len=*), PARAMETER, PRIVATE :: moduleN = 'pao_ml'


   PUBLIC :: pao_ml_init, pao_ml_predict, pao_ml_forces


   ! linked list used to group training points by kind

   TYPE training_point_type

      TYPE(training_point_type), POINTER       :: next => null()

      REAL(dp), DIMENSION(:), ALLOCATABLE      :: input

      REAL(dp), DIMENSION(:), ALLOCATABLE      :: output

   END TYPE training_point_type


   TYPE training_list_type

      CHARACTER(LEN=default_string_length)     :: kindname = ""

      TYPE(training_point_type), POINTER       :: head => null()

      INTEGER                                  :: npoints = 0

   END TYPE training_list_type


CONTAINS


! **************************************************************************************************

!> \brief Initializes the learning machinery

!> \param pao ...

!> \param qs_env ...

! **************************************************************************************************


   SUBROUTINE pao_ml_init(pao, qs_env)

      TYPE(pao_env_type), POINTER                        :: pao

      TYPE(qs_environment_type), POINTER                 :: qs_env


      INTEGER                                            :: i

      TYPE(atomic_kind_type), DIMENSION(:), POINTER      :: atomic_kind_set

      TYPE(mp_para_env_type), POINTER                    :: para_env

      TYPE(training_list_type), ALLOCATABLE, &

         DIMENSION(:)                                    :: training_lists


      IF (SIZE(pao%ml_training_set) == 0) RETURN


      IF (pao%iw > 0) WRITE (pao%iw, *) 'PAO|ML| Initializing maschine learning...'


      IF (pao%parameterization /= pao_rotinv_param) &

         cpabort("PAO maschine learning requires ROTINV parametrization")


      CALL get_qs_env(qs_env, para_env=para_env, atomic_kind_set=atomic_kind_set)


      ! create training-set data-structure

      ALLOCATE (training_lists(SIZE(atomic_kind_set)))

      DO i = 1, SIZE(training_lists)

         CALL get_atomic_kind(atomic_kind_set(i), name=training_lists(i)%kindname)

      END DO


      ! parses training files, calculates descriptors and stores all training-points as linked lists

      DO i = 1, SIZE(pao%ml_training_set)

         CALL add_to_training_list(pao, qs_env, training_lists, filename=pao%ml_training_set(i)%fn)

      END DO


      ! ensure there there are training points for all kinds that use pao

      CALL sanity_check(qs_env, training_lists)


      ! turns linked lists into matrices and syncs them across ranks

      CALL training_list2matrix(training_lists, pao%ml_training_matrices, para_env)


      ! calculate and subtract prior

      CALL pao_ml_substract_prior(pao%ml_prior, pao%ml_training_matrices)


      ! print some statistics about the training set and dump it upon request

      CALL pao_ml_print(pao, pao%ml_training_matrices)


      ! use training-set to train model

      CALL pao_ml_train(pao)


   END SUBROUTINE pao_ml_init


! **************************************************************************************************

!> \brief Reads the given file and adds its training points to linked lists.

!> \param pao ...

!> \param qs_env ...

!> \param training_lists ...

!> \param filename ...

! **************************************************************************************************

   SUBROUTINE add_to_training_list(pao, qs_env, training_lists, filename)

      TYPE(pao_env_type), POINTER                        :: pao

      TYPE(qs_environment_type), POINTER                 :: qs_env

      TYPE(training_list_type), DIMENSION(:)             :: training_lists

      CHARACTER(LEN=default_path_length)                 :: filename


      CHARACTER(LEN=default_string_length)               :: param

      INTEGER                                            :: iatom, ikind, natoms, nkinds, nparams

      INTEGER, ALLOCATABLE, DIMENSION(:)                 :: atom2kind, kindsmap

      INTEGER, DIMENSION(2)                              :: ml_range

      REAL(dp), ALLOCATABLE, DIMENSION(:, :)             :: hmat, positions

      TYPE(atomic_kind_type), DIMENSION(:), POINTER      :: atomic_kind_set

      TYPE(cell_type), POINTER                           :: cell

      TYPE(mp_para_env_type), POINTER                    :: para_env

      TYPE(pao_ioblock_type), ALLOCATABLE, DIMENSION(:)  :: xblocks

      TYPE(pao_iokind_type), ALLOCATABLE, DIMENSION(:)   :: kinds

      TYPE(particle_type), DIMENSION(:), POINTER         :: my_particle_set

      TYPE(qs_kind_type), DIMENSION(:), POINTER          :: qs_kind_set

      TYPE(training_point_type), POINTER                 :: new_point


      NULLIFY (new_point, cell)


      IF (pao%iw > 0) WRITE (pao%iw, '(A,A)') " PAO|ML| Reading training frame from file: ", trim(filename)


      CALL get_qs_env(qs_env, para_env=para_env)


      ! parse training data on first rank

      IF (para_env%is_source()) THEN

         CALL pao_read_raw(filename, param, hmat, kinds, atom2kind, positions, xblocks, ml_range)


         ! check parametrization

         IF (trim(param) .NE. trim(adjustl(id2str(pao%parameterization)))) &

            cpabort("Restart PAO parametrization does not match")


         ! map read-in kinds onto kinds of this run

         CALL match_kinds(pao, qs_env, kinds, kindsmap)

         nkinds = SIZE(kindsmap)

         natoms = SIZE(positions, 1)

      END IF


      ! broadcast parsed raw training data

      CALL para_env%bcast(nkinds)

      CALL para_env%bcast(natoms)

      IF (.NOT. para_env%is_source()) THEN

         ALLOCATE (hmat(3, 3))

         ALLOCATE (kindsmap(nkinds))

         ALLOCATE (positions(natoms, 3))

         ALLOCATE (atom2kind(natoms))

      END IF

      CALL para_env%bcast(hmat)

      CALL para_env%bcast(kindsmap)

      CALL para_env%bcast(atom2kind)

      CALL para_env%bcast(positions)

      CALL para_env%bcast(ml_range)


      IF (ml_range(1) /= 1 .OR. ml_range(2) /= natoms) THEN

         cpwarn("Skipping some atoms for PAO-ML training.")

      END IF


      ! create cell from read-in h-matrix

      CALL cell_create(cell, hmat)


      ! create a particle_set based on read-in positions and refere to kinds of this run

      CALL get_qs_env(qs_env, atomic_kind_set=atomic_kind_set, qs_kind_set=qs_kind_set)

      ALLOCATE (my_particle_set(natoms))

      DO iatom = 1, natoms

         ikind = kindsmap(atom2kind(iatom))

         my_particle_set(iatom)%atomic_kind => atomic_kind_set(ikind)

         my_particle_set(iatom)%r = positions(iatom, :)

      END DO


      ! fill linked list with training points

      ! Afterwards all ranks will have lists with the same number of entries,

      ! however the input and output arrays will only be allocated on one rank per entry.

      ! We farm out the expensive calculation of the descriptor across ranks.

      DO iatom = 1, natoms

         IF (iatom < ml_range(1) .OR. ml_range(2) < iatom) cycle

         ALLOCATE (new_point)


         ! training-point input, calculate descriptor only on one rank

         IF (mod(iatom - 1, para_env%num_pe) == para_env%mepos) THEN

            CALL pao_ml_calc_descriptor(pao, &

                                        my_particle_set, &

                                        qs_kind_set, &

                                        cell, &

                                        iatom=iatom, &

                                        descriptor=new_point%input)

         END IF


         ! copy training-point output on first rank

         IF (para_env%is_source()) THEN

            nparams = SIZE(xblocks(iatom)%p, 1)

            ALLOCATE (new_point%output(nparams))

            new_point%output(:) = xblocks(iatom)%p(:, 1)

         END IF


         ! add to linked list

         ikind = kindsmap(atom2kind(iatom))

         training_lists(ikind)%npoints = training_lists(ikind)%npoints + 1

         new_point%next => training_lists(ikind)%head

         training_lists(ikind)%head => new_point

      END DO


      DEALLOCATE (cell, my_particle_set, hmat, kindsmap, positions, atom2kind)


   END SUBROUTINE add_to_training_list


! **************************************************************************************************

!> \brief Make read-in kinds on to atomic-kinds of this run

!> \param pao ...

!> \param qs_env ...

!> \param kinds ...

!> \param kindsmap ...

! **************************************************************************************************

   SUBROUTINE match_kinds(pao, qs_env, kinds, kindsmap)

      TYPE(pao_env_type), POINTER                        :: pao

      TYPE(qs_environment_type), POINTER                 :: qs_env

      TYPE(pao_iokind_type), DIMENSION(:)                :: kinds

      INTEGER, ALLOCATABLE, DIMENSION(:)                 :: kindsmap


      CHARACTER(LEN=default_string_length)               :: name

      INTEGER                                            :: ikind, jkind

      TYPE(atomic_kind_type), DIMENSION(:), POINTER      :: atomic_kind_set


      CALL get_qs_env(qs_env, atomic_kind_set=atomic_kind_set)


      cpassert(.NOT. ALLOCATED(kindsmap))

      ALLOCATE (kindsmap(SIZE(kinds)))

      kindsmap(:) = -1


      DO ikind = 1, SIZE(kinds)

         DO jkind = 1, SIZE(atomic_kind_set)

            CALL get_atomic_kind(atomic_kind_set(jkind), name=name)

            ! match kinds via their name

            IF (trim(kinds(ikind)%name) .EQ. trim(name)) THEN

               CALL pao_kinds_ensure_equal(pao, qs_env, jkind, kinds(ikind))

               kindsmap(ikind) = jkind

               EXIT

            END IF

         END DO

      END DO


      IF (any(kindsmap < 1)) &

         cpabort("PAO: Could not match all kinds from training set")

   END SUBROUTINE match_kinds


! **************************************************************************************************

!> \brief Checks that there is at least one training point per pao-enabled kind

!> \param qs_env ...

!> \param training_lists ...

! **************************************************************************************************

   SUBROUTINE sanity_check(qs_env, training_lists)

      TYPE(qs_environment_type), POINTER                 :: qs_env

      TYPE(training_list_type), DIMENSION(:), TARGET     :: training_lists


      INTEGER                                            :: ikind, pao_basis_size

      TYPE(gto_basis_set_type), POINTER                  :: basis_set

      TYPE(qs_kind_type), DIMENSION(:), POINTER          :: qs_kind_set

      TYPE(training_list_type), POINTER                  :: training_list


      CALL get_qs_env(qs_env, qs_kind_set=qs_kind_set)


      DO ikind = 1, SIZE(training_lists)

         training_list => training_lists(ikind)

         IF (training_list%npoints > 0) cycle ! it's ok

         CALL get_qs_kind(qs_kind_set(ikind), basis_set=basis_set, pao_basis_size=pao_basis_size)

         IF (pao_basis_size /= basis_set%nsgf) & ! if this kind has pao enabled...

            cpabort("Found no training-points for kind: "//trim(training_list%kindname))

      END DO


   END SUBROUTINE sanity_check


! **************************************************************************************************

!> \brief Turns the linked lists of training points into matrices

!> \param training_lists ...

!> \param training_matrices ...

!> \param para_env ...

! **************************************************************************************************

   SUBROUTINE training_list2matrix(training_lists, training_matrices, para_env)

      TYPE(training_list_type), ALLOCATABLE, &

         DIMENSION(:), TARGET                            :: training_lists

      TYPE(training_matrix_type), ALLOCATABLE, &

         DIMENSION(:), TARGET                            :: training_matrices

      TYPE(mp_para_env_type), POINTER                    :: para_env


      INTEGER                                            :: i, ikind, inp_size, ninputs, noutputs, &

                                                            npoints, out_size

      TYPE(training_list_type), POINTER                  :: training_list

      TYPE(training_matrix_type), POINTER                :: training_matrix

      TYPE(training_point_type), POINTER                 :: cur_point, prev_point


      cpassert(ALLOCATED(training_lists) .AND. .NOT. ALLOCATED(training_matrices))


      ALLOCATE (training_matrices(SIZE(training_lists)))


      DO ikind = 1, SIZE(training_lists)

         training_list => training_lists(ikind)

         training_matrix => training_matrices(ikind)

         training_matrix%kindname = training_list%kindname ! copy kindname

         npoints = training_list%npoints ! number of points

         IF (npoints == 0) THEN

            ALLOCATE (training_matrix%inputs(0, 0))

            ALLOCATE (training_matrix%outputs(0, 0))

            cycle

         END IF


         ! figure out size of input and output

         inp_size = 0; out_size = 0

         IF (ALLOCATED(training_list%head%input)) &

            inp_size = SIZE(training_list%head%input)

         IF (ALLOCATED(training_list%head%output)) &

            out_size = SIZE(training_list%head%output)

         CALL para_env%sum(inp_size)

         CALL para_env%sum(out_size)


         ! allocate matices to hold all training points

         ALLOCATE (training_matrix%inputs(inp_size, npoints))

         ALLOCATE (training_matrix%outputs(out_size, npoints))

         training_matrix%inputs(:, :) = 0.0_dp

         training_matrix%outputs(:, :) = 0.0_dp


         ! loop over all training points, consume linked-list in the process

         ninputs = 0; noutputs = 0

         cur_point => training_list%head

         NULLIFY (training_list%head)

         DO i = 1, npoints

            IF (ALLOCATED(cur_point%input)) THEN

               training_matrix%inputs(:, i) = cur_point%input(:)

               ninputs = ninputs + 1

            END IF

            IF (ALLOCATED(cur_point%output)) THEN

               training_matrix%outputs(:, i) = cur_point%output(:)

               noutputs = noutputs + 1

            END IF

            ! advance to next entry and deallocate the current one

            prev_point => cur_point

            cur_point => cur_point%next

            DEALLOCATE (prev_point)

         END DO

         training_list%npoints = 0 ! list is now empty


         ! sync training_matrix across ranks

         CALL para_env%sum(training_matrix%inputs)

         CALL para_env%sum(training_matrix%outputs)


         ! sanity check

         CALL para_env%sum(noutputs)

         CALL para_env%sum(ninputs)

         cpassert(noutputs == npoints .AND. ninputs == npoints)

      END DO


   END SUBROUTINE training_list2matrix


! **************************************************************************************************

!> \brief TODO

!> \param ml_prior ...

!> \param training_matrices ...

! **************************************************************************************************

   SUBROUTINE pao_ml_substract_prior(ml_prior, training_matrices)

      INTEGER, INTENT(IN)                                :: ml_prior

      TYPE(training_matrix_type), DIMENSION(:), TARGET   :: training_matrices


      INTEGER                                            :: i, ikind, npoints, out_size

      TYPE(training_matrix_type), POINTER                :: training_matrix


      DO ikind = 1, SIZE(training_matrices)

         training_matrix => training_matrices(ikind)

         out_size = SIZE(training_matrix%outputs, 1)

         npoints = SIZE(training_matrix%outputs, 2)

         IF (npoints == 0) cycle

         ALLOCATE (training_matrix%prior(out_size))


         ! calculate prior

         SELECT CASE (ml_prior)

         CASE (pao_ml_prior_zero)

            training_matrix%prior(:) = 0.0_dp

         CASE (pao_ml_prior_mean)

            training_matrix%prior(:) = sum(training_matrix%outputs, 2)/real(npoints, dp)

         CASE DEFAULT

            cpabort("PAO: unknown prior")

         END SELECT


         ! subtract prior from all training points

         DO i = 1, npoints

            training_matrix%outputs(:, i) = training_matrix%outputs(:, i) - training_matrix%prior

         END DO

      END DO


   END SUBROUTINE pao_ml_substract_prior


! **************************************************************************************************

!> \brief Print some statistics about the training set and dump it upon request

!> \param pao ...

!> \param training_matrices ...

! **************************************************************************************************

   SUBROUTINE pao_ml_print(pao, training_matrices)

      TYPE(pao_env_type), POINTER                        :: pao

      TYPE(training_matrix_type), DIMENSION(:), TARGET   :: training_matrices


      INTEGER                                            :: i, ikind, n, npoints

      TYPE(training_matrix_type), POINTER                :: training_matrix


      ! dump training data

      IF (pao%iw_mldata > 0) THEN

         DO ikind = 1, SIZE(training_matrices)

            training_matrix => training_matrices(ikind)

            npoints = SIZE(training_matrix%outputs, 2)

            DO i = 1, npoints

               WRITE (pao%iw_mldata, *) "PAO|ML| training-point kind: ", trim(training_matrix%kindname), &

                  " point:", i, " in:", training_matrix%inputs(:, i), &

                  " out:", training_matrix%outputs(:, i)

            END DO

         END DO

         CALL m_flush(pao%iw_mldata)

      END IF


      ! print stats

      IF (pao%iw > 0) THEN

         DO ikind = 1, SIZE(training_matrices)

            training_matrix => training_matrices(ikind)

            n = SIZE(training_matrix%inputs)

            IF (n == 0) cycle

            WRITE (pao%iw, "(A,I3,A,E10.1,1X,E10.1,1X,E10.1)") " PAO|ML| Descriptor for kind: "// &

               trim(training_matrix%kindname)//" size: ", &

               SIZE(training_matrix%inputs, 1), " min/mean/max: ", &

               minval(training_matrix%inputs), &

               sum(training_matrix%inputs)/real(n, dp), &

               maxval(training_matrix%inputs)

         END DO

      END IF


   END SUBROUTINE pao_ml_print


! **************************************************************************************************

!> \brief Calls the actual learning algorthim to traing on the given matrices

!> \param pao ...

! **************************************************************************************************

   SUBROUTINE pao_ml_train(pao)

      TYPE(pao_env_type), POINTER                        :: pao


      CHARACTER(len=*), PARAMETER                        :: routinen = 'pao_ml_train'


      INTEGER                                            :: handle


      CALL timeset(routinen, handle)


      SELECT CASE (pao%ml_method)

      CASE (pao_ml_gp)

         CALL pao_ml_gp_train(pao)

      CASE (pao_ml_nn)

         CALL pao_ml_nn_train(pao)

      CASE (pao_ml_lazy)

         ! nothing to do

      CASE DEFAULT

         cpabort("PAO: unknown machine learning scheme")

      END SELECT


      CALL timestop(handle)


   END SUBROUTINE pao_ml_train


! **************************************************************************************************

!> \brief Fills pao%matrix_X based on machine learning predictions

!> \param pao ...

!> \param qs_env ...

! **************************************************************************************************


   SUBROUTINE pao_ml_predict(pao, qs_env)

      TYPE(pao_env_type), POINTER                        :: pao

      TYPE(qs_environment_type), POINTER                 :: qs_env


      CHARACTER(len=*), PARAMETER                        :: routinen = 'pao_ml_predict'


      INTEGER                                            :: acol, arow, handle, iatom, ikind, natoms

      REAL(dp), ALLOCATABLE, DIMENSION(:)                :: descriptor, variances

      REAL(dp), DIMENSION(:, :), POINTER                 :: block_x

      TYPE(atomic_kind_type), DIMENSION(:), POINTER      :: atomic_kind_set

      TYPE(cell_type), POINTER                           :: cell

      TYPE(dbcsr_iterator_type)                          :: iter

      TYPE(mp_para_env_type), POINTER                    :: para_env

      TYPE(particle_type), DIMENSION(:), POINTER         :: particle_set

      TYPE(qs_kind_type), DIMENSION(:), POINTER          :: qs_kind_set


      CALL timeset(routinen, handle)


      CALL get_qs_env(qs_env, &

                      para_env=para_env, &

                      cell=cell, &

                      particle_set=particle_set, &

                      atomic_kind_set=atomic_kind_set, &

                      qs_kind_set=qs_kind_set, &

                      natom=natoms)


      ! fill matrix_X

      ALLOCATE (variances(natoms))

      variances(:) = 0.0_dp

!$OMP PARALLEL DEFAULT(NONE) SHARED(pao,qs_env,particle_set,qs_kind_set,cell,variances) &

!$OMP PRIVATE(iter,arow,acol,iatom,ikind,descriptor,block_X)

      CALL dbcsr_iterator_start(iter, pao%matrix_X)

      DO WHILE (dbcsr_iterator_blocks_left(iter))

         CALL dbcsr_iterator_next_block(iter, arow, acol, block_x)

         iatom = arow; cpassert(arow == acol)

         CALL get_atomic_kind(particle_set(iatom)%atomic_kind, kind_number=ikind)

         IF (SIZE(block_x) == 0) cycle ! pao disabled for iatom


         ! calculate descriptor

         CALL pao_ml_calc_descriptor(pao, &

                                     particle_set, &

                                     qs_kind_set, &

                                     cell, &

                                     iatom, &

                                     descriptor)


         ! call actual machine learning for prediction

         CALL pao_ml_predict_low(pao, ikind=ikind, &

                                 descriptor=descriptor, &

                                 output=block_x(:, 1), &

                                 variance=variances(iatom))


         DEALLOCATE (descriptor)


         !add prior

         block_x(:, 1) = block_x(:, 1) + pao%ml_training_matrices(ikind)%prior

      END DO

      CALL dbcsr_iterator_stop(iter)

!$OMP END PARALLEL


      ! print variances

      CALL para_env%sum(variances)

      IF (pao%iw_mlvar > 0) THEN

         DO iatom = 1, natoms

            WRITE (pao%iw_mlvar, *) "PAO|ML| atom:", iatom, " prediction variance:", variances(iatom)

         END DO

         CALL m_flush(pao%iw_mlvar)

      END IF


      ! one-line summary

      IF (pao%iw > 0) WRITE (pao%iw, "(A,E20.10,A,T71,I10)") " PAO|ML| max prediction variance:", &

         maxval(variances), " for atom:", maxloc(variances)


      IF (maxval(variances) > pao%ml_tolerance) &

         cpabort("Variance of prediction above ML_TOLERANCE.")


      DEALLOCATE (variances)


      CALL timestop(handle)


   END SUBROUTINE pao_ml_predict


! **************************************************************************************************

!> \brief Queries the actual learning algorthim to make a prediction

!> \param pao ...

!> \param ikind ...

!> \param descriptor ...

!> \param output ...

!> \param variance ...

! **************************************************************************************************

   SUBROUTINE pao_ml_predict_low(pao, ikind, descriptor, output, variance)

      TYPE(pao_env_type), POINTER                        :: pao

      INTEGER, INTENT(IN)                                :: ikind

      REAL(dp), DIMENSION(:), INTENT(IN)                 :: descriptor

      REAL(dp), DIMENSION(:), INTENT(OUT)                :: output

      REAL(dp), INTENT(OUT)                              :: variance


      SELECT CASE (pao%ml_method)

      CASE (pao_ml_gp)

         CALL pao_ml_gp_predict(pao, ikind, descriptor, output, variance)

      CASE (pao_ml_nn)

         CALL pao_ml_nn_predict(pao, ikind, descriptor, output, variance)

      CASE (pao_ml_lazy)

         output = 0.0_dp ! let's be really lazy and just rely on the prior

         variance = 0

      CASE DEFAULT

         cpabort("PAO: unknown machine learning scheme")

      END SELECT


   END SUBROUTINE pao_ml_predict_low


! **************************************************************************************************

!> \brief Calculate forces contributed by machine learning

!> \param pao ...

!> \param qs_env ...

!> \param matrix_G ...

!> \param forces ...

! **************************************************************************************************


   SUBROUTINE pao_ml_forces(pao, qs_env, matrix_G, forces)

      TYPE(pao_env_type), POINTER                        :: pao

      TYPE(qs_environment_type), POINTER                 :: qs_env

      TYPE(dbcsr_type)                                   :: matrix_g

      REAL(dp), DIMENSION(:, :), INTENT(INOUT)           :: forces


      CHARACTER(len=*), PARAMETER                        :: routinen = 'pao_ml_forces'


      INTEGER                                            :: acol, arow, handle, iatom, ikind

      REAL(dp), ALLOCATABLE, DIMENSION(:)                :: descr_grad, descriptor

      REAL(dp), DIMENSION(:, :), POINTER                 :: block_g

      TYPE(atomic_kind_type), DIMENSION(:), POINTER      :: atomic_kind_set

      TYPE(cell_type), POINTER                           :: cell

      TYPE(dbcsr_iterator_type)                          :: iter

      TYPE(mp_para_env_type), POINTER                    :: para_env

      TYPE(particle_type), DIMENSION(:), POINTER         :: particle_set

      TYPE(qs_kind_type), DIMENSION(:), POINTER          :: qs_kind_set


      CALL timeset(routinen, handle)


      CALL get_qs_env(qs_env, &

                      para_env=para_env, &

                      cell=cell, &

                      particle_set=particle_set, &

                      atomic_kind_set=atomic_kind_set, &

                      qs_kind_set=qs_kind_set)


!$OMP PARALLEL DEFAULT(NONE) SHARED(pao,matrix_G,particle_set,qs_kind_set,cell) &

!$OMP REDUCTION(+:forces) &

!$OMP PRIVATE(iter,arow,acol,iatom,ikind,block_G,descriptor,descr_grad)

      CALL dbcsr_iterator_start(iter, matrix_g)

      DO WHILE (dbcsr_iterator_blocks_left(iter))

         CALL dbcsr_iterator_next_block(iter, arow, acol, block_g)

         iatom = arow; cpassert(arow == acol)

         CALL get_atomic_kind(particle_set(iatom)%atomic_kind, kind_number=ikind)

         IF (SIZE(block_g) == 0) cycle ! pao disabled for iatom


         ! calculate descriptor

         CALL pao_ml_calc_descriptor(pao, &

                                     particle_set, &

                                     qs_kind_set, &

                                     cell, &

                                     iatom=iatom, &

                                     descriptor=descriptor)


         ! calcaulte derivate of machine learning prediction

         CALL pao_ml_gradient_low(pao, ikind=ikind, &

                                  descriptor=descriptor, &

                                  outer_deriv=block_g(:, 1), &

                                  gradient=descr_grad)


         ! calculate force contributions from descriptor

         CALL pao_ml_calc_descriptor(pao, &

                                     particle_set, &

                                     qs_kind_set, &

                                     cell, &

                                     iatom=iatom, &

                                     descr_grad=descr_grad, &

                                     forces=forces)


         DEALLOCATE (descriptor, descr_grad)

      END DO

      CALL dbcsr_iterator_stop(iter)

!$OMP END PARALLEL


      CALL timestop(handle)


   END SUBROUTINE pao_ml_forces


! **************************************************************************************************

!> \brief Calculate gradient of machine learning algorithm

!> \param pao ...

!> \param ikind ...

!> \param descriptor ...

!> \param outer_deriv ...

!> \param gradient ...

! **************************************************************************************************

   SUBROUTINE pao_ml_gradient_low(pao, ikind, descriptor, outer_deriv, gradient)

      TYPE(pao_env_type), POINTER                        :: pao

      INTEGER, INTENT(IN)                                :: ikind

      REAL(dp), DIMENSION(:), INTENT(IN)                 :: descriptor, outer_deriv

      REAL(dp), ALLOCATABLE, DIMENSION(:)                :: gradient


      ALLOCATE (gradient(SIZE(descriptor)))


      SELECT CASE (pao%ml_method)

      CASE (pao_ml_gp)

         CALL pao_ml_gp_gradient(pao, ikind, descriptor, outer_deriv, gradient)

      CASE (pao_ml_nn)

         CALL pao_ml_nn_gradient(pao, ikind, descriptor, outer_deriv, gradient)

      CASE (pao_ml_lazy)

         gradient = 0.0_dp

      CASE DEFAULT

         cpabort("PAO: unknown machine learning scheme")

      END SELECT


   END SUBROUTINE pao_ml_gradient_low


END MODULE pao_ml

atomic_kind_types
Define the atomic kind types and their sub types.
Definition atomic_kind_types.F:23

atomic_kind_types::get_atomic_kind
subroutine, public get_atomic_kind(atomic_kind, fist_potential, element_symbol, name, mass, kind_number, natom, atom_list, rcov, rvdw, z, qeff, apol, cpol, mm_radius, shell, shell_active, damping)
Get attributes of an atomic kind.
Definition atomic_kind_types.F:138

basis_set_types
Definition basis_set_types.F:15

cell_methods
Handles all functions related to the CELL.
Definition cell_methods.F:15

cell_methods::cell_create
subroutine, public cell_create(cell, hmat, periodic, tag)
allocates and initializes a cell
Definition cell_methods.F:85

cell_types
Handles all functions related to the CELL.
Definition cell_types.F:15

cp_dbcsr_api
Definition cp_dbcsr_api.F:8

cp_dbcsr_api::dbcsr_iterator_next_block
subroutine, public dbcsr_iterator_next_block(iterator, row, column, block, block_number_argument_has_been_removed, row_size, col_size, row_offset, col_offset)
...
Definition cp_dbcsr_api.F:956

cp_dbcsr_api::dbcsr_iterator_blocks_left
logical function, public dbcsr_iterator_blocks_left(iterator)
...
Definition cp_dbcsr_api.F:930

cp_dbcsr_api::dbcsr_iterator_stop
subroutine, public dbcsr_iterator_stop(iterator)
...
Definition cp_dbcsr_api.F:1027

cp_dbcsr_api::dbcsr_iterator_start
subroutine, public dbcsr_iterator_start(iterator, matrix, shared, dynamic, dynamic_byrows)
...
Definition cp_dbcsr_api.F:989

kinds
Defines the basic variable types.
Definition kinds.F:23

kinds::dp
integer, parameter, public dp
Definition kinds.F:34

kinds::default_string_length
integer, parameter, public default_string_length
Definition kinds.F:57

kinds::default_path_length
integer, parameter, public default_path_length
Definition kinds.F:58

machine
Machine interface based on Fortran 2003 and POSIX.
Definition machine.F:17

machine::m_flush
subroutine, public m_flush(lunit)
flushes units if the &GLOBAL flag is set accordingly
Definition machine.F:130

message_passing
Interface to the message passing library MPI.
Definition message_passing.F:23

pao_input
Definition pao_input.F:8

pao_input::id2str
character(len=11) function, public id2str(id)
Helper routine.
Definition pao_input.F:216

pao_input::pao_ml_gp
integer, parameter, public pao_ml_gp
Definition pao_input.F:45

pao_input::pao_ml_prior_mean
integer, parameter, public pao_ml_prior_mean
Definition pao_input.F:45

pao_input::pao_ml_lazy
integer, parameter, public pao_ml_lazy
Definition pao_input.F:45

pao_input::pao_rotinv_param
integer, parameter, public pao_rotinv_param
Definition pao_input.F:45

pao_input::pao_ml_prior_zero
integer, parameter, public pao_ml_prior_zero
Definition pao_input.F:45

pao_input::pao_ml_nn
integer, parameter, public pao_ml_nn
Definition pao_input.F:45

pao_io
Routines for reading and writing restart files.
Definition pao_io.F:12

pao_io::pao_kinds_ensure_equal
subroutine, public pao_kinds_ensure_equal(pao, qs_env, ikind, pao_kind)
Ensure that the kind read from the restart is equal to the kind curretly in use.
Definition pao_io.F:326

pao_io::pao_read_raw
subroutine, public pao_read_raw(filename, param, hmat, kinds, atom2kind, positions, xblocks, ml_range)
Reads a restart file into temporary datastructures.
Definition pao_io.F:183

pao_ml_descriptor
Feature vectors for describing chemical environments in a rotationally invariant fashion.
Definition pao_ml_descriptor.F:12

pao_ml_descriptor::pao_ml_calc_descriptor
subroutine, public pao_ml_calc_descriptor(pao, particle_set, qs_kind_set, cell, iatom, descriptor, descr_grad, forces)
Calculates a descriptor for chemical environment of given atom.
Definition pao_ml_descriptor.F:55

pao_ml_gaussprocess
Gaussian Process implementation.
Definition pao_ml_gaussprocess.F:12

pao_ml_gaussprocess::pao_ml_gp_gradient
subroutine, public pao_ml_gp_gradient(pao, ikind, descriptor, outer_deriv, gradient)
Calculate gradient of Gaussian process.
Definition pao_ml_gaussprocess.F:130

pao_ml_gaussprocess::pao_ml_gp_train
subroutine, public pao_ml_gp_train(pao)
Builds the covariance matrix.
Definition pao_ml_gaussprocess.F:33

pao_ml_gaussprocess::pao_ml_gp_predict
subroutine, public pao_ml_gp_predict(pao, ikind, descriptor, output, variance)
Uses covariance matrix to make prediction.
Definition pao_ml_gaussprocess.F:81

pao_ml_neuralnet
Neural Network implementation.
Definition pao_ml_neuralnet.F:12

pao_ml_neuralnet::pao_ml_nn_gradient
subroutine, public pao_ml_nn_gradient(pao, ikind, descriptor, outer_deriv, gradient)
Calculate gradient of neural network.
Definition pao_ml_neuralnet.F:68

pao_ml_neuralnet::pao_ml_nn_train
subroutine, public pao_ml_nn_train(pao)
Trains the neural network on given training points.
Definition pao_ml_neuralnet.F:121

pao_ml_neuralnet::pao_ml_nn_predict
subroutine, public pao_ml_nn_predict(pao, ikind, descriptor, output, variance)
Uses neural network to make a prediction.
Definition pao_ml_neuralnet.F:44

pao_ml
Main module for PAO Machine Learning.
Definition pao_ml.F:12

pao_ml::pao_ml_forces
subroutine, public pao_ml_forces(pao, qs_env, matrix_g, forces)
Calculate forces contributed by machine learning.
Definition pao_ml.F:623

pao_ml::pao_ml_init
subroutine, public pao_ml_init(pao, qs_env)
Initializes the learning machinery.
Definition pao_ml.F:85

pao_ml::pao_ml_predict
subroutine, public pao_ml_predict(pao, qs_env)
Fills paomatrix_X based on machine learning predictions.
Definition pao_ml.F:505

pao_types
Types used by the PAO machinery.
Definition pao_types.F:12

particle_types
Define the data structure for the particle information.
Definition particle_types.F:19

qs_environment_types
Definition qs_environment_types.F:14

qs_environment_types::get_qs_env
subroutine, public get_qs_env(qs_env, atomic_kind_set, qs_kind_set, cell, super_cell, cell_ref, use_ref_cell, kpoints, dft_control, mos, sab_orb, sab_all, qmmm, qmmm_periodic, sac_ae, sac_ppl, sac_lri, sap_ppnl, sab_vdw, sab_scp, sap_oce, sab_lrc, sab_se, sab_xtbe, sab_tbe, sab_core, sab_xb, sab_xtb_pp, sab_xtb_nonbond, sab_almo, sab_kp, sab_kp_nosym, particle_set, energy, force, matrix_h, matrix_h_im, matrix_ks, matrix_ks_im, matrix_vxc, run_rtp, rtp, matrix_h_kp, matrix_h_im_kp, matrix_ks_kp, matrix_ks_im_kp, matrix_vxc_kp, kinetic_kp, matrix_s_kp, matrix_w_kp, matrix_s_ri_aux_kp, matrix_s, matrix_s_ri_aux, matrix_w, matrix_p_mp2, matrix_p_mp2_admm, rho, rho_xc, pw_env, ewald_env, ewald_pw, active_space, mpools, input, para_env, blacs_env, scf_control, rel_control, kinetic, qs_charges, vppl, rho_core, rho_nlcc, rho_nlcc_g, ks_env, ks_qmmm_env, wf_history, scf_env, local_particles, local_molecules, distribution_2d, dbcsr_dist, molecule_kind_set, molecule_set, subsys, cp_subsys, oce, local_rho_set, rho_atom_set, task_list, task_list_soft, rho0_atom_set, rho0_mpole, rhoz_set, ecoul_1c, rho0_s_rs, rho0_s_gs, do_kpoints, has_unit_metric, requires_mo_derivs, mo_derivs, mo_loc_history, nkind, natom, nelectron_total, nelectron_spin, efield, neighbor_list_id, linres_control, xas_env, virial, cp_ddapc_env, cp_ddapc_ewald, outer_scf_history, outer_scf_ihistory, x_data, et_coupling, dftb_potential, results, se_taper, se_store_int_env, se_nddo_mpole, se_nonbond_env, admm_env, lri_env, lri_density, exstate_env, ec_env, harris_env, dispersion_env, gcp_env, vee, rho_external, external_vxc, mask, mp2_env, bs_env, kg_env, wanniercentres, atprop, ls_scf_env, do_transport, transport_env, v_hartree_rspace, s_mstruct_changed, rho_changed, potential_changed, forces_up_to_date, mscfg_env, almo_scf_env, gradient_history, variable_history, embed_pot, spin_embed_pot, polar_env, mos_last_converged, eeq, rhs, tb_tblite)
Get the QUICKSTEP environment.
Definition qs_environment_types.F:518

qs_kind_types
Define the quickstep kind type and their sub types.
Definition qs_kind_types.F:23

qs_kind_types::get_qs_kind
subroutine, public get_qs_kind(qs_kind, basis_set, basis_type, ncgf, nsgf, all_potential, tnadd_potential, gth_potential, sgp_potential, upf_potential, se_parameter, dftb_parameter, xtb_parameter, dftb3_param, zatom, zeff, elec_conf, mao, lmax_dftb, alpha_core_charge, ccore_charge, core_charge, core_charge_radius, paw_proj_set, paw_atom, hard_radius, hard0_radius, max_rad_local, covalent_radius, vdw_radius, gpw_type_forced, harmonics, max_iso_not0, max_s_harm, grid_atom, ngrid_ang, ngrid_rad, lmax_rho0, dft_plus_u_atom, l_of_dft_plus_u, n_of_dft_plus_u, u_minus_j, u_of_dft_plus_u, j_of_dft_plus_u, alpha_of_dft_plus_u, beta_of_dft_plus_u, j0_of_dft_plus_u, occupation_of_dft_plus_u, dispersion, bs_occupation, magnetization, no_optimize, addel, laddel, naddel, orbitals, max_scf, eps_scf, smear, u_ramping, u_minus_j_target, eps_u_ramping, init_u_ramping_each_scf, reltmat, ghost, floating, name, element_symbol, pao_basis_size, pao_model_file, pao_potentials, pao_descriptors, nelec)
Get attributes of an atomic kind.
Definition qs_kind_types.F:454

atomic_kind_types::atomic_kind_type
Provides all information about an atomic kind.
Definition atomic_kind_types.F:45

basis_set_types::gto_basis_set_type
Definition basis_set_types.F:72

cell_types::cell_type
Type defining parameters related to the simulation cell.
Definition cell_types.F:55

cp_dbcsr_api::dbcsr_iterator_type
Definition cp_dbcsr_api.F:186

cp_dbcsr_api::dbcsr_type
Definition cp_dbcsr_api.F:174

message_passing::mp_para_env_type
stores all the informations relevant to an mpi environment
Definition message_passing.F:763

pao_io::pao_ioblock_type
Definition pao_io.F:63

pao_io::pao_iokind_type
Definition pao_io.F:67

pao_types::pao_env_type
Definition pao_types.F:147

pao_types::training_matrix_type
Definition pao_types.F:48

particle_types::particle_type
Definition particle_types.F:35

qs_environment_types::qs_environment_type
Definition qs_environment_types.F:219

qs_kind_types::qs_kind_type
Provides all information about a quickstep kind.
Definition qs_kind_types.F:171