html/magma_8cpp_source.html

// Copyright (c) 2010-2025, Lawrence Livermore National Security, LLC. Produced

// at the Lawrence Livermore National Laboratory. All Rights reserved. See files

// LICENSE and NOTICE for details. LLNL-CODE-806117.

//

// This file is part of the MFEM library. For more information and source code

// availability visit https://mfem.org.

//

// MFEM is free software; you can redistribute it and/or modify it under the

// terms of the BSD-3 license. We welcome feedback and contributions, see file

// CONTRIBUTING.md for details.


#include "magma.hpp"

#include "../lapack.hpp"

#include "../../general/forall.hpp"


#ifdef MFEM_USE_MAGMA


#ifdef MFEM_USE_SINGLE

#define MFEM_MAGMA_PREFIX(stub) magma_s ## stub

#define MFEM_MAGMABLAS_PREFIX(stub) magmablas_s ## stub

#elif defined(MFEM_USE_DOUBLE)

#define MFEM_MAGMA_PREFIX(stub) magma_d ## stub

#define MFEM_MAGMABLAS_PREFIX(stub) magmablas_d ## stub

#endif


namespace mfem

{


Magma::Magma()

{

   const magma_int_t status = magma_init();

   MFEM_VERIFY(status == MAGMA_SUCCESS, "Error initializing MAGMA.");

   magma_device_t dev;

   magma_getdevice(&dev);

   magma_queue_create(dev, &queue);

}


Magma::~Magma()

{

   magma_queue_destroy(queue);

   const magma_int_t status = magma_finalize();

   MFEM_VERIFY(status == MAGMA_SUCCESS, "Error finalizing MAGMA.");

}


Magma &Magma::Instance()

{

   static Magma magma;

   return magma;

}


magma_queue_t Magma::Queue()

{

   return Instance().queue;

}


void MagmaBatchedLinAlg::AddMult(const DenseTensor &A, const Vector &x,

                                 Vector &y, real_t alpha, real_t beta,

                                 Op op) const

{

   const bool tr = (op == Op::T);


   const int m = tr ? A.SizeJ() : A.SizeI();

   const int n = tr ? A.SizeI() : A.SizeJ();

   const int n_mat = A.SizeK();

   const int k = x.Size() / n / n_mat;


   auto d_A = A.Read();

   auto d_x = x.Read(); // Shape (n, k, n_mat);

   auto d_y = beta == 0.0 ? y.Write() : y.ReadWrite(); // Shape (m, k, n_mat);


   magma_trans_t magma_op = tr ? MagmaTrans : MagmaNoTrans;


   MFEM_MAGMABLAS_PREFIX(gemm_batched_strided)(

      magma_op, MagmaNoTrans, m, k, n, alpha, d_A, m, m*n, d_x, n, n*k,

      beta, d_y, m, m*k, n_mat, Magma::Queue());

}


void MagmaBatchedLinAlg::LUFactor(DenseTensor &A, Array<int> &P) const

{

   const int n = A.SizeI();

   const int n_mat = A.SizeK();


   P.SetSize(n*n_mat);


   real_t *A_base = A.ReadWrite();

   int *P_base = P.ReadWrite();


   Array<real_t*> A_ptrs(n_mat);

   Array<int*> P_ptrs(n_mat);

   real_t **d_A_ptrs = A_ptrs.Write();

   int **d_P_ptrs = P_ptrs.Write();

   mfem::forall(n_mat, [=] MFEM_HOST_DEVICE (int i)

   {

      d_A_ptrs[i] = A_base + i*n*n;

      d_P_ptrs[i] = P_base + i*n;

   });


   Array<int> info_array(n_mat);

   const magma_int_t status = MFEM_MAGMA_PREFIX(getrf_batched)(

                                 n, n, d_A_ptrs, n, d_P_ptrs,

                                 info_array.Write(), n_mat, Magma::Queue());

   MFEM_VERIFY(status == MAGMA_SUCCESS, "");

}


void MagmaBatchedLinAlg::LUSolve(

   const DenseTensor &LU, const Array<int> &P, Vector &x) const

{

   const int n = LU.SizeI();

   const int n_mat = LU.SizeK();

   const int n_rhs = x.Size() / n / n_mat;


   Array<real_t*> A_ptrs(n_mat);

   Array<real_t*> B_ptrs(n_mat);

   Array<int*> P_ptrs(n_mat);

   real_t **d_A_ptrs = A_ptrs.Write();

   real_t **d_B_ptrs = B_ptrs.Write();

   int **d_P_ptrs = P_ptrs.Write();


   {

      real_t *A_base = const_cast<real_t*>(LU.Read());

      real_t *B_base = x.ReadWrite();

      int *P_base = const_cast<int*>(P.Read());

      mfem::forall(n_mat, [=] MFEM_HOST_DEVICE (int i)

      {

         d_A_ptrs[i] = A_base + i*n*n;

         d_B_ptrs[i] = B_base + i*n*n_rhs;

         d_P_ptrs[i] = P_base + i*n;

      });

   }


   const magma_int_t status = MFEM_MAGMA_PREFIX(getrs_batched)(

                                 MagmaNoTrans, n, n_rhs, d_A_ptrs, n, d_P_ptrs,

                                 d_B_ptrs, n, n_mat, Magma::Queue());

   MFEM_VERIFY(status == MAGMA_SUCCESS, "");

}


void MagmaBatchedLinAlg::Invert(DenseTensor &A) const

{

   const int n = A.SizeI();

   const int n_mat = A.SizeK();


   DenseTensor LU(A.SizeI(), A.SizeJ(), A.SizeK());

   LU.Write();

   LU.GetMemory().CopyFrom(A.GetMemory(), A.TotalSize());


   Array<int> P(n*n_mat);


   Array<real_t*> LU_ptrs(n_mat);

   Array<real_t*> A_ptrs(n_mat);

   Array<int*> P_ptrs(n_mat);

   real_t **d_A_ptrs = A_ptrs.Write();

   real_t **d_LU_ptrs = LU_ptrs.Write();

   int **d_P_ptrs = P_ptrs.Write();

   {

      real_t *A_base = A.ReadWrite();

      real_t *LU_base = LU.Write();

      int *P_base = P.Write();

      mfem::forall(n_mat, [=] MFEM_HOST_DEVICE (int i)

      {

         d_A_ptrs[i] = A_base + i*n*n;

         d_LU_ptrs[i] = LU_base + i*n*n;

         d_P_ptrs[i] = P_base + i*n;

      });

   }


   Array<int> info_array(n_mat);

   magma_int_t status;


   status = MFEM_MAGMA_PREFIX(getrf_batched)(

               n, n, d_LU_ptrs, n, d_P_ptrs, info_array.Write(), n_mat,

               Magma::Queue());

   MFEM_VERIFY(status == MAGMA_SUCCESS, "");


   status = MFEM_MAGMA_PREFIX(getri_outofplace_batched)(

               n, d_LU_ptrs, n, d_P_ptrs, d_A_ptrs, n, info_array.Write(),

               n_mat, Magma::Queue());

   MFEM_VERIFY(status == MAGMA_SUCCESS, "");

}


} // namespace mfem


#endif

mfem::Array
Definition array.hpp:48

mfem::Array::ReadWrite
T * ReadWrite(bool on_dev=true)
Shortcut for mfem::ReadWrite(a.GetMemory(), a.Size(), on_dev).
Definition array.hpp:397

mfem::Array::SetSize
void SetSize(int nsize)
Change the logical size of the array, keep existing entries.
Definition array.hpp:840

mfem::Array::Write
T * Write(bool on_dev=true)
Shortcut for mfem::Write(a.GetMemory(), a.Size(), on_dev).
Definition array.hpp:389

mfem::Array::Read
const T * Read(bool on_dev=true) const
Shortcut for mfem::Read(a.GetMemory(), a.Size(), on_dev).
Definition array.hpp:381

mfem::BatchedLinAlg::Op
Op
Operation type (transposed or not transposed)
Definition batched.hpp:54

mfem::DenseTensor
Rank 3 tensor (array of matrices)
Definition densemat.hpp:1111

mfem::DenseTensor::GetMemory
Memory< real_t > & GetMemory()
Definition densemat.hpp:1229

mfem::DenseTensor::SizeJ
int SizeJ() const
Definition densemat.hpp:1129

mfem::DenseTensor::TotalSize
int TotalSize() const
Definition densemat.hpp:1132

mfem::DenseTensor::Read
const real_t * Read(bool on_dev=true) const
Shortcut for mfem::Read( GetMemory(), TotalSize(), on_dev).
Definition densemat.hpp:1242

mfem::DenseTensor::Write
real_t * Write(bool on_dev=true)
Shortcut for mfem::Write(GetMemory(), TotalSize(), on_dev).
Definition densemat.hpp:1248

mfem::DenseTensor::ReadWrite
real_t * ReadWrite(bool on_dev=true)
Shortcut for mfem::ReadWrite(GetMemory(), TotalSize(), on_dev).
Definition densemat.hpp:1254

mfem::DenseTensor::SizeI
int SizeI() const
Definition densemat.hpp:1128

mfem::DenseTensor::SizeK
int SizeK() const
Definition densemat.hpp:1130

mfem::MagmaBatchedLinAlg::LUSolve
void LUSolve(const DenseTensor &A, const Array< int > &P, Vector &x) const override
See BatchedLinAlg::LUSolve.
Definition magma.cpp:105

mfem::MagmaBatchedLinAlg::LUFactor
void LUFactor(DenseTensor &A, Array< int > &P) const override
See BatchedLinAlg::LUFactor.
Definition magma.cpp:78

mfem::MagmaBatchedLinAlg::AddMult
void AddMult(const DenseTensor &A, const Vector &x, Vector &y, real_t alpha=1.0, real_t beta=1.0, Op op=Op::N) const override
See BatchedLinAlg::AddMult.
Definition magma.cpp:56

mfem::MagmaBatchedLinAlg::Invert
void Invert(DenseTensor &A) const override
See BatchedLinAlg::Invert.
Definition magma.cpp:137

mfem::Magma::Queue
static magma_queue_t Queue()
Return the queue, creating it if needed.
Definition magma.cpp:51

mfem::Memory::CopyFrom
void CopyFrom(const Memory &src, int size)
Copy size entries from src to *this.
Definition mem_manager.hpp:1282

mfem::Vector
Vector data type.
Definition vector.hpp:82

mfem::Vector::Read
virtual const real_t * Read(bool on_dev=true) const
Shortcut for mfem::Read(vec.GetMemory(), vec.Size(), on_dev).
Definition vector.hpp:520

mfem::Vector::ReadWrite
virtual real_t * ReadWrite(bool on_dev=true)
Shortcut for mfem::ReadWrite(vec.GetMemory(), vec.Size(), on_dev).
Definition vector.hpp:536

mfem::Vector::Size
int Size() const
Returns the size of the vector.
Definition vector.hpp:234

mfem::Vector::Write
virtual real_t * Write(bool on_dev=true)
Shortcut for mfem::Write(vec.GetMemory(), vec.Size(), on_dev).
Definition vector.hpp:528

alpha
const real_t alpha
Definition ex15.cpp:369

forall.hpp

magma.hpp

mfem::future::dev
MFEM_HOST_DEVICE tensor< T, n, n > dev(const tensor< T, n, n > &A)
Calculates the deviator of a matrix (rank-2 tensor)
Definition tensor.hpp:1354

mfem
Definition CodeDocumentation.dox:1

mfem::real_t
float real_t
Definition config.hpp:46

mfem::forall
void forall(int N, lambda &&body)
Definition forall.hpp:839