html/bilininteg__convection__ea_8cpp_source.html

// Copyright (c) 2010-2025, Lawrence Livermore National Security, LLC. Produced

// at the Lawrence Livermore National Laboratory. All Rights reserved. See files

// LICENSE and NOTICE for details. LLNL-CODE-806117.

//

// This file is part of the MFEM library. For more information and source code

// availability visit https://mfem.org.

//

// MFEM is free software; you can redistribute it and/or modify it under the

// terms of the BSD-3 license. We welcome feedback and contributions, see file

// CONTRIBUTING.md for details.


#include "../../general/forall.hpp"

#include "../bilininteg.hpp"

#include "../gridfunc.hpp"


namespace mfem

{


template<int T_D1D = 0, int T_Q1D = 0>

static void EAConvectionAssemble1D(const int NE,

                                   const Array<real_t> &b,

                                   const Array<real_t> &g,

                                   const Vector &padata,

                                   Vector &eadata,

                                   const bool add,

                                   const int d1d = 0,

                                   const int q1d = 0)

{

   const int D1D = T_D1D ? T_D1D : d1d;

   const int Q1D = T_Q1D ? T_Q1D : q1d;

   MFEM_VERIFY(D1D <= DeviceDofQuadLimits::Get().MAX_D1D, "");

   MFEM_VERIFY(Q1D <= DeviceDofQuadLimits::Get().MAX_Q1D, "");

   auto B = Reshape(b.Read(), Q1D, D1D);

   auto G = Reshape(g.Read(), Q1D, D1D);

   auto D = Reshape(padata.Read(), Q1D, NE);

   auto A = Reshape(eadata.ReadWrite(), D1D, D1D, NE);

   mfem::forall_2D(NE, D1D, D1D, [=] MFEM_HOST_DEVICE (int e)

   {

      const int D1D = T_D1D ? T_D1D : d1d;

      const int Q1D = T_Q1D ? T_Q1D : q1d;

      constexpr int MQ1 = T_Q1D ? T_Q1D : DofQuadLimits::MAX_Q1D;

      real_t r_Gi[MQ1];

      real_t r_Bj[MQ1];

      for (int q = 0; q < Q1D; q++)

      {

         r_Gi[q] = G(q,MFEM_THREAD_ID(x));

         r_Bj[q] = B(q,MFEM_THREAD_ID(y));

      }

      MFEM_FOREACH_THREAD(i1,x,D1D)

      {

         MFEM_FOREACH_THREAD(j1,y,D1D)

         {

            real_t val = 0.0;

            for (int k1 = 0; k1 < Q1D; ++k1)

            {

               val += r_Bj[k1] * D(k1, e) * r_Gi[k1];

            }

            if (add)

            {

               A(i1, j1, e) += val;

            }

            else

            {

               A(i1, j1, e) = val;

            }

         }

      }

   });

}


template<int T_D1D = 0, int T_Q1D = 0>

static void EAConvectionAssemble2D(const int NE,

                                   const Array<real_t> &b,

                                   const Array<real_t> &g,

                                   const Vector &padata,

                                   Vector &eadata,

                                   const bool add,

                                   const int d1d = 0,

                                   const int q1d = 0)

{

   const int D1D = T_D1D ? T_D1D : d1d;

   const int Q1D = T_Q1D ? T_Q1D : q1d;

   MFEM_VERIFY(D1D <= DeviceDofQuadLimits::Get().MAX_D1D, "");

   MFEM_VERIFY(Q1D <= DeviceDofQuadLimits::Get().MAX_Q1D, "");

   auto B = Reshape(b.Read(), Q1D, D1D);

   auto G = Reshape(g.Read(), Q1D, D1D);

   auto D = Reshape(padata.Read(), Q1D, Q1D, 2, NE);

   auto A = Reshape(eadata.ReadWrite(), D1D, D1D, D1D, D1D, NE);

   mfem::forall_2D(NE, D1D, D1D, [=] MFEM_HOST_DEVICE (int e)

   {

      const int D1D = T_D1D ? T_D1D : d1d;

      const int Q1D = T_Q1D ? T_Q1D : q1d;

      constexpr int MD1 = T_D1D ? T_D1D : DofQuadLimits::MAX_D1D;

      constexpr int MQ1 = T_Q1D ? T_Q1D : DofQuadLimits::MAX_Q1D;

      real_t r_B[MQ1][MD1];

      real_t r_G[MQ1][MD1];

      for (int d = 0; d < D1D; d++)

      {

         for (int q = 0; q < Q1D; q++)

         {

            r_B[q][d] = B(q,d);

            r_G[q][d] = G(q,d);

         }

      }

      MFEM_SHARED real_t s_D[MQ1][MQ1][2];

      MFEM_FOREACH_THREAD(k1,x,Q1D)

      {

         MFEM_FOREACH_THREAD(k2,y,Q1D)

         {

            s_D[k1][k2][0] = D(k1,k2,0,e);

            s_D[k1][k2][1] = D(k1,k2,1,e);

         }

      }

      MFEM_SYNC_THREAD;

      MFEM_FOREACH_THREAD(i1,x,D1D)

      {

         MFEM_FOREACH_THREAD(i2,y,D1D)

         {

            for (int j1 = 0; j1 < D1D; ++j1)

            {

               for (int j2 = 0; j2 < D1D; ++j2)

               {

                  real_t val = 0.0;

                  for (int k1 = 0; k1 < Q1D; ++k1)

                  {

                     for (int k2 = 0; k2 < Q1D; ++k2)

                     {

                        val += (r_G[k1][i1] * r_B[k2][i2] * s_D[k1][k2][0]

                                + r_B[k1][i1] * r_G[k2][i2] * s_D[k1][k2][1])

                               * r_B[k1][j1]* r_B[k2][j2];

                     }

                  }

                  if (add)

                  {

                     A(i1, i2, j1, j2, e) += val;

                  }

                  else

                  {

                     A(i1, i2, j1, j2, e) = val;

                  }

               }

            }

         }

      }

   });

}


template<int T_D1D = 0, int T_Q1D = 0>

static void EAConvectionAssemble3D(const int NE,

                                   const Array<real_t> &b,

                                   const Array<real_t> &g,

                                   const Vector &padata,

                                   Vector &eadata,

                                   const bool add,

                                   const int d1d = 0,

                                   const int q1d = 0)

{

   const int D1D = T_D1D ? T_D1D : d1d;

   const int Q1D = T_Q1D ? T_Q1D : q1d;

   MFEM_VERIFY(D1D <= DeviceDofQuadLimits::Get().MAX_D1D, "");

   MFEM_VERIFY(Q1D <= DeviceDofQuadLimits::Get().MAX_Q1D, "");

   auto B = Reshape(b.Read(), Q1D, D1D);

   auto G = Reshape(g.Read(), Q1D, D1D);

   auto D = Reshape(padata.Read(), Q1D, Q1D, Q1D, 3, NE);

   auto A = Reshape(eadata.ReadWrite(), D1D, D1D, D1D, D1D, D1D, D1D, NE);

   mfem::forall_3D(NE, D1D, D1D, D1D, [=] MFEM_HOST_DEVICE (int e)

   {

      const int D1D = T_D1D ? T_D1D : d1d;

      const int Q1D = T_Q1D ? T_Q1D : q1d;

      constexpr int MD1 = T_D1D ? T_D1D : DofQuadLimits::MAX_D1D;

      constexpr int MQ1 = T_Q1D ? T_Q1D : DofQuadLimits::MAX_Q1D;

      real_t r_B[MQ1][MD1];

      real_t r_G[MQ1][MD1];

      for (int d = 0; d < D1D; d++)

      {

         for (int q = 0; q < Q1D; q++)

         {

            r_B[q][d] = B(q,d);

            r_G[q][d] = G(q,d);

         }

      }

      MFEM_FOREACH_THREAD(i1,x,D1D)

      {

         MFEM_FOREACH_THREAD(i2,y,D1D)

         {

            MFEM_FOREACH_THREAD(i3,z,D1D)

            {

               for (int j1 = 0; j1 < D1D; ++j1)

               {

                  for (int j2 = 0; j2 < D1D; ++j2)

                  {

                     for (int j3 = 0; j3 < D1D; ++j3)

                     {

                        real_t val = 0.0;

                        for (int k1 = 0; k1 < Q1D; ++k1)

                        {

                           for (int k2 = 0; k2 < Q1D; ++k2)

                           {

                              for (int k3 = 0; k3 < Q1D; ++k3)

                              {

                                 real_t D0 = D(k1,k2,k3,0,e);

                                 real_t D1 = D(k1,k2,k3,1,e);

                                 real_t D2 = D(k1,k2,k3,2,e);

                                 val += (r_G[k1][i1] * r_B[k2][i2] * r_B[k3][i3] * D0

                                         + r_B[k1][i1] * r_G[k2][i2] * r_B[k3][i3] * D1

                                         + r_B[k1][i1] * r_B[k2][i2] * r_G[k3][i3] * D2)

                                        * r_B[k1][j1] * r_B[k2][j2] * r_B[k3][j3];

                              }

                           }

                        }

                        if (add)

                        {

                           A(i1, i2, i3, j1, j2, j3, e) += val;

                        }

                        else

                        {

                           A(i1, i2, i3, j1, j2, j3, e) = val;

                        }

                     }

                  }

               }

            }

         }

      }

   });

}


void ConvectionIntegrator::AssembleEA(const FiniteElementSpace &fes,

                                      Vector &ea_data,

                                      const bool add)

{

   AssemblePA(fes);

   ne = fes.GetMesh()->GetNE();

   const Array<real_t> &B = maps->B;

   const Array<real_t> &G = maps->G;

   if (dim == 1)

   {

      switch ((dofs1D << 4 ) | quad1D)

      {

         case 0x22: return EAConvectionAssemble1D<2,2>(ne,B,G,pa_data,ea_data,add);

         case 0x33: return EAConvectionAssemble1D<3,3>(ne,B,G,pa_data,ea_data,add);

         case 0x44: return EAConvectionAssemble1D<4,4>(ne,B,G,pa_data,ea_data,add);

         case 0x55: return EAConvectionAssemble1D<5,5>(ne,B,G,pa_data,ea_data,add);

         case 0x66: return EAConvectionAssemble1D<6,6>(ne,B,G,pa_data,ea_data,add);

         case 0x77: return EAConvectionAssemble1D<7,7>(ne,B,G,pa_data,ea_data,add);

         case 0x88: return EAConvectionAssemble1D<8,8>(ne,B,G,pa_data,ea_data,add);

         case 0x99: return EAConvectionAssemble1D<9,9>(ne,B,G,pa_data,ea_data,add);

         default:   return EAConvectionAssemble1D(ne,B,G,pa_data,ea_data,add,

                                                     dofs1D,quad1D);

      }

   }

   else if (dim == 2)

   {

      switch ((dofs1D << 4 ) | quad1D)

      {

         case 0x22: return EAConvectionAssemble2D<2,2>(ne,B,G,pa_data,ea_data,add);

         case 0x33: return EAConvectionAssemble2D<3,3>(ne,B,G,pa_data,ea_data,add);

         case 0x44: return EAConvectionAssemble2D<4,4>(ne,B,G,pa_data,ea_data,add);

         case 0x55: return EAConvectionAssemble2D<5,5>(ne,B,G,pa_data,ea_data,add);

         case 0x66: return EAConvectionAssemble2D<6,6>(ne,B,G,pa_data,ea_data,add);

         case 0x77: return EAConvectionAssemble2D<7,7>(ne,B,G,pa_data,ea_data,add);

         case 0x88: return EAConvectionAssemble2D<8,8>(ne,B,G,pa_data,ea_data,add);

         case 0x99: return EAConvectionAssemble2D<9,9>(ne,B,G,pa_data,ea_data,add);

         default:   return EAConvectionAssemble2D(ne,B,G,pa_data,ea_data,add,

                                                     dofs1D,quad1D);

      }

   }

   else if (dim == 3)

   {

      switch ((dofs1D << 4 ) | quad1D)

      {

         case 0x23: return EAConvectionAssemble3D<2,3>(ne,B,G,pa_data,ea_data,add);

         case 0x34: return EAConvectionAssemble3D<3,4>(ne,B,G,pa_data,ea_data,add);

         case 0x45: return EAConvectionAssemble3D<4,5>(ne,B,G,pa_data,ea_data,add);

         case 0x56: return EAConvectionAssemble3D<5,6>(ne,B,G,pa_data,ea_data,add);

         case 0x67: return EAConvectionAssemble3D<6,7>(ne,B,G,pa_data,ea_data,add);

         case 0x78: return EAConvectionAssemble3D<7,8>(ne,B,G,pa_data,ea_data,add);

         case 0x89: return EAConvectionAssemble3D<8,9>(ne,B,G,pa_data,ea_data,add);

         default:   return EAConvectionAssemble3D(ne,B,G,pa_data,ea_data,add,

                                                     dofs1D,quad1D);

      }

   }

   MFEM_ABORT("Unknown kernel.");

}


}

bilininteg.hpp

mfem::Array
Definition array.hpp:48

mfem::ConvectionIntegrator::maps
const DofToQuad * maps
Not owned.
Definition bilininteg.hpp:2488

mfem::ConvectionIntegrator::AssemblePA
void AssemblePA(const FiniteElementSpace &) override
Method defining partial assembly.

mfem::ConvectionIntegrator::quad1D
int quad1D
Definition bilininteg.hpp:2490

mfem::ConvectionIntegrator::ne
int ne
Definition bilininteg.hpp:2490

mfem::ConvectionIntegrator::dofs1D
int dofs1D
Definition bilininteg.hpp:2490

mfem::ConvectionIntegrator::AssembleEA
void AssembleEA(const FiniteElementSpace &fes, Vector &emat, const bool add) override
Method defining element assembly.
Definition bilininteg_convection_ea.cpp:228

mfem::ConvectionIntegrator::pa_data
Vector pa_data
Definition bilininteg.hpp:2487

mfem::ConvectionIntegrator::dim
int dim
Definition bilininteg.hpp:2490

mfem::DofToQuad::G
Array< real_t > G
Gradients/divergences/curls of basis functions evaluated at quadrature points.
Definition fe_base.hpp:214

mfem::DofToQuad::B
Array< real_t > B
Basis functions evaluated at quadrature points.
Definition fe_base.hpp:193

mfem::FiniteElementSpace
Class FiniteElementSpace - responsible for providing FEM view of the mesh, mainly managing the set of...
Definition fespace.hpp:208

mfem::FiniteElementSpace::GetMesh
Mesh * GetMesh() const
Returns the mesh.
Definition fespace.hpp:644

mfem::Mesh::GetNE
int GetNE() const
Returns number of elements.
Definition mesh.hpp:1377

mfem::Vector
Vector data type.
Definition vector.hpp:82

forall.hpp

gridfunc.hpp

b
real_t b
Definition lissajous.cpp:42

real_t
mfem::real_t real_t
Definition mtop_solvers.hpp:17

mfem
Definition CodeDocumentation.dox:1

mfem::add
void add(const Vector &v1, const Vector &v2, Vector &v)
Definition vector.cpp:414

mfem::Reshape
MFEM_HOST_DEVICE DeviceTensor< sizeof...(Dims), T > Reshape(T *ptr, Dims... dims)
Wrap a pointer as a DeviceTensor with automatically deduced template parameters.
Definition dtensor.hpp:138

mfem::forall_2D
void forall_2D(int N, int X, int Y, lambda &&body)
Definition forall.hpp:925

mfem::forall_3D
void forall_3D(int N, int X, int Y, int Z, lambda &&body)
Definition forall.hpp:937

mfem::DeviceDofQuadLimits::Get
static const DeviceDofQuadLimits & Get()
Return a const reference to the DeviceDofQuadLimits singleton.
Definition forall.hpp:128