4.5.2/lininteg__domain__grad_8cpp_source.html

 // Copyright (c) 2010-2023, Lawrence Livermore National Security, LLC. Produced
 // at the Lawrence Livermore National Laboratory. All Rights reserved. See files
 // LICENSE and NOTICE for details. LLNL-CODE-806117.
 //
 // This file is part of the MFEM library. For more information and source code
 // availability visit https://mfem.org.
 //
 // MFEM is free software; you can redistribute it and/or modify it under the
 // terms of the BSD-3 license. We welcome feedback and contributions, see file
 // CONTRIBUTING.md for details.

 #include "fem.hpp"
 #include "../fem/kernels.hpp"
 #include "../general/forall.hpp"

 namespace mfem
 {

 template<int T_D1D = 0, int T_Q1D = 0> static
 void DLFGradAssemble2D(const int vdim, const int ne, const int d, const int q,
                        const int *markers, const double *b, const double *g,
                        const double *jacobians,
                        const double *weights, const Vector &coeff, double *y)
 {
    const auto F = coeff.Read();
    const auto M = Reshape(markers, ne);
    const auto B = Reshape(b, q, d);
    const auto G = Reshape(g, q, d);
    const auto J = Reshape(jacobians, q, q, 2,2, ne);
    const auto W = Reshape(weights, q, q);
    const bool cst = coeff.Size() == vdim*2;
    const auto C = cst ? Reshape(F,2,vdim,1,1,1) : Reshape(F,2,vdim,q,q,ne);
    auto Y = Reshape(y, d,d, vdim, ne);

    MFEM_FORALL_2D(e, ne, q, q, 1,
    {
       if (M(e) == 0) { return; } // ignore

       constexpr int Q = T_Q1D ? T_Q1D : MAX_Q1D;
       constexpr int D = T_D1D ? T_D1D : MAX_D1D;

       MFEM_SHARED double sBGt[2][Q*D];
       MFEM_SHARED double sQQ[2][Q*Q];
       MFEM_SHARED double sDQ[2][D*Q];

       const DeviceMatrix Bt(sBGt[0], q, d);
       const DeviceMatrix Gt(sBGt[1], q, d);
       kernels::internal::LoadBGt<D,Q>(d, q, B, G, sBGt);

       const DeviceMatrix QQ0(sQQ[0], q, q);
       const DeviceMatrix QQ1(sQQ[1], q, q);

       const DeviceMatrix DQ0(sDQ[0], d, q);
       const DeviceMatrix DQ1(sDQ[1], d, q);

       for (int c = 0; c < vdim; ++c)
       {
          const double cst_val0 = C(0,c,0,0,0);
          const double cst_val1 = C(1,c,0,0,0);

          MFEM_FOREACH_THREAD(x,x,q)
          {
             MFEM_FOREACH_THREAD(y,y,q)
             {
                const double w = W(x,y);
                const double J11 = J(x,y,0,0,e);
                const double J21 = J(x,y,1,0,e);
                const double J12 = J(x,y,0,1,e);
                const double J22 = J(x,y,1,1,e);
                const double u = cst ? cst_val0 : C(0,c,x,y,e);
                const double v = cst ? cst_val1 : C(1,c,x,y,e);
                // QQ = w * det(J) * J^{-1} . C = w * adj(J) . { u, v }
                QQ0(y,x) = w * (J22*u - J12*v);
                QQ1(y,x) = w * (J11*v - J21*u);
             }
          }
          MFEM_SYNC_THREAD;
          MFEM_FOREACH_THREAD(qx,x,q)
          {
             MFEM_FOREACH_THREAD(dy,y,d)
             {
                double u = 0.0, v = 0.0;
                for (int qy = 0; qy < q; ++qy)
                {
                   u += QQ0(qy,qx) * Bt(qy,dy);
                   v += QQ1(qy,qx) * Gt(qy,dy);
                }
                DQ0(dy,qx) = u;
                DQ1(dy,qx) = v;
             }
          }
          MFEM_SYNC_THREAD;
          MFEM_FOREACH_THREAD(dx,x,d)
          {
             MFEM_FOREACH_THREAD(dy,y,d)
             {
                double u = 0.0, v = 0.0;
                for (int qx = 0; qx < q; ++qx)
                {
                   u += DQ0(dy,qx) * Gt(qx,dx);
                   v += DQ1(dy,qx) * Bt(qx,dx);
                }
                Y(dx,dy,c,e) += u + v;
             }
          }
          MFEM_SYNC_THREAD;
       }
    });
 }

 template<int T_D1D = 0, int T_Q1D = 0> static
 void DLFGradAssemble3D(const int vdim, const int ne, const int d, const int q,
                        const int *markers, const double *b, const double *g,
                        const double *jacobians,
                        const double *weights, const Vector &coeff,
                        double *output)
 {
    const auto F = coeff.Read();
    const auto M = Reshape(markers, ne);
    const auto B = Reshape(b, q,d);
    const auto G = Reshape(g, q,d);
    const auto J = Reshape(jacobians, q,q,q, 3,3, ne);
    const auto W = Reshape(weights, q,q,q);
    const bool cst = coeff.Size() == vdim*3;
    const auto C = cst ? Reshape(F,3,vdim,1,1,1,1) : Reshape(F,3,vdim,q,q,q,ne);

    auto Y = Reshape(output, d,d,d, vdim, ne);

    MFEM_FORALL_2D(e, ne, q, q, 1,
    {
       if (M(e) == 0) { return; } // ignore

       constexpr int Q = T_Q1D ? T_Q1D : MAX_Q1D;
       constexpr int D = T_D1D ? T_D1D : MAX_D1D;

       double r_u[D];

       MFEM_SHARED double sBGt[2][Q*D];
       MFEM_SHARED double sQQQ[Q*Q*Q];

       const DeviceMatrix Bt(sBGt[0], q,d), Gt(sBGt[1], q,d);
       kernels::internal::LoadBGt<D,Q>(d,q,B,G,sBGt);

       const DeviceCube QQQ(sQQQ, q,q,q);
       const DeviceCube QQD(sQQQ, q,q,d);
       const DeviceCube QDD(sQQQ, q,d,d);

       for (int c = 0; c < vdim; ++c)
       {
          const double cst_val_0 = C(0,c,0,0,0,0);
          const double cst_val_1 = C(1,c,0,0,0,0);
          const double cst_val_2 = C(2,c,0,0,0,0);

          for (int k = 0; k < 3; ++k)
          {
             for (int z = 0; z < q; ++z)
             {
                MFEM_FOREACH_THREAD(y,y,q)
                {
                   MFEM_FOREACH_THREAD(x,x,q)
                   {
                      const double J11 = J(x,y,z,0,0,e);
                      const double J21 = J(x,y,z,1,0,e);
                      const double J31 = J(x,y,z,2,0,e);
                      const double J12 = J(x,y,z,0,1,e);
                      const double J22 = J(x,y,z,1,1,e);
                      const double J32 = J(x,y,z,2,1,e);
                      const double J13 = J(x,y,z,0,2,e);
                      const double J23 = J(x,y,z,1,2,e);
                      const double J33 = J(x,y,z,2,2,e);

                      const double u = cst ? cst_val_0 : C(0,c,x,y,z,e);
                      const double v = cst ? cst_val_1 : C(1,c,x,y,z,e);
                      const double w = cst ? cst_val_2 : C(2,c,x,y,z,e);

                      if (k == 0)
                      {
                         const double A11 = (J22 * J33) - (J23 * J32);
                         const double A12 = (J32 * J13) - (J12 * J33);
                         const double A13 = (J12 * J23) - (J22 * J13);
                         QQQ(z,y,x) = A11*u + A12*v + A13*w;

                      }

                      if (k == 1)
                      {
                         const double A21 = (J31 * J23) - (J21 * J33);
                         const double A22 = (J11 * J33) - (J13 * J31);
                         const double A23 = (J21 * J13) - (J11 * J23);
                         QQQ(z,y,x) = A21*u + A22*v + A23*w;
                      }

                      if (k == 2)
                      {
                         const double A31 = (J21 * J32) - (J31 * J22);
                         const double A32 = (J31 * J12) - (J11 * J32);
                         const double A33 = (J11 * J22) - (J12 * J21);
                         QQQ(z,y,x) = A31*u + A32*v + A33*w;
                      }

                      QQQ(z,y,x) *= W(x,y,z);
                   }
                }
                MFEM_SYNC_THREAD;
             }
             MFEM_FOREACH_THREAD(qz,x,q)
             {
                MFEM_FOREACH_THREAD(qy,y,q)
                {
                   for (int dx = 0; dx < d; ++dx) { r_u[dx] = 0.0; }
                   for (int qx = 0; qx < q; ++qx)
                   {
                      const double r_v = QQQ(qz,qy,qx);
                      for (int dx = 0; dx < d; ++dx)
                      {
                         r_u[dx] += (k == 0 ? Gt(qx,dx) : Bt(qx,dx)) * r_v;
                      }
                   }
                   for (int dx = 0; dx < d; ++dx) { QQD(qz,qy,dx) = r_u[dx]; }
                }
             }
             MFEM_SYNC_THREAD;
             MFEM_FOREACH_THREAD(qz,y,q)
             {
                MFEM_FOREACH_THREAD(dx,x,d)
                {
                   for (int dy = 0; dy < d; ++dy) { r_u[dy] = 0.0; }
                   for (int qy = 0; qy < q; ++qy)
                   {
                      const double r_v = QQD(qz,qy,dx);
                      for (int dy = 0; dy < d; ++dy)
                      {
                         r_u[dy] += (k == 1 ? Gt(qy,dy) : Bt(qy,dy)) * r_v;
                      }
                   }
                   for (int dy = 0; dy < d; ++dy) { QDD(qz,dy,dx) = r_u[dy]; }
                }
             }
             MFEM_SYNC_THREAD;
             MFEM_FOREACH_THREAD(dy,y,d)
             {
                MFEM_FOREACH_THREAD(dx,x,d)
                {
                   for (int dz = 0; dz < d; ++dz) { r_u[dz] = 0.0; }
                   for (int qz = 0; qz < q; ++qz)
                   {
                      const double r_v = QDD(qz,dy,dx);
                      for (int dz = 0; dz < d; ++dz)
                      {
                         r_u[dz] += (k == 2 ? Gt(qz,dz) : Bt(qz,dz)) * r_v;
                      }
                   }
                   for (int dz = 0; dz < d; ++dz) { Y(dx,dy,dz,c,e) += r_u[dz]; }
                }
             }
             MFEM_SYNC_THREAD;
          } // dim
       } // vdim
    });
 }

 static void DLFGradAssemble(const FiniteElementSpace &fes,
                             const IntegrationRule *ir,
                             const Array<int> &markers,
                             const Vector &coeff,
                             Vector &y)
 {
    Mesh *mesh = fes.GetMesh();
    const int dim = mesh->Dimension();
    const FiniteElement &el = *fes.GetFE(0);
    const MemoryType mt = Device::GetDeviceMemoryType();
    const DofToQuad &maps = el.GetDofToQuad(*ir, DofToQuad::TENSOR);
    const int d = maps.ndof, q = maps.nqpt;
    constexpr int flags = GeometricFactors::JACOBIANS;
    const GeometricFactors *geom = mesh->GetGeometricFactors(*ir, flags, mt);
    decltype(&DLFGradAssemble2D<>) ker =
       dim == 2 ? DLFGradAssemble2D<> :  DLFGradAssemble3D<>;

    if (dim==2)
    {
       if (d==1 && q==1) { ker=DLFGradAssemble2D<1,1>; }
       if (d==2 && q==2) { ker=DLFGradAssemble2D<2,2>; }
       if (d==3 && q==3) { ker=DLFGradAssemble2D<3,3>; }
       if (d==4 && q==4) { ker=DLFGradAssemble2D<4,4>; }
       if (d==5 && q==5) { ker=DLFGradAssemble2D<5,5>; }
       if (d==2 && q==3) { ker=DLFGradAssemble2D<2,3>; }
       if (d==3 && q==4) { ker=DLFGradAssemble2D<3,4>; }
       if (d==4 && q==5) { ker=DLFGradAssemble2D<4,5>; }
       if (d==5 && q==6) { ker=DLFGradAssemble2D<5,6>; }
    }

    if (dim==3)
    {
       if (d==1 && q==1) { ker=DLFGradAssemble3D<1,1>; }
       if (d==2 && q==2) { ker=DLFGradAssemble3D<2,2>; }
       if (d==3 && q==3) { ker=DLFGradAssemble3D<3,3>; }
       if (d==4 && q==4) { ker=DLFGradAssemble3D<4,4>; }
       if (d==5 && q==5) { ker=DLFGradAssemble3D<5,5>; }
       if (d==2 && q==3) { ker=DLFGradAssemble3D<2,3>; }
       if (d==3 && q==4) { ker=DLFGradAssemble3D<3,4>; }
       if (d==4 && q==5) { ker=DLFGradAssemble3D<4,5>; }
       if (d==5 && q==6) { ker=DLFGradAssemble3D<5,6>; }
    }

    MFEM_VERIFY(ker, "No kernel ndof " << d << " nqpt " << q);

    const int vdim = fes.GetVDim();
    const int ne = fes.GetMesh()->GetNE();
    const int *M = markers.Read();
    const double *B = maps.B.Read();
    const double *G = maps.G.Read();
    const double *J = geom->J.Read();
    const double *W = ir->GetWeights().Read();
    double *Y = y.ReadWrite();
    ker(vdim, ne, d, q, M, B, G, J, W, coeff, Y);
 }

 void DomainLFGradIntegrator::AssembleDevice(const FiniteElementSpace &fes,
                                             const Array<int> &markers,
                                             Vector &b)
 {

    const FiniteElement &fe = *fes.GetFE(0);
    const int qorder = 2 * fe.GetOrder();
    const Geometry::Type gtype = fe.GetGeomType();
    const IntegrationRule *ir = IntRule ? IntRule : &IntRules.Get(gtype, qorder);

    QuadratureSpace qs(*fes.GetMesh(), *ir);
    CoefficientVector coeff(Q, qs, CoefficientStorage::COMPRESSED);
    DLFGradAssemble(fes, ir, markers, coeff, b);
 }

 void VectorDomainLFGradIntegrator::AssembleDevice(const FiniteElementSpace &fes,
                                                   const Array<int> &markers,
                                                   Vector &b)
 {
    const FiniteElement &fe = *fes.GetFE(0);
    const int qorder = 2 * fe.GetOrder();
    const Geometry::Type gtype = fe.GetGeomType();
    const IntegrationRule *ir = IntRule ? IntRule : &IntRules.Get(gtype, qorder);

    QuadratureSpace qs(*fes.GetMesh(), *ir);
    CoefficientVector coeff(Q, qs, CoefficientStorage::COMPRESSED);
    DLFGradAssemble(fes, ir, markers, coeff, b);
 }

 } // namespace mfem
mfem::FiniteElement
Abstract class for all finite elements.
Definition: fe_base.hpp:232

mfem::IntegrationRule
Class for an integration rule - an Array of IntegrationPoint.
Definition: intrules.hpp:90

mfem::IntegrationRules::Get
const IntegrationRule & Get(int GeomType, int Order)
Returns an integration rule for given GeomType and Order.
Definition: intrules.cpp:923

mfem::DofToQuad::TENSOR
Tensor product representation using 1D matrices/tensors with dimensions using 1D number of quadrature...
Definition: fe_base.hpp:160

mfem::LinearFormIntegrator::IntRule
const IntegrationRule * IntRule
Definition: lininteg.hpp:27

mfem::CoefficientVector
Class to represent a coefficient evaluated at quadrature points.
Definition: coefficient.hpp:2182

mfem::FiniteElementSpace::GetFE
virtual const FiniteElement * GetFE(int i) const
Returns pointer to the FiniteElement in the FiniteElementCollection associated with i&#39;th element in t...
Definition: fespace.cpp:2783

mfem::IntRules
IntegrationRules IntRules(0, Quadrature1D::GaussLegendre)
A global object with all integration rules (defined in intrules.cpp)
Definition: intrules.hpp:379

mfem::DeviceMatrix
DeviceTensor< 2, double > DeviceMatrix
Definition: dtensor.hpp:143

mfem::FiniteElement::GetGeomType
Geometry::Type GetGeomType() const
Returns the Geometry::Type of the reference element.
Definition: fe_base.hpp:319

mfem::MAX_Q1D
const int MAX_Q1D
Definition: forall.hpp:29

mfem
Definition: CodeDocumentation.dox:1

b
double b
Definition: lissajous.cpp:42

mfem::Array< int >

mfem::Device::GetDeviceMemoryType
static MemoryType GetDeviceMemoryType()
Get the current Device MemoryType. This is the MemoryType used by most MFEM classes when allocating m...
Definition: device.hpp:273

mfem::CoefficientStorage::COMPRESSED
Enable all above compressions.

mfem::FiniteElementSpace::GetMesh
Mesh * GetMesh() const
Returns the mesh.
Definition: fespace.hpp:441

mfem::DeviceCube
DeviceTensor< 3, double > DeviceCube
Definition: dtensor.hpp:146

mfem::FiniteElementSpace
Class FiniteElementSpace - responsible for providing FEM view of the mesh, mainly managing the set of...
Definition: fespace.hpp:96

fem.hpp

mfem::MemoryType
MemoryType
Memory types supported by MFEM.
Definition: mem_manager.hpp:31

mfem::VectorDomainLFGradIntegrator::AssembleDevice
virtual void AssembleDevice(const FiniteElementSpace &fes, const Array< int > &markers, Vector &b) override
Method defining assembly on device.
Definition: lininteg_domain_grad.cpp:333

mfem::DomainLFGradIntegrator::AssembleDevice
virtual void AssembleDevice(const FiniteElementSpace &fes, const Array< int > &markers, Vector &b)
Method defining assembly on device.
Definition: lininteg_domain_grad.cpp:318

mfem::GeometricFactors::JACOBIANS
Definition: mesh.hpp:1930

dim
int dim
Definition: ex24.cpp:53

mfem::MAX_D1D
const int MAX_D1D
Definition: forall.hpp:28

mfem::Vector
Vector data type.
Definition: vector.hpp:60

mfem::QuadratureSpace
Class representing the storage layout of a QuadratureFunction.
Definition: qspace.hpp:92

mfem::u
double u(const Vector &xvec)
Definition: lor_mms.hpp:24

mfem::Reshape
MFEM_HOST_DEVICE DeviceTensor< sizeof...(Dims), T > Reshape(T *ptr, Dims... dims)
Wrap a pointer as a DeviceTensor with automatically deduced template parameters.
Definition: dtensor.hpp:131

mfem::FiniteElement::GetOrder
int GetOrder() const
Returns the order of the finite element. In the case of anisotropic orders, returns the maximum order...
Definition: fe_base.hpp:326

mfem::Geometry::Type
Type
Definition: geom.hpp:35