4.1/bilininteg__convection_8cpp_source.html

 // Copyright (c) 2010-2020, Lawrence Livermore National Security, LLC. Produced

 // at the Lawrence Livermore National Laboratory. All Rights reserved. See files

 // LICENSE and NOTICE for details. LLNL-CODE-806117.

 //

 // This file is part of the MFEM library. For more information and source code

 // availability visit https://mfem.org.

 //

 // MFEM is free software; you can redistribute it and/or modify it under the

 // terms of the BSD-3 license. We welcome feedback and contributions, see file

 // CONTRIBUTING.md for details.


 #include "../general/forall.hpp"

 #include "bilininteg.hpp"

 #include "gridfunc.hpp"


 using namespace std;


 namespace mfem

 {


 // PA Convection Integrator


 // PA Convection Assemble 2D kernel

 static void PAConvectionSetup2D(const int Q1D,

                                 const int ne,

                                 const Array<double> &w,

                                 const Vector &j,

                                 const Vector &vel,

                                 const double alpha,

                                 Vector &op)

 {

    const int NE = ne;

    const int NQ = Q1D*Q1D;

    auto W = w.Read();


    auto J = Reshape(j.Read(), NQ, 2, 2, NE);

    const bool const_v = vel.Size() == 2;

    auto V =

       const_v ? Reshape(vel.Read(), 2,1,1) : Reshape(vel.Read(), 2,NQ,NE);

    auto y = Reshape(op.Write(), NQ, 2, NE);


    MFEM_FORALL(e, NE,

    {

       for (int q = 0; q < NQ; ++q)

       {

          const double J11 = J(q,0,0,e);

          const double J21 = J(q,1,0,e);

          const double J12 = J(q,0,1,e);

          const double J22 = J(q,1,1,e);

          const double w = alpha * W[q];

          const double v0 = const_v ? V(0,0,0) : V(0,q,e);

          const double v1 = const_v ? V(1,0,0) : V(1,q,e);

          const double wx = w * v0;

          const double wy = w * v1;

          //w*J^-1

          y(q,0,e) =  wx * J22 - wy * J12; // 1

          y(q,1,e) = -wx * J21 + wy * J11; // 2

       }

    });

 }


 // PA Convection Assemble 3D kernel

 static void PAConvectionSetup3D(const int Q1D,

                                 const int NE,

                                 const Array<double> &w,

                                 const Vector &j,

                                 const Vector &vel,

                                 const double alpha,

                                 Vector &op)

 {

    const int NQ = Q1D*Q1D*Q1D;

    auto W = w.Read();

    auto J = Reshape(j.Read(), NQ, 3, 3, NE);

    const bool const_v = vel.Size() == 3;

    auto V =

       const_v ? Reshape(vel.Read(), 3,1,1) : Reshape(vel.Read(), 3,NQ,NE);

    auto y = Reshape(op.Write(), NQ, 3, NE);

    MFEM_FORALL(e, NE,

    {

       for (int q = 0; q < NQ; ++q)

       {

          const double J11 = J(q,0,0,e);

          const double J21 = J(q,1,0,e);

          const double J31 = J(q,2,0,e);

          const double J12 = J(q,0,1,e);

          const double J22 = J(q,1,1,e);

          const double J32 = J(q,2,1,e);

          const double J13 = J(q,0,2,e);

          const double J23 = J(q,1,2,e);

          const double J33 = J(q,2,2,e);

          const double w = alpha * W[q];

          const double v0 = const_v ? V(0,0,0) : V(0,q,e);

          const double v1 = const_v ? V(1,0,0) : V(1,q,e);

          const double v2 = const_v ? V(2,0,0) : V(2,q,e);

          const double wx = w * v0;

          const double wy = w * v1;

          const double wz = w * v2;

          // adj(J)

          const double A11 = (J22 * J33) - (J23 * J32);

          const double A12 = (J32 * J13) - (J12 * J33);

          const double A13 = (J12 * J23) - (J22 * J13);

          const double A21 = (J31 * J23) - (J21 * J33);

          const double A22 = (J11 * J33) - (J13 * J31);

          const double A23 = (J21 * J13) - (J11 * J23);

          const double A31 = (J21 * J32) - (J31 * J22);

          const double A32 = (J31 * J12) - (J11 * J32);

          const double A33 = (J11 * J22) - (J12 * J21);

          // q . J^{-1} = q . adj(J)

          y(q,0,e) =  wx * A11 + wy * A12 + wz * A13;

          y(q,1,e) =  wx * A21 + wy * A22 + wz * A23;

          y(q,2,e) =  wx * A31 + wy * A32 + wz * A33;

       }

    });

 }


 static void PAConvectionSetup(const int dim,

                               const int D1D,

                               const int Q1D,

                               const int NE,

                               const Array<double> &W,

                               const Vector &J,

                               const Vector &coeff,

                               const double alpha,

                               Vector &op)

 {

    if (dim == 1) { MFEM_ABORT("dim==1 not supported in PAConvectionSetup"); }

    if (dim == 2)

    {

       PAConvectionSetup2D(Q1D, NE, W, J, coeff, alpha, op);

    }

    if (dim == 3)

    {

       PAConvectionSetup3D(Q1D, NE, W, J, coeff, alpha, op);

    }

 }


 // PA Convection Apply 2D kernel

 template<int T_D1D = 0, int T_Q1D = 0> static

 void PAConvectionApply2D(const int ne,

                          const Array<double> &b,

                          const Array<double> &g,

                          const Array<double> &bt,

                          const Array<double> &gt,

                          const Vector &_op,

                          const Vector &_x,

                          Vector &_y,

                          const int d1d = 0,

                          const int q1d = 0)

 {

    const int NE = ne;

    const int D1D = T_D1D ? T_D1D : d1d;

    const int Q1D = T_Q1D ? T_Q1D : q1d;

    MFEM_VERIFY(D1D <= MAX_D1D, "");

    MFEM_VERIFY(Q1D <= MAX_Q1D, "");

    auto B = Reshape(b.Read(), Q1D, D1D);

    auto G = Reshape(g.Read(), Q1D, D1D);

    auto Bt = Reshape(bt.Read(), D1D, Q1D);

    auto op = Reshape(_op.Read(), Q1D, Q1D, 2, NE);

    auto x = Reshape(_x.Read(), D1D, D1D, NE);

    auto y = Reshape(_y.ReadWrite(), D1D, D1D, NE);

    MFEM_FORALL(e, NE,

    {

       const int D1D = T_D1D ? T_D1D : d1d;

       const int Q1D = T_Q1D ? T_Q1D : q1d;

       // the following variables are evaluated at compile time

       constexpr int max_D1D = T_D1D ? T_D1D : MAX_D1D;

       constexpr int max_Q1D = T_Q1D ? T_Q1D : MAX_Q1D;


       double u[max_D1D][max_D1D];

       for (int dy = 0; dy < D1D; ++dy)

       {

          for (int dx = 0; dx < D1D; ++dx)

          {

             u[dy][dx] = x(dx,dy,e);

          }

       }

       double Bu[max_D1D][max_Q1D];

       double Gu[max_D1D][max_Q1D];

       for (int dy = 0; dy < D1D; ++dy)

       {

          for (int qx = 0; qx < Q1D; ++qx)

          {

             Bu[dy][qx] = 0.0;

             Gu[dy][qx] = 0.0;

             for (int dx = 0; dx < D1D; ++dx)

             {

                const double bx  = B(qx,dx);

                const double gx  = G(qx,dx);

                const double x = u[dy][dx];

                Bu[dy][qx] += bx * x;

                Gu[dy][qx] += gx * x;

             }

          }

       }

       double GBu[max_Q1D][max_Q1D];

       double BGu[max_Q1D][max_Q1D];

       for (int qx = 0; qx < Q1D; ++qx)

       {

          for (int qy = 0; qy < Q1D; ++qy)

          {

             GBu[qy][qx] = 0.0;

             BGu[qy][qx] = 0.0;

             for (int dy = 0; dy < D1D; ++dy)

             {

                const double bx  = B(qy,dy);

                const double gx  = G(qy,dy);

                GBu[qy][qx] += gx * Bu[dy][qx];

                BGu[qy][qx] += bx * Gu[dy][qx];

             }

          }

       }

       // Calculate Dxy, xDy in plane

       double DGu[max_Q1D][max_Q1D];

       for (int qy = 0; qy < Q1D; ++qy)

       {

          for (int qx = 0; qx < Q1D; ++qx)

          {

             const double O1 = op(qx,qy,0,e);

             const double O2 = op(qx,qy,1,e);


             const double gradX = BGu[qy][qx];

             const double gradY = GBu[qy][qx];


             DGu[qy][qx] = (O1 * gradX) + (O2 * gradY);

          }

       }

       double BDGu[max_D1D][max_Q1D];

       for (int qx = 0; qx < Q1D; ++qx)

       {

          for (int dy = 0; dy < D1D; ++dy)

          {

             BDGu[dy][qx] = 0.0;

             for (int qy = 0; qy < Q1D; ++qy)

             {

                const double w  = Bt(dy,qy);

                BDGu[dy][qx] += w * DGu[qy][qx];

             }

          }

       }

       for (int dx = 0; dx < D1D; ++dx)

       {

          for (int dy = 0; dy < D1D; ++dy)

          {

             double BBDGu = 0.0;

             for (int qx = 0; qx < Q1D; ++qx)

             {

                const double w  = Bt(dx,qx);

                BBDGu += w * BDGu[dy][qx];

             }

             y(dx,dy,e) += BBDGu;

          }

       }

    });

 }


 // Optimized PA Convection Apply 2D kernel

 template<int T_D1D = 0, int T_Q1D = 0, int T_NBZ = 0> static

 void SmemPAConvectionApply2D(const int ne,

                              const Array<double> &b,

                              const Array<double> &g,

                              const Array<double> &bt,

                              const Array<double> &gt,

                              const Vector &_op,

                              const Vector &_x,

                              Vector &_y,

                              const int d1d = 0,

                              const int q1d = 0)

 {

    const int NE = ne;

    const int D1D = T_D1D ? T_D1D : d1d;

    const int Q1D = T_Q1D ? T_Q1D : q1d;

    constexpr int NBZ = T_NBZ ? T_NBZ : 1;

    MFEM_VERIFY(D1D <= MAX_D1D, "");

    MFEM_VERIFY(Q1D <= MAX_Q1D, "");

    auto B = Reshape(b.Read(), Q1D, D1D);

    auto G = Reshape(g.Read(), Q1D, D1D);

    auto Bt = Reshape(bt.Read(), D1D, Q1D);

    auto op = Reshape(_op.Read(), Q1D, Q1D, 2, NE);

    auto x = Reshape(_x.Read(), D1D, D1D, NE);

    auto y = Reshape(_y.ReadWrite(), D1D, D1D, NE);

    MFEM_FORALL_2D(e, NE, Q1D, Q1D, NBZ,

    {

       const int tidz = MFEM_THREAD_ID(z);

       const int D1D = T_D1D ? T_D1D : d1d;

       const int Q1D = T_Q1D ? T_Q1D : q1d;

       // the following variables are evaluated at compile time

       constexpr int NBZ = T_NBZ ? T_NBZ : 1;

       constexpr int max_D1D = T_D1D ? T_D1D : MAX_D1D;

       constexpr int max_Q1D = T_Q1D ? T_Q1D : MAX_Q1D;

       // constexpr int MDQ = (max_Q1D > max_D1D) ? max_Q1D : max_D1D;

       MFEM_SHARED double u[NBZ][max_D1D][max_D1D];

       MFEM_FOREACH_THREAD(dy,y,D1D)

       {

          MFEM_FOREACH_THREAD(dx,x,D1D)

          {

             // e is really equal to e+tidz

             u[tidz][dy][dx] = x(dx,dy,e);

          }

       }

       MFEM_SYNC_THREAD;

       MFEM_SHARED double Bu[NBZ][max_D1D][max_Q1D];

       MFEM_SHARED double Gu[NBZ][max_D1D][max_Q1D];

       MFEM_FOREACH_THREAD(dy,y,D1D)

       {

          MFEM_FOREACH_THREAD(qx,x,Q1D)

          {

             Bu[tidz][dy][qx] = 0.0;

             Gu[tidz][dy][qx] = 0.0;

             for (int dx = 0; dx < D1D; ++dx)

             {

                const double bx = B(qx,dx);

                const double gx = G(qx,dx);

                const double x  = u[tidz][dy][dx];

                Bu[tidz][dy][qx] += bx * x;

                Gu[tidz][dy][qx] += gx * x;

             }

          }

       }

       MFEM_SYNC_THREAD;

       MFEM_SHARED double GBu[NBZ][max_Q1D][max_Q1D];

       MFEM_SHARED double BGu[NBZ][max_Q1D][max_Q1D];

       MFEM_FOREACH_THREAD(qx,x,Q1D)

       {

          MFEM_FOREACH_THREAD(qy,y,Q1D)

          {

             GBu[tidz][qy][qx] = 0.0;

             BGu[tidz][qy][qx] = 0.0;

             for (int dy = 0; dy < D1D; ++dy)

             {

                const double bx  = B(qy,dy);

                const double gx  = G(qy,dy);

                GBu[tidz][qy][qx] += gx * Bu[tidz][dy][qx];

                BGu[tidz][qy][qx] += bx * Gu[tidz][dy][qx];

             }

          }

       }

       MFEM_SYNC_THREAD;

       // Calculate Dxy, xDy in plane

       MFEM_SHARED double DGu[NBZ][max_Q1D][max_Q1D];

       MFEM_FOREACH_THREAD(qy,y,Q1D)

       {

          MFEM_FOREACH_THREAD(qx,x,Q1D)

          {

             const double O1 = op(qx,qy,0,e);

             const double O2 = op(qx,qy,1,e);


             const double gradX = BGu[tidz][qy][qx];

             const double gradY = GBu[tidz][qy][qx];


             DGu[tidz][qy][qx] = (O1 * gradX) + (O2 * gradY);

          }

       }

       MFEM_SYNC_THREAD;

       MFEM_SHARED double BDGu[NBZ][max_D1D][max_Q1D];

       MFEM_FOREACH_THREAD(qx,x,Q1D)

       {

          MFEM_FOREACH_THREAD(dy,y,D1D)

          {

             BDGu[tidz][dy][qx] = 0.0;

             for (int qy = 0; qy < Q1D; ++qy)

             {

                const double w  = Bt(dy,qy);

                BDGu[tidz][dy][qx] += w * DGu[tidz][qy][qx];

             }

          }

       }

       MFEM_SYNC_THREAD;

       MFEM_FOREACH_THREAD(dx,x,D1D)

       {

          MFEM_FOREACH_THREAD(dy,y,D1D)

          {

             double BBDGu = 0.0;

             for (int qx = 0; qx < Q1D; ++qx)

             {

                const double w  = Bt(dx,qx);

                BBDGu += w * BDGu[tidz][dy][qx];

             }

             y(dx,dy,e) += BBDGu;

          }

       }

    });

 }


 // PA Convection Apply 3D kernel

 template<int T_D1D = 0, int T_Q1D = 0> static

 void PAConvectionApply3D(const int ne,

                          const Array<double> &b,

                          const Array<double> &g,

                          const Array<double> &bt,

                          const Array<double> &gt,

                          const Vector &_op,

                          const Vector &_x,

                          Vector &_y,

                          const int d1d = 0,

                          const int q1d = 0)

 {

    const int NE = ne;

    const int D1D = T_D1D ? T_D1D : d1d;

    const int Q1D = T_Q1D ? T_Q1D : q1d;

    MFEM_VERIFY(D1D <= MAX_D1D, "");

    MFEM_VERIFY(Q1D <= MAX_Q1D, "");

    auto B = Reshape(b.Read(), Q1D, D1D);

    auto G = Reshape(g.Read(), Q1D, D1D);

    auto Bt = Reshape(bt.Read(), D1D, Q1D);

    auto op = Reshape(_op.Read(), Q1D, Q1D, Q1D, 3, NE);

    auto x = Reshape(_x.Read(), D1D, D1D, D1D, NE);

    auto y = Reshape(_y.ReadWrite(), D1D, D1D, D1D, NE);

    MFEM_FORALL(e, NE,

    {

       const int D1D = T_D1D ? T_D1D : d1d;

       const int Q1D = T_Q1D ? T_Q1D : q1d;

       // the following variables are evaluated at compile time

       constexpr int max_D1D = T_D1D ? T_D1D : MAX_D1D;

       constexpr int max_Q1D = T_Q1D ? T_Q1D : MAX_Q1D;


       double u[max_D1D][max_D1D][max_D1D];

       for (int dz = 0; dz < D1D; ++dz)

       {

          for (int dy = 0; dy < D1D; ++dy)

          {

             for (int dx = 0; dx < D1D; ++dx)

             {

                u[dz][dy][dx] = x(dx,dy,dz,e);

             }

          }

       }

       double Bu[max_D1D][max_D1D][max_Q1D];

       double Gu[max_D1D][max_D1D][max_Q1D];

       for (int dz = 0; dz < D1D; ++dz)

       {

          for (int dy = 0; dy < D1D; ++dy)

          {

             for (int qx = 0; qx < Q1D; ++qx)

             {

                Bu[dz][dy][qx] = 0.0;

                Gu[dz][dy][qx] = 0.0;

                for (int dx = 0; dx < D1D; ++dx)

                {

                   const double bx  = B(qx,dx);

                   const double gx  = G(qx,dx);

                   const double x = u[dz][dy][dx];

                   Bu[dz][dy][qx] += bx * x;

                   Gu[dz][dy][qx] += gx * x;

                }

             }

          }

       }

       double BBu[max_D1D][max_Q1D][max_Q1D];

       double GBu[max_D1D][max_Q1D][max_Q1D];

       double BGu[max_D1D][max_Q1D][max_Q1D];

       for (int dz = 0; dz < D1D; ++dz)

       {

          for (int qx = 0; qx < Q1D; ++qx)

          {

             for (int qy = 0; qy < Q1D; ++qy)

             {

                BBu[dz][qy][qx] = 0.0;

                GBu[dz][qy][qx] = 0.0;

                BGu[dz][qy][qx] = 0.0;

                for (int dy = 0; dy < D1D; ++dy)

                {

                   const double bx  = B(qy,dy);

                   const double gx  = G(qy,dy);

                   BBu[dz][qy][qx] += bx * Bu[dz][dy][qx];

                   GBu[dz][qy][qx] += gx * Bu[dz][dy][qx];

                   BGu[dz][qy][qx] += bx * Gu[dz][dy][qx];

                }

             }

          }

       }

       double GBBu[max_Q1D][max_Q1D][max_Q1D];

       double BGBu[max_Q1D][max_Q1D][max_Q1D];

       double BBGu[max_Q1D][max_Q1D][max_Q1D];

       for (int qx = 0; qx < Q1D; ++qx)

       {

          for (int qy = 0; qy < Q1D; ++qy)

          {

             for (int qz = 0; qz < Q1D; ++qz)

             {

                GBBu[qz][qy][qx] = 0.0;

                BGBu[qz][qy][qx] = 0.0;

                BBGu[qz][qy][qx] = 0.0;

                for (int dz = 0; dz < D1D; ++dz)

                {

                   const double bx  = B(qz,dz);

                   const double gx  = G(qz,dz);

                   GBBu[qz][qy][qx] += gx * BBu[dz][qy][qx];

                   BGBu[qz][qy][qx] += bx * GBu[dz][qy][qx];

                   BBGu[qz][qy][qx] += bx * BGu[dz][qy][qx];

                }

             }

          }

       }

       // Calculate Dxy, xDy in plane

       double DGu[max_Q1D][max_Q1D][max_Q1D];

       for (int qz = 0; qz < Q1D; ++qz)

       {

          for (int qy = 0; qy < Q1D; ++qy)

          {

             for (int qx = 0; qx < Q1D; ++qx)

             {

                const double O1 = op(qx,qy,qz,0,e);

                const double O2 = op(qx,qy,qz,1,e);

                const double O3 = op(qx,qy,qz,2,e);


                const double gradX = BBGu[qz][qy][qx];

                const double gradY = BGBu[qz][qy][qx];

                const double gradZ = GBBu[qz][qy][qx];


                DGu[qz][qy][qx] = (O1 * gradX) + (O2 * gradY) + (O3 * gradZ);

             }

          }

       }

       double BDGu[max_D1D][max_Q1D][max_Q1D];

       for (int qx = 0; qx < Q1D; ++qx)

       {

          for (int qy = 0; qy < Q1D; ++qy)

          {

             for (int dz = 0; dz < D1D; ++dz)

             {

                BDGu[dz][qy][qx] = 0.0;

                for (int qz = 0; qz < Q1D; ++qz)

                {

                   const double w  = Bt(dz,qz);

                   BDGu[dz][qy][qx] += w * DGu[qz][qy][qx];

                }

             }

          }

       }

       double BBDGu[max_D1D][max_D1D][max_Q1D];

       for (int dz = 0; dz < D1D; ++dz)

       {

          for (int qx = 0; qx < Q1D; ++qx)

          {

             for (int dy = 0; dy < D1D; ++dy)

             {

                BBDGu[dz][dy][qx] = 0.0;

                for (int qy = 0; qy < Q1D; ++qy)

                {

                   const double w  = Bt(dy,qy);

                   BBDGu[dz][dy][qx] += w * BDGu[dz][qy][qx];

                }

             }

          }

       }

       for (int dz = 0; dz < D1D; ++dz)

       {

          for (int dy = 0; dy < D1D; ++dy)

          {

             for (int dx = 0; dx < D1D; ++dx)

             {

                double BBBDGu = 0.0;

                for (int qx = 0; qx < Q1D; ++qx)

                {

                   const double w  = Bt(dx,qx);

                   BBBDGu += w * BBDGu[dz][dy][qx];

                }

                y(dx,dy,dz,e) += BBBDGu;

             }

          }

       }

    });

 }


 // Optimized PA Convection Apply 3D kernel

 template<int T_D1D = 0, int T_Q1D = 0> static

 void SmemPAConvectionApply3D(const int ne,

                              const Array<double> &b,

                              const Array<double> &g,

                              const Array<double> &bt,

                              const Array<double> &gt,

                              const Vector &_op,

                              const Vector &_x,

                              Vector &_y,

                              const int d1d = 0,

                              const int q1d = 0)

 {

    const int NE = ne;

    const int D1D = T_D1D ? T_D1D : d1d;

    const int Q1D = T_Q1D ? T_Q1D : q1d;

    MFEM_VERIFY(D1D <= MAX_D1D, "");

    MFEM_VERIFY(Q1D <= MAX_Q1D, "");

    auto B = Reshape(b.Read(), Q1D, D1D);

    auto G = Reshape(g.Read(), Q1D, D1D);

    auto Bt = Reshape(bt.Read(), D1D, Q1D);

    auto op = Reshape(_op.Read(), Q1D, Q1D, Q1D, 3, NE);

    auto x = Reshape(_x.Read(), D1D, D1D, D1D, NE);

    auto y = Reshape(_y.ReadWrite(), D1D, D1D, D1D, NE);

    MFEM_FORALL_3D(e, NE, Q1D, Q1D, Q1D,

    {

       const int D1D = T_D1D ? T_D1D : d1d;

       const int Q1D = T_Q1D ? T_Q1D : q1d;

       // the following variables are evaluated at compile time

       constexpr int max_D1D = T_D1D ? T_D1D : MAX_D1D;

       constexpr int max_Q1D = T_Q1D ? T_Q1D : MAX_Q1D;

       constexpr int max_DQ = (max_Q1D > max_D1D) ? max_Q1D : max_D1D;

       MFEM_SHARED double sm0[max_DQ*max_DQ*max_DQ];

       MFEM_SHARED double sm1[max_DQ*max_DQ*max_DQ];

       MFEM_SHARED double sm2[max_DQ*max_DQ*max_DQ];

       MFEM_SHARED double sm3[max_DQ*max_DQ*max_DQ];

       MFEM_SHARED double sm4[max_DQ*max_DQ*max_DQ];

       MFEM_SHARED double sm5[max_DQ*max_DQ*max_DQ];


       double (*u)[max_D1D][max_D1D] = (double (*)[max_D1D][max_D1D]) sm0;

       MFEM_FOREACH_THREAD(dz,z,D1D)

       {

          MFEM_FOREACH_THREAD(dy,y,D1D)

          {

             MFEM_FOREACH_THREAD(dx,x,D1D)

             {

                u[dz][dy][dx] = x(dx,dy,dz,e);

             }

          }

       }

       MFEM_SYNC_THREAD;

       double (*Bu)[max_D1D][max_Q1D] = (double (*)[max_D1D][max_Q1D])sm1;

       double (*Gu)[max_D1D][max_Q1D] = (double (*)[max_D1D][max_Q1D])sm2;

       MFEM_FOREACH_THREAD(dz,z,D1D)

       {

          MFEM_FOREACH_THREAD(dy,y,D1D)

          {

             MFEM_FOREACH_THREAD(qx,x,Q1D)

             {

                double Bu_ = 0.0;

                double Gu_ = 0.0;

                for (int dx = 0; dx < D1D; ++dx)

                {

                   const double bx  = B(qx,dx);

                   const double gx  = G(qx,dx);

                   const double x = u[dz][dy][dx];

                   Bu_ += bx * x;

                   Gu_ += gx * x;

                }

                Bu[dz][dy][qx] = Bu_;

                Gu[dz][dy][qx] = Gu_;

             }

          }

       }

       MFEM_SYNC_THREAD;

       double (*BBu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm3;

       double (*GBu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm4;

       double (*BGu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm5;

       MFEM_FOREACH_THREAD(dz,z,D1D)

       {

          MFEM_FOREACH_THREAD(qx,x,Q1D)

          {

             MFEM_FOREACH_THREAD(qy,y,Q1D)

             {

                double BBu_ = 0.0;

                double GBu_ = 0.0;

                double BGu_ = 0.0;

                for (int dy = 0; dy < D1D; ++dy)

                {

                   const double bx  = B(qy,dy);

                   const double gx  = G(qy,dy);

                   BBu_ += bx * Bu[dz][dy][qx];

                   GBu_ += gx * Bu[dz][dy][qx];

                   BGu_ += bx * Gu[dz][dy][qx];

                }

                BBu[dz][qy][qx] = BBu_;

                GBu[dz][qy][qx] = GBu_;

                BGu[dz][qy][qx] = BGu_;

             }

          }

       }

       MFEM_SYNC_THREAD;

       double (*GBBu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm0;

       double (*BGBu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm1;

       double (*BBGu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm2;

       MFEM_FOREACH_THREAD(qx,x,Q1D)

       {

          MFEM_FOREACH_THREAD(qy,y,Q1D)

          {

             MFEM_FOREACH_THREAD(qz,z,Q1D)

             {

                double GBBu_ = 0.0;

                double BGBu_ = 0.0;

                double BBGu_ = 0.0;

                for (int dz = 0; dz < D1D; ++dz)

                {

                   const double bx  = B(qz,dz);

                   const double gx  = G(qz,dz);

                   GBBu_ += gx * BBu[dz][qy][qx];

                   BGBu_ += bx * GBu[dz][qy][qx];

                   BBGu_ += bx * BGu[dz][qy][qx];

                }

                GBBu[qz][qy][qx] = GBBu_;

                BGBu[qz][qy][qx] = BGBu_;

                BBGu[qz][qy][qx] = BBGu_;

             }

          }

       }

       MFEM_SYNC_THREAD;

       double (*DGu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm3;

       MFEM_FOREACH_THREAD(qz,z,Q1D)

       {

          MFEM_FOREACH_THREAD(qy,y,Q1D)

          {

             MFEM_FOREACH_THREAD(qx,x,Q1D)

             {

                const double O1 = op(qx,qy,qz,0,e);

                const double O2 = op(qx,qy,qz,1,e);

                const double O3 = op(qx,qy,qz,2,e);


                const double gradX = BBGu[qz][qy][qx];

                const double gradY = BGBu[qz][qy][qx];

                const double gradZ = GBBu[qz][qy][qx];


                DGu[qz][qy][qx] = (O1 * gradX) + (O2 * gradY) + (O3 * gradZ);

             }

          }

       }

       MFEM_SYNC_THREAD;

       double (*BDGu)[max_Q1D][max_Q1D] = (double (*)[max_Q1D][max_Q1D])sm4;

       MFEM_FOREACH_THREAD(qx,x,Q1D)

       {

          MFEM_FOREACH_THREAD(qy,y,Q1D)

          {

             MFEM_FOREACH_THREAD(dz,z,D1D)

             {

                double BDGu_ = 0.0;

                for (int qz = 0; qz < Q1D; ++qz)

                {

                   const double w  = Bt(dz,qz);

                   BDGu_ += w * DGu[qz][qy][qx];

                }

                BDGu[dz][qy][qx] = BDGu_;

             }

          }

       }

       MFEM_SYNC_THREAD;

       double (*BBDGu)[max_D1D][max_Q1D] = (double (*)[max_D1D][max_Q1D])sm5;

       MFEM_FOREACH_THREAD(dz,z,D1D)

       {

          MFEM_FOREACH_THREAD(qx,x,Q1D)

          {

             MFEM_FOREACH_THREAD(dy,y,D1D)

             {

                double BBDGu_ = 0.0;

                for (int qy = 0; qy < Q1D; ++qy)

                {

                   const double w  = Bt(dy,qy);

                   BBDGu_ += w * BDGu[dz][qy][qx];

                }

                BBDGu[dz][dy][qx] = BBDGu_;

             }

          }

       }

       MFEM_SYNC_THREAD;

       MFEM_FOREACH_THREAD(dz,z,D1D)

       {

          MFEM_FOREACH_THREAD(dy,y,D1D)

          {

             MFEM_FOREACH_THREAD(dx,x,D1D)

             {

                double BBBDGu = 0.0;

                for (int qx = 0; qx < Q1D; ++qx)

                {

                   const double w  = Bt(dx,qx);

                   BBBDGu += w * BBDGu[dz][dy][qx];

                }

                y(dx,dy,dz,e) = BBBDGu;

             }

          }

       }

    });

 }


 void ConvectionIntegrator::AssemblePA(const FiniteElementSpace &fes)

 {

    // Assumes tensor-product elements

    Mesh *mesh = fes.GetMesh();

    const FiniteElement &el = *fes.GetFE(0);

    ElementTransformation &Trans = *fes.GetElementTransformation(0);

    const IntegrationRule *ir = IntRule ? IntRule : &GetRule(el, Trans);

    const int dims = el.GetDim();

    const int symmDims = dims;

    const int nq = ir->GetNPoints();

    dim = mesh->Dimension();

    ne = fes.GetNE();

    geom = mesh->GetGeometricFactors(*ir, GeometricFactors::JACOBIANS);

    maps = &el.GetDofToQuad(*ir, DofToQuad::TENSOR);

    dofs1D = maps->ndof;

    quad1D = maps->nqpt;

    pa_data.SetSize(symmDims * nq * ne, Device::GetMemoryType());

    Vector vel;

    if (VectorConstantCoefficient *cQ = dynamic_cast<VectorConstantCoefficient*>(Q))

    {

       vel = cQ->GetVec();

    }

    else

    {

       vel.SetSize(dim * nq * ne);

       auto C = Reshape(vel.HostWrite(), dim, nq, ne);

       Vector Vq(dim);

       for (int e = 0; e < ne; ++e)

       {

          ElementTransformation& T = *fes.GetElementTransformation(e);

          for (int q = 0; q < nq; ++q)

          {

             Q->Eval(Vq, T, ir->IntPoint(q));

             for (int i = 0; i < dim; ++i)

             {

                C(i,q,e) = Vq(i);

             }

          }

       }

    }

    PAConvectionSetup(dim, dofs1D, quad1D, ne, ir->GetWeights(), geom->J,

                      vel, alpha, pa_data);

 }


 static void PAConvectionApply(const int dim,

                               const int D1D,

                               const int Q1D,

                               const int NE,

                               const Array<double> &B,

                               const Array<double> &G,

                               const Array<double> &Bt,

                               const Array<double> &Gt,

                               const Vector &op,

                               const Vector &x,

                               Vector &y)

 {

    if (dim == 2)

    {

       switch ((D1D << 4 ) | Q1D)

       {

          case 0x22: return SmemPAConvectionApply2D<2,2,8>(NE,B,G,Bt,Gt,op,x,y);

          case 0x33: return SmemPAConvectionApply2D<3,3,3>(NE,B,G,Bt,Gt,op,x,y);

          case 0x44: return SmemPAConvectionApply2D<4,4,2>(NE,B,G,Bt,Gt,op,x,y);

          case 0x55: return SmemPAConvectionApply2D<5,5,2>(NE,B,G,Bt,Gt,op,x,y);

          case 0x66: return SmemPAConvectionApply2D<6,6,1>(NE,B,G,Bt,Gt,op,x,y);

          case 0x77: return SmemPAConvectionApply2D<7,7,1>(NE,B,G,Bt,Gt,op,x,y);

          case 0x88: return SmemPAConvectionApply2D<8,8,1>(NE,B,G,Bt,Gt,op,x,y);

          case 0x99: return SmemPAConvectionApply2D<9,9,1>(NE,B,G,Bt,Gt,op,x,y);

          default:   return PAConvectionApply2D(NE,B,G,Bt,Gt,op,x,y,D1D,Q1D);

       }

    }

    else if (dim == 3)

    {

       switch ((D1D << 4 ) | Q1D)

       {

          case 0x23: return SmemPAConvectionApply3D<2,3>(NE,B,G,Bt,Gt,op,x,y);

          case 0x34: return SmemPAConvectionApply3D<3,4>(NE,B,G,Bt,Gt,op,x,y);

          case 0x45: return SmemPAConvectionApply3D<4,5>(NE,B,G,Bt,Gt,op,x,y);

          case 0x56: return SmemPAConvectionApply3D<5,6>(NE,B,G,Bt,Gt,op,x,y);

          case 0x67: return SmemPAConvectionApply3D<6,7>(NE,B,G,Bt,Gt,op,x,y);

          case 0x78: return SmemPAConvectionApply3D<7,8>(NE,B,G,Bt,Gt,op,x,y);

          case 0x89: return SmemPAConvectionApply3D<8,9>(NE,B,G,Bt,Gt,op,x,y);

          default:   return PAConvectionApply3D(NE,B,G,Bt,Gt,op,x,y,D1D,Q1D);

       }

    }

    MFEM_ABORT("Unknown kernel.");

 }


 // PA Convection Apply kernel

 void ConvectionIntegrator::AddMultPA(const Vector &x, Vector &y) const

 {

    PAConvectionApply(dim, dofs1D, quad1D, ne,

                      maps->B, maps->G, maps->Bt, maps->Gt,

                      pa_data, x, y);

 }


 } // namespace mfem

mfem::IntegrationRule::GetNPoints
int GetNPoints() const
Returns the number of the points in the integration rule.
Definition: intrules.hpp:245

mfem::FiniteElement
Abstract class for Finite Elements.
Definition: fe.hpp:232

mfem::FiniteElement::GetDim
int GetDim() const
Returns the reference space dimension for the finite element.
Definition: fe.hpp:308

mfem::Mesh
Definition: mesh.hpp:49

mfem::IntegrationRule
Class for an integration rule - an Array of IntegrationPoint.
Definition: intrules.hpp:90

mfem::Vector::SetSize
void SetSize(int s)
Resize the vector to size s.
Definition: vector.hpp:407

geom
const Geometry::Type geom
Definition: ex1.cpp:40

mfem::VectorConstantCoefficient
Definition: coefficient.hpp:321

mfem::DofToQuad::ndof
int ndof
Number of degrees of freedom = number of basis functions. When mode is TENSOR, this is the 1D number...
Definition: fe.hpp:162

mfem::IntegrationRule::GetWeights
const Array< double > & GetWeights() const
Return the quadrature weights in a contiguous array.
Definition: intrules.cpp:85

mfem::Reshape
DeviceTensor< sizeof...(Dims), T > Reshape(T *ptr, Dims...dims)
Wrap a pointer as a DeviceTensor with automatically deduced template parameters.
Definition: dtensor.hpp:134

mfem::FiniteElementSpace::GetNE
int GetNE() const
Returns number of elements in the mesh.
Definition: fespace.hpp:408

mfem::IntegrationRule::IntPoint
IntegrationPoint & IntPoint(int i)
Returns a reference to the i-th integration point.
Definition: intrules.hpp:248

mfem::Mesh::GetGeometricFactors
const GeometricFactors * GetGeometricFactors(const IntegrationRule &ir, const int flags)
Return the mesh geometric factors corresponding to the given integration rule.
Definition: mesh.cpp:763

mfem::MAX_Q1D
const int MAX_Q1D
Definition: forall.hpp:36

mfem::FiniteElementSpace::GetMesh
Mesh * GetMesh() const
Returns the mesh.
Definition: fespace.hpp:295

b
double b
Definition: lissajous.cpp:42

mfem::Array< double >

mfem::Mesh::Dimension
int Dimension() const
Definition: mesh.hpp:744

mfem::superlu::Trans
Trans
Definition: superlu.hpp:39

bilininteg.hpp

mfem::FiniteElementSpace::GetElementTransformation
ElementTransformation * GetElementTransformation(int i) const
Returns ElementTransformation for the i-th element.
Definition: fespace.hpp:441

mfem::FiniteElementSpace
Class FiniteElementSpace - responsible for providing FEM view of the mesh, mainly managing the set of...
Definition: fespace.hpp:87

mfem::FiniteElement::GetDofToQuad
virtual const DofToQuad & GetDofToQuad(const IntegrationRule &ir, DofToQuad::Mode mode) const
Definition: fe.cpp:370

mfem::ElementTransformation
Definition: eltrans.hpp:23

dim
int dim
Definition: ex24.cpp:43

mfem::GetMemoryType
MemoryType GetMemoryType(MemoryClass mc)
Return a suitable MemoryType for a given MemoryClass.
Definition: mem_manager.cpp:49

mfem::MAX_D1D
const int MAX_D1D
Definition: forall.hpp:35

mfem::FiniteElementSpace::GetFE
const FiniteElement * GetFE(int i) const
Returns pointer to the FiniteElement associated with i&#39;th element.
Definition: fespace.cpp:1642

mfem::Vector::HostWrite
double * HostWrite()
Shortcut for mfem::Write(vec.GetMemory(), vec.Size(), false).
Definition: vector.hpp:345

alpha
const double alpha
Definition: ex15.cpp:336

mfem::Vector
Vector data type.
Definition: vector.hpp:48

gridfunc.hpp