4.9/ttensor_8hpp_source.html

// Copyright (c) 2010-2025, Lawrence Livermore National Security, LLC. Produced

// at the Lawrence Livermore National Laboratory. All Rights reserved. See files

// LICENSE and NOTICE for details. LLNL-CODE-806117.

//

// This file is part of the MFEM library. For more information and source code

// availability visit https://mfem.org.

//

// MFEM is free software; you can redistribute it and/or modify it under the

// terms of the BSD-3 license. We welcome feedback and contributions, see file

// CONTRIBUTING.md for details.


#ifndef MFEM_TEMPLATE_TENSOR

#define MFEM_TEMPLATE_TENSOR


#include "../config/tconfig.hpp"

#include "../linalg/simd.hpp"

#include "../general/tassign.hpp"

#include "tlayout.hpp"

#include "tmatrix.hpp"


// Templated tensor implementation (up to order 4)


namespace mfem

{


// Element-wise tensor operations


namespace internal

{


template <int Rank>

struct TensorOps;


template <>

struct TensorOps<1> // rank = 1

{

   // Assign: A {=,+=,*=} scalar_value

   template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

             typename scalar_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      const scalar_t value)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 1, "invalid rank");

      for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

      {

         mfem::Assign<Op>(A_data[A_layout.ind(i1)], value);

      }

   }


   // Assign: A {=,+=,*=} scalar_value, host+device version

   template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

             typename scalar_t>

   MFEM_HOST_DEVICE

   static void AssignHD(const A_layout_t &A_layout, A_data_t &A_data,

                        const scalar_t value)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 1, "invalid rank");

      for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

      {

         mfem::AssignHD<Op>(A_data[A_layout.ind(i1)], value);

      }

   }


   // Assign: A {=,+=,*=} B

   template <AssignOp::Type Op,

             typename A_layout_t, typename A_data_t,

             typename B_layout_t, typename B_data_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      const B_layout_t &B_layout, const B_data_t &B_data)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 1 && B_layout_t::rank == 1,

                         "invalid ranks");

      MFEM_STATIC_ASSERT(A_layout_t::dim_1 == B_layout_t::dim_1,

                         "invalid dimensions");

      for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

      {

         mfem::Assign<Op>(A_data[A_layout.ind(i1)], B_data[B_layout.ind(i1)]);

      }

   }

};


template <>

struct TensorOps<2> // rank = 2

{

   // Assign: A {=,+=,*=} scalar_value

   template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

             typename scalar_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      scalar_t value)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 2, "invalid rank");

      for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

      {

         for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

         {

            mfem::Assign<Op>(A_data[A_layout.ind(i1,i2)], value);

         }

      }

   }


   // Assign: A {=,+=,*=} scalar_value, host+device version

   template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

             typename scalar_t>

   MFEM_HOST_DEVICE

   static void AssignHD(const A_layout_t &A_layout, A_data_t &A_data,

                        scalar_t value)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 2, "invalid rank");

      for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

      {

         for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

         {

            mfem::AssignHD<Op>(A_data[A_layout.ind(i1,i2)], value);

         }

      }

   }


   // Assign: A {=,+=,*=} B

   template <AssignOp::Type Op,

             typename A_layout_t, typename A_data_t,

             typename B_layout_t, typename B_data_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      const B_layout_t &B_layout, const B_data_t &B_data)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 2 && B_layout_t::rank == 2,

                         "invalid ranks");

      MFEM_STATIC_ASSERT(A_layout_t::dim_1 == B_layout_t::dim_1 &&

                         A_layout_t::dim_2 == B_layout_t::dim_2,

                         "invalid dimensions");

      for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

      {

         for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

         {

            mfem::Assign<Op>(A_data[A_layout.ind(i1,i2)],

                             B_data[B_layout.ind(i1,i2)]);

         }

      }

   }

};


template <>

struct TensorOps<3> // rank = 3

{

   // Assign: A {=,+=,*=} scalar_value

   template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

             typename scalar_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      scalar_t value)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 3, "invalid rank");

      for (int i3 = 0; i3 < A_layout_t::dim_3; i3++)

      {

         for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

         {

            for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

            {

               mfem::Assign<Op>(A_data[A_layout.ind(i1,i2,i3)], value);

            }

         }

      }

   }


   // Assign: A {=,+=,*=} B

   template <AssignOp::Type Op,

             typename A_layout_t, typename A_data_t,

             typename B_layout_t, typename B_data_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      const B_layout_t &B_layout, const B_data_t &B_data)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 3 && B_layout_t::rank == 3,

                         "invalid ranks");

      MFEM_STATIC_ASSERT(A_layout_t::dim_1 == B_layout_t::dim_1 &&

                         A_layout_t::dim_2 == B_layout_t::dim_2 &&

                         A_layout_t::dim_3 == B_layout_t::dim_3,

                         "invalid dimensions");

      for (int i3 = 0; i3 < A_layout_t::dim_3; i3++)

      {

         for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

         {

            for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

            {

               mfem::Assign<Op>(A_data[A_layout.ind(i1,i2,i3)],

                                B_data[B_layout.ind(i1,i2,i3)]);

            }

         }

      }

   }

};


template <>

struct TensorOps<4> // rank = 4

{

   // Assign: A {=,+=,*=} scalar_value

   template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

             typename scalar_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      scalar_t value)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 4, "invalid rank");

      for (int i4 = 0; i4 < A_layout_t::dim_4; i4++)

      {

         for (int i3 = 0; i3 < A_layout_t::dim_3; i3++)

         {

            for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

            {

               for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

               {

                  mfem::Assign<Op>(A_data[A_layout.ind(i1,i2,i3,i4)], value);

               }

            }

         }

      }

   }


   // Assign: A {=,+=,*=} B

   template <AssignOp::Type Op,

             typename A_layout_t, typename A_data_t,

             typename B_layout_t, typename B_data_t>

   static void Assign(const A_layout_t &A_layout, A_data_t &A_data,

                      const B_layout_t &B_layout, const B_data_t &B_data)

   {

      MFEM_STATIC_ASSERT(A_layout_t::rank == 4 && B_layout_t::rank == 4,

                         "invalid ranks");

      MFEM_STATIC_ASSERT(A_layout_t::dim_1 == B_layout_t::dim_1 &&

                         A_layout_t::dim_2 == B_layout_t::dim_2 &&

                         A_layout_t::dim_3 == B_layout_t::dim_3 &&

                         A_layout_t::dim_4 == B_layout_t::dim_4,

                         "invalid dimensions");

      for (int i4 = 0; i4 < A_layout_t::dim_4; i4++)

      {

         for (int i3 = 0; i3 < A_layout_t::dim_3; i3++)

         {

            for (int i2 = 0; i2 < A_layout_t::dim_2; i2++)

            {

               for (int i1 = 0; i1 < A_layout_t::dim_1; i1++)

               {

                  mfem::Assign<Op>(A_data[A_layout.ind(i1,i2,i3,i4)],

                                   B_data[B_layout.ind(i1,i2,i3,i4)]);

               }

            }

         }

      }

   }

};


} // namespace mfem::internal


// Tensor or sub-tensor assign function: A {=,+=,*=} scalar_value.

template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

          typename scalar_t>


inline void TAssign(const A_layout_t &A_layout, A_data_t &A_data,

                    const scalar_t value)

{

   internal::TensorOps<A_layout_t::rank>::

   template Assign<Op>(A_layout, A_data, value);

}


// Tensor or sub-tensor assign function: A {=,+=,*=} scalar_value.

// Host+device version.

template <AssignOp::Type Op, typename A_layout_t, typename A_data_t,

          typename scalar_t>

MFEM_HOST_DEVICE


inline void TAssignHD(const A_layout_t &A_layout, A_data_t &A_data,

                      const scalar_t value)

{

   internal::TensorOps<A_layout_t::rank>::

   template AssignHD<Op>(A_layout, A_data, value);

}


// Tensor assign function: A {=,+=,*=} B that allows different input and output

// layouts. With suitable layouts this function can be used to permute

// (transpose) tensors, extract sub-tensors, etc.

template <AssignOp::Type Op,

          typename A_layout_t, typename A_data_t,

          typename B_layout_t, typename B_data_t>


inline void TAssign(const A_layout_t &A_layout, A_data_t &A_data,

                    const B_layout_t &B_layout, const B_data_t &B_data)

{

   internal::TensorOps<A_layout_t::rank>::

   template Assign<Op>(A_layout, A_data, B_layout, B_data);

}


// classes TVector, TMatrix, TTensor3, TTensor4


template <int S, typename data_t = double, bool align = false>


struct TVector

{

public:

   static const int size = S;

   static const int aligned_size = align ? MFEM_ALIGN_SIZE(S,data_t) : size;

   typedef data_t data_type;

   data_t data[aligned_size>0?aligned_size:1];


   typedef StridedLayout1D<S,1> layout_type;

   static const layout_type layout;


   data_t &operator[](int i) { return data[i]; }

   const data_t &operator[](int i) const { return data[i]; }


   template <AssignOp::Type Op>


   void Assign(const data_t d)

   {

      TAssign<Op>(layout, data, d);

   }


   template <AssignOp::Type Op, typename src_data_t>


   void Assign(const src_data_t &src)

   {

      TAssign<Op>(layout, data, layout, src);

   }


   template <AssignOp::Type Op, typename dest_data_t>


   void AssignTo(dest_data_t &dest)

   {

      TAssign<Op>(layout, dest, layout, data);

   }


   void Set(const data_t d)

   {

      Assign<AssignOp::Set>(d);

   }


   template <typename src_data_t>


   void Set(const src_data_t &src)

   {

      Assign<AssignOp::Set>(src);

   }


   template <typename dest_data_t>


   void Assemble(dest_data_t &dest) const

   {

      AssignTo<AssignOp::Add>(dest);

   }


   void Scale(const data_t scale)

   {

      Assign<AssignOp::Mult>(scale);

   }


};


template <int S, typename data_t, bool align>

const typename TVector<S,data_t,align>::layout_type

TVector<S,data_t,align>::layout = layout_type();


template <int N1, int N2, typename data_t = double, bool align = false>


struct TMatrix : public TVector<N1*N2,data_t,align>

{

   typedef TVector<N1*N2,data_t,align> base_class;

   using base_class::size;

   using base_class::data;


   typedef ColumnMajorLayout2D<N1,N2> layout_type;

   static const layout_type layout;

   static inline int ind(int i1, int i2) { return layout.ind(i1,i2); }


   data_t &operator()(int i, int j) { return data[ind(i,j)]; }

   const data_t &operator()(int i, int j) const { return data[ind(i,j)]; }


   inline data_t Det() const

   {

      return TDet<data_t>(layout, data);

   }


   inline void Adjugate(TMatrix<N1,N2,data_t> &adj) const

   {

      TAdjugate<data_t>(layout, data, layout, adj.data);

   }


   // Compute the adjugate and the determinant of a (small) matrix.


   inline data_t AdjDet(TMatrix<N2,N1,data_t> &adj) const

   {

      return TAdjDet<data_t>(layout, data, layout, adj.data);

   }


};


template <int N1, int N2, typename data_t, bool align>

const typename TMatrix<N1,N2,data_t,align>::layout_type

TMatrix<N1,N2,data_t,align>::layout = layout_type();


template <int N1, int N2, int N3, typename data_t = double, bool align = false>


struct TTensor3 : TVector<N1*N2*N3,data_t,align>

{

   typedef TVector<N1*N2*N3,data_t,align> base_class;

   using base_class::size;

   using base_class::data;


   typedef ColumnMajorLayout3D<N1,N2,N3> layout_type;

   static const layout_type layout;


   static inline int ind(int i1, int i2, int i3)

   { return layout.ind(i1,i2,i3); }


   data_t &operator()(int i, int j, int k) { return data[ind(i,j,k)]; }


   const data_t &operator()(int i, int j, int k) const

   { return data[ind(i,j,k)]; }


};


template <int N1, int N2, int N3, typename data_t, bool align>

const typename TTensor3<N1,N2,N3,data_t,align>::layout_type

TTensor3<N1,N2,N3,data_t,align>::layout = layout_type();


template <int N1, int N2, int N3, int N4, typename data_t = double,

          bool align = false>


struct TTensor4 : TVector<N1*N2*N3*N4,data_t,align>

{

   typedef TVector<N1*N2*N3*N4,data_t,align> base_class;

   using base_class::size;

   using base_class::data;


   typedef ColumnMajorLayout4D<N1,N2,N3,N4> layout_type;

   static const layout_type layout;


   static inline int ind(int i1, int i2, int i3, int i4)

   { return layout.ind(i1,i2,i3,i4); }


   data_t &operator()(int i, int j, int k, int l)

   { return data[ind(i,j,k,l)]; }


   const data_t &operator()(int i, int j, int k, int l) const

   { return data[ind(i,j,k,l)]; }


};


template <int N1, int N2, int N3, int N4, typename data_t, bool align>

const typename TTensor4<N1,N2,N3,N4,data_t,align>::layout_type

TTensor4<N1,N2,N3,N4,data_t,align>::layout = layout_type();


// Tensor products


// C_{i,j,k}  {=|+=}  \sum_s A_{s,j} B_{i,s,k}

template <bool Add,

          typename A_layout_t, typename A_data_t,

          typename B_layout_t, typename B_data_t,

          typename C_layout_t, typename C_data_t>

MFEM_ALWAYS_INLINE inline


void Mult_1_2(const A_layout_t &A_layout, const A_data_t &A_data,

              const B_layout_t &B_layout, const B_data_t &B_data,

              const C_layout_t &C_layout, C_data_t &C_data)

{

   MFEM_STATIC_ASSERT(A_layout_t::rank == 2 && B_layout_t::rank == 3 &&

                      C_layout_t::rank == 3, "invalid ranks");

   const int B3 = B_layout_t::dim_3;

   const int C3 = C_layout_t::dim_3;

   MFEM_STATIC_ASSERT(B3 == C3, "invalid dimensions");

   for (int k = 0; k < B3; k++)

   {

      Mult_AB<Add>(B_layout.ind3(k), B_data,

                   A_layout, A_data,

                   C_layout.ind3(k), C_data);

   }

}


// C_{i,j,k}  {=|+=}  \sum_s A_{i,s} B_{s,j,k}

template <bool Add,

          typename A_layout_t, typename A_data_t,

          typename B_layout_t, typename B_data_t,

          typename C_layout_t, typename C_data_t>

MFEM_ALWAYS_INLINE inline


void Mult_2_1(const A_layout_t &A_layout, const A_data_t &A_data,

              const B_layout_t &B_layout, const B_data_t &B_data,

              const C_layout_t &C_layout, C_data_t &C_data)

{

   MFEM_STATIC_ASSERT(A_layout_t::rank == 2 && B_layout_t::rank == 3 &&

                      C_layout_t::rank == 3, "invalid ranks");

   Mult_AB<Add>(A_layout, A_data,

                B_layout.merge_23(), B_data,

                C_layout.merge_23(), C_data);

}


// C_{i,k,j,l}  {=|+=}  \sum_s A_{s,i} A_{s,j} B_{k,s,l}

template <bool Add,

          typename A_layout_t, typename A_data_t,

          typename B_layout_t, typename B_data_t,

          typename C_layout_t, typename C_data_t>

MFEM_ALWAYS_INLINE inline


void TensorAssemble(const A_layout_t &A_layout, const A_data_t &A_data,

                    const B_layout_t &B_layout, const B_data_t &B_data,

                    const C_layout_t &C_layout, C_data_t &C_data)

{

   MFEM_STATIC_ASSERT(A_layout_t::rank == 2 && B_layout_t::rank == 3 &&

                      C_layout_t::rank == 4, "invalid ranks");

   const int A1 = A_layout_t::dim_1;

   const int A2 = A_layout_t::dim_2;

   const int B1 = B_layout_t::dim_1;

   const int B2 = B_layout_t::dim_2;

   const int B3 = B_layout_t::dim_3;

   const int C1 = C_layout_t::dim_1;

   const int C2 = C_layout_t::dim_2;

   const int C3 = C_layout_t::dim_3;

   const int C4 = C_layout_t::dim_4;

   MFEM_STATIC_ASSERT(A1 == B2 && A2 == C1 && A2 == C3 && B1 == C2 && B3 == C4,

                      "invalid dimensions");


#if 1

   // Impl == 3

   MFEM_FLOPS_ADD(3*A1*A2*A2*B1*B3);

   if (!Add) { TAssign<AssignOp::Set>(C_layout, C_data, 0.0); }

   for (int j = 0; j < A2; j++)

   {

      for (int i = 0; i < A2; i++)

      {

         for (int l = 0; l < B3; l++)

         {

            for (int k = 0; k < B1; k++)

            {

               for (int s = 0; s < A1; s++)

               {

                  // C(i,k,j,l) += A(s,i) * A(s,j) * B(k,s,l);

                  C_data[C_layout.ind(i,k,j,l)] +=

                     A_data[A_layout.ind(s,i)] *

                     A_data[A_layout.ind(s,j)] *

                     B_data[B_layout.ind(k,s,l)];

               }

            }

         }

      }

   }

#else

   // Impl == 1

   if (!Add) { TAssign<AssignOp::Set>(C_layout, C_data, 0.0); }

   for (int s = 0; s < A1; s++)

   {

      for (int i = 0; i < A2; i++)

      {

         for (int k = 0; k < B1; k++)

         {

            for (int j = 0; j < A2; j++)

            {

               for (int l = 0; l < B3; l++)

               {

                  // C(i,k,j,l) += A(s,i) * A(s,j) * B(k,s,l);

                  C_data[C_layout.ind(i,k,j,l)] +=

                     A_data[A_layout.ind(s,i)] *

                     A_data[A_layout.ind(s,j)] *

                     B_data[B_layout.ind(k,s,l)];

               }

            }

         }

      }

   }

#endif

}


// D_{i,k,j,l}  {=|+=}  \sum_s A_{i,s} B_{s,j} C_{k,s,l}

template <bool Add,

          typename A_layout_t, typename A_data_t,

          typename B_layout_t, typename B_data_t,

          typename C_layout_t, typename C_data_t,

          typename D_layout_t, typename D_data_t>

MFEM_ALWAYS_INLINE inline


void TensorAssemble(const A_layout_t &A_layout, const A_data_t &A_data,

                    const B_layout_t &B_layout, const B_data_t &B_data,

                    const C_layout_t &C_layout, const C_data_t &C_data,

                    const D_layout_t &D_layout, D_data_t &D_data)

{

   MFEM_STATIC_ASSERT(A_layout_t::rank == 2 && B_layout_t::rank == 2 &&

                      C_layout_t::rank == 3 && D_layout_t::rank == 4,

                      "invalid ranks");

   const int A1 = A_layout_t::dim_1;

   const int A2 = A_layout_t::dim_2;

   const int B1 = B_layout_t::dim_1;

   const int B2 = B_layout_t::dim_2;

   const int C1 = C_layout_t::dim_1;

   const int C2 = C_layout_t::dim_2;

   const int C3 = C_layout_t::dim_3;

   const int D1 = D_layout_t::dim_1;

   const int D2 = D_layout_t::dim_2;

   const int D3 = D_layout_t::dim_3;

   const int D4 = D_layout_t::dim_4;

   MFEM_STATIC_ASSERT(A2 == B1 && A2 == C2 && A1 == D1 && B2 == D3 &&

                      C1 == D2 && C3 == D4, "invalid dimensions");


#if 0

   TTensor4<A1,C1,A2,C3> H;

   // H_{i,k,s,l} = A_{i,s} C_{k,s,l}

   for (int l = 0; l < C3; l++)

   {

      for (int s = 0; s < B1; s++)

      {

         for (int k = 0; k < C1; k++)

         {

            for (int i = 0; i < A1; i++)

            {

               H(i,k,s,l) = A_data[A_layout.ind(i,s)]*

                            C_data[C_layout.ind(k,s,l)];

            }

         }

      }

   }

   // D_{(i,k),j,l} = \sum_s B_{s,j} H_{(i,k),s,l}

   Mult_1_2<Add>(B_layout, B_data, H.layout.merge_12(), H,

                 D_layout.merge_12(), D_data);

#elif 1

   MFEM_FLOPS_ADD(A1*B1*C1*C3); // computation of H(l)

   for (int l = 0; l < C3; l++)

   {

      TTensor3<A1,C1,A2,typename C_data_t::data_type> H;

      // H(l)_{i,k,s} = A_{i,s} C_{k,s,l}

      for (int s = 0; s < B1; s++)

      {

         for (int k = 0; k < C1; k++)

         {

            for (int i = 0; i < A1; i++)

            {

               H(i,k,s) = A_data[A_layout.ind(i,s)]*

                          C_data[C_layout.ind(k,s,l)];

            }

         }

      }

      // D_{(i,k),j,l} = \sum_s H(l)_{(i,k),s} B_{s,j}

      Mult_AB<Add>(H.layout.merge_12(), H, B_layout, B_data,

                   D_layout.merge_12().ind3(l), D_data);

   }

#else

   TTensor4<B1,C1,B2,C3> F;

   for (int l = 0; l < C3; l++)

   {

      for (int j = 0; j < B2; j++)

      {

         for (int k = 0; k < C1; k++)

         {

            for (int s = 0; s < B1; s++)

            {

               F(s,k,j,l) = B_data[B_layout.ind(s,j)]*

                            C_data[C_layout.ind(k,s,l)];

            }

         }

      }

   }

   Mult_AB<Add>(A_layout, A_data, F.layout.merge_34().merge_23(), F,

                D_layout.merge_34().merge_23(), D_data);

#endif

}


// C_{i,j,k,l}  {=|+=}  A_{i,j,k} B_{j,l}

template <AssignOp::Type Op,

          typename A_layout_t, typename A_data_t,

          typename B_layout_t, typename B_data_t,

          typename C_layout_t, typename C_data_t>

MFEM_ALWAYS_INLINE inline


void TensorProduct(const A_layout_t &a, const A_data_t &A,

                   const B_layout_t &b, const B_data_t &B,

                   const C_layout_t &c, C_data_t &C)

{

   const int A1 = A_layout_t::dim_1;

   const int A2 = A_layout_t::dim_2;

   const int A3 = A_layout_t::dim_3;

   const int B1 = B_layout_t::dim_1;

   const int B2 = B_layout_t::dim_2;

   const int C1 = C_layout_t::dim_1;

   const int C2 = C_layout_t::dim_2;

   const int C3 = C_layout_t::dim_3;

   const int C4 = C_layout_t::dim_4;

   MFEM_STATIC_ASSERT(A1 == C1 && A2 == B1 && A2 == C2 && A3 == C3 && B2 == C4,

                      "invalid dimensions");


   MFEM_FLOPS_ADD(A1*A2*A3*B2);

   for (int l = 0; l < B2; l++)

   {

      for (int k = 0; k < A3; k++)

      {

         for (int j = 0; j < A2; j++)

         {

            for (int i = 0; i < A1; i++)

            {

               mfem::Assign<Op>(C[c.ind(i,j,k,l)],

                                A[a.ind(i,j,k)]*B[b.ind(j,l)]);

            }

         }

      }

   }

}


} // namespace mfem


#endif // MFEM_TEMPLATE_TENSOR

b
real_t b
Definition lissajous.cpp:42

a
real_t a
Definition lissajous.cpp:41

mfem
Definition CodeDocumentation.dox:1

mfem::Mult_1_2
MFEM_ALWAYS_INLINE void Mult_1_2(const A_layout_t &A_layout, const A_data_t &A_data, const B_layout_t &B_layout, const B_data_t &B_data, const C_layout_t &C_layout, C_data_t &C_data)
Definition ttensor.hpp:435

mfem::TAssignHD
MFEM_HOST_DEVICE void TAssignHD(const A_layout_t &A_layout, A_data_t &A_data, const scalar_t value)
Definition ttensor.hpp:263

mfem::Assign
lvalue_t & Assign(lvalue_t &a, const rvalue_t &b)
Definition tassign.hpp:137

mfem::TDet
scalar_t TDet(const layout_t &a, const data_t &A)
Definition tmatrix.hpp:572

mfem::Mult_AB
MFEM_ALWAYS_INLINE void Mult_AB(const A_layout_t &A_layout, const A_data_t &A_data, const B_layout_t &B_layout, const B_data_t &B_data, const C_layout_t &C_layout, C_data_t &C_data)
Definition tmatrix.hpp:229

mfem::Mult_2_1
MFEM_ALWAYS_INLINE void Mult_2_1(const A_layout_t &A_layout, const A_data_t &A_data, const B_layout_t &B_layout, const B_data_t &B_data, const C_layout_t &C_layout, C_data_t &C_data)
Definition ttensor.hpp:458

mfem::TensorProduct
MFEM_ALWAYS_INLINE void TensorProduct(const A_layout_t &a, const A_data_t &A, const B_layout_t &b, const B_data_t &B, const C_layout_t &c, C_data_t &C)
Definition ttensor.hpp:641

mfem::TAdjugate
void TAdjugate(const A_layout_t &a, const A_data_t &A, const B_layout_t &b, B_data_t &B)
Definition tmatrix.hpp:619

mfem::TAssign
void TAssign(const A_layout_t &A_layout, A_data_t &A_data, const scalar_t value)
Definition ttensor.hpp:251

mfem::TAdjDet
scalar_t TAdjDet(const A_layout_t &a, const A_data_t &A, const B_layout_t &b, B_data_t &B)
Definition tmatrix.hpp:648

mfem::TensorAssemble
MFEM_ALWAYS_INLINE void TensorAssemble(const A_layout_t &A_layout, const A_data_t &A_data, const B_layout_t &B_layout, const B_data_t &B_data, const C_layout_t &C_layout, C_data_t &C_data)
Definition ttensor.hpp:475

mfem::Add
void Add(const DenseMatrix &A, const DenseMatrix &B, real_t alpha, DenseMatrix &C)
C = A + alpha*B.
Definition densemat.cpp:2339

mfem::AssignHD
MFEM_HOST_DEVICE lvalue_t & AssignHD(lvalue_t &a, const rvalue_t &b)
Definition tassign.hpp:144

simd.hpp

mfem::AssignOp::Type
Type
Definition tassign.hpp:26

mfem::ColumnMajorLayout2D
Definition tlayout.hpp:450

mfem::ColumnMajorLayout3D
Definition tlayout.hpp:454

mfem::ColumnMajorLayout4D
Definition tlayout.hpp:458

mfem::StridedLayout1D
Definition tlayout.hpp:30

mfem::StridedLayout2D::ind
static MFEM_HOST_DEVICE int ind(int i1, int i2)
Definition tlayout.hpp:106

mfem::StridedLayout3D::merge_12
static StridedLayout2D< N1 *N2, S1, N3, S3 > merge_12()
Definition tlayout.hpp:267

mfem::StridedLayout3D::ind
static int ind(int i1, int i2, int i3)
Definition tlayout.hpp:248

mfem::StridedLayout4D::ind
static int ind(int i1, int i2, int i3, int i4)
Definition tlayout.hpp:395

mfem::StridedLayout4D::merge_34
static StridedLayout3D< N1, S1, N2, S2, N3 *N4, S3 > merge_34()
Definition tlayout.hpp:419

mfem::StridedLayout4D::merge_12
static StridedLayout3D< N1 *N2, S1, N3, S3, N4, S4 > merge_12()
Definition tlayout.hpp:412

mfem::TMatrix
Definition ttensor.hpp:348

mfem::TMatrix::layout
static const layout_type layout
Definition ttensor.hpp:354

mfem::TMatrix::operator()
data_t & operator()(int i, int j)
Definition ttensor.hpp:357

mfem::TMatrix::data
data_t data[aligned_size >0?aligned_size:1]
Definition ttensor.hpp:292

mfem::TMatrix::operator()
const data_t & operator()(int i, int j) const
Definition ttensor.hpp:358

mfem::TMatrix::ind
static int ind(int i1, int i2)
Definition ttensor.hpp:355

mfem::TMatrix::layout_type
ColumnMajorLayout2D< N1, N2 > layout_type
Definition ttensor.hpp:353

mfem::TMatrix::Det
data_t Det() const
Definition ttensor.hpp:360

mfem::TMatrix::base_class
TVector< N1 *N2, data_t, align > base_class
Definition ttensor.hpp:349

mfem::TMatrix::Adjugate
void Adjugate(TMatrix< N1, N2, data_t > &adj) const
Definition ttensor.hpp:365

mfem::TMatrix::AdjDet
data_t AdjDet(TMatrix< N2, N1, data_t > &adj) const
Definition ttensor.hpp:371

mfem::TTensor3
Definition ttensor.hpp:384

mfem::TTensor3::layout_type
ColumnMajorLayout3D< N1, N2, N3 > layout_type
Definition ttensor.hpp:389

mfem::TTensor3::data
data_t data[aligned_size >0?aligned_size:1]
Definition ttensor.hpp:292

mfem::TTensor3::layout
static const layout_type layout
Definition ttensor.hpp:390

mfem::TTensor3::operator()
data_t & operator()(int i, int j, int k)
Definition ttensor.hpp:394

mfem::TTensor3::operator()
const data_t & operator()(int i, int j, int k) const
Definition ttensor.hpp:395

mfem::TTensor3::base_class
TVector< N1 *N2 *N3, data_t, align > base_class
Definition ttensor.hpp:385

mfem::TTensor3::ind
static int ind(int i1, int i2, int i3)
Definition ttensor.hpp:391

mfem::TTensor4
Definition ttensor.hpp:406

mfem::TTensor4::operator()
const data_t & operator()(int i, int j, int k, int l) const
Definition ttensor.hpp:418

mfem::TTensor4::data
data_t data[aligned_size >0?aligned_size:1]
Definition ttensor.hpp:292

mfem::TTensor4::operator()
data_t & operator()(int i, int j, int k, int l)
Definition ttensor.hpp:416

mfem::TTensor4::base_class
TVector< N1 *N2 *N3 *N4, data_t, align > base_class
Definition ttensor.hpp:407

mfem::TTensor4::layout_type
ColumnMajorLayout4D< N1, N2, N3, N4 > layout_type
Definition ttensor.hpp:411

mfem::TTensor4::ind
static int ind(int i1, int i2, int i3, int i4)
Definition ttensor.hpp:413

mfem::TTensor4::layout
static const layout_type layout
Definition ttensor.hpp:412

mfem::TVector
Definition ttensor.hpp:287

mfem::TVector::aligned_size
static const int aligned_size
Definition ttensor.hpp:290

mfem::TVector::Scale
void Scale(const data_t scale)
Definition ttensor.hpp:335

mfem::TVector::layout
static const layout_type layout
Definition ttensor.hpp:295

mfem::TVector::operator[]
const data_t & operator[](int i) const
Definition ttensor.hpp:298

mfem::TVector::data
data_t data[aligned_size >0?aligned_size:1]
Definition ttensor.hpp:292

mfem::TVector::operator[]
data_t & operator[](int i)
Definition ttensor.hpp:297

mfem::TVector::Assign
void Assign(const src_data_t &src)
Definition ttensor.hpp:307

mfem::TVector::AssignTo
void AssignTo(dest_data_t &dest)
Definition ttensor.hpp:313

mfem::TVector::Assemble
void Assemble(dest_data_t &dest) const
Definition ttensor.hpp:330

mfem::TVector::size
static const int size
Definition ttensor.hpp:289

mfem::TVector::Set
void Set(const data_t d)
Definition ttensor.hpp:318

mfem::TVector::layout_type
StridedLayout1D< S, 1 > layout_type
Definition ttensor.hpp:294

mfem::TVector::Assign
void Assign(const data_t d)
Definition ttensor.hpp:301

mfem::TVector::data_type
data_t data_type
Definition ttensor.hpp:291

mfem::TVector::Set
void Set(const src_data_t &src)
Definition ttensor.hpp:324

tassign.hpp

tconfig.hpp

tlayout.hpp

tmatrix.hpp