doxygen/5.1.0/_phys_deriv_8cpp_source.html

 ///////////////////////////////////////////////////////////////////////////////

 //

 // File: PhysDeriv.cpp

 //

 // For more information, please see: http://www.nektar.info

 //

 // The MIT License

 //

 // Copyright (c) 2006 Division of Applied Mathematics, Brown University (USA),

 // Department of Aeronautics, Imperial College London (UK), and Scientific

 // Computing and Imaging Institute, University of Utah (USA).

 //

 // Permission is hereby granted, free of charge, to any person obtaining a

 // copy of this software and associated documentation files (the "Software"),

 // to deal in the Software without restriction, including without limitation

 // the rights to use, copy, modify, merge, publish, distribute, sublicense,

 // and/or sell copies of the Software, and to permit persons to whom the

 // Software is furnished to do so, subject to the following conditions:

 //

 // The above copyright notice and this permission notice shall be included

 // in all copies or substantial portions of the Software.

 //

 // THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS

 // OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

 // FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL

 // THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

 // LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING

 // FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER

 // DEALINGS IN THE SOFTWARE.

 //

 // Description: PhysDeriv operator implementations

 //

 ///////////////////////////////////////////////////////////////////////////////


 #include <boost/core/ignore_unused.hpp>


 #include <MatrixFreeOps/Operator.hpp>


 #include <Collections/Operator.h>

 #include <Collections/MatrixFreeBase.h>

 #include <Collections/Collection.h>


 using namespace std;


 namespace Nektar {

 namespace Collections {


 using LibUtilities::eSegment;

 using LibUtilities::eQuadrilateral;

 using LibUtilities::eTriangle;

 using LibUtilities::eHexahedron;

 using LibUtilities::eTetrahedron;

 using LibUtilities::ePrism;

 using LibUtilities::ePyramid;


 /**

  * @brief Phys deriv operator using standard matrix approach

  */

 class PhysDeriv_StdMat : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_StdMat)


         ~PhysDeriv_StdMat() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);

             Array<OneD, Array<OneD, NekDouble> > out(3);

             out[0] = output0;  out[1] = output1;    out[2] = output2;


             for(int i = 0; i < m_dim; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // calculate local derivatives

             for(int i = 0; i < m_dim; ++i)

             {

                 Blas::Dgemm('N', 'N', m_derivMat[i]->GetRows(), m_numElmt,

                             m_derivMat[i]->GetColumns(), 1.0,

                             m_derivMat[i]->GetRawPtr(),

                             m_derivMat[i]->GetRows(), input.get(), nPhys,

                             0.0, &Diff[i][0],nPhys);

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Zero(ntot,out[i],1);

                     for(int j = 0; j < m_dim; ++j)

                     {

                         Vmath::Vvtvp (ntot, m_derivFac[i*m_dim+j], 1,

                                       Diff[j],  1,

                                       out[i],   1,

                                       out[i],   1);

                     }

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Zero(ntot,out[i],1);

                     for(int e = 0; e < m_numElmt; ++e)

                     {

                         for(int j = 0; j < m_dim; ++j)

                         {

                             Vmath::Svtvp (m_nqe, m_derivFac[i*m_dim+j][e],

                                           Diff[j] + e*m_nqe,     1,

                                           out[i]  + e*m_nqe,     1,

                                           t = out[i]  + e*m_nqe, 1);

                         }

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);


             for(int i = 0; i < m_dim; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // calculate local derivatives

             for(int i = 0; i < m_dim; ++i)

             {

                 Blas::Dgemm('N', 'N', m_derivMat[i]->GetRows(), m_numElmt,

                             m_derivMat[i]->GetColumns(), 1.0,

                             m_derivMat[i]->GetRawPtr(),

                             m_derivMat[i]->GetRows(), input.get(), nPhys,

                             0.0, &Diff[i][0],nPhys);

             }


             // calculate full derivative

             Vmath::Zero(ntot,output,1);

             if(m_isDeformed)

             {

                 for(int j = 0; j < m_dim; ++j)

                 {

                     Vmath::Vvtvp (ntot, m_derivFac[dir*m_dim+j], 1,

                                   Diff[j],  1,

                                   output,   1,

                                   output,   1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int j = 0; j < m_dim; ++j)

                     {

                         Vmath::Svtvp (m_nqe, m_derivFac[dir*m_dim+j][e],

                                       Diff[j] + e*m_nqe,     1,

                                       output  + e*m_nqe,     1,

                                       t = output  + e*m_nqe, 1);

                     }

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         Array<OneD, DNekMatSharedPtr>   m_derivMat;

         Array<TwoD, const NekDouble>    m_derivFac;

         int                             m_dim;

         int                             m_coordim;


     private:

         PhysDeriv_StdMat(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors)

         {

             int nqtot = 1;

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();

             m_dim = PtsKey.size();

             m_coordim = pCollExp[0]->GetCoordim();


             for(int i = 0; i < m_dim; ++i)

             {

                 nqtot *= PtsKey[i].GetNumPoints();

             }

             // set up a PhysDeriv StdMat.

             m_derivMat = Array<OneD, DNekMatSharedPtr>(m_dim);

             for(int i = 0; i < m_dim; ++i)

             {

                 Array<OneD, NekDouble> tmp(nqtot),tmp1(nqtot);

                 m_derivMat[i] = MemoryManager<DNekMat>

                                             ::AllocateSharedPtr(nqtot,nqtot);

                 for(int j = 0; j < nqtot; ++j)

                 {

                     Vmath::Zero(nqtot,tmp,1);

                     tmp[j] = 1.0;

                     m_stdExp->PhysDeriv(i,tmp,tmp1);

                     Vmath::Vcopy(nqtot, &tmp1[0], 1,

                                  &(m_derivMat[i]->GetPtr())[0] + j*nqtot, 1);

                 }

             }

             m_derivFac = pGeomData->GetDerivFactors(pCollExp);

             m_wspSize = 3*nqtot*m_numElmt;

         }

 };


 /// Factory initialisation for the PhysDeriv_StdMat operators

 OperatorKey PhysDeriv_StdMat::m_typeArr[] =

 {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eSegment,       ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Seg"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle,      ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Tri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle,      ePhysDeriv, eStdMat, true),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_NodalTri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eQuadrilateral, ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Quad"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron,   ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Tet"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron,   ePhysDeriv, eStdMat, true),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_NodalTet"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePyramid,       ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Pyr"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism,         ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Prism"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism,         ePhysDeriv, eStdMat, true),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_NodalPrism"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eHexahedron,    ePhysDeriv, eStdMat, false),

         PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Hex"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePyramid, ePhysDeriv, eSumFac, false),

         PhysDeriv_StdMat::create, "PhysDeriv_SumFac_Pyr")

 };


 /**

  * @brief Phys deriv operator using matrix free operators.

  */

 class PhysDeriv_MatrixFree : public Operator, MatrixFreeOneInMultiOut

 {

     public:

     OPERATOR_CREATE(PhysDeriv_MatrixFree)


     ~PhysDeriv_MatrixFree() final

     {

     }


     void operator()(

              const Array<OneD, const NekDouble> &input,

                    Array<OneD,       NekDouble> &output0,

                    Array<OneD,       NekDouble> &output1,

                    Array<OneD,       NekDouble> &output2,

                    Array<OneD,       NekDouble> &wsp) final

     {

         boost::ignore_unused(wsp);


         if (m_isPadded)

         {

             // copy into padded vector

             Vmath::Vcopy(m_nIn, input, 1, m_input, 1);

             (*m_oper)(m_input, m_output);

         }

         else

         {

             (*m_oper)(input, m_output);

         }


         // currently using temporary local temporary space for output

         // to allow for other operator call below which is

         // directionally dependent

         switch(m_coordim)

         {

         case 1:

             Vmath::Vcopy(m_nOut, m_output[0], 1, output0, 1);

             break;

         case 2:

             Vmath::Vcopy(m_nOut, m_output[0], 1, output0, 1);

             Vmath::Vcopy(m_nOut, m_output[1], 1, output1, 1);

             break;

         case 3:

             Vmath::Vcopy(m_nOut, m_output[0], 1, output0, 1);

             Vmath::Vcopy(m_nOut, m_output[1], 1, output1, 1);

             Vmath::Vcopy(m_nOut, m_output[2], 1, output2, 1);

             break;

         default:

             NEKERROR(ErrorUtil::efatal,

                      "Unknown coordinate dimension");

             break;

         }

     }


     void operator()(int dir,

                     const Array<OneD, const NekDouble> &input,

                     Array<OneD, NekDouble> &output,

                     Array<OneD, NekDouble> &wsp) final

     {

         boost::ignore_unused(wsp);

         if (m_isPadded)

         {

             // copy into padded vector

             Vmath::Vcopy(m_nIn, input, 1, m_input, 1);

             (*m_oper)(m_input, m_output);

         }

         else

         {

             (*m_oper)(input, m_output);

         }

         Vmath::Vcopy(m_nOut, m_output[dir], 1, output, 1);

     }


     virtual void CheckFactors(StdRegions::FactorMap factors,

                               int coll_phys_offset)

     {

         boost::ignore_unused(factors, coll_phys_offset);

         ASSERTL0(false, "Not valid for this operator.");

     }


 private:

     std::shared_ptr<MatrixFree::PhysDeriv> m_oper;


     PhysDeriv_MatrixFree(

                     vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                     CoalescedGeomDataSharedPtr                pGeomData,

                     StdRegions::FactorMap                     factors)

         : Operator(pCollExp, pGeomData, factors),

           MatrixFreeOneInMultiOut(pCollExp[0]->GetCoordim(),

                                   pCollExp[0]->GetStdExp()->GetTotPoints(),

                                   pCollExp[0]->GetStdExp()->GetTotPoints(),

                                   pCollExp.size())

     {

         // Check if deformed

         bool deformed{pGeomData->IsDeformed(pCollExp)};

         const auto dim = pCollExp[0]->GetStdExp()->GetShapeDimension();


         if(m_isPadded == false) // declare local space non-padded case

         {

             int nOut = pCollExp[0]->GetStdExp()->GetTotPoints();

             m_output = Array<OneD, Array<OneD, NekDouble>> (m_coordim);

             m_output[0] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

             if(m_coordim == 2)

             {

                 m_output[1] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

             }

             else if (m_coordim == 3)

             {

                 m_output[1] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

                 m_output[2] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

             }

         }


         // Basis vector.

         std::vector<LibUtilities::BasisSharedPtr> basis(dim);

         for (unsigned int i = 0; i < dim; ++i)

         {

             basis[i] = pCollExp[0]->GetBasis(i);

         }


         // Get shape type

         auto shapeType = pCollExp[0]->GetStdExp()->DetShapeType();


         // Generate operator string and create operator.

         std::string op_string = "PhysDeriv";

         op_string += MatrixFree::GetOpstring(shapeType, deformed);

         auto oper = MatrixFree::GetOperatorFactory().

             CreateInstance(op_string, basis, m_nElmtPad);


         // Set derivative factors

         oper->SetDF(pGeomData->GetDerivFactorsInterLeave

                     (pCollExp,m_nElmtPad));


         m_oper = std::dynamic_pointer_cast<MatrixFree::PhysDeriv>(oper);

         ASSERTL0(m_oper, "Failed to cast pointer.");


     }

 };


 /// Factory initialisation for the PhysDeriv_MatrixFree operators

 OperatorKey PhysDeriv_MatrixFree::m_typeArr[] =

     {

      GetOperatorFactory().RegisterCreatorFunction(

                     OperatorKey(eSegment, ePhysDeriv, eMatrixFree, false),

                     PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Seg"),

      GetOperatorFactory().RegisterCreatorFunction(

                     OperatorKey(eTriangle, ePhysDeriv, eMatrixFree, false),

                     PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Tri"),

      GetOperatorFactory().RegisterCreatorFunction(

                     OperatorKey(eQuadrilateral, ePhysDeriv, eMatrixFree, false),

                     PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Quad"),

      GetOperatorFactory().RegisterCreatorFunction(

                     OperatorKey(eHexahedron, ePhysDeriv, eMatrixFree, false),

                     PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Hex"),

      GetOperatorFactory().RegisterCreatorFunction(

                     OperatorKey(ePrism, ePhysDeriv, eMatrixFree, false),

                     PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Prism"),

      GetOperatorFactory().RegisterCreatorFunction(

                     OperatorKey(ePyramid, ePhysDeriv, eMatrixFree, false),

                     PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Pyr"),

      GetOperatorFactory().RegisterCreatorFunction(

                      OperatorKey(eTetrahedron, ePhysDeriv, eMatrixFree, false),

                      PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Tet")


     };


 /**

  * @brief Phys deriv operator using element-wise operation

  */

 class PhysDeriv_IterPerExp : public Operator

 {

 public:

     OPERATOR_CREATE(PhysDeriv_IterPerExp)


     ~PhysDeriv_IterPerExp() final

     {

     }


     void operator()( const Array<OneD, const NekDouble> &input,

                             Array<OneD,       NekDouble> &output0,

                             Array<OneD,       NekDouble> &output1,

                             Array<OneD,       NekDouble> &output2,

                             Array<OneD,       NekDouble> &wsp) final

         {


             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);

             Array<OneD, Array<OneD, NekDouble> > out(3);

             out[0] = output0;  out[1] = output1;  out[2] = output2;


             for(int i = 0; i < m_dim; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // calculate local derivatives

             for (int i = 0; i < m_numElmt; ++i)

             {

                 m_stdExp->PhysDeriv(input + i*nPhys,

                                     tmp0 = Diff[0] + i*nPhys,

                                     tmp1 = Diff[1] + i*nPhys,

                                     tmp2 = Diff[2] + i*nPhys);

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Vmul(ntot,m_derivFac[i*m_dim],1,Diff[0],1,out[i],1);

                     for(int j = 1; j < m_dim; ++j)

                     {

                         Vmath::Vvtvp (ntot, m_derivFac[i*m_dim+j], 1,

                                       Diff[j],               1,

                                       out[i],                1,

                                       out[i],                1);

                     }

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int i = 0; i < m_coordim; ++i)

                     {

                         Vmath::Smul(m_nqe,m_derivFac[i*m_dim][e],

                                     Diff[0] + e*m_nqe,1,

                                     t = out[i] + e*m_nqe,1);

                         for(int j = 1; j < m_dim; ++j)

                         {

                             Vmath::Svtvp (m_nqe, m_derivFac[i*m_dim+j][e],

                                           Diff[j] + e*m_nqe,     1,

                                           out[i]  + e*m_nqe,     1,

                                           t = out[i]  + e*m_nqe, 1);

                         }

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD,NekDouble> &wsp) final

         {

             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);


             for(int i = 0; i < m_dim; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // calculate local derivatives

             for (int i = 0; i < m_numElmt; ++i)

             {

                 m_stdExp->PhysDeriv(input + i*nPhys,

                                     tmp0 = Diff[0] + i*nPhys,

                                     tmp1 = Diff[1] + i*nPhys,

                                     tmp2 = Diff[2] + i*nPhys);

             }


             Vmath::Zero(ntot,output,1);

             if(m_isDeformed)

             {

                 for(int j = 0; j < m_dim; ++j)

                 {

                     Vmath::Vvtvp (ntot, m_derivFac[dir*m_dim+j], 1,

                                   Diff[j],               1,

                                   output,                1,

                                   output,                1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int j = 0; j < m_dim; ++j)

                     {

                         Vmath::Svtvp (m_nqe, m_derivFac[dir*m_dim+j][e],

                                       Diff[j] + e*m_nqe,     1,

                                       output  + e*m_nqe,     1,

                                       t = output  + e*m_nqe, 1);

                     }

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         Array<TwoD, const NekDouble>    m_derivFac;

         int                             m_dim;

         int                             m_coordim;


     private:

         PhysDeriv_IterPerExp(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

         : Operator(pCollExp, pGeomData, factors)

         {

             int nqtot = 1;

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();

             m_dim = PtsKey.size();

             m_coordim = pCollExp[0]->GetCoordim();


             for(int i = 0; i < m_dim; ++i)

             {

                 nqtot *= PtsKey[i].GetNumPoints();

             }

             m_derivFac = pGeomData->GetDerivFactors(pCollExp);

             m_wspSize = 3*nqtot*m_numElmt;

         }

 };


 /// Factory initialisation for the PhysDeriv_IterPerExp operators

 OperatorKey PhysDeriv_IterPerExp::m_typeArr[] =

 {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eSegment,       ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Seg"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle,      ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Tri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle,      ePhysDeriv, eIterPerExp,true),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_NodalTri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eQuadrilateral, ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Quad"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron,   ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Tet"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron,   ePhysDeriv, eIterPerExp,true),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_NodalTet"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePyramid,       ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Pyr"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism,         ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Prism"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism,         ePhysDeriv, eIterPerExp,true),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_NodalPrism"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eHexahedron,    ePhysDeriv, eIterPerExp,false),

         PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Hex")

 };


 /**

  * @brief Phys deriv operator using original LocalRegions implementation.

  */

 class PhysDeriv_NoCollection : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_NoCollection)


         ~PhysDeriv_NoCollection() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {

             boost::ignore_unused(wsp);


             const int nPhys   = m_expList[0]->GetTotPoints();

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;


             // calculate local derivatives

             switch (m_expList[0]->GetShapeDimension())

             {

                 case 1:

                 {

                     for (int i = 0; i < m_numElmt; ++i)

                     {

                         m_expList[i]->PhysDeriv(input + i*nPhys,

                                         tmp0 = output0 + i*nPhys);

                     }

                     break;

                 }

                 case 2:

                 {

                     for (int i = 0; i < m_numElmt; ++i)

                     {

                         m_expList[i]->PhysDeriv(input + i*nPhys,

                                         tmp0 = output0 + i*nPhys,

                                         tmp1 = output1 + i*nPhys);

                     }

                     break;

                 }

                 case 3:

                 {

                     for (int i = 0; i < m_numElmt; ++i)

                     {

                         m_expList[i]->PhysDeriv(input + i*nPhys,

                                         tmp0 = output0 + i*nPhys,

                                         tmp1 = output1 + i*nPhys,

                                         tmp2 = output2 + i*nPhys);

                     }

                     break;

                 }

                 default:

                     ASSERTL0(false, "Unknown dimension.");

             }

         }


         void operator()(int dir,

                        const Array<OneD, const NekDouble> &input,

                        Array<OneD, NekDouble> &output,

                        Array<OneD, NekDouble> &wsp) final

         {

             boost::ignore_unused(wsp);


             const int nPhys   = m_expList[0]->GetTotPoints();

             Array<OneD, NekDouble> tmp;


             // calculate local derivatives

             for (int i = 0; i < m_numElmt; ++i)

             {

                 m_expList[i]->PhysDeriv(dir, input + i*nPhys,

                                              tmp = output + i*nPhys);

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         vector<StdRegions::StdExpansionSharedPtr> m_expList;


     private:

         PhysDeriv_NoCollection(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors)

         {

             m_expList = pCollExp;

         }

 };


 /// Factory initialisation for the PhysDeriv_NoCollection operators

 OperatorKey PhysDeriv_NoCollection::m_typeArr[] =

 {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eSegment,       ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Seg"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle,      ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Tri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle,      ePhysDeriv, eNoCollection,true),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_NodalTri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eQuadrilateral, ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Quad"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron,   ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Tet"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron,   ePhysDeriv, eNoCollection,true),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_NodalTet"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePyramid,       ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Pyr"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism,         ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Prism"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism,         ePhysDeriv, eNoCollection,true),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_NodalPrism"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eHexahedron,    ePhysDeriv, eNoCollection,false),

         PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Hex")

 };


 /**

  * @brief Phys deriv operator using sum-factorisation (Segment)

  */

 class PhysDeriv_SumFac_Seg : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Seg)


         ~PhysDeriv_SumFac_Seg() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             const int nqcol   = m_nquad0*m_numElmt;


             ASSERTL1(wsp.size() == m_wspSize,

                      "Incorrect workspace size");

             ASSERTL1(input.size() >= nqcol,

                      "Incorrect input size");


             Array<OneD, NekDouble> diff0(nqcol, wsp);


             Blas::Dgemm('N', 'N', m_nquad0, m_numElmt,

                         m_nquad0, 1.0, m_Deriv0, m_nquad0,

                         input.get(), m_nquad0, 0.0,

                         diff0.get(), m_nquad0);


             if(m_isDeformed)

             {

                 Vmath::Vmul  (nqcol, m_derivFac[0], 1, diff0, 1, output0, 1);


                 if (m_coordim == 2)

                 {

                     Vmath::Vmul  (nqcol, m_derivFac[1], 1, diff0, 1, output1, 1);

                 }

                 else if (m_coordim == 3)

                 {

                     Vmath::Vmul  (nqcol, m_derivFac[1], 1, diff0, 1, output1, 1);

                     Vmath::Vmul  (nqcol, m_derivFac[2], 1, diff0, 1, output2, 1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul  (m_nqe, m_derivFac[0][e], diff0 + e*m_nqe, 1,

                                   t = output0 + e*m_nqe, 1);

                 }


                 if (m_coordim == 2)

                 {

                     for(int e = 0; e < m_numElmt; ++e)

                     {

                         Vmath::Smul  (m_nqe, m_derivFac[1][e], diff0 + e*m_nqe, 1,

                                       t = output1 + e*m_nqe, 1);

                     }

                 }

                 else if (m_coordim == 3)

                 {

                     for(int e = 0; e < m_numElmt; ++e)

                     {

                         Vmath::Smul  (m_nqe, m_derivFac[1][e], diff0 + e*m_nqe, 1,

                                       t = output1 + e*m_nqe, 1);

                         Vmath::Smul  (m_nqe, m_derivFac[2][e], diff0 + e*m_nqe, 1,

                                       t = output2 + e*m_nqe, 1);}

                 }


             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             const int nqcol   = m_nquad0*m_numElmt;


             ASSERTL1(wsp.size() == m_wspSize,

                      "Incorrect workspace size");

             ASSERTL1(input.size() >= nqcol,

                      "Incorrect input size");


             Array<OneD, NekDouble> diff0(nqcol, wsp);


             Blas::Dgemm('N', 'N', m_nquad0, m_numElmt,

                         m_nquad0, 1.0, m_Deriv0, m_nquad0,

                         input.get(), m_nquad0, 0.0,

                         diff0.get(), m_nquad0);


             if(m_isDeformed)

             {

                 Vmath::Vmul(nqcol, m_derivFac[dir], 1, diff0, 1, output, 1);

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul  (m_nqe, m_derivFac[0][e], diff0 + e*m_nqe, 1,

                                   t = output + e*m_nqe, 1);

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         int                             m_coordim;

         const int                       m_nquad0;

         Array<TwoD, const NekDouble>    m_derivFac;

         NekDouble                      *m_Deriv0;


     private:

         PhysDeriv_SumFac_Seg(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0 (m_stdExp->GetNumPoints(0))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();

             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_wspSize = m_nquad0*m_numElmt;

         }


 };


 /// Factory initialisation for the PhysDeriv_SumFac_Seg operators

 OperatorKey PhysDeriv_SumFac_Seg::m_type = GetOperatorFactory().

     RegisterCreatorFunction(

         OperatorKey(eSegment, ePhysDeriv, eSumFac,false),

         PhysDeriv_SumFac_Seg::create, "PhysDeriv_SumFac_Seg");


 /**

  * @brief Phys deriv operator using sum-factorisation (Quad)

  */

 class PhysDeriv_SumFac_Quad : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Quad)


         ~PhysDeriv_SumFac_Quad() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             const int nqtot   = m_nquad0 * m_nquad1;

             const int nqcol   = nqtot*m_numElmt;


             ASSERTL1(wsp.size() == m_wspSize,

                      "Incorrect workspace size");

             ASSERTL1(input.size() >= nqcol,

                      "Incorrect input size");


             Array<OneD, NekDouble> diff0(nqcol, wsp             );

             Array<OneD, NekDouble> diff1(nqcol, wsp    +   nqcol);


             Blas::Dgemm('N', 'N', m_nquad0, m_nquad1*m_numElmt,

                         m_nquad0, 1.0, m_Deriv0, m_nquad0,

                         input.get(), m_nquad0, 0.0,

                         diff0.get(), m_nquad0);


             int cnt = 0;

             for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

             {

                 Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                             input.get() + cnt, m_nquad0,

                             m_Deriv1, m_nquad1, 0.0,

                             diff1.get() + cnt, m_nquad0);

             }


             if(m_isDeformed)

             {

                 Vmath::Vmul  (nqcol, m_derivFac[0], 1, diff0, 1, output0, 1);

                 Vmath::Vvtvp (nqcol, m_derivFac[1], 1, diff1, 1, output0, 1,

                               output0, 1);

                 Vmath::Vmul  (nqcol, m_derivFac[2], 1, diff0, 1, output1, 1);

                 Vmath::Vvtvp (nqcol, m_derivFac[3], 1, diff1, 1, output1, 1,

                               output1, 1);


                 if (m_coordim == 3)

                 {

                     Vmath::Vmul  (nqcol, m_derivFac[4], 1, diff0, 1, output2, 1);

                     Vmath::Vvtvp (nqcol, m_derivFac[5], 1, diff1, 1, output2, 1,

                                   output2, 1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul  (m_nqe, m_derivFac[0][e], diff0 + e*m_nqe, 1,

                                   t = output0 + e*m_nqe, 1);

                     Vmath::Svtvp (m_nqe, m_derivFac[1][e], diff1 + e*m_nqe, 1,

                                   output0 + e*m_nqe, 1, t = output0 + e*m_nqe, 1);


                     Vmath::Smul  (m_nqe, m_derivFac[2][e], diff0 + e*m_nqe, 1,

                                   t = output1 + e*m_nqe, 1);

                     Vmath::Svtvp (m_nqe, m_derivFac[3][e], diff1 + e*m_nqe, 1,

                                   output1 + e*m_nqe, 1, t = output1 + e*m_nqe, 1);

                 }


                 if (m_coordim == 3)

                 {

                     for(int e = 0; e < m_numElmt; ++e)

                     {

                         Vmath::Smul  (m_nqe, m_derivFac[4][e], diff0 + e*m_nqe, 1,

                                       t = output2 + e*m_nqe, 1);

                         Vmath::Svtvp (m_nqe, m_derivFac[5][e], diff1 + e*m_nqe, 1,

                                       output2 + e*m_nqe, 1, t = output2 + e*m_nqe, 1);

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             const int nqtot   = m_nquad0 * m_nquad1;

             const int nqcol   = nqtot*m_numElmt;


             ASSERTL1(wsp.size() == m_wspSize,

                      "Incorrect workspace size");

             ASSERTL1(input.size() >= nqcol,

                      "Incorrect input size");


             Array<OneD, NekDouble> diff0(nqcol, wsp             );

             Array<OneD, NekDouble> diff1(nqcol, wsp    +   nqcol);


             Blas::Dgemm('N', 'N', m_nquad0, m_nquad1*m_numElmt,

                         m_nquad0, 1.0, m_Deriv0, m_nquad0,

                         input.get(), m_nquad0, 0.0,

                         diff0.get(), m_nquad0);


             int cnt = 0;

             for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

             {

                 Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                             input.get() + cnt, m_nquad0,

                             m_Deriv1, m_nquad1, 0.0,

                             diff1.get() + cnt, m_nquad0);

             }


             if(m_isDeformed)

             {

                 Vmath::Vmul  (nqcol, m_derivFac[2*dir]  , 1, diff0, 1, output, 1);

                 Vmath::Vvtvp (nqcol, m_derivFac[2*dir+1], 1, diff1, 1, output, 1,

                               output, 1);

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul  (m_nqe, m_derivFac[2*dir][e], diff0 + e*m_nqe, 1,

                                   t = output + e*m_nqe, 1);

                     Vmath::Svtvp (m_nqe, m_derivFac[2*dir+1][e], diff1 + e*m_nqe, 1,

                                   output + e*m_nqe, 1, t = output + e*m_nqe, 1);

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         int                             m_coordim;

         const int                       m_nquad0;

         const int                       m_nquad1;

         Array<TwoD, const NekDouble>    m_derivFac;

         NekDouble                      *m_Deriv0;

         NekDouble                      *m_Deriv1;


     private:

         PhysDeriv_SumFac_Quad(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0 (m_stdExp->GetNumPoints(0)),

               m_nquad1 (m_stdExp->GetNumPoints(1))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();

             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

             m_wspSize = 2 * m_nquad0*m_nquad1*m_numElmt;

         }


 };


 /// Factory initialisation for the PhysDeriv_SumFac_Quad operators

 OperatorKey PhysDeriv_SumFac_Quad::m_type = GetOperatorFactory().

     RegisterCreatorFunction(

                             OperatorKey(eQuadrilateral, ePhysDeriv, eSumFac, false),

         PhysDeriv_SumFac_Quad::create, "PhysDeriv_SumFac_Quad");


 /**

  * @brief Phys deriv operator using sum-factorisation (Tri)

  */

 class PhysDeriv_SumFac_Tri : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Tri)


         ~PhysDeriv_SumFac_Tri() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             const int nqtot   = m_nquad0 * m_nquad1;

             const int nqcol   = nqtot*m_numElmt;


             ASSERTL1(wsp.size() == m_wspSize,

                      "Incorrect workspace size");

             ASSERTL1(input.size() >= nqcol,

                      "Incorrect input size");


             Array<OneD, NekDouble> diff0(nqcol, wsp             );

             Array<OneD, NekDouble> diff1(nqcol, wsp    +   nqcol);


             // Tensor Product Derivative

             Blas::Dgemm('N', 'N', m_nquad0, m_nquad1*m_numElmt,

                         m_nquad0, 1.0, m_Deriv0, m_nquad0,

                         input.get(), m_nquad0, 0.0,

                         diff0.get(), m_nquad0);


             int cnt = 0;

             for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

             {

                 // scale diff0 by geometric factor: 2/(1-z1)

                 Vmath::Vmul(nqtot,&m_fac1[0],1,diff0.get()+cnt,1,

                             diff0.get()+cnt,1);


                 Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                             input.get() + cnt, m_nquad0,

                             m_Deriv1, m_nquad1, 0.0,

                             diff1.get() + cnt, m_nquad0);


                 // add to diff1 by diff0 scaled by: (1_z0)/(1-z1)

                 Vmath::Vvtvp(nqtot,m_fac0.get(),1,diff0.get()+cnt,1,

                              diff1.get()+cnt,1,diff1.get()+cnt,1);

             }


             if(m_isDeformed)

             {

                 Vmath::Vmul  (nqcol, m_derivFac[0], 1, diff0, 1, output0, 1);

                 Vmath::Vvtvp (nqcol, m_derivFac[1], 1, diff1, 1, output0, 1,

                               output0, 1);

                 Vmath::Vmul  (nqcol, m_derivFac[2], 1, diff0, 1, output1, 1);

                 Vmath::Vvtvp (nqcol, m_derivFac[3], 1, diff1, 1, output1, 1,

                               output1, 1);


                 if (m_coordim == 3)

                 {

                     Vmath::Vmul  (nqcol, m_derivFac[4], 1, diff0, 1, output2, 1);

                     Vmath::Vvtvp (nqcol, m_derivFac[5], 1, diff1, 1, output2, 1,

                                   output2, 1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul  (m_nqe, m_derivFac[0][e], diff0 + e*m_nqe, 1,

                                   t = output0 + e*m_nqe, 1);

                     Vmath::Svtvp (m_nqe, m_derivFac[1][e], diff1 + e*m_nqe, 1,

                                   output0 + e*m_nqe, 1, t = output0 + e*m_nqe, 1);


                     Vmath::Smul  (m_nqe, m_derivFac[2][e], diff0 + e*m_nqe, 1,

                                   t = output1 + e*m_nqe, 1);

                     Vmath::Svtvp (m_nqe, m_derivFac[3][e], diff1 + e*m_nqe, 1,

                                   output1 + e*m_nqe, 1, t = output1 + e*m_nqe, 1);

                 }


                 if (m_coordim == 3)

                 {

                     for(int e = 0; e < m_numElmt; ++e)

                     {

                         Vmath::Smul  (m_nqe, m_derivFac[4][e], diff0 + e*m_nqe, 1,

                                       t = output2 + e*m_nqe, 1);

                         Vmath::Svtvp (m_nqe, m_derivFac[5][e], diff1 + e*m_nqe, 1,

                                       output2 + e*m_nqe, 1, t = output2 + e*m_nqe, 1);

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             const int nqtot   = m_nquad0 * m_nquad1;

             const int nqcol   = nqtot*m_numElmt;


             ASSERTL1(wsp.size() == m_wspSize,

                      "Incorrect workspace size");

             ASSERTL1(input.size() >= nqcol,

                      "Incorrect input size");


             Array<OneD, NekDouble> diff0(nqcol, wsp             );

             Array<OneD, NekDouble> diff1(nqcol, wsp    +   nqcol);


             // Tensor Product Derivative

             Blas::Dgemm('N', 'N', m_nquad0, m_nquad1*m_numElmt,

                         m_nquad0, 1.0, m_Deriv0, m_nquad0,

                         input.get(), m_nquad0, 0.0,

                         diff0.get(), m_nquad0);


             int cnt = 0;

             for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

             {

                 // scale diff0 by geometric factor: 2/(1-z1)

                 Vmath::Vmul(nqtot,&m_fac1[0],1,diff0.get()+cnt,1,

                             diff0.get()+cnt,1);


                 Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                             input.get() + cnt, m_nquad0,

                             m_Deriv1, m_nquad1, 0.0,

                             diff1.get() + cnt, m_nquad0);


                 // add to diff1 by diff0 scaled by: (1_z0)/(1-z1)

                 Vmath::Vvtvp(nqtot,m_fac0.get(),1,diff0.get()+cnt,1,

                              diff1.get()+cnt,1,diff1.get()+cnt,1);

             }


             if(m_isDeformed)

             {

                 Vmath::Vmul  (nqcol, m_derivFac[2*dir]  , 1, diff0, 1, output, 1);

                 Vmath::Vvtvp (nqcol, m_derivFac[2*dir+1], 1, diff1, 1, output, 1,

                               output, 1);

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul  (m_nqe, m_derivFac[2*dir][e], diff0 + e*m_nqe, 1,

                                   t = output + e*m_nqe, 1);

                     Vmath::Svtvp (m_nqe, m_derivFac[2*dir+1][e], diff1 + e*m_nqe, 1,

                                   output + e*m_nqe, 1, t = output + e*m_nqe, 1);

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         int                             m_coordim;

         const int                       m_nquad0;

         const int                       m_nquad1;

         Array<TwoD, const NekDouble>    m_derivFac;

         NekDouble                      *m_Deriv0;

         NekDouble                      *m_Deriv1;

         Array<OneD, NekDouble>          m_fac0;

         Array<OneD, NekDouble>          m_fac1;


     private:

         PhysDeriv_SumFac_Tri(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0 (m_stdExp->GetNumPoints(0)),

               m_nquad1 (m_stdExp->GetNumPoints(1))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();

             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             const Array<OneD, const NekDouble>& z0

                                             = m_stdExp->GetBasis(0)->GetZ();

             const Array<OneD, const NekDouble>& z1

                                             = m_stdExp->GetBasis(1)->GetZ();

             m_fac0 = Array<OneD, NekDouble>(m_nquad0*m_nquad1);

             // set up geometric factor: 0.5*(1+z0)

             for (int i = 0; i < m_nquad0; ++i)

             {

                 for(int j = 0; j < m_nquad1; ++j)

                 {

                     m_fac0[i+j*m_nquad0] = 0.5*(1+z0[i]);

                 }

             }


             m_fac1 = Array<OneD, NekDouble>(m_nquad0*m_nquad1);

             // set up geometric factor: 2/(1-z1)

             for (int i = 0; i < m_nquad0; ++i)

             {

                 for(int j = 0; j < m_nquad1; ++j)

                 {

                     m_fac1[i+j*m_nquad0] = 2.0/(1-z1[j]);

                 }

             }


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

             m_wspSize = 2 * m_nquad0*m_nquad1*m_numElmt;

         }

 };


 /// Factory initialisation for the PhysDeriv_SumFac_Tri operators

 OperatorKey PhysDeriv_SumFac_Tri::m_typeArr[] =

 {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle, ePhysDeriv, eSumFac,false),

         PhysDeriv_SumFac_Tri::create, "PhysDeriv_SumFac_Tri"),

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTriangle, ePhysDeriv, eSumFac,true),

         PhysDeriv_SumFac_Tri::create, "PhysDeriv_SumFac_NodalTri")

 };


 /**

  * @brief Phys deriv operator using sum-factorisation (Hex)

  */

 class PhysDeriv_SumFac_Hex : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Hex)


         ~PhysDeriv_SumFac_Hex() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);

             Array<OneD, Array<OneD, NekDouble> > out(3);

             out[0] = output0;  out[1] = output1;    out[2] = output2;


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             for(int  i = 0; i < m_numElmt; ++i)

             {

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Vmul(ntot,m_derivFac[i*3],1,Diff[0],1,out[i],1);

                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Vvtvp (ntot, m_derivFac[i*3+j], 1,

                                       Diff[j],               1,

                                       out[i],                1,

                                       out[i],                1);

                     }

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int i = 0; i < m_coordim; ++i)

                     {


                         Vmath::Smul(m_nqe,m_derivFac[i*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = out[i] + e*m_nqe,1);


                         for(int j = 1; j < 3; ++j)

                         {

                             Vmath::Svtvp (m_nqe, m_derivFac[i*e+j][e],

                                           Diff[j] + e*m_nqe,     1,

                                           out[i]  + e*m_nqe,     1,

                                           t = out[i]  + e*m_nqe, 1);

                         }

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             for(int  i = 0; i < m_numElmt; ++i)

             {

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 // calculate full derivative

                 Vmath::Vmul(ntot,m_derivFac[dir*3],1,Diff[0],1,output,1);

                 for(int j = 1; j < 3; ++j)

                 {

                     Vmath::Vvtvp (ntot, m_derivFac[dir*3+j], 1,

                                   Diff[j],               1,

                                   output,                1,

                                   output,                1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul(m_nqe,m_derivFac[dir*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = output + e*m_nqe,1);


                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Svtvp (m_nqe, m_derivFac[dir*3+j][e],

                                       Diff[j] + e*m_nqe,     1,

                                       output  + e*m_nqe,     1,

                                       t = output  + e*m_nqe, 1);

                     }

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         Array<TwoD, const NekDouble>    m_derivFac;

         int                             m_coordim;

         const int                       m_nquad0;

         const int                       m_nquad1;

         const int                       m_nquad2;

         NekDouble                      *m_Deriv0;

         NekDouble                      *m_Deriv1;

         NekDouble                      *m_Deriv2;


     private:

         PhysDeriv_SumFac_Hex(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0  (m_stdExp->GetNumPoints(0)),

               m_nquad1  (m_stdExp->GetNumPoints(1)),

               m_nquad2  (m_stdExp->GetNumPoints(2))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();


             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

             m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


             m_wspSize = 3*m_nquad0*m_nquad1*m_nquad2*m_numElmt;

         }

 };


 /// Factory initialisation for the PhysDeriv_SumFac_Hex operators

 OperatorKey PhysDeriv_SumFac_Hex::m_typeArr[] =

 {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eHexahedron, ePhysDeriv, eSumFac, false),

         PhysDeriv_SumFac_Hex::create, "PhysDeriv_SumFac_Hex")

 };


 /**

  * @brief Phys deriv operator using sum-factorisation (Tet)

  */

 class PhysDeriv_SumFac_Tet : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Tet)


         ~PhysDeriv_SumFac_Tet() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);

             Array<OneD, Array<OneD, NekDouble> > out(3);

             out[0] = output0;  out[1] = output1;    out[2] = output2;


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // dEta0

             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             // dEta2

             for(int  i = 0; i < m_numElmt; ++i)

             {

                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);

             }


             for(int  i = 0; i < m_numElmt; ++i)

             {


                 // dEta1

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 // dxi2 = (1 + eta_1)/(1 -eta_2)*dEta1 + dEta2

                 Vmath::Vvtvp(nPhys, m_fac3.get(),            1,

                                     Diff[1].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1);


                 // dxi1 =  2/(1 - eta_2) dEta1

                 Vmath::Vmul(nPhys,  m_fac2.get(),            1,

                                     Diff[1].get() + i*nPhys, 1,

                                     Diff[1].get() + i*nPhys, 1);


                 // dxi1 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi1

                 Vmath::Vvtvp(nPhys, m_fac1.get(),            1,

                                     Diff[0].get() + i*nPhys, 1,

                                     Diff[1].get() + i*nPhys, 1,

                                     Diff[1].get() + i*nPhys, 1);


                 // dxi2 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi2

                 Vmath::Vvtvp(nPhys, m_fac1.get(),            1,

                                     Diff[0].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1);


                 // dxi0 = 4.0/((1-eta_1)(1-eta_2)) dEta0

                 Vmath::Vmul(nPhys,  m_fac0.get(),            1,

                                     Diff[0].get() + i*nPhys, 1,

                                     Diff[0].get() + i*nPhys, 1);


             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Vmul(ntot,m_derivFac[i*3],1,Diff[0],1,out[i],1);

                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Vvtvp (ntot, m_derivFac[i*3+j], 1,

                                       Diff[j],               1,

                                       out[i],                1,

                                       out[i],                1);

                     }

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int i = 0; i < m_coordim; ++i)

                     {

                         Vmath::Smul(m_nqe,m_derivFac[i*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = out[i] + e*m_nqe,1);


                         for(int j = 1; j < 3; ++j)

                         {

                             Vmath::Svtvp (m_nqe, m_derivFac[i*3+j][e],

                                           Diff[j] + e*m_nqe,     1,

                                           out[i]  + e*m_nqe,     1,

                                           t = out[i]  + e*m_nqe, 1);

                         }

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // dEta0

             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             // dEta2

             for(int  i = 0; i < m_numElmt; ++i)

             {

                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);

             }


             for(int  i = 0; i < m_numElmt; ++i)

             {


                 // dEta1

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 // dxi2 = (1 + eta_1)/(1 -eta_2)*dEta1 + dEta2

                 Vmath::Vvtvp(nPhys, m_fac3.get(),            1,

                                     Diff[1].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1);


                 // dxi1 =  2/(1 - eta_2) dEta1

                 Vmath::Vmul(nPhys,  m_fac2.get(),            1,

                                     Diff[1].get() + i*nPhys, 1,

                                     Diff[1].get() + i*nPhys, 1);


                 // dxi1 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi1

                 Vmath::Vvtvp(nPhys, m_fac1.get(),            1,

                                     Diff[0].get() + i*nPhys, 1,

                                     Diff[1].get() + i*nPhys, 1,

                                     Diff[1].get() + i*nPhys, 1);


                 // dxi2 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi2

                 Vmath::Vvtvp(nPhys, m_fac1.get(),            1,

                                     Diff[0].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1,

                                     Diff[2].get() + i*nPhys, 1);


                 // dxi0 = 4.0/((1-eta_1)(1-eta_2)) dEta0

                 Vmath::Vmul(nPhys,  m_fac0.get(),            1,

                                     Diff[0].get() + i*nPhys, 1,

                                     Diff[0].get() + i*nPhys, 1);


             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 // calculate full derivative

                 Vmath::Vmul(ntot,m_derivFac[dir*3],1,Diff[0],1,output,1);

                 for(int j = 1; j < 3; ++j)

                 {

                     Vmath::Vvtvp (ntot, m_derivFac[dir*3+j], 1,

                                   Diff[j],               1,

                                   output,                1,

                                   output,                1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul(m_nqe,m_derivFac[dir*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = output + e*m_nqe,1);


                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Svtvp (m_nqe, m_derivFac[dir*3+j][e],

                                       Diff[j] + e*m_nqe,     1,

                                       output  + e*m_nqe,     1,

                                       t = output  + e*m_nqe, 1);

                     }

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         Array<TwoD, const NekDouble>    m_derivFac;

         int                             m_coordim;

         const int                       m_nquad0;

         const int                       m_nquad1;

         const int                       m_nquad2;

         NekDouble                      *m_Deriv0;

         NekDouble                      *m_Deriv1;

         NekDouble                      *m_Deriv2;

         Array<OneD, NekDouble>          m_fac0;

         Array<OneD, NekDouble>          m_fac1;

         Array<OneD, NekDouble>          m_fac2;

         Array<OneD, NekDouble>          m_fac3;


     private:

         PhysDeriv_SumFac_Tet(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0  (m_stdExp->GetNumPoints(0)),

               m_nquad1  (m_stdExp->GetNumPoints(1)),

               m_nquad2  (m_stdExp->GetNumPoints(2))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();


             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

             m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


             m_wspSize = 3*m_nquad0*m_nquad1*m_nquad2*m_numElmt;


             const Array<OneD, const NekDouble>& z0

                                             = m_stdExp->GetBasis(0)->GetZ();

             const Array<OneD, const NekDouble>& z1

                                             = m_stdExp->GetBasis(1)->GetZ();

             const Array<OneD, const NekDouble>& z2

                                             = m_stdExp->GetBasis(2)->GetZ();


             m_fac0 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             m_fac1 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             m_fac2 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             m_fac3 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             // calculate 2.0/((1-eta_1)(1-eta_2))

             for (int i = 0; i < m_nquad0; ++i)

             {

                 for(int j = 0; j < m_nquad1; ++j)

                 {

                     for(int k = 0; k < m_nquad2; ++k)

                     {


                         m_fac0[i + j*m_nquad0 + k*m_nquad0*m_nquad1]

                                = 4.0/((1-z1[j])*(1-z2[k]));

                         m_fac1[i + j*m_nquad0 + k*m_nquad0*m_nquad1]

                                = 2.0*(1+z0[i])/((1-z1[j])*(1-z2[k]));

                         m_fac2[i + j*m_nquad0 + k*m_nquad0*m_nquad1]

                                = 2.0/(1-z2[k]);

                         m_fac3[i + j*m_nquad0 + k*m_nquad0*m_nquad1]

                                = (1+z1[j])/(1-z2[k]);

                     }

                 }

             }


         }

 };


 /// Factory initialisation for the PhysDeriv_SumFac_Tet operators

 OperatorKey PhysDeriv_SumFac_Tet::m_typeArr[] =

 {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(eTetrahedron, ePhysDeriv, eSumFac, false),

         PhysDeriv_SumFac_Tet::create, "PhysDeriv_SumFac_Tet")

 };


 /**

  * @brief Phys deriv operator using sum-factorisation (Prism)

  */

 class PhysDeriv_SumFac_Prism : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Prism)


         ~PhysDeriv_SumFac_Prism() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);

             Array<OneD, Array<OneD, NekDouble> > out(3);

             out[0] = output0; out[1] = output1; out[2] = output2;


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // dEta0

             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             int cnt = 0;

             for(int  i = 0; i < m_numElmt; ++i)

             {


                 // dEta 1

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 // dEta 2

                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);


                 // dxi0 = 2/(1-eta_2) d Eta_0

                 Vmath::Vmul(nPhys,&m_fac0[0],1,Diff[0].get()+cnt,1,

                             Diff[0].get()+cnt,1);


                 // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

                 Vmath::Vvtvp(nPhys,&m_fac1[0],1,Diff[0].get()+cnt,1,

                              Diff[2].get()+cnt,1,Diff[2].get()+cnt,1);

                 cnt += nPhys;

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Vmul(ntot,m_derivFac[i*3],1,Diff[0],1,out[i],1);

                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Vvtvp (ntot, m_derivFac[i*3+j], 1,

                                       Diff[j],               1,

                                       out[i],                1,

                                       out[i],                1);

                     }

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int i = 0; i < m_coordim; ++i)

                     {

                         Vmath::Smul(m_nqe,m_derivFac[i*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = out[i] + e*m_nqe,1);


                         for(int j = 1; j < 3; ++j)

                         {

                             Vmath::Svtvp (m_nqe, m_derivFac[i*3+j][e],

                                           Diff[j] + e*m_nqe,     1,

                                           out[i]  + e*m_nqe,     1,

                                           t = out[i]  + e*m_nqe, 1);

                         }

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // dEta0

             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             int cnt = 0;

             for(int  i = 0; i < m_numElmt; ++i)

             {


                 // dEta 1

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 // dEta 2

                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);


                 // dxi0 = 2/(1-eta_2) d Eta_0

                 Vmath::Vmul(nPhys,&m_fac0[0],1,Diff[0].get()+cnt,1,

                             Diff[0].get()+cnt,1);


                 // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

                 Vmath::Vvtvp(nPhys,&m_fac1[0],1,Diff[0].get()+cnt,1,

                              Diff[2].get()+cnt,1,Diff[2].get()+cnt,1);

                 cnt += nPhys;

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 // calculate full derivative

                 Vmath::Vmul(ntot,m_derivFac[dir*3],1,Diff[0],1,output,1);

                 for(int j = 1; j < 3; ++j)

                 {

                     Vmath::Vvtvp (ntot, m_derivFac[dir*3+j], 1,

                                   Diff[j],               1,

                                   output,                1,

                                   output,                1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul(m_nqe,m_derivFac[dir*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = output + e*m_nqe,1);


                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Svtvp (m_nqe, m_derivFac[dir*3+j][e],

                                       Diff[j] + e*m_nqe,     1,

                                       output  + e*m_nqe,     1,

                                       t = output  + e*m_nqe, 1);

                     }

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         Array<TwoD, const NekDouble>    m_derivFac;

         int                             m_coordim;

         const int                       m_nquad0;

         const int                       m_nquad1;

         const int                       m_nquad2;

         NekDouble                      *m_Deriv0;

         NekDouble                      *m_Deriv1;

         NekDouble                      *m_Deriv2;

         Array<OneD, NekDouble>          m_fac0;

         Array<OneD, NekDouble>          m_fac1;


     private:

         PhysDeriv_SumFac_Prism(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0  (m_stdExp->GetNumPoints(0)),

               m_nquad1  (m_stdExp->GetNumPoints(1)),

               m_nquad2  (m_stdExp->GetNumPoints(2))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();


             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             const Array<OneD, const NekDouble>& z0

                                             = m_stdExp->GetBasis(0)->GetZ();

             const Array<OneD, const NekDouble>& z2

                                             = m_stdExp->GetBasis(2)->GetZ();

             m_fac0 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             m_fac1 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             for (int i = 0; i < m_nquad0; ++i)

             {

                 for(int j = 0; j < m_nquad1; ++j)

                 {

                     for(int k = 0; k < m_nquad2; ++k)

                     {

                         m_fac0[i+j*m_nquad0 + k*m_nquad0*m_nquad1] =

                             2.0/(1-z2[k]);

                         m_fac1[i+j*m_nquad0 + k*m_nquad0*m_nquad1] =

                             0.5*(1+z0[i]);

                     }

                 }

             }


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

             m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


             m_wspSize = 3*m_nquad0*m_nquad1*m_nquad2*m_numElmt;

         }

 };


 /// Factory initialisation for the PhysDeriv_SumFac_Prism operators

 OperatorKey PhysDeriv_SumFac_Prism::m_typeArr[] = {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePrism, ePhysDeriv, eSumFac, false),

         PhysDeriv_SumFac_Prism::create, "PhysDeriv_SumFac_Prism")

 };


 /**

  * @brief Phys deriv operator using sum-factorisation (Pyramid)

  */

 class PhysDeriv_SumFac_Pyr : public Operator

 {

     public:

         OPERATOR_CREATE(PhysDeriv_SumFac_Pyr)


         ~PhysDeriv_SumFac_Pyr() final

         {

         }


         void operator()(

                 const Array<OneD, const NekDouble> &input,

                       Array<OneD,       NekDouble> &output0,

                       Array<OneD,       NekDouble> &output1,

                       Array<OneD,       NekDouble> &output2,

                       Array<OneD,       NekDouble> &wsp) final

         {


             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);

             Array<OneD, Array<OneD, NekDouble> > out(3);

             out[0] = output0; out[1] = output1; out[2] = output2;


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // dEta0

             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             int cnt = 0;

             for(int  i = 0; i < m_numElmt; ++i)

             {


                 // dEta 1

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 // dEta 2

                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);


                 // dxi0 = 2/(1-eta_2) d Eta_0

                 Vmath::Vmul(nPhys,&m_fac0[0],1,Diff[0].get()+cnt,1,

                             Diff[0].get()+cnt,1);


                 // dxi1 = 2/(1-eta_2) d Eta_1

                 Vmath::Vmul(nPhys,&m_fac0[0],1,Diff[1].get()+cnt,1,

                             Diff[1].get()+cnt,1);


                 // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

                 Vmath::Vvtvp(nPhys,&m_fac1[0],1,Diff[0].get()+cnt,1,

                              Diff[2].get()+cnt,1,Diff[2].get()+cnt,1);


                 // dxi2 += (1+eta1)/(1-eta_2) d Eta_1

                 Vmath::Vvtvp(nPhys,&m_fac2[0],1,Diff[1].get()+cnt,1,

                              Diff[2].get()+cnt,1,Diff[2].get()+cnt,1);

                 cnt += nPhys;

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 for(int i = 0; i < m_coordim; ++i)

                 {

                     Vmath::Vmul(ntot,m_derivFac[i*3],1,Diff[0],1,out[i],1);

                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Vvtvp (ntot, m_derivFac[i*3+j], 1,

                                       Diff[j],               1,

                                       out[i],                1,

                                       out[i],                1);

                     }

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     for(int i = 0; i < m_coordim; ++i)

                     {

                         Vmath::Smul(m_nqe,m_derivFac[i*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = out[i] + e*m_nqe,1);


                         for(int j = 1; j < 3; ++j)

                         {

                             Vmath::Svtvp (m_nqe, m_derivFac[i*3+j][e],

                                           Diff[j] + e*m_nqe,     1,

                                           out[i]  + e*m_nqe,     1,

                                           t = out[i]  + e*m_nqe, 1);

                         }

                     }

                 }

             }

         }


         void operator()(int dir,

                         const Array<OneD, const NekDouble> &input,

                         Array<OneD, NekDouble> &output,

                         Array<OneD, NekDouble> &wsp) final

         {

             int nPhys = m_stdExp->GetTotPoints();

             int ntot = m_numElmt*nPhys;

             Array<OneD, NekDouble> tmp0,tmp1,tmp2;

             Array<OneD, Array<OneD, NekDouble> > Diff(3);


             for(int i = 0; i < 3; ++i)

             {

                 Diff[i] = wsp + i*ntot;

             }


             // dEta0

             Blas::Dgemm('N','N', m_nquad0,m_nquad1*m_nquad2*m_numElmt,

                         m_nquad0,1.0, m_Deriv0,m_nquad0,&input[0],

                         m_nquad0,0.0,&Diff[0][0],m_nquad0);


             int cnt = 0;

             for(int  i = 0; i < m_numElmt; ++i)

             {

                 // dEta 1

                 for (int j = 0; j < m_nquad2; ++j)

                 {

                     Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1,

                                 1.0, &input[i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0, m_Deriv1, m_nquad1, 0.0,

                                 &Diff[1][i*nPhys+j*m_nquad0*m_nquad1],

                                 m_nquad0);

                 }


                 // dEta 2

                 Blas::Dgemm('N','T',m_nquad0*m_nquad1,m_nquad2,m_nquad2,

                             1.0, &input[i*nPhys],m_nquad0*m_nquad1,

                             m_Deriv2,m_nquad2, 0.0,&Diff[2][i*nPhys],

                             m_nquad0*m_nquad1);


                 // dxi0 = 2/(1-eta_2) d Eta_0

                 Vmath::Vmul(nPhys,&m_fac0[0],1,Diff[0].get()+cnt,1,

                             Diff[0].get()+cnt,1);


                 // dxi1 = 2/(1-eta_2) d Eta_1

                 Vmath::Vmul(nPhys,&m_fac0[0],1,Diff[1].get()+cnt,1,

                             Diff[1].get()+cnt,1);


                 // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

                 Vmath::Vvtvp(nPhys,&m_fac1[0],1,Diff[0].get()+cnt,1,

                              Diff[2].get()+cnt,1,Diff[2].get()+cnt,1);

                 // dxi2 = (1+eta1)/(1-eta_2) d Eta_1 + d/dEta2;

                 Vmath::Vvtvp(nPhys,&m_fac2[0],1,Diff[1].get()+cnt,1,

                              Diff[2].get()+cnt,1,Diff[2].get()+cnt,1);

                 cnt += nPhys;

             }


             // calculate full derivative

             if(m_isDeformed)

             {

                 // calculate full derivative

                 Vmath::Vmul(ntot,m_derivFac[dir*3],1,Diff[0],1,output,1);

                 for(int j = 1; j < 3; ++j)

                 {

                     Vmath::Vvtvp (ntot, m_derivFac[dir*3+j], 1,

                                   Diff[j],               1,

                                   output,                1,

                                   output,                1);

                 }

             }

             else

             {

                 Array<OneD, NekDouble> t;

                 for(int e = 0; e < m_numElmt; ++e)

                 {

                     Vmath::Smul(m_nqe,m_derivFac[dir*3][e],

                                     Diff[0] + e*m_nqe, 1,

                                     t = output + e*m_nqe,1);


                     for(int j = 1; j < 3; ++j)

                     {

                         Vmath::Svtvp (m_nqe, m_derivFac[dir*3+j][e],

                                       Diff[j] + e*m_nqe,     1,

                                       output  + e*m_nqe,     1,

                                       t = output  + e*m_nqe, 1);

                     }

                 }

             }

         }


         virtual void CheckFactors(StdRegions::FactorMap factors,

                                   int coll_phys_offset)

         {

             boost::ignore_unused(factors, coll_phys_offset);

             ASSERTL0(false, "Not valid for this operator.");

         }


     protected:

         Array<TwoD, const NekDouble>    m_derivFac;

         int                             m_coordim;

         const int                       m_nquad0;

         const int                       m_nquad1;

         const int                       m_nquad2;

         NekDouble                      *m_Deriv0;

         NekDouble                      *m_Deriv1;

         NekDouble                      *m_Deriv2;

         Array<OneD, NekDouble>          m_fac0;

         Array<OneD, NekDouble>          m_fac1;

         Array<OneD, NekDouble>          m_fac2;


     private:

         PhysDeriv_SumFac_Pyr(

                 vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                 CoalescedGeomDataSharedPtr                pGeomData,

                 StdRegions::FactorMap                     factors)

             : Operator(pCollExp, pGeomData, factors),

               m_nquad0  (m_stdExp->GetNumPoints(0)),

               m_nquad1  (m_stdExp->GetNumPoints(1)),

               m_nquad2  (m_stdExp->GetNumPoints(2))

         {

             LibUtilities::PointsKeyVector PtsKey = m_stdExp->GetPointsKeys();


             m_coordim = pCollExp[0]->GetCoordim();


             m_derivFac = pGeomData->GetDerivFactors(pCollExp);


             const Array<OneD, const NekDouble>& z0

                                             = m_stdExp->GetBasis(0)->GetZ();

             const Array<OneD, const NekDouble>& z1

                                             = m_stdExp->GetBasis(1)->GetZ();

             const Array<OneD, const NekDouble>& z2

                                             = m_stdExp->GetBasis(2)->GetZ();

             m_fac0 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             m_fac1 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);

             m_fac2 = Array<OneD, NekDouble>(m_nquad0*m_nquad1*m_nquad2);


             int nq0_nq1 = m_nquad0*m_nquad1;

             for (int i = 0; i < m_nquad0; ++i)

             {

                 for(int j = 0; j < m_nquad1; ++j)

                 {

                     int ifac = i+j*m_nquad0;

                     for(int k = 0; k < m_nquad2; ++k)

                     {

                         m_fac0[ifac + k*nq0_nq1] =

                             2.0/(1-z2[k]);

                         m_fac1[ifac + k*nq0_nq1] =

                             0.5*(1+z0[i]);

                         m_fac2[ifac + k*nq0_nq1] =

                             0.5*(1+z1[j]);

                     }

                 }

             }


             m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

             m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

             m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


             m_wspSize = 3*m_nquad0*m_nquad1*m_nquad2*m_numElmt;

         }

 };


 /// Factory initialisation for the PhysDeriv_SumFac_Pyr operators

 OperatorKey PhysDeriv_SumFac_Pyr::m_typeArr[] = {

     GetOperatorFactory().RegisterCreatorFunction(

         OperatorKey(ePyramid, ePhysDeriv, eSumFac, false),

         PhysDeriv_SumFac_Pyr::create, "PhysDeriv_SumFac_Pyr")

 };


 }

 }

Collection.h

ASSERTL0
#define ASSERTL0(condition, msg)
Definition: ErrorUtil.hpp:216

NEKERROR
#define NEKERROR(type, msg)
Assert Level 0 – Fundamental assert which is used whether in FULLDEBUG, DEBUG or OPT compilation mode...
Definition: ErrorUtil.hpp:209

ASSERTL1
#define ASSERTL1(condition, msg)
Assert Level 1 – Debugging which is used whether in FULLDEBUG or DEBUG compilation mode....
Definition: ErrorUtil.hpp:250

MatrixFreeBase.h

Operator.h

OPERATOR_CREATE
#define OPERATOR_CREATE(cname)
Definition: Operator.h:45

Nektar::Array
Definition: SharedArray.hpp:54

Nektar::Collections::MatrixFreeOneInMultiOut
Definition: MatrixFreeBase.h:142

Nektar::Collections::Operator
Base class for operators on a collection of elements.
Definition: Operator.h:115

Nektar::Collections::PhysDeriv_IterPerExp
Phys deriv operator using element-wise operation.
Definition: PhysDeriv.cpp:446

Nektar::Collections::PhysDeriv_IterPerExp::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:519

Nektar::Collections::PhysDeriv_IterPerExp::PhysDeriv_IterPerExp
PhysDeriv_IterPerExp(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:583

Nektar::Collections::PhysDeriv_IterPerExp::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:454

Nektar::Collections::PhysDeriv_IterPerExp::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:578

Nektar::Collections::PhysDeriv_IterPerExp::~PhysDeriv_IterPerExp
~PhysDeriv_IterPerExp() final
Definition: PhysDeriv.cpp:450

Nektar::Collections::PhysDeriv_IterPerExp::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:580

Nektar::Collections::PhysDeriv_IterPerExp::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:570

Nektar::Collections::PhysDeriv_IterPerExp::m_dim
int m_dim
Definition: PhysDeriv.cpp:579

Nektar::Collections::PhysDeriv_MatrixFree
Phys deriv operator using matrix free operators.
Definition: PhysDeriv.cpp:278

Nektar::Collections::PhysDeriv_MatrixFree::~PhysDeriv_MatrixFree
~PhysDeriv_MatrixFree() final
Definition: PhysDeriv.cpp:282

Nektar::Collections::PhysDeriv_MatrixFree::PhysDeriv_MatrixFree
PhysDeriv_MatrixFree(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:359

Nektar::Collections::PhysDeriv_MatrixFree::m_oper
std::shared_ptr< MatrixFree::PhysDeriv > m_oper
Definition: PhysDeriv.cpp:357

Nektar::Collections::PhysDeriv_MatrixFree::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:286

Nektar::Collections::PhysDeriv_MatrixFree::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:349

Nektar::Collections::PhysDeriv_MatrixFree::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:330

Nektar::Collections::PhysDeriv_NoCollection
Phys deriv operator using original LocalRegions implementation.
Definition: PhysDeriv.cpp:643

Nektar::Collections::PhysDeriv_NoCollection::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:701

Nektar::Collections::PhysDeriv_NoCollection::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:719

Nektar::Collections::PhysDeriv_NoCollection::PhysDeriv_NoCollection
PhysDeriv_NoCollection(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:730

Nektar::Collections::PhysDeriv_NoCollection::m_expList
vector< StdRegions::StdExpansionSharedPtr > m_expList
Definition: PhysDeriv.cpp:727

Nektar::Collections::PhysDeriv_NoCollection::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:651

Nektar::Collections::PhysDeriv_NoCollection::~PhysDeriv_NoCollection
~PhysDeriv_NoCollection() final
Definition: PhysDeriv.cpp:647

Nektar::Collections::PhysDeriv_StdMat
Phys deriv operator using standard matrix approach.
Definition: PhysDeriv.cpp:60

Nektar::Collections::PhysDeriv_StdMat::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:195

Nektar::Collections::PhysDeriv_StdMat::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:197

Nektar::Collections::PhysDeriv_StdMat::m_derivMat
Array< OneD, DNekMatSharedPtr > m_derivMat
Definition: PhysDeriv.cpp:194

Nektar::Collections::PhysDeriv_StdMat::PhysDeriv_StdMat
PhysDeriv_StdMat(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:200

Nektar::Collections::PhysDeriv_StdMat::~PhysDeriv_StdMat
~PhysDeriv_StdMat() final
Definition: PhysDeriv.cpp:64

Nektar::Collections::PhysDeriv_StdMat::m_dim
int m_dim
Definition: PhysDeriv.cpp:196

Nektar::Collections::PhysDeriv_StdMat::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:68

Nektar::Collections::PhysDeriv_StdMat::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:186

Nektar::Collections::PhysDeriv_StdMat::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:133

Nektar::Collections::PhysDeriv_SumFac_Hex
Phys deriv operator using sum-factorisation (Hex)
Definition: PhysDeriv.cpp:1345

Nektar::Collections::PhysDeriv_SumFac_Hex::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:1514

Nektar::Collections::PhysDeriv_SumFac_Hex::PhysDeriv_SumFac_Hex
PhysDeriv_SumFac_Hex(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1520

Nektar::Collections::PhysDeriv_SumFac_Hex::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1516

Nektar::Collections::PhysDeriv_SumFac_Hex::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:1502

Nektar::Collections::PhysDeriv_SumFac_Hex::~PhysDeriv_SumFac_Hex
~PhysDeriv_SumFac_Hex() final
Definition: PhysDeriv.cpp:1349

Nektar::Collections::PhysDeriv_SumFac_Hex::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1515

Nektar::Collections::PhysDeriv_SumFac_Hex::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1510

Nektar::Collections::PhysDeriv_SumFac_Hex::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1511

Nektar::Collections::PhysDeriv_SumFac_Hex::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:1517

Nektar::Collections::PhysDeriv_SumFac_Hex::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1433

Nektar::Collections::PhysDeriv_SumFac_Hex::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1512

Nektar::Collections::PhysDeriv_SumFac_Hex::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:1353

Nektar::Collections::PhysDeriv_SumFac_Hex::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1513

Nektar::Collections::PhysDeriv_SumFac_Prism
Phys deriv operator using sum-factorisation (Prism)
Definition: PhysDeriv.cpp:1874

Nektar::Collections::PhysDeriv_SumFac_Prism::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:2075

Nektar::Collections::PhysDeriv_SumFac_Prism::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1975

Nektar::Collections::PhysDeriv_SumFac_Prism::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:2066

Nektar::Collections::PhysDeriv_SumFac_Prism::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:2069

Nektar::Collections::PhysDeriv_SumFac_Prism::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:1882

Nektar::Collections::PhysDeriv_SumFac_Prism::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:2070

Nektar::Collections::PhysDeriv_SumFac_Prism::PhysDeriv_SumFac_Prism
PhysDeriv_SumFac_Prism(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:2078

Nektar::Collections::PhysDeriv_SumFac_Prism::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:2073

Nektar::Collections::PhysDeriv_SumFac_Prism::~PhysDeriv_SumFac_Prism
~PhysDeriv_SumFac_Prism() final
Definition: PhysDeriv.cpp:1878

Nektar::Collections::PhysDeriv_SumFac_Prism::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:2074

Nektar::Collections::PhysDeriv_SumFac_Prism::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:2058

Nektar::Collections::PhysDeriv_SumFac_Prism::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:2072

Nektar::Collections::PhysDeriv_SumFac_Prism::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:2067

Nektar::Collections::PhysDeriv_SumFac_Prism::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:2068

Nektar::Collections::PhysDeriv_SumFac_Prism::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:2071

Nektar::Collections::PhysDeriv_SumFac_Pyr
Phys deriv operator using sum-factorisation (Pyramid)
Definition: PhysDeriv.cpp:2135

Nektar::Collections::PhysDeriv_SumFac_Pyr::PhysDeriv_SumFac_Pyr
PhysDeriv_SumFac_Pyr(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:2354

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:2345

Nektar::Collections::PhysDeriv_SumFac_Pyr::~PhysDeriv_SumFac_Pyr
~PhysDeriv_SumFac_Pyr() final
Definition: PhysDeriv.cpp:2139

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:2343

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:2342

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:2350

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:2346

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_fac2
Array< OneD, NekDouble > m_fac2
Definition: PhysDeriv.cpp:2351

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:2341

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:2347

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:2348

Nektar::Collections::PhysDeriv_SumFac_Pyr::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:2143

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:2349

Nektar::Collections::PhysDeriv_SumFac_Pyr::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:2244

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:2344

Nektar::Collections::PhysDeriv_SumFac_Pyr::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:2333

Nektar::Collections::PhysDeriv_SumFac_Quad
Phys deriv operator using sum-factorisation (Quad)
Definition: PhysDeriv.cpp:932

Nektar::Collections::PhysDeriv_SumFac_Quad::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:1067

Nektar::Collections::PhysDeriv_SumFac_Quad::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1077

Nektar::Collections::PhysDeriv_SumFac_Quad::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1079

Nektar::Collections::PhysDeriv_SumFac_Quad::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1076

Nektar::Collections::PhysDeriv_SumFac_Quad::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1018

Nektar::Collections::PhysDeriv_SumFac_Quad::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1075

Nektar::Collections::PhysDeriv_SumFac_Quad::PhysDeriv_SumFac_Quad
PhysDeriv_SumFac_Quad(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1083

Nektar::Collections::PhysDeriv_SumFac_Quad::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1080

Nektar::Collections::PhysDeriv_SumFac_Quad::~PhysDeriv_SumFac_Quad
~PhysDeriv_SumFac_Quad() final
Definition: PhysDeriv.cpp:936

Nektar::Collections::PhysDeriv_SumFac_Quad::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1078

Nektar::Collections::PhysDeriv_SumFac_Quad::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:940

Nektar::Collections::PhysDeriv_SumFac_Seg
Phys deriv operator using sum-factorisation (Segment)
Definition: PhysDeriv.cpp:780

Nektar::Collections::PhysDeriv_SumFac_Seg::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:888

Nektar::Collections::PhysDeriv_SumFac_Seg::PhysDeriv_SumFac_Seg
PhysDeriv_SumFac_Seg(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:902

Nektar::Collections::PhysDeriv_SumFac_Seg::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:897

Nektar::Collections::PhysDeriv_SumFac_Seg::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:898

Nektar::Collections::PhysDeriv_SumFac_Seg::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:854

Nektar::Collections::PhysDeriv_SumFac_Seg::~PhysDeriv_SumFac_Seg
~PhysDeriv_SumFac_Seg() final
Definition: PhysDeriv.cpp:784

Nektar::Collections::PhysDeriv_SumFac_Seg::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:896

Nektar::Collections::PhysDeriv_SumFac_Seg::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:788

Nektar::Collections::PhysDeriv_SumFac_Seg::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:899

Nektar::Collections::PhysDeriv_SumFac_Tet
Phys deriv operator using sum-factorisation (Tet)
Definition: PhysDeriv.cpp:1556

Nektar::Collections::PhysDeriv_SumFac_Tet::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1679

Nektar::Collections::PhysDeriv_SumFac_Tet::~PhysDeriv_SumFac_Tet
~PhysDeriv_SumFac_Tet() final
Definition: PhysDeriv.cpp:1560

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac2
Array< OneD, NekDouble > m_fac2
Definition: PhysDeriv.cpp:1802

Nektar::Collections::PhysDeriv_SumFac_Tet::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:1564

Nektar::Collections::PhysDeriv_SumFac_Tet::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:1799

Nektar::Collections::PhysDeriv_SumFac_Tet::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:1784

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:1801

Nektar::Collections::PhysDeriv_SumFac_Tet::PhysDeriv_SumFac_Tet
PhysDeriv_SumFac_Tet(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1806

Nektar::Collections::PhysDeriv_SumFac_Tet::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1793

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:1800

Nektar::Collections::PhysDeriv_SumFac_Tet::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1794

Nektar::Collections::PhysDeriv_SumFac_Tet::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1797

Nektar::Collections::PhysDeriv_SumFac_Tet::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1792

Nektar::Collections::PhysDeriv_SumFac_Tet::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1798

Nektar::Collections::PhysDeriv_SumFac_Tet::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1795

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac3
Array< OneD, NekDouble > m_fac3
Definition: PhysDeriv.cpp:1803

Nektar::Collections::PhysDeriv_SumFac_Tet::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:1796

Nektar::Collections::PhysDeriv_SumFac_Tri
Phys deriv operator using sum-factorisation (Tri)
Definition: PhysDeriv.cpp:1114

Nektar::Collections::PhysDeriv_SumFac_Tri::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1280

Nektar::Collections::PhysDeriv_SumFac_Tri::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1276

Nektar::Collections::PhysDeriv_SumFac_Tri::PhysDeriv_SumFac_Tri
PhysDeriv_SumFac_Tri(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1285

Nektar::Collections::PhysDeriv_SumFac_Tri::operator()
void operator()(const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output0, Array< OneD, NekDouble > &output1, Array< OneD, NekDouble > &output2, Array< OneD, NekDouble > &wsp) final
Perform operation.
Definition: PhysDeriv.cpp:1122

Nektar::Collections::PhysDeriv_SumFac_Tri::~PhysDeriv_SumFac_Tri
~PhysDeriv_SumFac_Tri() final
Definition: PhysDeriv.cpp:1118

Nektar::Collections::PhysDeriv_SumFac_Tri::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1209

Nektar::Collections::PhysDeriv_SumFac_Tri::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:1282

Nektar::Collections::PhysDeriv_SumFac_Tri::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1275

Nektar::Collections::PhysDeriv_SumFac_Tri::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1277

Nektar::Collections::PhysDeriv_SumFac_Tri::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1278

Nektar::Collections::PhysDeriv_SumFac_Tri::CheckFactors
virtual void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset)
Check the validity of the supplied factor map.
Definition: PhysDeriv.cpp:1267

Nektar::Collections::PhysDeriv_SumFac_Tri::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1279

Nektar::Collections::PhysDeriv_SumFac_Tri::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:1281

Nektar::LibUtilities::NekFactory::RegisterCreatorFunction
tKey RegisterCreatorFunction(tKey idKey, CreatorFunction classCreator, std::string pDesc="")
Register a class with the factory.
Definition: NekFactory.hpp:200

Nektar::MemoryManager
General purpose memory allocation routines with the ability to allocate from thread specific memory p...
Definition: NekMemoryManager.hpp:84

Blas::Dgemm
static void Dgemm(const char &transa, const char &transb, const int &m, const int &n, const int &k, const double &alpha, const double *a, const int &lda, const double *b, const int &ldb, const double &beta, double *c, const int &ldc)
BLAS level 3: Matrix-matrix multiply C = A x B where op(A)[m x k], op(B)[k x n], C[m x n] DGEMM perfo...
Definition: Blas.hpp:394

Nektar::Collections::eSumFac
@ eSumFac
Definition: Operator.h:91

Nektar::Collections::eIterPerExp
@ eIterPerExp
Definition: Operator.h:89

Nektar::Collections::eMatrixFree
@ eMatrixFree
Definition: Operator.h:92

Nektar::Collections::eNoCollection
@ eNoCollection
Definition: Operator.h:88

Nektar::Collections::eStdMat
@ eStdMat
Definition: Operator.h:90

Nektar::Collections::ePhysDeriv
@ ePhysDeriv
Definition: Operator.h:72

Nektar::Collections::OperatorKey
std::tuple< LibUtilities::ShapeType, OperatorType, ImplementationType, ExpansionIsNodal > OperatorKey
Key for describing an Operator.
Definition: Operator.h:181

Nektar::Collections::CoalescedGeomDataSharedPtr
std::shared_ptr< CoalescedGeomData > CoalescedGeomDataSharedPtr
Definition: CoalescedGeomData.h:94

Nektar::Collections::GetOperatorFactory
OperatorFactory & GetOperatorFactory()
Returns the singleton Operator factory object.
Definition: Operator.cpp:121

Nektar::LibUtilities::PointsKeyVector
std::vector< PointsKey > PointsKeyVector
Definition: Points.h:246

Nektar::LibUtilities::eTriangle
@ eTriangle
Definition: ShapeType.hpp:58

Nektar::LibUtilities::eTetrahedron
@ eTetrahedron
Definition: ShapeType.hpp:60

Nektar::LibUtilities::eQuadrilateral
@ eQuadrilateral
Definition: ShapeType.hpp:59

Nektar::LibUtilities::eHexahedron
@ eHexahedron
Definition: ShapeType.hpp:63

Nektar::LibUtilities::ePrism
@ ePrism
Definition: ShapeType.hpp:62

Nektar::LibUtilities::ePyramid
@ ePyramid
Definition: ShapeType.hpp:61

Nektar::LibUtilities::eSegment
@ eSegment
Definition: ShapeType.hpp:57

Nektar::StdRegions::FactorMap
ConstFactorMap FactorMap
Definition: StdRegions.hpp:318

Nektar
The above copyright notice and this permission notice shall be included.
Definition: CoupledSolver.h:1

Nektar::NekDouble
double NekDouble
Definition: NektarUnivTypeDefs.hpp:43

Vmath::Vmul
void Vmul(int n, const T *x, const int incx, const T *y, const int incy, T *z, const int incz)
Multiply vector z = x*y.
Definition: Vmath.cpp:192

Vmath::Svtvp
void Svtvp(int n, const T alpha, const T *x, const int incx, const T *y, const int incy, T *z, const int incz)
svtvp (scalar times vector plus vector): z = alpha*x + y
Definition: Vmath.cpp:565

Vmath::Vvtvp
void Vvtvp(int n, const T *w, const int incw, const T *x, const int incx, const T *y, const int incy, T *z, const int incz)
vvtvp (vector times vector plus vector): z = w*x + y
Definition: Vmath.cpp:513

Vmath::Smul
void Smul(int n, const T alpha, const T *x, const int incx, T *y, const int incy)
Scalar multiply y = alpha*x.
Definition: Vmath.cpp:225

Vmath::Zero
void Zero(int n, T *x, const int incx)
Zero vector.
Definition: Vmath.cpp:436

Vmath::Vcopy
void Vcopy(int n, const T *x, const int incx, T *y, const int incy)
Definition: Vmath.cpp:1199