doxygen/5.6.0/_phys_deriv_8cpp_source.html

///////////////////////////////////////////////////////////////////////////////

//

// File: PhysDeriv.cpp

//

// For more information, please see: http://www.nektar.info

//

// The MIT License

//

// Copyright (c) 2006 Division of Applied Mathematics, Brown University (USA),

// Department of Aeronautics, Imperial College London (UK), and Scientific

// Computing and Imaging Institute, University of Utah (USA).

//

// Permission is hereby granted, free of charge, to any person obtaining a

// copy of this software and associated documentation files (the "Software"),

// to deal in the Software without restriction, including without limitation

// the rights to use, copy, modify, merge, publish, distribute, sublicense,

// and/or sell copies of the Software, and to permit persons to whom the

// Software is furnished to do so, subject to the following conditions:

//

// The above copyright notice and this permission notice shall be included

// in all copies or substantial portions of the Software.

//

// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS

// OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

// FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL

// THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

// LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING

// FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER

// DEALINGS IN THE SOFTWARE.

//

// Description: PhysDeriv operator implementations

//

///////////////////////////////////////////////////////////////////////////////


#include <Collections/Collection.h>

#include <Collections/MatrixFreeBase.h>

#include <Collections/Operator.h>

#include <MatrixFreeOps/Operator.hpp>


using namespace std;


namespace Nektar::Collections

{


using LibUtilities::eHexahedron;

using LibUtilities::ePrism;

using LibUtilities::ePyramid;

using LibUtilities::eQuadrilateral;

using LibUtilities::eSegment;

using LibUtilities::eTetrahedron;

using LibUtilities::eTriangle;


/**

 * @brief Physical Derivative help class to calculate the size of the collection

 * that is given as an input and as an output to the PhysDeriv Operator. The

 * Operator evaluation is happenning in the physical space and the output is

 * expected to be part of the physical space too.

 */

class PhysDeriv_Helper : virtual public Operator

{

protected:

    PhysDeriv_Helper()

    {

        // expect input to be number of elements by the number of quadrature

        // points

        m_inputSize = m_numElmt * m_stdExp->GetTotPoints();

        // the derivate is using data from the physical space to evaluate the

        // derivative in the physical space

        m_outputSize = m_inputSize;

    }

};


/**

 * @brief Phys deriv operator using standard matrix approach

 */

class PhysDeriv_StdMat final : virtual public Operator,

                               virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_StdMat)


    ~PhysDeriv_StdMat() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);

        Array<OneD, Array<OneD, NekDouble>> out(3);

        out[0] = output0;

        out[1] = output1;

        out[2] = output2;


        for (int i = 0; i < m_dim; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // calculate local derivatives

        for (int i = 0; i < m_dim; ++i)

        {

            Blas::Dgemm('N', 'N', m_derivMat[i]->GetRows(), m_numElmt,

                        m_derivMat[i]->GetColumns(), 1.0,

                        m_derivMat[i]->GetRawPtr(), m_derivMat[i]->GetRows(),

                        input.get(), nPhys, 0.0, &Diff[i][0], nPhys);

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Zero(ntot, out[i], 1);

                for (int j = 0; j < m_dim; ++j)

                {

                    Vmath::Vvtvp(ntot, m_derivFac[i * m_dim + j], 1, Diff[j], 1,

                                 out[i], 1, out[i], 1);

                }

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Zero(ntot, out[i], 1);

                for (int e = 0; e < m_numElmt; ++e)

                {

                    for (int j = 0; j < m_dim; ++j)

                    {

                        Vmath::Svtvp(m_nqe, m_derivFac[i * m_dim + j][e],

                                     Diff[j] + e * m_nqe, 1, out[i] + e * m_nqe,

                                     1, t = out[i] + e * m_nqe, 1);

                    }

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);


        for (int i = 0; i < m_dim; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // calculate local derivatives

        for (int i = 0; i < m_dim; ++i)

        {

            Blas::Dgemm('N', 'N', m_derivMat[i]->GetRows(), m_numElmt,

                        m_derivMat[i]->GetColumns(), 1.0,

                        m_derivMat[i]->GetRawPtr(), m_derivMat[i]->GetRows(),

                        input.get(), nPhys, 0.0, &Diff[i][0], nPhys);

        }


        // calculate full derivative

        Vmath::Zero(ntot, output, 1);

        if (m_isDeformed)

        {

            for (int j = 0; j < m_dim; ++j)

            {

                Vmath::Vvtvp(ntot, m_derivFac[dir * m_dim + j], 1, Diff[j], 1,

                             output, 1, output, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int j = 0; j < m_dim; ++j)

                {

                    Vmath::Svtvp(m_nqe, m_derivFac[dir * m_dim + j][e],

                                 Diff[j] + e * m_nqe, 1, output + e * m_nqe, 1,

                                 t = output + e * m_nqe, 1);

                }

            }

        }

    }


protected:

    Array<OneD, DNekMatSharedPtr> m_derivMat;

    Array<TwoD, const NekDouble> m_derivFac;

    int m_dim;

    int m_coordim;


private:

    PhysDeriv_StdMat(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                     CoalescedGeomDataSharedPtr pGeomData,

                     StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper()

    {

        int nqtot = pCollExp[0]->GetTotPoints();

        m_dim     = pCollExp[0]->GetShapeDimension();

        m_coordim = pCollExp[0]->GetCoordim();


        // set up a PhysDeriv StdMat.

        m_derivMat = Array<OneD, DNekMatSharedPtr>(m_dim);

        for (int i = 0; i < m_dim; ++i)

        {

            Array<OneD, NekDouble> tmp(nqtot), tmp1(nqtot);

            m_derivMat[i] =

                MemoryManager<DNekMat>::AllocateSharedPtr(nqtot, nqtot);

            for (int j = 0; j < nqtot; ++j)

            {

                Vmath::Zero(nqtot, tmp, 1);

                tmp[j] = 1.0;

                m_stdExp->PhysDeriv(i, tmp, tmp1);

                Vmath::Vcopy(nqtot, &tmp1[0], 1,

                             &(m_derivMat[i]->GetPtr())[0] + j * nqtot, 1);

            }

        }

        m_derivFac = pGeomData->GetDerivFactors(pCollExp);

        m_wspSize  = 3 * nqtot * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_StdMat operators

OperatorKey PhysDeriv_StdMat::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eStdMat, true),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_NodalTri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eStdMat, true),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_NodalTet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eStdMat, true),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_NodalPrism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, ePhysDeriv, eStdMat, false),

        PhysDeriv_StdMat::create, "PhysDeriv_StdMat_Hex"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, ePhysDeriv, eSumFac, false),

        PhysDeriv_StdMat::create, "PhysDeriv_SumFac_Pyr")};


/**

 * @brief Phys deriv operator using matrix free operators.

 */

class PhysDeriv_MatrixFree final : virtual public Operator,

                                   MatrixFreeOneInMultiOut,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_MatrixFree)


    ~PhysDeriv_MatrixFree() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        if (m_isPadded)

        {

            // copy into padded vector

            Vmath::Vcopy(m_nIn, input, 1, m_input, 1);

            (*m_oper)(m_input, m_output);

        }

        else

        {

            (*m_oper)(input, m_output);

        }


        // currently using temporary local temporary space for output

        // to allow for other operator call below which is

        // directionally dependent

        switch (m_coordim)

        {

            case 1:

                Vmath::Vcopy(m_nOut, m_output[0], 1, output0, 1);

                break;

            case 2:

                Vmath::Vcopy(m_nOut, m_output[0], 1, output0, 1);

                Vmath::Vcopy(m_nOut, m_output[1], 1, output1, 1);

                break;

            case 3:

                Vmath::Vcopy(m_nOut, m_output[0], 1, output0, 1);

                Vmath::Vcopy(m_nOut, m_output[1], 1, output1, 1);

                Vmath::Vcopy(m_nOut, m_output[2], 1, output2, 1);

                break;

            default:

                NEKERROR(ErrorUtil::efatal, "Unknown coordinate dimension");

                break;

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        if (m_isPadded)

        {

            // copy into padded vector

            Vmath::Vcopy(m_nIn, input, 1, m_input, 1);

            (*m_oper)(m_input, m_output);

        }

        else

        {

            (*m_oper)(input, m_output);

        }

        Vmath::Vcopy(m_nOut, m_output[dir], 1, output, 1);

    }


private:

    std::shared_ptr<MatrixFree::PhysDeriv> m_oper;


    PhysDeriv_MatrixFree(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          MatrixFreeOneInMultiOut(pCollExp[0]->GetCoordim(),

                                  pCollExp[0]->GetStdExp()->GetTotPoints(),

                                  pCollExp[0]->GetStdExp()->GetTotPoints(),

                                  pCollExp.size())

    {

        // Check if deformed

        bool deformed{pGeomData->IsDeformed(pCollExp)};

        const auto dim = pCollExp[0]->GetStdExp()->GetShapeDimension();


        if (m_isPadded == false) // declare local space non-padded case

        {

            int nOut    = pCollExp[0]->GetStdExp()->GetTotPoints();

            m_output    = Array<OneD, Array<OneD, NekDouble>>(m_coordim);

            m_output[0] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

            if (m_coordim == 2)

            {

                m_output[1] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

            }

            else if (m_coordim == 3)

            {

                m_output[1] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

                m_output[2] = Array<OneD, NekDouble>{nOut * m_nElmtPad, 0.0};

            }

        }


        // Basis vector.

        std::vector<LibUtilities::BasisSharedPtr> basis(dim);

        for (unsigned int i = 0; i < dim; ++i)

        {

            basis[i] = pCollExp[0]->GetBasis(i);

        }


        // Get shape type

        auto shapeType = pCollExp[0]->GetStdExp()->DetShapeType();


        // Generate operator string and create operator.

        std::string op_string = "PhysDeriv";

        op_string += MatrixFree::GetOpstring(shapeType, deformed);

        auto oper = MatrixFree::GetOperatorFactory().CreateInstance(

            op_string, basis, m_nElmtPad);


        // Set derivative factors

        oper->SetDF(pGeomData->GetDerivFactorsInterLeave(pCollExp, m_nElmtPad));


        m_oper = std::dynamic_pointer_cast<MatrixFree::PhysDeriv>(oper);

        ASSERTL0(m_oper, "Failed to cast pointer.");

    }

};


/// Factory initialisation for the PhysDeriv_MatrixFree operators

OperatorKey PhysDeriv_MatrixFree::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Hex"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eMatrixFree, false),

        PhysDeriv_MatrixFree::create, "PhysDeriv_MatrixFree_Tet")


};


/**

 * @brief Phys deriv operator using element-wise operation

 */

class PhysDeriv_IterPerExp final : virtual public Operator,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_IterPerExp)


    ~PhysDeriv_IterPerExp() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);

        Array<OneD, Array<OneD, NekDouble>> out(3);

        out[0] = output0;

        out[1] = output1;

        out[2] = output2;


        for (int i = 0; i < m_dim; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // calculate local derivatives

        for (int i = 0; i < m_numElmt; ++i)

        {

            m_stdExp->PhysDeriv(input + i * nPhys, tmp0 = Diff[0] + i * nPhys,

                                tmp1 = Diff[1] + i * nPhys,

                                tmp2 = Diff[2] + i * nPhys);

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Vmul(ntot, m_derivFac[i * m_dim], 1, Diff[0], 1, out[i],

                            1);

                for (int j = 1; j < m_dim; ++j)

                {

                    Vmath::Vvtvp(ntot, m_derivFac[i * m_dim + j], 1, Diff[j], 1,

                                 out[i], 1, out[i], 1);

                }

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int i = 0; i < m_coordim; ++i)

                {

                    Vmath::Smul(m_nqe, m_derivFac[i * m_dim][e],

                                Diff[0] + e * m_nqe, 1, t = out[i] + e * m_nqe,

                                1);

                    for (int j = 1; j < m_dim; ++j)

                    {

                        Vmath::Svtvp(m_nqe, m_derivFac[i * m_dim + j][e],

                                     Diff[j] + e * m_nqe, 1, out[i] + e * m_nqe,

                                     1, t = out[i] + e * m_nqe, 1);

                    }

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);


        for (int i = 0; i < m_dim; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // calculate local derivatives

        for (int i = 0; i < m_numElmt; ++i)

        {

            m_stdExp->PhysDeriv(input + i * nPhys, tmp0 = Diff[0] + i * nPhys,

                                tmp1 = Diff[1] + i * nPhys,

                                tmp2 = Diff[2] + i * nPhys);

        }


        Vmath::Zero(ntot, output, 1);

        if (m_isDeformed)

        {

            for (int j = 0; j < m_dim; ++j)

            {

                Vmath::Vvtvp(ntot, m_derivFac[dir * m_dim + j], 1, Diff[j], 1,

                             output, 1, output, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int j = 0; j < m_dim; ++j)

                {

                    Vmath::Svtvp(m_nqe, m_derivFac[dir * m_dim + j][e],

                                 Diff[j] + e * m_nqe, 1, output + e * m_nqe, 1,

                                 t = output + e * m_nqe, 1);

                }

            }

        }

    }


protected:

    Array<TwoD, const NekDouble> m_derivFac;

    int m_dim;

    int m_coordim;


private:

    PhysDeriv_IterPerExp(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper()

    {

        int nqtot = pCollExp[0]->GetTotPoints();

        m_dim     = pCollExp[0]->GetShapeDimension();

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);

        m_wspSize  = 3 * nqtot * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_IterPerExp operators

OperatorKey PhysDeriv_IterPerExp::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eIterPerExp, true),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_NodalTri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eIterPerExp, true),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_NodalTet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eIterPerExp, true),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_NodalPrism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, ePhysDeriv, eIterPerExp, false),

        PhysDeriv_IterPerExp::create, "PhysDeriv_IterPerExp_Hex")};


/**

 * @brief Phys deriv operator using original LocalRegions implementation.

 */

class PhysDeriv_NoCollection final : virtual public Operator,

                                     virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_NoCollection)


    ~PhysDeriv_NoCollection() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        const int nPhys = m_expList[0]->GetTotPoints();

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;


        // calculate local derivatives

        switch (m_expList[0]->GetShapeDimension())

        {

            case 1:

            {

                for (int i = 0; i < m_numElmt; ++i)

                {

                    m_expList[i]->PhysDeriv(input + i * nPhys,

                                            tmp0 = output0 + i * nPhys);

                }

                break;

            }

            case 2:

            {

                for (int i = 0; i < m_numElmt; ++i)

                {

                    m_expList[i]->PhysDeriv(input + i * nPhys,

                                            tmp0 = output0 + i * nPhys,

                                            tmp1 = output1 + i * nPhys);

                }

                break;

            }

            case 3:

            {

                for (int i = 0; i < m_numElmt; ++i)

                {

                    m_expList[i]->PhysDeriv(

                        input + i * nPhys, tmp0 = output0 + i * nPhys,

                        tmp1 = output1 + i * nPhys, tmp2 = output2 + i * nPhys);

                }

                break;

            }

            default:

                ASSERTL0(false, "Unknown dimension.");

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        const int nPhys = m_expList[0]->GetTotPoints();

        Array<OneD, NekDouble> tmp;


        // calculate local derivatives

        for (int i = 0; i < m_numElmt; ++i)

        {

            m_expList[i]->PhysDeriv(dir, input + i * nPhys,

                                    tmp = output + i * nPhys);

        }

    }


protected:

    vector<StdRegions::StdExpansionSharedPtr> m_expList;


private:

    PhysDeriv_NoCollection(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                           CoalescedGeomDataSharedPtr pGeomData,

                           StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper()

    {

        m_expList = pCollExp;

    }

};


/// Factory initialisation for the PhysDeriv_NoCollection operators

OperatorKey PhysDeriv_NoCollection::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eNoCollection, true),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_NodalTri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eNoCollection, true),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_NodalTet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eNoCollection, true),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_NodalPrism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, ePhysDeriv, eNoCollection, false),

        PhysDeriv_NoCollection::create, "PhysDeriv_NoCollection_Hex")};


/**

 * @brief Phys deriv operator using sum-factorisation (Segment)

 */

class PhysDeriv_SumFac_Seg final : virtual public Operator,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Seg)


    ~PhysDeriv_SumFac_Seg() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        const int nqcol = m_nquad0 * m_numElmt;


        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");

        ASSERTL1(input.size() >= nqcol, "Incorrect input size");


        Array<OneD, NekDouble> diff0(nqcol, wsp);


        Blas::Dgemm('N', 'N', m_nquad0, m_numElmt, m_nquad0, 1.0, m_Deriv0,

                    m_nquad0, input.get(), m_nquad0, 0.0, diff0.get(),

                    m_nquad0);


        if (m_isDeformed)

        {

            Vmath::Vmul(nqcol, m_derivFac[0], 1, diff0, 1, output0, 1);


            if (m_coordim == 2)

            {

                Vmath::Vmul(nqcol, m_derivFac[1], 1, diff0, 1, output1, 1);

            }

            else if (m_coordim == 3)

            {

                Vmath::Vmul(nqcol, m_derivFac[1], 1, diff0, 1, output1, 1);

                Vmath::Vmul(nqcol, m_derivFac[2], 1, diff0, 1, output2, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[0][e], diff0 + e * m_nqe, 1,

                            t = output0 + e * m_nqe, 1);

            }


            if (m_coordim == 2)

            {

                for (int e = 0; e < m_numElmt; ++e)

                {

                    Vmath::Smul(m_nqe, m_derivFac[1][e], diff0 + e * m_nqe, 1,

                                t = output1 + e * m_nqe, 1);

                }

            }

            else if (m_coordim == 3)

            {

                for (int e = 0; e < m_numElmt; ++e)

                {

                    Vmath::Smul(m_nqe, m_derivFac[1][e], diff0 + e * m_nqe, 1,

                                t = output1 + e * m_nqe, 1);

                    Vmath::Smul(m_nqe, m_derivFac[2][e], diff0 + e * m_nqe, 1,

                                t = output2 + e * m_nqe, 1);

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        const int nqcol = m_nquad0 * m_numElmt;


        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");

        ASSERTL1(input.size() >= nqcol, "Incorrect input size");


        Array<OneD, NekDouble> diff0(nqcol, wsp);


        Blas::Dgemm('N', 'N', m_nquad0, m_numElmt, m_nquad0, 1.0, m_Deriv0,

                    m_nquad0, input.get(), m_nquad0, 0.0, diff0.get(),

                    m_nquad0);


        if (m_isDeformed)

        {

            Vmath::Vmul(nqcol, m_derivFac[dir], 1, diff0, 1, output, 1);

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[0][e], diff0 + e * m_nqe, 1,

                            t = output + e * m_nqe, 1);

            }

        }

    }


protected:

    int m_coordim;

    const int m_nquad0;

    Array<TwoD, const NekDouble> m_derivFac;

    NekDouble *m_Deriv0;


private:

    PhysDeriv_SumFac_Seg(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        m_Deriv0  = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_wspSize = m_nquad0 * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Seg operators

OperatorKey PhysDeriv_SumFac_Seg::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Seg::create, "PhysDeriv_SumFac_Seg");


/**

 * @brief Phys deriv operator using sum-factorisation (Quad)

 */

class PhysDeriv_SumFac_Quad final : virtual public Operator,

                                    virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Quad)


    ~PhysDeriv_SumFac_Quad() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        const int nqtot = m_nquad0 * m_nquad1;

        const int nqcol = nqtot * m_numElmt;


        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");

        ASSERTL1(input.size() >= nqcol, "Incorrect input size");


        Array<OneD, NekDouble> diff0(nqcol, wsp);

        Array<OneD, NekDouble> diff1(nqcol, wsp + nqcol);


        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_numElmt, m_nquad0, 1.0,

                    m_Deriv0, m_nquad0, input.get(), m_nquad0, 0.0, diff0.get(),

                    m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

        {

            Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                        input.get() + cnt, m_nquad0, m_Deriv1, m_nquad1, 0.0,

                        diff1.get() + cnt, m_nquad0);

        }


        if (m_isDeformed)

        {

            Vmath::Vmul(nqcol, m_derivFac[0], 1, diff0, 1, output0, 1);

            Vmath::Vvtvp(nqcol, m_derivFac[1], 1, diff1, 1, output0, 1, output0,

                         1);

            Vmath::Vmul(nqcol, m_derivFac[2], 1, diff0, 1, output1, 1);

            Vmath::Vvtvp(nqcol, m_derivFac[3], 1, diff1, 1, output1, 1, output1,

                         1);


            if (m_coordim == 3)

            {

                Vmath::Vmul(nqcol, m_derivFac[4], 1, diff0, 1, output2, 1);

                Vmath::Vvtvp(nqcol, m_derivFac[5], 1, diff1, 1, output2, 1,

                             output2, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[0][e], diff0 + e * m_nqe, 1,

                            t = output0 + e * m_nqe, 1);

                Vmath::Svtvp(m_nqe, m_derivFac[1][e], diff1 + e * m_nqe, 1,

                             output0 + e * m_nqe, 1, t = output0 + e * m_nqe,

                             1);


                Vmath::Smul(m_nqe, m_derivFac[2][e], diff0 + e * m_nqe, 1,

                            t = output1 + e * m_nqe, 1);

                Vmath::Svtvp(m_nqe, m_derivFac[3][e], diff1 + e * m_nqe, 1,

                             output1 + e * m_nqe, 1, t = output1 + e * m_nqe,

                             1);

            }


            if (m_coordim == 3)

            {

                for (int e = 0; e < m_numElmt; ++e)

                {

                    Vmath::Smul(m_nqe, m_derivFac[4][e], diff0 + e * m_nqe, 1,

                                t = output2 + e * m_nqe, 1);

                    Vmath::Svtvp(m_nqe, m_derivFac[5][e], diff1 + e * m_nqe, 1,

                                 output2 + e * m_nqe, 1,

                                 t = output2 + e * m_nqe, 1);

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        const int nqtot = m_nquad0 * m_nquad1;

        const int nqcol = nqtot * m_numElmt;


        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");

        ASSERTL1(input.size() >= nqcol, "Incorrect input size");


        Array<OneD, NekDouble> diff0(nqcol, wsp);

        Array<OneD, NekDouble> diff1(nqcol, wsp + nqcol);


        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_numElmt, m_nquad0, 1.0,

                    m_Deriv0, m_nquad0, input.get(), m_nquad0, 0.0, diff0.get(),

                    m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

        {

            Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                        input.get() + cnt, m_nquad0, m_Deriv1, m_nquad1, 0.0,

                        diff1.get() + cnt, m_nquad0);

        }


        if (m_isDeformed)

        {

            Vmath::Vmul(nqcol, m_derivFac[2 * dir], 1, diff0, 1, output, 1);

            Vmath::Vvtvp(nqcol, m_derivFac[2 * dir + 1], 1, diff1, 1, output, 1,

                         output, 1);

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[2 * dir][e], diff0 + e * m_nqe, 1,

                            t = output + e * m_nqe, 1);

                Vmath::Svtvp(m_nqe, m_derivFac[2 * dir + 1][e],

                             diff1 + e * m_nqe, 1, output + e * m_nqe, 1,

                             t = output + e * m_nqe, 1);

            }

        }

    }


protected:

    int m_coordim;

    const int m_nquad0;

    const int m_nquad1;

    Array<TwoD, const NekDouble> m_derivFac;

    NekDouble *m_Deriv0;

    NekDouble *m_Deriv1;


private:

    PhysDeriv_SumFac_Quad(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                          CoalescedGeomDataSharedPtr pGeomData,

                          StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        m_Deriv0  = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_Deriv1  = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

        m_wspSize = 2 * m_nquad0 * m_nquad1 * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Quad operators

OperatorKey PhysDeriv_SumFac_Quad::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Quad::create, "PhysDeriv_SumFac_Quad");


/**

 * @brief Phys deriv operator using sum-factorisation (Tri)

 */

class PhysDeriv_SumFac_Tri final : virtual public Operator,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Tri)


    ~PhysDeriv_SumFac_Tri() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        const int nqtot = m_nquad0 * m_nquad1;

        const int nqcol = nqtot * m_numElmt;


        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");

        ASSERTL1(input.size() >= nqcol, "Incorrect input size");


        Array<OneD, NekDouble> diff0(nqcol, wsp);

        Array<OneD, NekDouble> diff1(nqcol, wsp + nqcol);


        // Tensor Product Derivative

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_numElmt, m_nquad0, 1.0,

                    m_Deriv0, m_nquad0, input.get(), m_nquad0, 0.0, diff0.get(),

                    m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

        {

            // scale diff0 by geometric factor: 2/(1-z1)

            Vmath::Vmul(nqtot, &m_fac1[0], 1, diff0.get() + cnt, 1,

                        diff0.get() + cnt, 1);


            Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                        input.get() + cnt, m_nquad0, m_Deriv1, m_nquad1, 0.0,

                        diff1.get() + cnt, m_nquad0);


            // add to diff1 by diff0 scaled by: (1_z0)/(1-z1)

            Vmath::Vvtvp(nqtot, m_fac0.get(), 1, diff0.get() + cnt, 1,

                         diff1.get() + cnt, 1, diff1.get() + cnt, 1);

        }


        if (m_isDeformed)

        {

            Vmath::Vmul(nqcol, m_derivFac[0], 1, diff0, 1, output0, 1);

            Vmath::Vvtvp(nqcol, m_derivFac[1], 1, diff1, 1, output0, 1, output0,

                         1);

            Vmath::Vmul(nqcol, m_derivFac[2], 1, diff0, 1, output1, 1);

            Vmath::Vvtvp(nqcol, m_derivFac[3], 1, diff1, 1, output1, 1, output1,

                         1);


            if (m_coordim == 3)

            {

                Vmath::Vmul(nqcol, m_derivFac[4], 1, diff0, 1, output2, 1);

                Vmath::Vvtvp(nqcol, m_derivFac[5], 1, diff1, 1, output2, 1,

                             output2, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[0][e], diff0 + e * m_nqe, 1,

                            t = output0 + e * m_nqe, 1);

                Vmath::Svtvp(m_nqe, m_derivFac[1][e], diff1 + e * m_nqe, 1,

                             output0 + e * m_nqe, 1, t = output0 + e * m_nqe,

                             1);


                Vmath::Smul(m_nqe, m_derivFac[2][e], diff0 + e * m_nqe, 1,

                            t = output1 + e * m_nqe, 1);

                Vmath::Svtvp(m_nqe, m_derivFac[3][e], diff1 + e * m_nqe, 1,

                             output1 + e * m_nqe, 1, t = output1 + e * m_nqe,

                             1);

            }


            if (m_coordim == 3)

            {

                for (int e = 0; e < m_numElmt; ++e)

                {

                    Vmath::Smul(m_nqe, m_derivFac[4][e], diff0 + e * m_nqe, 1,

                                t = output2 + e * m_nqe, 1);

                    Vmath::Svtvp(m_nqe, m_derivFac[5][e], diff1 + e * m_nqe, 1,

                                 output2 + e * m_nqe, 1,

                                 t = output2 + e * m_nqe, 1);

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        const int nqtot = m_nquad0 * m_nquad1;

        const int nqcol = nqtot * m_numElmt;


        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");

        ASSERTL1(input.size() >= nqcol, "Incorrect input size");


        Array<OneD, NekDouble> diff0(nqcol, wsp);

        Array<OneD, NekDouble> diff1(nqcol, wsp + nqcol);


        // Tensor Product Derivative

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_numElmt, m_nquad0, 1.0,

                    m_Deriv0, m_nquad0, input.get(), m_nquad0, 0.0, diff0.get(),

                    m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i, cnt += nqtot)

        {

            // scale diff0 by geometric factor: 2/(1-z1)

            Vmath::Vmul(nqtot, &m_fac1[0], 1, diff0.get() + cnt, 1,

                        diff0.get() + cnt, 1);


            Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                        input.get() + cnt, m_nquad0, m_Deriv1, m_nquad1, 0.0,

                        diff1.get() + cnt, m_nquad0);


            // add to diff1 by diff0 scaled by: (1_z0)/(1-z1)

            Vmath::Vvtvp(nqtot, m_fac0.get(), 1, diff0.get() + cnt, 1,

                         diff1.get() + cnt, 1, diff1.get() + cnt, 1);

        }


        if (m_isDeformed)

        {

            Vmath::Vmul(nqcol, m_derivFac[2 * dir], 1, diff0, 1, output, 1);

            Vmath::Vvtvp(nqcol, m_derivFac[2 * dir + 1], 1, diff1, 1, output, 1,

                         output, 1);

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[2 * dir][e], diff0 + e * m_nqe, 1,

                            t = output + e * m_nqe, 1);

                Vmath::Svtvp(m_nqe, m_derivFac[2 * dir + 1][e],

                             diff1 + e * m_nqe, 1, output + e * m_nqe, 1,

                             t = output + e * m_nqe, 1);

            }

        }

    }


protected:

    int m_coordim;

    const int m_nquad0;

    const int m_nquad1;

    Array<TwoD, const NekDouble> m_derivFac;

    NekDouble *m_Deriv0;

    NekDouble *m_Deriv1;

    Array<OneD, NekDouble> m_fac0;

    Array<OneD, NekDouble> m_fac1;


private:

    PhysDeriv_SumFac_Tri(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        const Array<OneD, const NekDouble> &z0 = m_stdExp->GetBasis(0)->GetZ();

        const Array<OneD, const NekDouble> &z1 = m_stdExp->GetBasis(1)->GetZ();

        m_fac0 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1);

        // set up geometric factor: 0.5*(1+z0)

        for (int i = 0; i < m_nquad0; ++i)

        {

            for (int j = 0; j < m_nquad1; ++j)

            {

                m_fac0[i + j * m_nquad0] = 0.5 * (1 + z0[i]);

            }

        }


        m_fac1 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1);

        // set up geometric factor: 2/(1-z1)

        for (int i = 0; i < m_nquad0; ++i)

        {

            for (int j = 0; j < m_nquad1; ++j)

            {

                m_fac1[i + j * m_nquad0] = 2.0 / (1 - z1[j]);

            }

        }


        m_Deriv0  = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_Deriv1  = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

        m_wspSize = 2 * m_nquad0 * m_nquad1 * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Tri operators

OperatorKey PhysDeriv_SumFac_Tri::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Tri::create, "PhysDeriv_SumFac_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, ePhysDeriv, eSumFac, true),

        PhysDeriv_SumFac_Tri::create, "PhysDeriv_SumFac_NodalTri")};


/**

 * @brief Phys deriv operator using sum-factorisation (Hex)

 */

class PhysDeriv_SumFac_Hex final : virtual public Operator,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Hex)


    ~PhysDeriv_SumFac_Hex() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);

        Array<OneD, Array<OneD, NekDouble>> out(3);

        out[0] = output0;

        out[1] = output1;

        out[2] = output2;


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        for (int i = 0; i < m_numElmt; ++i)

        {

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Vmul(ntot, m_derivFac[i * 3], 1, Diff[0], 1, out[i], 1);

                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Vvtvp(ntot, m_derivFac[i * 3 + j], 1, Diff[j], 1,

                                 out[i], 1, out[i], 1);

                }

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int i = 0; i < m_coordim; ++i)

                {

                    Vmath::Smul(m_nqe, m_derivFac[i * 3][e],

                                Diff[0] + e * m_nqe, 1, t = out[i] + e * m_nqe,

                                1);


                    for (int j = 1; j < 3; ++j)

                    {

                        Vmath::Svtvp(m_nqe, m_derivFac[i * 3 + j][e],

                                     Diff[j] + e * m_nqe, 1, out[i] + e * m_nqe,

                                     1, t = out[i] + e * m_nqe, 1);

                    }

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        for (int i = 0; i < m_numElmt; ++i)

        {

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            // calculate full derivative

            Vmath::Vmul(ntot, m_derivFac[dir * 3], 1, Diff[0], 1, output, 1);

            for (int j = 1; j < 3; ++j)

            {

                Vmath::Vvtvp(ntot, m_derivFac[dir * 3 + j], 1, Diff[j], 1,

                             output, 1, output, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[dir * 3][e], Diff[0] + e * m_nqe,

                            1, t = output + e * m_nqe, 1);


                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Svtvp(m_nqe, m_derivFac[dir * 3 + j][e],

                                 Diff[j] + e * m_nqe, 1, output + e * m_nqe, 1,

                                 t = output + e * m_nqe, 1);

                }

            }

        }

    }


protected:

    Array<TwoD, const NekDouble> m_derivFac;

    int m_coordim;

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    NekDouble *m_Deriv0;

    NekDouble *m_Deriv1;

    NekDouble *m_Deriv2;


private:

    PhysDeriv_SumFac_Hex(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

        m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


        m_wspSize = 3 * m_nquad0 * m_nquad1 * m_nquad2 * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Hex operators

OperatorKey PhysDeriv_SumFac_Hex::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Hex::create, "PhysDeriv_SumFac_Hex")};


/**

 * @brief Phys deriv operator using sum-factorisation (Tet)

 */

class PhysDeriv_SumFac_Tet final : virtual public Operator,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Tet)


    ~PhysDeriv_SumFac_Tet() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);

        Array<OneD, Array<OneD, NekDouble>> out(3);

        out[0] = output0;

        out[1] = output1;

        out[2] = output2;


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // dEta0

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        // dEta2

        for (int i = 0; i < m_numElmt; ++i)

        {

            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);

        }


        for (int i = 0; i < m_numElmt; ++i)

        {

            // dEta1

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            // dxi2 = (1 + eta_1)/(1 -eta_2)*dEta1 + dEta2

            Vmath::Vvtvp(nPhys, m_fac3.get(), 1, Diff[1].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1);


            // dxi1 =  2/(1 - eta_2) dEta1

            Vmath::Vmul(nPhys, m_fac2.get(), 1, Diff[1].get() + i * nPhys, 1,

                        Diff[1].get() + i * nPhys, 1);


            // dxi1 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi1

            Vmath::Vvtvp(nPhys, m_fac1.get(), 1, Diff[0].get() + i * nPhys, 1,

                         Diff[1].get() + i * nPhys, 1,

                         Diff[1].get() + i * nPhys, 1);


            // dxi2 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi2

            Vmath::Vvtvp(nPhys, m_fac1.get(), 1, Diff[0].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1);


            // dxi0 = 4.0/((1-eta_1)(1-eta_2)) dEta0

            Vmath::Vmul(nPhys, m_fac0.get(), 1, Diff[0].get() + i * nPhys, 1,

                        Diff[0].get() + i * nPhys, 1);

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Vmul(ntot, m_derivFac[i * 3], 1, Diff[0], 1, out[i], 1);

                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Vvtvp(ntot, m_derivFac[i * 3 + j], 1, Diff[j], 1,

                                 out[i], 1, out[i], 1);

                }

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int i = 0; i < m_coordim; ++i)

                {

                    Vmath::Smul(m_nqe, m_derivFac[i * 3][e],

                                Diff[0] + e * m_nqe, 1, t = out[i] + e * m_nqe,

                                1);

                    for (int j = 1; j < 3; ++j)

                    {

                        Vmath::Svtvp(m_nqe, m_derivFac[i * 3 + j][e],

                                     Diff[j] + e * m_nqe, 1, out[i] + e * m_nqe,

                                     1, t = out[i] + e * m_nqe, 1);

                    }

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // dEta0

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        // dEta2

        for (int i = 0; i < m_numElmt; ++i)

        {

            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);

        }


        for (int i = 0; i < m_numElmt; ++i)

        {

            // dEta1

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            // dxi2 = (1 + eta_1)/(1 -eta_2)*dEta1 + dEta2

            Vmath::Vvtvp(nPhys, m_fac3.get(), 1, Diff[1].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1);


            // dxi1 =  2/(1 - eta_2) dEta1

            Vmath::Vmul(nPhys, m_fac2.get(), 1, Diff[1].get() + i * nPhys, 1,

                        Diff[1].get() + i * nPhys, 1);


            // dxi1 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi1

            Vmath::Vvtvp(nPhys, m_fac1.get(), 1, Diff[0].get() + i * nPhys, 1,

                         Diff[1].get() + i * nPhys, 1,

                         Diff[1].get() + i * nPhys, 1);


            // dxi2 = 2.0(1+eta_0)/((1-eta_1)(1-eta_2)) dEta0 + dxi2

            Vmath::Vvtvp(nPhys, m_fac1.get(), 1, Diff[0].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1,

                         Diff[2].get() + i * nPhys, 1);


            // dxi0 = 4.0/((1-eta_1)(1-eta_2)) dEta0

            Vmath::Vmul(nPhys, m_fac0.get(), 1, Diff[0].get() + i * nPhys, 1,

                        Diff[0].get() + i * nPhys, 1);

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            // calculate full derivative

            Vmath::Vmul(ntot, m_derivFac[dir * 3], 1, Diff[0], 1, output, 1);

            for (int j = 1; j < 3; ++j)

            {

                Vmath::Vvtvp(ntot, m_derivFac[dir * 3 + j], 1, Diff[j], 1,

                             output, 1, output, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[dir * 3][e], Diff[0] + e * m_nqe,

                            1, t = output + e * m_nqe, 1);

                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Svtvp(m_nqe, m_derivFac[dir * 3 + j][e],

                                 Diff[j] + e * m_nqe, 1, output + e * m_nqe, 1,

                                 t = output + e * m_nqe, 1);

                }

            }

        }

    }


protected:

    Array<TwoD, const NekDouble> m_derivFac;

    int m_coordim;

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    NekDouble *m_Deriv0;

    NekDouble *m_Deriv1;

    NekDouble *m_Deriv2;

    Array<OneD, NekDouble> m_fac0;

    Array<OneD, NekDouble> m_fac1;

    Array<OneD, NekDouble> m_fac2;

    Array<OneD, NekDouble> m_fac3;


private:

    PhysDeriv_SumFac_Tet(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

        m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


        m_wspSize = 3 * m_nquad0 * m_nquad1 * m_nquad2 * m_numElmt;


        const Array<OneD, const NekDouble> &z0 = m_stdExp->GetBasis(0)->GetZ();

        const Array<OneD, const NekDouble> &z1 = m_stdExp->GetBasis(1)->GetZ();

        const Array<OneD, const NekDouble> &z2 = m_stdExp->GetBasis(2)->GetZ();


        m_fac0 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        m_fac1 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        m_fac2 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        m_fac3 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);


        // calculate 2.0/((1-eta_1)(1-eta_2))

        for (int i = 0; i < m_nquad0; ++i)

        {

            for (int j = 0; j < m_nquad1; ++j)

            {

                for (int k = 0; k < m_nquad2; ++k)

                {

                    m_fac0[i + j * m_nquad0 + k * m_nquad0 * m_nquad1] =

                        4.0 / ((1 - z1[j]) * (1 - z2[k]));

                    m_fac1[i + j * m_nquad0 + k * m_nquad0 * m_nquad1] =

                        2.0 * (1 + z0[i]) / ((1 - z1[j]) * (1 - z2[k]));

                    m_fac2[i + j * m_nquad0 + k * m_nquad0 * m_nquad1] =

                        2.0 / (1 - z2[k]);

                    m_fac3[i + j * m_nquad0 + k * m_nquad0 * m_nquad1] =

                        (1 + z1[j]) / (1 - z2[k]);

                }

            }

        }

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Tet operators

OperatorKey PhysDeriv_SumFac_Tet::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Tet::create, "PhysDeriv_SumFac_Tet")};


/**

 * @brief Phys deriv operator using sum-factorisation (Prism)

 */

class PhysDeriv_SumFac_Prism final : virtual public Operator,

                                     virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Prism)


    ~PhysDeriv_SumFac_Prism() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);

        Array<OneD, Array<OneD, NekDouble>> out(3);

        out[0] = output0;

        out[1] = output1;

        out[2] = output2;


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // dEta0

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i)

        {

            // dEta 1

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            // dEta 2

            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);


            // dxi0 = 2/(1-eta_2) d Eta_0

            Vmath::Vmul(nPhys, &m_fac0[0], 1, Diff[0].get() + cnt, 1,

                        Diff[0].get() + cnt, 1);


            // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

            Vmath::Vvtvp(nPhys, &m_fac1[0], 1, Diff[0].get() + cnt, 1,

                         Diff[2].get() + cnt, 1, Diff[2].get() + cnt, 1);

            cnt += nPhys;

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Vmul(ntot, m_derivFac[i * 3], 1, Diff[0], 1, out[i], 1);

                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Vvtvp(ntot, m_derivFac[i * 3 + j], 1, Diff[j], 1,

                                 out[i], 1, out[i], 1);

                }

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int i = 0; i < m_coordim; ++i)

                {

                    Vmath::Smul(m_nqe, m_derivFac[i * 3][e],

                                Diff[0] + e * m_nqe, 1, t = out[i] + e * m_nqe,

                                1);


                    for (int j = 1; j < 3; ++j)

                    {

                        Vmath::Svtvp(m_nqe, m_derivFac[i * 3 + j][e],

                                     Diff[j] + e * m_nqe, 1, out[i] + e * m_nqe,

                                     1, t = out[i] + e * m_nqe, 1);

                    }

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // dEta0

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i)

        {

            // dEta 1

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            // dEta 2

            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);


            // dxi0 = 2/(1-eta_2) d Eta_0

            Vmath::Vmul(nPhys, &m_fac0[0], 1, Diff[0].get() + cnt, 1,

                        Diff[0].get() + cnt, 1);


            // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

            Vmath::Vvtvp(nPhys, &m_fac1[0], 1, Diff[0].get() + cnt, 1,

                         Diff[2].get() + cnt, 1, Diff[2].get() + cnt, 1);

            cnt += nPhys;

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            // calculate full derivative

            Vmath::Vmul(ntot, m_derivFac[dir * 3], 1, Diff[0], 1, output, 1);

            for (int j = 1; j < 3; ++j)

            {

                Vmath::Vvtvp(ntot, m_derivFac[dir * 3 + j], 1, Diff[j], 1,

                             output, 1, output, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[dir * 3][e], Diff[0] + e * m_nqe,

                            1, t = output + e * m_nqe, 1);


                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Svtvp(m_nqe, m_derivFac[dir * 3 + j][e],

                                 Diff[j] + e * m_nqe, 1, output + e * m_nqe, 1,

                                 t = output + e * m_nqe, 1);

                }

            }

        }

    }


protected:

    Array<TwoD, const NekDouble> m_derivFac;

    int m_coordim;

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    NekDouble *m_Deriv0;

    NekDouble *m_Deriv1;

    NekDouble *m_Deriv2;

    Array<OneD, NekDouble> m_fac0;

    Array<OneD, NekDouble> m_fac1;


private:

    PhysDeriv_SumFac_Prism(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                           CoalescedGeomDataSharedPtr pGeomData,

                           StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        const Array<OneD, const NekDouble> &z0 = m_stdExp->GetBasis(0)->GetZ();

        const Array<OneD, const NekDouble> &z2 = m_stdExp->GetBasis(2)->GetZ();

        m_fac0 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        m_fac1 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        for (int i = 0; i < m_nquad0; ++i)

        {

            for (int j = 0; j < m_nquad1; ++j)

            {

                for (int k = 0; k < m_nquad2; ++k)

                {

                    m_fac0[i + j * m_nquad0 + k * m_nquad0 * m_nquad1] =

                        2.0 / (1 - z2[k]);

                    m_fac1[i + j * m_nquad0 + k * m_nquad0 * m_nquad1] =

                        0.5 * (1 + z0[i]);

                }

            }

        }


        m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

        m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


        m_wspSize = 3 * m_nquad0 * m_nquad1 * m_nquad2 * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Prism operators

OperatorKey PhysDeriv_SumFac_Prism::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Prism::create, "PhysDeriv_SumFac_Prism")};


/**

 * @brief Phys deriv operator using sum-factorisation (Pyramid)

 */

class PhysDeriv_SumFac_Pyr final : virtual public Operator,

                                   virtual public PhysDeriv_Helper

{

public:

    OPERATOR_CREATE(PhysDeriv_SumFac_Pyr)


    ~PhysDeriv_SumFac_Pyr() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    Array<OneD, NekDouble> &output1,

                    Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);

        Array<OneD, Array<OneD, NekDouble>> out(3);

        out[0] = output0;

        out[1] = output1;

        out[2] = output2;


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // dEta0

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i)

        {

            // dEta 1

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            // dEta 2

            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);


            // dxi0 = 2/(1-eta_2) d Eta_0

            Vmath::Vmul(nPhys, &m_fac0[0], 1, Diff[0].get() + cnt, 1,

                        Diff[0].get() + cnt, 1);


            // dxi1 = 2/(1-eta_2) d Eta_1

            Vmath::Vmul(nPhys, &m_fac0[0], 1, Diff[1].get() + cnt, 1,

                        Diff[1].get() + cnt, 1);


            // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

            Vmath::Vvtvp(nPhys, &m_fac1[0], 1, Diff[0].get() + cnt, 1,

                         Diff[2].get() + cnt, 1, Diff[2].get() + cnt, 1);


            // dxi2 += (1+eta1)/(1-eta_2) d Eta_1

            Vmath::Vvtvp(nPhys, &m_fac2[0], 1, Diff[1].get() + cnt, 1,

                         Diff[2].get() + cnt, 1, Diff[2].get() + cnt, 1);

            cnt += nPhys;

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            for (int i = 0; i < m_coordim; ++i)

            {

                Vmath::Vmul(ntot, m_derivFac[i * 3], 1, Diff[0], 1, out[i], 1);

                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Vvtvp(ntot, m_derivFac[i * 3 + j], 1, Diff[j], 1,

                                 out[i], 1, out[i], 1);

                }

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                for (int i = 0; i < m_coordim; ++i)

                {

                    Vmath::Smul(m_nqe, m_derivFac[i * 3][e],

                                Diff[0] + e * m_nqe, 1, t = out[i] + e * m_nqe,

                                1);


                    for (int j = 1; j < 3; ++j)

                    {

                        Vmath::Svtvp(m_nqe, m_derivFac[i * 3 + j][e],

                                     Diff[j] + e * m_nqe, 1, out[i] + e * m_nqe,

                                     1, t = out[i] + e * m_nqe, 1);

                    }

                }

            }

        }

    }


    void operator()(int dir, const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output,

                    Array<OneD, NekDouble> &wsp) final

    {

        int nPhys = m_stdExp->GetTotPoints();

        int ntot  = m_numElmt * nPhys;

        Array<OneD, NekDouble> tmp0, tmp1, tmp2;

        Array<OneD, Array<OneD, NekDouble>> Diff(3);


        for (int i = 0; i < 3; ++i)

        {

            Diff[i] = wsp + i * ntot;

        }


        // dEta0

        Blas::Dgemm('N', 'N', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nquad0, 1.0, m_Deriv0, m_nquad0, &input[0], m_nquad0, 0.0,

                    &Diff[0][0], m_nquad0);


        int cnt = 0;

        for (int i = 0; i < m_numElmt; ++i)

        {

            // dEta 1

            for (int j = 0; j < m_nquad2; ++j)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nquad1, 1.0,

                            &input[i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0, m_Deriv1, m_nquad1, 0.0,

                            &Diff[1][i * nPhys + j * m_nquad0 * m_nquad1],

                            m_nquad0);

            }


            // dEta 2

            Blas::Dgemm('N', 'T', m_nquad0 * m_nquad1, m_nquad2, m_nquad2, 1.0,

                        &input[i * nPhys], m_nquad0 * m_nquad1, m_Deriv2,

                        m_nquad2, 0.0, &Diff[2][i * nPhys],

                        m_nquad0 * m_nquad1);


            // dxi0 = 2/(1-eta_2) d Eta_0

            Vmath::Vmul(nPhys, &m_fac0[0], 1, Diff[0].get() + cnt, 1,

                        Diff[0].get() + cnt, 1);


            // dxi1 = 2/(1-eta_2) d Eta_1

            Vmath::Vmul(nPhys, &m_fac0[0], 1, Diff[1].get() + cnt, 1,

                        Diff[1].get() + cnt, 1);


            // dxi2 = (1+eta0)/(1-eta_2) d Eta_0 + d/dEta2;

            Vmath::Vvtvp(nPhys, &m_fac1[0], 1, Diff[0].get() + cnt, 1,

                         Diff[2].get() + cnt, 1, Diff[2].get() + cnt, 1);


            // dxi2 = (1+eta1)/(1-eta_2) d Eta_1 + d/dEta2;

            Vmath::Vvtvp(nPhys, &m_fac2[0], 1, Diff[1].get() + cnt, 1,

                         Diff[2].get() + cnt, 1, Diff[2].get() + cnt, 1);

            cnt += nPhys;

        }


        // calculate full derivative

        if (m_isDeformed)

        {

            // calculate full derivative

            Vmath::Vmul(ntot, m_derivFac[dir * 3], 1, Diff[0], 1, output, 1);

            for (int j = 1; j < 3; ++j)

            {

                Vmath::Vvtvp(ntot, m_derivFac[dir * 3 + j], 1, Diff[j], 1,

                             output, 1, output, 1);

            }

        }

        else

        {

            Array<OneD, NekDouble> t;

            for (int e = 0; e < m_numElmt; ++e)

            {

                Vmath::Smul(m_nqe, m_derivFac[dir * 3][e], Diff[0] + e * m_nqe,

                            1, t = output + e * m_nqe, 1);


                for (int j = 1; j < 3; ++j)

                {

                    Vmath::Svtvp(m_nqe, m_derivFac[dir * 3 + j][e],

                                 Diff[j] + e * m_nqe, 1, output + e * m_nqe, 1,

                                 t = output + e * m_nqe, 1);

                }

            }

        }

    }


protected:

    Array<TwoD, const NekDouble> m_derivFac;

    int m_coordim;

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    NekDouble *m_Deriv0;

    NekDouble *m_Deriv1;

    NekDouble *m_Deriv2;

    Array<OneD, NekDouble> m_fac0;

    Array<OneD, NekDouble> m_fac1;

    Array<OneD, NekDouble> m_fac2;


private:

    PhysDeriv_SumFac_Pyr(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), PhysDeriv_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2))

    {

        m_coordim = pCollExp[0]->GetCoordim();


        m_derivFac = pGeomData->GetDerivFactors(pCollExp);


        const Array<OneD, const NekDouble> &z0 = m_stdExp->GetBasis(0)->GetZ();

        const Array<OneD, const NekDouble> &z1 = m_stdExp->GetBasis(1)->GetZ();

        const Array<OneD, const NekDouble> &z2 = m_stdExp->GetBasis(2)->GetZ();

        m_fac0 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        m_fac1 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);

        m_fac2 = Array<OneD, NekDouble>(m_nquad0 * m_nquad1 * m_nquad2);


        int nq0_nq1 = m_nquad0 * m_nquad1;

        for (int i = 0; i < m_nquad0; ++i)

        {

            for (int j = 0; j < m_nquad1; ++j)

            {

                int ifac = i + j * m_nquad0;

                for (int k = 0; k < m_nquad2; ++k)

                {

                    m_fac0[ifac + k * nq0_nq1] = 2.0 / (1 - z2[k]);

                    m_fac1[ifac + k * nq0_nq1] = 0.5 * (1 + z0[i]);

                    m_fac2[ifac + k * nq0_nq1] = 0.5 * (1 + z1[j]);

                }

            }

        }


        m_Deriv0 = &((m_stdExp->GetBasis(0)->GetD())->GetPtr())[0];

        m_Deriv1 = &((m_stdExp->GetBasis(1)->GetD())->GetPtr())[0];

        m_Deriv2 = &((m_stdExp->GetBasis(2)->GetD())->GetPtr())[0];


        m_wspSize = 3 * m_nquad0 * m_nquad1 * m_nquad2 * m_numElmt;

    }

};


/// Factory initialisation for the PhysDeriv_SumFac_Pyr operators

OperatorKey PhysDeriv_SumFac_Pyr::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, ePhysDeriv, eSumFac, false),

        PhysDeriv_SumFac_Pyr::create, "PhysDeriv_SumFac_Pyr")};


} // namespace Nektar::Collections

Collection.h

ASSERTL0
#define ASSERTL0(condition, msg)
Definition: ErrorUtil.hpp:208

NEKERROR
#define NEKERROR(type, msg)
Assert Level 0 – Fundamental assert which is used whether in FULLDEBUG, DEBUG or OPT compilation mode...
Definition: ErrorUtil.hpp:202

ASSERTL1
#define ASSERTL1(condition, msg)
Assert Level 1 – Debugging which is used whether in FULLDEBUG or DEBUG compilation mode....
Definition: ErrorUtil.hpp:242

MatrixFreeBase.h

Operator.h

OPERATOR_CREATE
#define OPERATOR_CREATE(cname)
Definition: Operator.h:43

Nektar::Array
Definition: BasicUtils/SharedArray.hpp:51

Nektar::Collections::MatrixFreeBase::m_nIn
unsigned int m_nIn
Definition: MatrixFreeBase.h:60

Nektar::Collections::MatrixFreeBase::m_isPadded
bool m_isPadded
flag for padding
Definition: MatrixFreeBase.h:57

Nektar::Collections::MatrixFreeBase::m_nElmtPad
unsigned int m_nElmtPad
size after padding
Definition: MatrixFreeBase.h:59

Nektar::Collections::MatrixFreeBase::m_nOut
unsigned int m_nOut
Definition: MatrixFreeBase.h:61

Nektar::Collections::MatrixFreeOneInMultiOut
Definition: MatrixFreeBase.h:138

Nektar::Collections::MatrixFreeOneInMultiOut::m_input
Array< OneD, NekDouble > m_input
padded input/output vectors
Definition: MatrixFreeBase.h:179

Nektar::Collections::MatrixFreeOneInMultiOut::m_coordim
unsigned short m_coordim
coordinates dimension
Definition: MatrixFreeBase.h:177

Nektar::Collections::MatrixFreeOneInMultiOut::m_output
Array< OneD, Array< OneD, NekDouble > > m_output
Definition: MatrixFreeBase.h:180

Nektar::Collections::Operator
Base class for operators on a collection of elements.
Definition: Operator.h:138

Nektar::Collections::Operator::m_wspSize
unsigned int m_wspSize
Definition: Operator.h:221

Nektar::Collections::Operator::m_stdExp
StdRegions::StdExpansionSharedPtr m_stdExp
Definition: Operator.h:217

Nektar::Collections::Operator::m_numElmt
unsigned int m_numElmt
number of elements that the operator is applied on
Definition: Operator.h:219

Nektar::Collections::Operator::m_nqe
unsigned int m_nqe
Definition: Operator.h:220

Nektar::Collections::Operator::m_outputSize
unsigned int m_outputSize
number of modes or quadrature points that are taken as output from an operator
Definition: Operator.h:227

Nektar::Collections::Operator::m_inputSize
unsigned int m_inputSize
number of modes or quadrature points that are passed as input to an operator
Definition: Operator.h:224

Nektar::Collections::Operator::m_isDeformed
bool m_isDeformed
Definition: Operator.h:216

Nektar::Collections::PhysDeriv_Helper
Physical Derivative help class to calculate the size of the collection that is given as an input and ...
Definition: PhysDeriv.cpp:60

Nektar::Collections::PhysDeriv_Helper::PhysDeriv_Helper
PhysDeriv_Helper()
Definition: PhysDeriv.cpp:62

Nektar::Collections::PhysDeriv_IterPerExp
Phys deriv operator using element-wise operation.
Definition: PhysDeriv.cpp:422

Nektar::Collections::PhysDeriv_IterPerExp::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:491

Nektar::Collections::PhysDeriv_IterPerExp::PhysDeriv_IterPerExp
PhysDeriv_IterPerExp(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:543

Nektar::Collections::PhysDeriv_IterPerExp::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:538

Nektar::Collections::PhysDeriv_IterPerExp::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:540

Nektar::Collections::PhysDeriv_IterPerExp::~PhysDeriv_IterPerExp
~PhysDeriv_IterPerExp() final=default

Nektar::Collections::PhysDeriv_IterPerExp::m_dim
int m_dim
Definition: PhysDeriv.cpp:539

Nektar::Collections::PhysDeriv_MatrixFree
Phys deriv operator using matrix free operators.
Definition: PhysDeriv.cpp:272

Nektar::Collections::PhysDeriv_MatrixFree::PhysDeriv_MatrixFree
PhysDeriv_MatrixFree(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:338

Nektar::Collections::PhysDeriv_MatrixFree::~PhysDeriv_MatrixFree
~PhysDeriv_MatrixFree() final=default

Nektar::Collections::PhysDeriv_MatrixFree::m_oper
std::shared_ptr< MatrixFree::PhysDeriv > m_oper
Definition: PhysDeriv.cpp:336

Nektar::Collections::PhysDeriv_MatrixFree::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:318

Nektar::Collections::PhysDeriv_NoCollection
Phys deriv operator using original LocalRegions implementation.
Definition: PhysDeriv.cpp:595

Nektar::Collections::PhysDeriv_NoCollection::~PhysDeriv_NoCollection
~PhysDeriv_NoCollection() final=default

Nektar::Collections::PhysDeriv_NoCollection::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:647

Nektar::Collections::PhysDeriv_NoCollection::PhysDeriv_NoCollection
PhysDeriv_NoCollection(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:666

Nektar::Collections::PhysDeriv_NoCollection::m_expList
vector< StdRegions::StdExpansionSharedPtr > m_expList
Definition: PhysDeriv.cpp:663

Nektar::Collections::PhysDeriv_StdMat
Phys deriv operator using standard matrix approach.
Definition: PhysDeriv.cpp:78

Nektar::Collections::PhysDeriv_StdMat::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:195

Nektar::Collections::PhysDeriv_StdMat::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:197

Nektar::Collections::PhysDeriv_StdMat::m_derivMat
Array< OneD, DNekMatSharedPtr > m_derivMat
Definition: PhysDeriv.cpp:194

Nektar::Collections::PhysDeriv_StdMat::PhysDeriv_StdMat
PhysDeriv_StdMat(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:200

Nektar::Collections::PhysDeriv_StdMat::m_dim
int m_dim
Definition: PhysDeriv.cpp:196

Nektar::Collections::PhysDeriv_StdMat::~PhysDeriv_StdMat
~PhysDeriv_StdMat() final=default

Nektar::Collections::PhysDeriv_StdMat::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:145

Nektar::Collections::PhysDeriv_SumFac_Hex
Phys deriv operator using sum-factorisation (Hex)
Definition: PhysDeriv.cpp:1214

Nektar::Collections::PhysDeriv_SumFac_Hex::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:1365

Nektar::Collections::PhysDeriv_SumFac_Hex::PhysDeriv_SumFac_Hex
PhysDeriv_SumFac_Hex(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1371

Nektar::Collections::PhysDeriv_SumFac_Hex::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1367

Nektar::Collections::PhysDeriv_SumFac_Hex::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1366

Nektar::Collections::PhysDeriv_SumFac_Hex::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1361

Nektar::Collections::PhysDeriv_SumFac_Hex::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1362

Nektar::Collections::PhysDeriv_SumFac_Hex::~PhysDeriv_SumFac_Hex
~PhysDeriv_SumFac_Hex() final=default

Nektar::Collections::PhysDeriv_SumFac_Hex::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:1368

Nektar::Collections::PhysDeriv_SumFac_Hex::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1296

Nektar::Collections::PhysDeriv_SumFac_Hex::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1363

Nektar::Collections::PhysDeriv_SumFac_Hex::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1364

Nektar::Collections::PhysDeriv_SumFac_Prism
Phys deriv operator using sum-factorisation (Prism)
Definition: PhysDeriv.cpp:1678

Nektar::Collections::PhysDeriv_SumFac_Prism::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:1860

Nektar::Collections::PhysDeriv_SumFac_Prism::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1773

Nektar::Collections::PhysDeriv_SumFac_Prism::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1851

Nektar::Collections::PhysDeriv_SumFac_Prism::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1854

Nektar::Collections::PhysDeriv_SumFac_Prism::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:1855

Nektar::Collections::PhysDeriv_SumFac_Prism::~PhysDeriv_SumFac_Prism
~PhysDeriv_SumFac_Prism() final=default

Nektar::Collections::PhysDeriv_SumFac_Prism::PhysDeriv_SumFac_Prism
PhysDeriv_SumFac_Prism(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1863

Nektar::Collections::PhysDeriv_SumFac_Prism::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:1858

Nektar::Collections::PhysDeriv_SumFac_Prism::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:1859

Nektar::Collections::PhysDeriv_SumFac_Prism::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1857

Nektar::Collections::PhysDeriv_SumFac_Prism::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1852

Nektar::Collections::PhysDeriv_SumFac_Prism::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1853

Nektar::Collections::PhysDeriv_SumFac_Prism::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1856

Nektar::Collections::PhysDeriv_SumFac_Pyr
Phys deriv operator using sum-factorisation (Pyramid)
Definition: PhysDeriv.cpp:1912

Nektar::Collections::PhysDeriv_SumFac_Pyr::PhysDeriv_SumFac_Pyr
PhysDeriv_SumFac_Pyr(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:2114

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:2105

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:2103

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:2102

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:2110

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:2106

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_fac2
Array< OneD, NekDouble > m_fac2
Definition: PhysDeriv.cpp:2111

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:2101

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:2107

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:2108

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:2109

Nektar::Collections::PhysDeriv_SumFac_Pyr::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:2015

Nektar::Collections::PhysDeriv_SumFac_Pyr::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:2104

Nektar::Collections::PhysDeriv_SumFac_Pyr::~PhysDeriv_SumFac_Pyr
~PhysDeriv_SumFac_Pyr() final=default

Nektar::Collections::PhysDeriv_SumFac_Quad
Phys deriv operator using sum-factorisation (Quad)
Definition: PhysDeriv.cpp:843

Nektar::Collections::PhysDeriv_SumFac_Quad::~PhysDeriv_SumFac_Quad
~PhysDeriv_SumFac_Quad() final=default

Nektar::Collections::PhysDeriv_SumFac_Quad::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:972

Nektar::Collections::PhysDeriv_SumFac_Quad::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:974

Nektar::Collections::PhysDeriv_SumFac_Quad::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:971

Nektar::Collections::PhysDeriv_SumFac_Quad::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:924

Nektar::Collections::PhysDeriv_SumFac_Quad::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:970

Nektar::Collections::PhysDeriv_SumFac_Quad::PhysDeriv_SumFac_Quad
PhysDeriv_SumFac_Quad(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:978

Nektar::Collections::PhysDeriv_SumFac_Quad::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:975

Nektar::Collections::PhysDeriv_SumFac_Quad::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:973

Nektar::Collections::PhysDeriv_SumFac_Seg
Phys deriv operator using sum-factorisation (Segment)
Definition: PhysDeriv.cpp:713

Nektar::Collections::PhysDeriv_SumFac_Seg::PhysDeriv_SumFac_Seg
PhysDeriv_SumFac_Seg(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:817

Nektar::Collections::PhysDeriv_SumFac_Seg::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:812

Nektar::Collections::PhysDeriv_SumFac_Seg::~PhysDeriv_SumFac_Seg
~PhysDeriv_SumFac_Seg() final=default

Nektar::Collections::PhysDeriv_SumFac_Seg::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:813

Nektar::Collections::PhysDeriv_SumFac_Seg::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:780

Nektar::Collections::PhysDeriv_SumFac_Seg::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:811

Nektar::Collections::PhysDeriv_SumFac_Seg::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:814

Nektar::Collections::PhysDeriv_SumFac_Tet
Phys deriv operator using sum-factorisation (Tet)
Definition: PhysDeriv.cpp:1402

Nektar::Collections::PhysDeriv_SumFac_Tet::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1512

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac2
Array< OneD, NekDouble > m_fac2
Definition: PhysDeriv.cpp:1615

Nektar::Collections::PhysDeriv_SumFac_Tet::m_Deriv2
NekDouble * m_Deriv2
Definition: PhysDeriv.cpp:1612

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:1614

Nektar::Collections::PhysDeriv_SumFac_Tet::PhysDeriv_SumFac_Tet
PhysDeriv_SumFac_Tet(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1619

Nektar::Collections::PhysDeriv_SumFac_Tet::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1606

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:1613

Nektar::Collections::PhysDeriv_SumFac_Tet::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1607

Nektar::Collections::PhysDeriv_SumFac_Tet::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1610

Nektar::Collections::PhysDeriv_SumFac_Tet::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1605

Nektar::Collections::PhysDeriv_SumFac_Tet::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1611

Nektar::Collections::PhysDeriv_SumFac_Tet::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1608

Nektar::Collections::PhysDeriv_SumFac_Tet::m_fac3
Array< OneD, NekDouble > m_fac3
Definition: PhysDeriv.cpp:1616

Nektar::Collections::PhysDeriv_SumFac_Tet::~PhysDeriv_SumFac_Tet
~PhysDeriv_SumFac_Tet() final=default

Nektar::Collections::PhysDeriv_SumFac_Tet::m_nquad2
const int m_nquad2
Definition: PhysDeriv.cpp:1609

Nektar::Collections::PhysDeriv_SumFac_Tri
Phys deriv operator using sum-factorisation (Tri)
Definition: PhysDeriv.cpp:1006

Nektar::Collections::PhysDeriv_SumFac_Tri::m_Deriv1
NekDouble * m_Deriv1
Definition: PhysDeriv.cpp:1156

Nektar::Collections::PhysDeriv_SumFac_Tri::m_nquad0
const int m_nquad0
Definition: PhysDeriv.cpp:1152

Nektar::Collections::PhysDeriv_SumFac_Tri::PhysDeriv_SumFac_Tri
PhysDeriv_SumFac_Tri(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: PhysDeriv.cpp:1161

Nektar::Collections::PhysDeriv_SumFac_Tri::~PhysDeriv_SumFac_Tri
~PhysDeriv_SumFac_Tri() final=default

Nektar::Collections::PhysDeriv_SumFac_Tri::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: PhysDeriv.cpp:1096

Nektar::Collections::PhysDeriv_SumFac_Tri::m_fac1
Array< OneD, NekDouble > m_fac1
Definition: PhysDeriv.cpp:1158

Nektar::Collections::PhysDeriv_SumFac_Tri::m_coordim
int m_coordim
Definition: PhysDeriv.cpp:1151

Nektar::Collections::PhysDeriv_SumFac_Tri::m_nquad1
const int m_nquad1
Definition: PhysDeriv.cpp:1153

Nektar::Collections::PhysDeriv_SumFac_Tri::m_derivFac
Array< TwoD, const NekDouble > m_derivFac
Definition: PhysDeriv.cpp:1154

Nektar::Collections::PhysDeriv_SumFac_Tri::m_Deriv0
NekDouble * m_Deriv0
Definition: PhysDeriv.cpp:1155

Nektar::Collections::PhysDeriv_SumFac_Tri::m_fac0
Array< OneD, NekDouble > m_fac0
Definition: PhysDeriv.cpp:1157

Nektar::ErrorUtil::efatal
@ efatal
Definition: ErrorUtil.hpp:67

Nektar::LibUtilities::NekFactory::RegisterCreatorFunction
tKey RegisterCreatorFunction(tKey idKey, CreatorFunction classCreator, std::string pDesc="")
Register a class with the factory.
Definition: BasicUtils/NekFactory.hpp:197

Nektar::LibUtilities::NekFactory::CreateInstance
tBaseSharedPtr CreateInstance(tKey idKey, tParam... args)
Create an instance of the class referred to by idKey.
Definition: BasicUtils/NekFactory.hpp:143

Nektar::MemoryManager::AllocateSharedPtr
static std::shared_ptr< DataType > AllocateSharedPtr(const Args &...args)
Allocate a shared pointer from the memory pool.
Definition: NekMemoryManager.hpp:166

Blas::Dgemm
static void Dgemm(const char &transa, const char &transb, const int &m, const int &n, const int &k, const double &alpha, const double *a, const int &lda, const double *b, const int &ldb, const double &beta, double *c, const int &ldc)
BLAS level 3: Matrix-matrix multiply C = A x B where op(A)[m x k], op(B)[k x n], C[m x n] DGEMM perfo...
Definition: Blas.hpp:383

Nektar::Collections
Definition: BwdTrans.cpp:44

Nektar::Collections::eSumFac
@ eSumFac
Definition: Operator.h:92

Nektar::Collections::eIterPerExp
@ eIterPerExp
Definition: Operator.h:90

Nektar::Collections::eMatrixFree
@ eMatrixFree
Definition: Operator.h:93

Nektar::Collections::eNoCollection
@ eNoCollection
Definition: Operator.h:89

Nektar::Collections::eStdMat
@ eStdMat
Definition: Operator.h:91

Nektar::Collections::ePhysDeriv
@ ePhysDeriv
Definition: Operator.h:69

Nektar::Collections::OperatorKey
std::tuple< LibUtilities::ShapeType, OperatorType, ImplementationType, ExpansionIsNodal > OperatorKey
Key for describing an Operator.
Definition: Operator.h:120

Nektar::Collections::CoalescedGeomDataSharedPtr
std::shared_ptr< CoalescedGeomData > CoalescedGeomDataSharedPtr
Definition: CoalescedGeomData.h:88

Nektar::Collections::GetOperatorFactory
OperatorFactory & GetOperatorFactory()
Returns the singleton Operator factory object.
Definition: Operator.cpp:44

Nektar::LibUtilities::eTriangle
@ eTriangle
Definition: ShapeType.hpp:56

Nektar::LibUtilities::eTetrahedron
@ eTetrahedron
Definition: ShapeType.hpp:58

Nektar::LibUtilities::eQuadrilateral
@ eQuadrilateral
Definition: ShapeType.hpp:57

Nektar::LibUtilities::eHexahedron
@ eHexahedron
Definition: ShapeType.hpp:61

Nektar::LibUtilities::ePrism
@ ePrism
Definition: ShapeType.hpp:60

Nektar::LibUtilities::ePyramid
@ ePyramid
Definition: ShapeType.hpp:59

Nektar::LibUtilities::eSegment
@ eSegment
Definition: ShapeType.hpp:55

Nektar::StdRegions::FactorMap
ConstFactorMap FactorMap
Definition: StdRegions.hpp:434

Nektar::VarcoeffHashingTest::factors
StdRegions::ConstFactorMap factors
Definition: TestVarcoeffHashing.cpp:51

Nektar::NekDouble
double NekDouble
Definition: NektarUnivTypeDefs.hpp:43

Vmath::Vmul
void Vmul(int n, const T *x, const int incx, const T *y, const int incy, T *z, const int incz)
Multiply vector z = x*y.
Definition: Vmath.hpp:72

Vmath::Svtvp
void Svtvp(int n, const T alpha, const T *x, const int incx, const T *y, const int incy, T *z, const int incz)
Svtvp (scalar times vector plus vector): z = alpha*x + y.
Definition: Vmath.hpp:396

Vmath::Vvtvp
void Vvtvp(int n, const T *w, const int incw, const T *x, const int incx, const T *y, const int incy, T *z, const int incz)
vvtvp (vector times vector plus vector): z = w*x + y
Definition: Vmath.hpp:366

Vmath::Smul
void Smul(int n, const T alpha, const T *x, const int incx, T *y, const int incy)
Scalar multiply y = alpha*x.
Definition: Vmath.hpp:100

Vmath::Zero
void Zero(int n, T *x, const int incx)
Zero vector.
Definition: Vmath.hpp:273

Vmath::Vcopy
void Vcopy(int n, const T *x, const int incx, T *y, const int incy)
Definition: Vmath.hpp:825

std
STL namespace.

Nektar::OneD
Definition: NektarUnivTypeDefs.hpp:54