doxygen/latest/_bwd_trans_8cpp_source.html

///////////////////////////////////////////////////////////////////////////////

//

// File: BwdTrans.cpp

//

// For more information, please see: http://www.nektar.info

//

// The MIT License

//

// Copyright (c) 2006 Division of Applied Mathematics, Brown University (USA),

// Department of Aeronautics, Imperial College London (UK), and Scientific

// Computing and Imaging Institute, University of Utah (USA).

//

// Permission is hereby granted, free of charge, to any person obtaining a

// copy of this software and associated documentation files (the "Software"),

// to deal in the Software without restriction, including without limitation

// the rights to use, copy, modify, merge, publish, distribute, sublicense,

// and/or sell copies of the Software, and to permit persons to whom the

// Software is furnished to do so, subject to the following conditions:

//

// The above copyright notice and this permission notice shall be included

// in all copies or substantial portions of the Software.

//

// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS

// OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

// FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL

// THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

// LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING

// FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER

// DEALINGS IN THE SOFTWARE.

//

// Description: BwdTrans operator implementations

//

///////////////////////////////////////////////////////////////////////////////


#include <Collections/CoalescedGeomData.h>

#include <Collections/MatrixFreeBase.h>

#include <Collections/Operator.h>


#include <MatrixFreeOps/Operator.hpp>


using namespace std;


namespace Nektar::Collections

{


using LibUtilities::eHexahedron;

using LibUtilities::ePrism;

using LibUtilities::ePyramid;

using LibUtilities::eQuadrilateral;

using LibUtilities::eSegment;

using LibUtilities::eTetrahedron;

using LibUtilities::eTriangle;


/**

 * @brief Backward transform help class to calculate the size of the collection

 * that is given as an input and as an output to the BwdTrans Operator. The size

 * evaluation takes into account the conversion from the coefficient space to

 * the physical space

 */

class BwdTrans_Helper : virtual public Operator

{

protected:

    BwdTrans_Helper()

    {

        // expect input to be number of elements by the number of coefficients

        m_inputSize = m_numElmt * m_stdExp->GetNcoeffs();

        // expect input to be number of elements by the number of quad points

        m_outputSize = m_numElmt * m_stdExp->GetTotPoints();

    }

};


/**

 * @brief Backward transform operator using standard matrix approach.

 */

class BwdTrans_StdMat final : virtual public Operator,

                              virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_StdMat)


    ~BwdTrans_StdMat() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) override

    {

        Blas::Dgemm('N', 'N', m_mat->GetRows(), m_numElmt, m_mat->GetColumns(),

                    1.0, m_mat->GetRawPtr(), m_mat->GetRows(), input.get(),

                    m_stdExp->GetNcoeffs(), 0.0, output0.get(),

                    m_stdExp->GetTotPoints());

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    DNekMatSharedPtr m_mat;


private:

    BwdTrans_StdMat(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                    CoalescedGeomDataSharedPtr pGeomData,

                    StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper()

    {

        StdRegions::StdMatrixKey key(StdRegions::eBwdTrans,

                                     m_stdExp->DetShapeType(), *m_stdExp);

        m_mat = m_stdExp->GetStdMatrix(key);

    }

};


/// Factory initialisation for the BwdTrans_StdMat operators

OperatorKey BwdTrans_StdMat::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, eBwdTrans, eStdMat, false),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eStdMat, false),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eStdMat, true),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_NodalTri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, eBwdTrans, eStdMat, false),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eStdMat, false),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eStdMat, true),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_NodalTet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, eBwdTrans, eStdMat, false),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eStdMat, false), BwdTrans_StdMat::create,

        "BwdTrans_StdMat_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eStdMat, true), BwdTrans_StdMat::create,

        "BwdTrans_StdMat_NodalPrism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, eBwdTrans, eStdMat, false),

        BwdTrans_StdMat::create, "BwdTrans_StdMat_Hex"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, eBwdTrans, eSumFac, false),

        BwdTrans_StdMat::create, "BwdTrans_SumFac_Pyr")};


/**

 * @brief Backward transform operator using matrix free operators.

 */

class BwdTrans_MatrixFree final : virtual public Operator,

                                  MatrixFreeOneInOneOut,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_MatrixFree)


    ~BwdTrans_MatrixFree() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        if (m_isPadded)

        {

            // copy into padded vector

            Vmath::Vcopy(m_nIn, input, 1, m_input, 1);

            // call op

            (*m_oper)(m_input, m_output);

            // copy out of padded vector

            Vmath::Vcopy(m_nOut, m_output, 1, output0, 1);

        }

        else

        {

            (*m_oper)(input, output0);

        }

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        NEKERROR(ErrorUtil::efatal,

                 "BwdTrans_MatrixFree: Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


private:

    std::shared_ptr<MatrixFree::BwdTrans> m_oper;


    BwdTrans_MatrixFree(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          MatrixFreeOneInOneOut(pCollExp[0]->GetStdExp()->GetNcoeffs(),

                                pCollExp[0]->GetStdExp()->GetTotPoints(),

                                pCollExp.size())

    {

        // Basis vector.

        const auto dim = pCollExp[0]->GetStdExp()->GetShapeDimension();

        std::vector<LibUtilities::BasisSharedPtr> basis(dim);

        for (auto i = 0; i < dim; ++i)

        {

            basis[i] = pCollExp[0]->GetBasis(i);

        }


        // Get shape type

        auto shapeType = pCollExp[0]->GetStdExp()->DetShapeType();


        // Generate operator string and create operator.

        std::string op_string = "BwdTrans";

        op_string += MatrixFree::GetOpstring(shapeType, false);

        auto oper = MatrixFree::GetOperatorFactory().CreateInstance(

            op_string, basis, m_nElmtPad);


        m_oper = std::dynamic_pointer_cast<MatrixFree::BwdTrans>(oper);

        ASSERTL0(m_oper, "Failed to cast pointer.");

    }

};


/// Factory initialisation for the BwdTrans_MatrixFree operators

OperatorKey BwdTrans_MatrixFree::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Hex"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, eBwdTrans, eMatrixFree, false),

        BwdTrans_MatrixFree::create, "BwdTrans_MatrixFree_Pyr")};


/**

 * @brief Backward transform operator using default StdRegions operator

 */

class BwdTrans_IterPerExp final : virtual public Operator,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_IterPerExp)


    ~BwdTrans_IterPerExp() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) override

    {

        const int nCoeffs = m_stdExp->GetNcoeffs();

        const int nPhys   = m_stdExp->GetTotPoints();

        Array<OneD, NekDouble> tmp;


        for (int i = 0; i < m_numElmt; ++i)

        {

            m_stdExp->BwdTrans(input + i * nCoeffs, tmp = output0 + i * nPhys);

        }

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


private:

    BwdTrans_IterPerExp(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper()

    {

    }

};


/// Factory initialisation for the BwdTrans_IterPerExp operators

OperatorKey BwdTrans_IterPerExp::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eIterPerExp, true),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_NodalTri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eIterPerExp, true),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_NodalTet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eIterPerExp, true),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_NodalPrism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, eBwdTrans, eIterPerExp, false),

        BwdTrans_IterPerExp::create, "BwdTrans_IterPerExp_Hex"),

};


/**

 * @brief Backward transform operator using LocalRegions implementation.

 */

class BwdTrans_NoCollection final : virtual public Operator,

                                    virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_NoCollection)


    ~BwdTrans_NoCollection() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) override

    {

        const int nCoeffs = m_expList[0]->GetNcoeffs();

        const int nPhys   = m_expList[0]->GetTotPoints();

        Array<OneD, NekDouble> tmp;


        for (int i = 0; i < m_numElmt; ++i)

        {

            m_expList[i]->BwdTrans(input + i * nCoeffs,

                                   tmp = output0 + i * nPhys);

        }

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    vector<StdRegions::StdExpansionSharedPtr> m_expList;


private:

    BwdTrans_NoCollection(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                          CoalescedGeomDataSharedPtr pGeomData,

                          StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper()

    {

        m_expList = pCollExp;

    }

};


/// Factory initialisation for the BwdTrans_NoCollection operators

OperatorKey BwdTrans_NoCollection::m_typeArr[] = {

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Seg"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Tri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eNoCollection, true),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_NodalTri"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Quad"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Tet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eNoCollection, true),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_NodalTet"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Pyr"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Prism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eNoCollection, true),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_NodalPrism"),

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, eBwdTrans, eNoCollection, false),

        BwdTrans_NoCollection::create, "BwdTrans_NoCollection_Hex"),

};


/**

 * @brief Backward transform operator using sum-factorisation (Segment)

 */

class BwdTrans_SumFac_Seg final : virtual public Operator,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Seg)


    ~BwdTrans_SumFac_Seg() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) override

    {

        if (m_colldir0)

        {

            Vmath::Vcopy(m_numElmt * m_nmodes0, input.get(), 1, output0.get(),

                         1);

        }

        else

        {

            // out = B0*in;

            Blas::Dgemm('N', 'N', m_nquad0, m_numElmt, m_nmodes0, 1.0,

                        m_base0.get(), m_nquad0, &input[0], m_nmodes0, 0.0,

                        &output0[0], m_nquad0);

        }

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nmodes0;

    const bool m_colldir0;

    Array<OneD, const NekDouble> m_base0;


private:

    BwdTrans_SumFac_Seg(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nmodes0(m_stdExp->GetBasisNumModes(0)),

          m_colldir0(m_stdExp->GetBasis(0)->Collocation()),

          m_base0(m_stdExp->GetBasis(0)->GetBdata())

    {

        m_wspSize = 0;

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Seg operator

OperatorKey BwdTrans_SumFac_Seg::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eSegment, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Seg::create, "BwdTrans_SumFac_Seg");


/**

 * @brief Backward transform operator using sum-factorisation (Quad)

 */

class BwdTrans_SumFac_Quad final : virtual public Operator,

                                   virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Quad)


    ~BwdTrans_SumFac_Quad() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) override

    {

        int i = 0;

        if (m_colldir0 && m_colldir1)

        {

            Vmath::Vcopy(m_numElmt * m_nmodes0 * m_nmodes1, input.get(), 1,

                         output0.get(), 1);

        }

        else if (m_colldir0)

        {

            for (i = 0; i < m_numElmt; ++i)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nmodes1, 1.0,

                            &input[i * m_nquad0 * m_nmodes1], m_nquad0,

                            m_base1.get(), m_nquad1, 0.0,

                            &output0[i * m_nquad0 * m_nquad1], m_nquad0);

            }

        }

        else if (m_colldir1)

        {

            Blas::Dgemm('N', 'N', m_nquad0, m_nmodes1 * m_numElmt, m_nmodes0,

                        1.0, m_base0.get(), m_nquad0, &input[0], m_nmodes0, 0.0,

                        &output0[0], m_nquad0);

        }

        else

        {

            ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");


            // Those two calls correpsond to the operation

            // out = B0*in*Transpose(B1);

            Blas::Dgemm('N', 'N', m_nquad0, m_nmodes1 * m_numElmt, m_nmodes0,

                        1.0, m_base0.get(), m_nquad0, &input[0], m_nmodes0, 0.0,

                        &wsp[0], m_nquad0);


            for (i = 0; i < m_numElmt; ++i)

            {

                Blas::Dgemm('N', 'T', m_nquad0, m_nquad1, m_nmodes1, 1.0,

                            &wsp[i * m_nquad0 * m_nmodes1], m_nquad0,

                            m_base1.get(), m_nquad1, 0.0,

                            &output0[i * m_nquad0 * m_nquad1], m_nquad0);

            }

        }

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nquad1;

    const int m_nmodes0;

    const int m_nmodes1;

    const bool m_colldir0;

    const bool m_colldir1;

    Array<OneD, const NekDouble> m_base0;

    Array<OneD, const NekDouble> m_base1;


private:

    BwdTrans_SumFac_Quad(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                         CoalescedGeomDataSharedPtr pGeomData,

                         StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nmodes0(m_stdExp->GetBasisNumModes(0)),

          m_nmodes1(m_stdExp->GetBasisNumModes(1)),

          m_colldir0(m_stdExp->GetBasis(0)->Collocation()),

          m_colldir1(m_stdExp->GetBasis(1)->Collocation()),

          m_base0(m_stdExp->GetBasis(0)->GetBdata()),

          m_base1(m_stdExp->GetBasis(1)->GetBdata())

    {

        m_wspSize = m_nquad0 * m_nmodes1 * m_numElmt;

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Quad operator

OperatorKey BwdTrans_SumFac_Quad::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eQuadrilateral, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Quad::create, "BwdTrans_SumFac_Quad");


/**

 * @brief Backward transform operator using sum-factorisation (Tri)

 */

class BwdTrans_SumFac_Tri final : virtual public Operator,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Tri)


    ~BwdTrans_SumFac_Tri() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) override

    {

        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");


        int ncoeffs = m_stdExp->GetNcoeffs();

        int i       = 0;

        int mode    = 0;


        for (i = mode = 0; i < m_nmodes0; ++i)

        {

            Blas::Dgemm('N', 'N', m_nquad1, m_numElmt, m_nmodes1 - i, 1.0,

                        m_base1.get() + mode * m_nquad1, m_nquad1,

                        &input[0] + mode, ncoeffs, 0.0,

                        &wsp[i * m_nquad1 * m_numElmt], m_nquad1);

            mode += m_nmodes1 - i;

        }


        // fix for modified basis by splitting top vertex mode

        if (m_sortTopVertex)

        {

            for (i = 0; i < m_numElmt; ++i)

            {

                Blas::Daxpy(m_nquad1, input[1 + i * ncoeffs],

                            m_base1.get() + m_nquad1, 1,

                            &wsp[m_nquad1 * m_numElmt] + i * m_nquad1, 1);

            }

        }


        Blas::Dgemm('N', 'T', m_nquad0, m_nquad1 * m_numElmt, m_nmodes0, 1.0,

                    m_base0.get(), m_nquad0, &wsp[0], m_nquad1 * m_numElmt, 0.0,

                    &output0[0], m_nquad0);

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nquad1;

    const int m_nmodes0;

    const int m_nmodes1;

    Array<OneD, const NekDouble> m_base0;

    Array<OneD, const NekDouble> m_base1;

    bool m_sortTopVertex;


private:

    BwdTrans_SumFac_Tri(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nmodes0(m_stdExp->GetBasisNumModes(0)),

          m_nmodes1(m_stdExp->GetBasisNumModes(1)),

          m_base0(m_stdExp->GetBasis(0)->GetBdata()),

          m_base1(m_stdExp->GetBasis(1)->GetBdata())

    {

        m_wspSize = m_nquad1 * m_nmodes0 * m_numElmt;

        if (m_stdExp->GetBasis(0)->GetBasisType() == LibUtilities::eModified_A)

        {

            m_sortTopVertex = true;

        }

        else

        {

            m_sortTopVertex = false;

        }

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Tri operator

OperatorKey BwdTrans_SumFac_Tri::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTriangle, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Tri::create, "BwdTrans_SumFac_Tri");


/// Backward transform operator using sum-factorisation (Hex)

class BwdTrans_SumFac_Hex final : virtual public Operator,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Hex)


    ~BwdTrans_SumFac_Hex() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) override

    {

        if (m_colldir0 && m_colldir1 && m_colldir2)

        {

            Vmath::Vcopy(m_numElmt * m_nmodes0 * m_nmodes1 * m_nmodes2,

                         input.get(), 1, output0.get(), 1);

        }

        else

        {

            ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");


            // Assign second half of workspace for 2nd DGEMM operation.

            int totmodes = m_nmodes0 * m_nmodes1 * m_nmodes2;


            Array<OneD, NekDouble> wsp2 =

                wsp + m_nmodes0 * m_nmodes1 * m_nquad2 * m_numElmt;


            // loop over elements  and do bwd trans wrt c

            for (int n = 0; n < m_numElmt; ++n)

            {

                Blas::Dgemm('N', 'T', m_nquad2, m_nmodes0 * m_nmodes1,

                            m_nmodes2, 1.0, m_base2.get(), m_nquad2,

                            &input[n * totmodes], m_nmodes0 * m_nmodes1, 0.0,

                            &wsp[n * m_nquad2], m_nquad2 * m_numElmt);

            }


            // trans wrt b

            Blas::Dgemm('N', 'T', m_nquad1, m_nquad2 * m_numElmt * m_nmodes0,

                        m_nmodes1, 1.0, m_base1.get(), m_nquad1, wsp.get(),

                        m_nquad2 * m_numElmt * m_nmodes0, 0.0, wsp2.get(),

                        m_nquad1);


            // trans wrt a

            Blas::Dgemm('N', 'T', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                        m_nmodes0, 1.0, m_base0.get(), m_nquad0, wsp2.get(),

                        m_nquad1 * m_nquad2 * m_numElmt, 0.0, output0.get(),

                        m_nquad0);

        }

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    const int m_nmodes0;

    const int m_nmodes1;

    const int m_nmodes2;

    Array<OneD, const NekDouble> m_base0;

    Array<OneD, const NekDouble> m_base1;

    Array<OneD, const NekDouble> m_base2;

    const bool m_colldir0;

    const bool m_colldir1;

    const bool m_colldir2;


private:

    BwdTrans_SumFac_Hex(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          m_nquad0(pCollExp[0]->GetNumPoints(0)),

          m_nquad1(pCollExp[0]->GetNumPoints(1)),

          m_nquad2(pCollExp[0]->GetNumPoints(2)),

          m_nmodes0(pCollExp[0]->GetBasisNumModes(0)),

          m_nmodes1(pCollExp[0]->GetBasisNumModes(1)),

          m_nmodes2(pCollExp[0]->GetBasisNumModes(2)),

          m_base0(pCollExp[0]->GetBasis(0)->GetBdata()),

          m_base1(pCollExp[0]->GetBasis(1)->GetBdata()),

          m_base2(pCollExp[0]->GetBasis(2)->GetBdata()),

          m_colldir0(pCollExp[0]->GetBasis(0)->Collocation()),

          m_colldir1(pCollExp[0]->GetBasis(1)->Collocation()),

          m_colldir2(pCollExp[0]->GetBasis(2)->Collocation())

    {

        m_wspSize = m_numElmt * m_nmodes0 *

                    (m_nmodes1 * m_nquad2 + m_nquad1 * m_nquad2);

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Hex operator

OperatorKey BwdTrans_SumFac_Hex::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eHexahedron, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Hex::create, "BwdTrans_SumFac_Hex");


/**

 * @brief Backward transform operator using sum-factorisation (Tet)

 */

class BwdTrans_SumFac_Tet final : virtual public Operator,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Tet)


    ~BwdTrans_SumFac_Tet() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");


        Array<OneD, NekDouble> tmp = wsp;

        Array<OneD, NekDouble> tmp1 =

            tmp + m_numElmt * m_nquad2 * m_nmodes0 *

                      (2 * m_nmodes1 - m_nmodes0 + 1) / 2;


        int mode    = 0;

        int mode1   = 0;

        int cnt     = 0;

        int ncoeffs = m_stdExp->GetNcoeffs();


        // Perform summation over '2' direction

        for (int i = 0; i < m_nmodes0; ++i)

        {

            for (int j = 0; j < m_nmodes1 - i; ++j, ++cnt)

            {

                Blas::Dgemm('N', 'N', m_nquad2, m_numElmt, m_nmodes2 - i - j,

                            1.0, m_base2.get() + mode * m_nquad2, m_nquad2,

                            input.get() + mode1, ncoeffs, 0.0,

                            tmp.get() + cnt * m_nquad2 * m_numElmt, m_nquad2);

                mode += m_nmodes2 - i - j;

                mode1 += m_nmodes2 - i - j;

            }


            // increment mode in case m_nmodes1!=m_nmodes2

            mode += (m_nmodes2 - m_nmodes1) * (m_nmodes2 - m_nmodes1 + 1) / 2;

        }


        // vertex mode - currently (1+c)/2 x (1-b)/2 x (1-a)/2

        // component is evaluated

        if (m_sortTopEdge)

        {

            for (int i = 0; i < m_numElmt; ++i)

            {

                // top singular vertex

                // (1+c)/2 x (1+b)/2 x (1-a)/2 component

                Blas::Daxpy(m_nquad2, input[1 + i * ncoeffs],

                            m_base2.get() + m_nquad2, 1,

                            &tmp[m_nquad2 * m_numElmt] + i * m_nquad2, 1);


                // top singular vertex

                // (1+c)/2 x (1-b)/2 x (1+a)/2 component

                Blas::Daxpy(

                    m_nquad2, input[1 + i * ncoeffs], m_base2.get() + m_nquad2,

                    1, &tmp[m_nmodes1 * m_nquad2 * m_numElmt] + i * m_nquad2,

                    1);

            }

        }


        // Perform summation over '1' direction

        mode = 0;

        for (int i = 0; i < m_nmodes0; ++i)

        {

            Blas::Dgemm('N', 'T', m_nquad1, m_nquad2 * m_numElmt, m_nmodes1 - i,

                        1.0, m_base1.get() + mode * m_nquad1, m_nquad1,

                        tmp.get() + mode * m_nquad2 * m_numElmt,

                        m_nquad2 * m_numElmt, 0.0,

                        tmp1.get() + i * m_nquad1 * m_nquad2 * m_numElmt,

                        m_nquad1);

            mode += m_nmodes1 - i;

        }


        // fix for modified basis by adding additional split of

        // top and base singular vertex modes as well as singular

        // edge

        if (m_sortTopEdge)

        {

            // this could probably be a dgemv or higher if we

            // made a specialised m_base1[m_nuqad1] array

            // containing multiply copies

            for (int i = 0; i < m_numElmt; ++i)

            {

                // sort out singular vertices and singular

                // edge components with (1+b)/2 (1+a)/2 form

                for (int j = 0; j < m_nquad2; ++j)

                {

                    Blas::Daxpy(m_nquad1,

                                tmp[m_nquad2 * m_numElmt + i * m_nquad2 + j],

                                m_base1.get() + m_nquad1, 1,

                                &tmp1[m_nquad1 * m_nquad2 * m_numElmt] +

                                    i * m_nquad1 * m_nquad2 + j * m_nquad1,

                                1);

                }

            }

        }


        // Perform summation over '0' direction

        Blas::Dgemm('N', 'T', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nmodes0, 1.0, m_base0.get(), m_nquad0, tmp1.get(),

                    m_nquad1 * m_nquad2 * m_numElmt, 0.0, output0.get(),

                    m_nquad0);

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    const int m_nmodes0;

    const int m_nmodes1;

    const int m_nmodes2;

    Array<OneD, const NekDouble> m_base0;

    Array<OneD, const NekDouble> m_base1;

    Array<OneD, const NekDouble> m_base2;

    bool m_sortTopEdge;


private:

    BwdTrans_SumFac_Tet(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2)),

          m_nmodes0(m_stdExp->GetBasisNumModes(0)),

          m_nmodes1(m_stdExp->GetBasisNumModes(1)),

          m_nmodes2(m_stdExp->GetBasisNumModes(2)),

          m_base0(m_stdExp->GetBasis(0)->GetBdata()),

          m_base1(m_stdExp->GetBasis(1)->GetBdata()),

          m_base2(m_stdExp->GetBasis(2)->GetBdata())

    {

        m_wspSize = m_numElmt * (m_nquad2 * m_nmodes0 *

                                     (2 * m_nmodes1 - m_nmodes0 + 1) / 2 +

                                 m_nquad2 * m_nquad1 * m_nmodes0);


        if (m_stdExp->GetBasis(0)->GetBasisType() == LibUtilities::eModified_A)

        {

            m_sortTopEdge = true;

        }

        else

        {

            m_sortTopEdge = false;

        }

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Tet operator

OperatorKey BwdTrans_SumFac_Tet::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(eTetrahedron, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Tet::create, "BwdTrans_SumFac_Tet");


/**

 * @brief Backward transform operator using sum-factorisation (Prism)

 */

class BwdTrans_SumFac_Prism final : virtual public Operator,

                                    virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Prism)


    ~BwdTrans_SumFac_Prism() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");


        // Assign second half of workspace for 2nd DGEMM operation.

        int totmodes = m_stdExp->GetNcoeffs();


        Array<OneD, NekDouble> wsp2 =

            wsp + m_nmodes0 * m_nmodes1 * m_nquad2 * m_numElmt;


        Vmath::Zero(m_nmodes0 * m_nmodes1 * m_nquad2 * m_numElmt, wsp, 1);

        int i     = 0;

        int j     = 0;

        int mode  = 0;

        int mode1 = 0;

        int cnt   = 0;

        for (i = mode = mode1 = 0; i < m_nmodes0; ++i)

        {

            cnt = i * m_nquad2 * m_numElmt;

            for (j = 0; j < m_nmodes1; ++j)

            {

                Blas::Dgemm('N', 'N', m_nquad2, m_numElmt, m_nmodes2 - i, 1.0,

                            m_base2.get() + mode * m_nquad2, m_nquad2,

                            input.get() + mode1, totmodes, 0.0,

                            &wsp[j * m_nquad2 * m_numElmt * m_nmodes0 + cnt],

                            m_nquad2);

                mode1 += m_nmodes2 - i;

            }

            mode += m_nmodes2 - i;

        }


        // fix for modified basis by splitting top vertex mode

        if (m_sortTopVertex)

        {

            for (j = 0; j < m_nmodes1; ++j)

            {

                for (i = 0; i < m_numElmt; ++i)

                {

                    Blas::Daxpy(m_nquad2,

                                input[1 + i * totmodes + j * m_nmodes2],

                                m_base2.get() + m_nquad2, 1,

                                &wsp[j * m_nquad2 * m_numElmt * m_nmodes0 +

                                     m_nquad2 * m_numElmt] +

                                    i * m_nquad2,

                                1);

                }

            }

            // Believe this could be made into a m_nmodes1

            // dgemv if we made an array of m_numElmt copies

            // of m_base2[m_quad2] (which are of size

            // m_nquad2.

        }


        // Perform summation over '1' direction

        Blas::Dgemm('N', 'T', m_nquad1, m_nquad2 * m_numElmt * m_nmodes0,

                    m_nmodes1, 1.0, m_base1.get(), m_nquad1, wsp.get(),

                    m_nquad2 * m_numElmt * m_nmodes0, 0.0, wsp2.get(),

                    m_nquad1);


        // Perform summation over '0' direction

        Blas::Dgemm('N', 'T', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nmodes0, 1.0, m_base0.get(), m_nquad0, wsp2.get(),

                    m_nquad1 * m_nquad2 * m_numElmt, 0.0, output0.get(),

                    m_nquad0);

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    const int m_nmodes0;

    const int m_nmodes1;

    const int m_nmodes2;

    Array<OneD, const NekDouble> m_base0;

    Array<OneD, const NekDouble> m_base1;

    Array<OneD, const NekDouble> m_base2;

    bool m_sortTopVertex;


private:

    BwdTrans_SumFac_Prism(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                          CoalescedGeomDataSharedPtr pGeomData,

                          StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2)),

          m_nmodes0(m_stdExp->GetBasisNumModes(0)),

          m_nmodes1(m_stdExp->GetBasisNumModes(1)),

          m_nmodes2(m_stdExp->GetBasisNumModes(2)),

          m_base0(m_stdExp->GetBasis(0)->GetBdata()),

          m_base1(m_stdExp->GetBasis(1)->GetBdata()),

          m_base2(m_stdExp->GetBasis(2)->GetBdata())

    {

        m_wspSize = m_numElmt * m_nmodes0 *

                    (m_nmodes1 * m_nquad2 + m_nquad1 * m_nquad2);


        if (m_stdExp->GetBasis(0)->GetBasisType() == LibUtilities::eModified_A)

        {

            m_sortTopVertex = true;

        }

        else

        {

            m_sortTopVertex = false;

        }

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Prism operator

OperatorKey BwdTrans_SumFac_Prism::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePrism, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Prism::create, "BwdTrans_SumFac_Prism");


/**

 * @brief Backward transform operator using sum-factorisation (Pyr)

 */

class BwdTrans_SumFac_Pyr final : virtual public Operator,

                                  virtual public BwdTrans_Helper

{

public:

    OPERATOR_CREATE(BwdTrans_SumFac_Pyr)


    ~BwdTrans_SumFac_Pyr() final = default;


    void operator()(const Array<OneD, const NekDouble> &input,

                    Array<OneD, NekDouble> &output0,

                    [[maybe_unused]] Array<OneD, NekDouble> &output1,

                    [[maybe_unused]] Array<OneD, NekDouble> &output2,

                    Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL1(wsp.size() == m_wspSize, "Incorrect workspace size");


        // Assign second half of workspace for 2nd DGEMM operation.

        int totmodes = m_stdExp->GetNcoeffs();


        Array<OneD, NekDouble> wsp2 =

            wsp + m_nmodes0 * m_nmodes1 * m_nquad2 * m_numElmt;


        Vmath::Zero(m_nmodes0 * m_nmodes1 * m_nquad2 * m_numElmt, wsp, 1);

        int i     = 0;

        int j     = 0;

        int mode  = 0;

        int mode1 = 0;

        int cnt   = 0;

        for (i = 0; i < m_nmodes0; ++i)

        {

            for (j = 0; j < m_nmodes1; ++j, ++cnt)

            {

                int ijmax = max(i, j);

                Blas::Dgemm('N', 'N', m_nquad2, m_numElmt, m_nmodes2 - ijmax,

                            1.0, m_base2.get() + mode * m_nquad2, m_nquad2,

                            input.get() + mode1, totmodes, 0.0,

                            wsp.get() + cnt * m_nquad2 * m_numElmt, m_nquad2);

                mode += m_nmodes2 - ijmax;

                mode1 += m_nmodes2 - ijmax;

            }


            // increment mode in case order1!=order2

            for (j = m_nmodes1; j < m_nmodes2 - i; ++j)

            {

                int ijmax = max(i, j);

                mode += m_nmodes2 - ijmax;

            }

        }


        // vertex mode - currently (1+c)/2 x (1-b)/2 x (1-a)/2

        // component is evaluated

        if (m_sortTopVertex)

        {

            for (i = 0; i < m_numElmt; ++i)

            {

                // top singular vertex

                // (1+c)/2 x (1+b)/2 x (1-a)/2 component

                Blas::Daxpy(m_nquad2, input[1 + i * totmodes],

                            m_base2.get() + m_nquad2, 1,

                            &wsp[m_nquad2 * m_numElmt] + i * m_nquad2, 1);


                // top singular vertex

                // (1+c)/2 x (1-b)/2 x (1+a)/2 component

                Blas::Daxpy(

                    m_nquad2, input[1 + i * totmodes], m_base2.get() + m_nquad2,

                    1, &wsp[m_nmodes1 * m_nquad2 * m_numElmt] + i * m_nquad2,

                    1);


                // top singular vertex

                // (1+c)/2 x (1+b)/2 x (1+a)/2 component

                Blas::Daxpy(m_nquad2, input[1 + i * totmodes],

                            m_base2.get() + m_nquad2, 1,

                            &wsp[(m_nmodes1 + 1) * m_nquad2 * m_numElmt] +

                                i * m_nquad2,

                            1);

            }

        }


        // Perform summation over '1' direction

        mode = 0;

        for (i = 0; i < m_nmodes0; ++i)

        {

            Blas::Dgemm('N', 'T', m_nquad1, m_nquad2 * m_numElmt, m_nmodes1,

                        1.0, m_base1.get(), m_nquad1,

                        wsp.get() + mode * m_nquad2 * m_numElmt,

                        m_nquad2 * m_numElmt, 0.0,

                        wsp2.get() + i * m_nquad1 * m_nquad2 * m_numElmt,

                        m_nquad1);

            mode += m_nmodes1;

        }


        // Perform summation over '0' direction

        Blas::Dgemm('N', 'T', m_nquad0, m_nquad1 * m_nquad2 * m_numElmt,

                    m_nmodes0, 1.0, m_base0.get(), m_nquad0, wsp2.get(),

                    m_nquad1 * m_nquad2 * m_numElmt, 0.0, output0.get(),

                    m_nquad0);

    }


    void operator()([[maybe_unused]] int dir,

                    [[maybe_unused]] const Array<OneD, const NekDouble> &input,

                    [[maybe_unused]] Array<OneD, NekDouble> &output,

                    [[maybe_unused]] Array<OneD, NekDouble> &wsp) final

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


    void CheckFactors([[maybe_unused]] StdRegions::FactorMap factors,

                      [[maybe_unused]] int coll_phys_offset) override

    {

        ASSERTL0(false, "Not valid for this operator.");

    }


protected:

    const int m_nquad0;

    const int m_nquad1;

    const int m_nquad2;

    const int m_nmodes0;

    const int m_nmodes1;

    const int m_nmodes2;

    Array<OneD, const NekDouble> m_base0;

    Array<OneD, const NekDouble> m_base1;

    Array<OneD, const NekDouble> m_base2;

    bool m_sortTopVertex;


private:

    BwdTrans_SumFac_Pyr(vector<StdRegions::StdExpansionSharedPtr> pCollExp,

                        CoalescedGeomDataSharedPtr pGeomData,

                        StdRegions::FactorMap factors)

        : Operator(pCollExp, pGeomData, factors), BwdTrans_Helper(),

          m_nquad0(m_stdExp->GetNumPoints(0)),

          m_nquad1(m_stdExp->GetNumPoints(1)),

          m_nquad2(m_stdExp->GetNumPoints(2)),

          m_nmodes0(m_stdExp->GetBasisNumModes(0)),

          m_nmodes1(m_stdExp->GetBasisNumModes(1)),

          m_nmodes2(m_stdExp->GetBasisNumModes(2)),

          m_base0(m_stdExp->GetBasis(0)->GetBdata()),

          m_base1(m_stdExp->GetBasis(1)->GetBdata()),

          m_base2(m_stdExp->GetBasis(2)->GetBdata())

    {

        m_wspSize = m_numElmt * m_nmodes0 * m_nquad2 * (m_nmodes1 + m_nquad1);


        if (m_stdExp->GetBasis(0)->GetBasisType() == LibUtilities::eModified_A)

        {

            m_sortTopVertex = true;

        }

        else

        {

            m_sortTopVertex = false;

        }

    }

};


/// Factory initialisation for the BwdTrans_SumFac_Pyr operator

OperatorKey BwdTrans_SumFac_Pyr::m_type =

    GetOperatorFactory().RegisterCreatorFunction(

        OperatorKey(ePyramid, eBwdTrans, eSumFac, false),

        BwdTrans_SumFac_Pyr::create, "BwdTrans_SumFac_Pyr");


} // namespace Nektar::Collections

CoalescedGeomData.h

ASSERTL0
#define ASSERTL0(condition, msg)
Definition: ErrorUtil.hpp:208

NEKERROR
#define NEKERROR(type, msg)
Assert Level 0 – Fundamental assert which is used whether in FULLDEBUG, DEBUG or OPT compilation mode...
Definition: ErrorUtil.hpp:202

ASSERTL1
#define ASSERTL1(condition, msg)
Assert Level 1 – Debugging which is used whether in FULLDEBUG or DEBUG compilation mode....
Definition: ErrorUtil.hpp:242

MatrixFreeBase.h

Operator.h

OPERATOR_CREATE
#define OPERATOR_CREATE(cname)
Definition: Operator.h:43

Nektar::Array
Definition: SharedArray.hpp:51

Nektar::Collections::BwdTrans_Helper
Backward transform help class to calculate the size of the collection that is given as an input and a...
Definition: BwdTrans.cpp:61

Nektar::Collections::BwdTrans_Helper::BwdTrans_Helper
BwdTrans_Helper()
Definition: BwdTrans.cpp:63

Nektar::Collections::BwdTrans_IterPerExp
Backward transform operator using default StdRegions operator.
Definition: BwdTrans.cpp:270

Nektar::Collections::BwdTrans_IterPerExp::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:292

Nektar::Collections::BwdTrans_IterPerExp::BwdTrans_IterPerExp
BwdTrans_IterPerExp(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:307

Nektar::Collections::BwdTrans_IterPerExp::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:300

Nektar::Collections::BwdTrans_IterPerExp::~BwdTrans_IterPerExp
~BwdTrans_IterPerExp() final=default

Nektar::Collections::BwdTrans_MatrixFree
Backward transform operator using matrix free operators.
Definition: BwdTrans.cpp:166

Nektar::Collections::BwdTrans_MatrixFree::m_oper
std::shared_ptr< MatrixFree::BwdTrans > m_oper
Definition: BwdTrans.cpp:209

Nektar::Collections::BwdTrans_MatrixFree::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:202

Nektar::Collections::BwdTrans_MatrixFree::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:193

Nektar::Collections::BwdTrans_MatrixFree::~BwdTrans_MatrixFree
~BwdTrans_MatrixFree() final=default

Nektar::Collections::BwdTrans_MatrixFree::BwdTrans_MatrixFree
BwdTrans_MatrixFree(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:211

Nektar::Collections::BwdTrans_NoCollection
Backward transform operator using LocalRegions implementation.
Definition: BwdTrans.cpp:354

Nektar::Collections::BwdTrans_NoCollection::BwdTrans_NoCollection
BwdTrans_NoCollection(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:395

Nektar::Collections::BwdTrans_NoCollection::~BwdTrans_NoCollection
~BwdTrans_NoCollection() final=default

Nektar::Collections::BwdTrans_NoCollection::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:385

Nektar::Collections::BwdTrans_NoCollection::m_expList
vector< StdRegions::StdExpansionSharedPtr > m_expList
Definition: BwdTrans.cpp:392

Nektar::Collections::BwdTrans_NoCollection::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:377

Nektar::Collections::BwdTrans_StdMat
Backward transform operator using standard matrix approach.
Definition: BwdTrans.cpp:77

Nektar::Collections::BwdTrans_StdMat::~BwdTrans_StdMat
~BwdTrans_StdMat() final=default

Nektar::Collections::BwdTrans_StdMat::m_mat
DNekMatSharedPtr m_mat
Definition: BwdTrans.cpp:110

Nektar::Collections::BwdTrans_StdMat::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:95

Nektar::Collections::BwdTrans_StdMat::BwdTrans_StdMat
BwdTrans_StdMat(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:113

Nektar::Collections::BwdTrans_StdMat::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:103

Nektar::Collections::BwdTrans_SumFac_Hex
Backward transform operator using sum-factorisation (Hex)
Definition: BwdTrans.cpp:720

Nektar::Collections::BwdTrans_SumFac_Hex::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:785

Nektar::Collections::BwdTrans_SumFac_Hex::m_colldir0
const bool m_colldir0
Definition: BwdTrans.cpp:794

Nektar::Collections::BwdTrans_SumFac_Hex::m_colldir1
const bool m_colldir1
Definition: BwdTrans.cpp:795

Nektar::Collections::BwdTrans_SumFac_Hex::m_base1
Array< OneD, const NekDouble > m_base1
Definition: BwdTrans.cpp:792

Nektar::Collections::BwdTrans_SumFac_Hex::m_nmodes2
const int m_nmodes2
Definition: BwdTrans.cpp:790

Nektar::Collections::BwdTrans_SumFac_Hex::m_nquad2
const int m_nquad2
Definition: BwdTrans.cpp:787

Nektar::Collections::BwdTrans_SumFac_Hex::~BwdTrans_SumFac_Hex
~BwdTrans_SumFac_Hex() final=default

Nektar::Collections::BwdTrans_SumFac_Hex::m_colldir2
const bool m_colldir2
Definition: BwdTrans.cpp:796

Nektar::Collections::BwdTrans_SumFac_Hex::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:778

Nektar::Collections::BwdTrans_SumFac_Hex::m_nmodes1
const int m_nmodes1
Definition: BwdTrans.cpp:789

Nektar::Collections::BwdTrans_SumFac_Hex::m_base2
Array< OneD, const NekDouble > m_base2
Definition: BwdTrans.cpp:793

Nektar::Collections::BwdTrans_SumFac_Hex::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:788

Nektar::Collections::BwdTrans_SumFac_Hex::m_nquad1
const int m_nquad1
Definition: BwdTrans.cpp:786

Nektar::Collections::BwdTrans_SumFac_Hex::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:791

Nektar::Collections::BwdTrans_SumFac_Hex::BwdTrans_SumFac_Hex
BwdTrans_SumFac_Hex(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:799

Nektar::Collections::BwdTrans_SumFac_Hex::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:770

Nektar::Collections::BwdTrans_SumFac_Prism
Backward transform operator using sum-factorisation (Prism)
Definition: BwdTrans.cpp:1005

Nektar::Collections::BwdTrans_SumFac_Prism::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:1099

Nektar::Collections::BwdTrans_SumFac_Prism::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:1081

Nektar::Collections::BwdTrans_SumFac_Prism::BwdTrans_SumFac_Prism
BwdTrans_SumFac_Prism(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:1108

Nektar::Collections::BwdTrans_SumFac_Prism::m_sortTopVertex
bool m_sortTopVertex
Definition: BwdTrans.cpp:1105

Nektar::Collections::BwdTrans_SumFac_Prism::~BwdTrans_SumFac_Prism
~BwdTrans_SumFac_Prism() final=default

Nektar::Collections::BwdTrans_SumFac_Prism::m_nquad2
const int m_nquad2
Definition: BwdTrans.cpp:1098

Nektar::Collections::BwdTrans_SumFac_Prism::m_nmodes1
const int m_nmodes1
Definition: BwdTrans.cpp:1100

Nektar::Collections::BwdTrans_SumFac_Prism::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:1096

Nektar::Collections::BwdTrans_SumFac_Prism::m_nquad1
const int m_nquad1
Definition: BwdTrans.cpp:1097

Nektar::Collections::BwdTrans_SumFac_Prism::m_nmodes2
const int m_nmodes2
Definition: BwdTrans.cpp:1101

Nektar::Collections::BwdTrans_SumFac_Prism::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:1102

Nektar::Collections::BwdTrans_SumFac_Prism::m_base1
Array< OneD, const NekDouble > m_base1
Definition: BwdTrans.cpp:1103

Nektar::Collections::BwdTrans_SumFac_Prism::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:1089

Nektar::Collections::BwdTrans_SumFac_Prism::m_base2
Array< OneD, const NekDouble > m_base2
Definition: BwdTrans.cpp:1104

Nektar::Collections::BwdTrans_SumFac_Pyr
Backward transform operator using sum-factorisation (Pyr)
Definition: BwdTrans.cpp:1147

Nektar::Collections::BwdTrans_SumFac_Pyr::m_base2
Array< OneD, const NekDouble > m_base2
Definition: BwdTrans.cpp:1266

Nektar::Collections::BwdTrans_SumFac_Pyr::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:1243

Nektar::Collections::BwdTrans_SumFac_Pyr::m_nquad1
const int m_nquad1
Definition: BwdTrans.cpp:1259

Nektar::Collections::BwdTrans_SumFac_Pyr::m_nquad2
const int m_nquad2
Definition: BwdTrans.cpp:1260

Nektar::Collections::BwdTrans_SumFac_Pyr::~BwdTrans_SumFac_Pyr
~BwdTrans_SumFac_Pyr() final=default

Nektar::Collections::BwdTrans_SumFac_Pyr::m_nmodes1
const int m_nmodes1
Definition: BwdTrans.cpp:1262

Nektar::Collections::BwdTrans_SumFac_Pyr::BwdTrans_SumFac_Pyr
BwdTrans_SumFac_Pyr(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:1270

Nektar::Collections::BwdTrans_SumFac_Pyr::m_sortTopVertex
bool m_sortTopVertex
Definition: BwdTrans.cpp:1267

Nektar::Collections::BwdTrans_SumFac_Pyr::m_base1
Array< OneD, const NekDouble > m_base1
Definition: BwdTrans.cpp:1265

Nektar::Collections::BwdTrans_SumFac_Pyr::m_nmodes2
const int m_nmodes2
Definition: BwdTrans.cpp:1263

Nektar::Collections::BwdTrans_SumFac_Pyr::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:1261

Nektar::Collections::BwdTrans_SumFac_Pyr::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:1264

Nektar::Collections::BwdTrans_SumFac_Pyr::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:1251

Nektar::Collections::BwdTrans_SumFac_Pyr::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:1258

Nektar::Collections::BwdTrans_SumFac_Quad
Backward transform operator using sum-factorisation (Quad)
Definition: BwdTrans.cpp:514

Nektar::Collections::BwdTrans_SumFac_Quad::m_base1
Array< OneD, const NekDouble > m_base1
Definition: BwdTrans.cpp:590

Nektar::Collections::BwdTrans_SumFac_Quad::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:568

Nektar::Collections::BwdTrans_SumFac_Quad::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:585

Nektar::Collections::BwdTrans_SumFac_Quad::m_nquad1
const int m_nquad1
Definition: BwdTrans.cpp:584

Nektar::Collections::BwdTrans_SumFac_Quad::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:589

Nektar::Collections::BwdTrans_SumFac_Quad::~BwdTrans_SumFac_Quad
~BwdTrans_SumFac_Quad() final=default

Nektar::Collections::BwdTrans_SumFac_Quad::m_colldir0
const bool m_colldir0
Definition: BwdTrans.cpp:587

Nektar::Collections::BwdTrans_SumFac_Quad::m_nmodes1
const int m_nmodes1
Definition: BwdTrans.cpp:586

Nektar::Collections::BwdTrans_SumFac_Quad::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:583

Nektar::Collections::BwdTrans_SumFac_Quad::BwdTrans_SumFac_Quad
BwdTrans_SumFac_Quad(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:593

Nektar::Collections::BwdTrans_SumFac_Quad::m_colldir1
const bool m_colldir1
Definition: BwdTrans.cpp:588

Nektar::Collections::BwdTrans_SumFac_Quad::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:576

Nektar::Collections::BwdTrans_SumFac_Seg
Backward transform operator using sum-factorisation (Segment)
Definition: BwdTrans.cpp:443

Nektar::Collections::BwdTrans_SumFac_Seg::~BwdTrans_SumFac_Seg
~BwdTrans_SumFac_Seg() final=default

Nektar::Collections::BwdTrans_SumFac_Seg::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:485

Nektar::Collections::BwdTrans_SumFac_Seg::BwdTrans_SumFac_Seg
BwdTrans_SumFac_Seg(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:490

Nektar::Collections::BwdTrans_SumFac_Seg::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:487

Nektar::Collections::BwdTrans_SumFac_Seg::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:477

Nektar::Collections::BwdTrans_SumFac_Seg::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:469

Nektar::Collections::BwdTrans_SumFac_Seg::m_colldir0
const bool m_colldir0
Definition: BwdTrans.cpp:486

Nektar::Collections::BwdTrans_SumFac_Seg::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:484

Nektar::Collections::BwdTrans_SumFac_Tet
Backward transform operator using sum-factorisation (Tet)
Definition: BwdTrans.cpp:832

Nektar::Collections::BwdTrans_SumFac_Tet::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:946

Nektar::Collections::BwdTrans_SumFac_Tet::m_nmodes2
const int m_nmodes2
Definition: BwdTrans.cpp:958

Nektar::Collections::BwdTrans_SumFac_Tet::m_nquad1
const int m_nquad1
Definition: BwdTrans.cpp:954

Nektar::Collections::BwdTrans_SumFac_Tet::BwdTrans_SumFac_Tet
BwdTrans_SumFac_Tet(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:965

Nektar::Collections::BwdTrans_SumFac_Tet::m_base1
Array< OneD, const NekDouble > m_base1
Definition: BwdTrans.cpp:960

Nektar::Collections::BwdTrans_SumFac_Tet::m_nquad2
const int m_nquad2
Definition: BwdTrans.cpp:955

Nektar::Collections::BwdTrans_SumFac_Tet::~BwdTrans_SumFac_Tet
~BwdTrans_SumFac_Tet() final=default

Nektar::Collections::BwdTrans_SumFac_Tet::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:959

Nektar::Collections::BwdTrans_SumFac_Tet::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:956

Nektar::Collections::BwdTrans_SumFac_Tet::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:938

Nektar::Collections::BwdTrans_SumFac_Tet::m_sortTopEdge
bool m_sortTopEdge
Definition: BwdTrans.cpp:962

Nektar::Collections::BwdTrans_SumFac_Tet::m_base2
Array< OneD, const NekDouble > m_base2
Definition: BwdTrans.cpp:961

Nektar::Collections::BwdTrans_SumFac_Tet::m_nmodes1
const int m_nmodes1
Definition: BwdTrans.cpp:957

Nektar::Collections::BwdTrans_SumFac_Tet::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:953

Nektar::Collections::BwdTrans_SumFac_Tri
Backward transform operator using sum-factorisation (Tri)
Definition: BwdTrans.cpp:621

Nektar::Collections::BwdTrans_SumFac_Tri::~BwdTrans_SumFac_Tri
~BwdTrans_SumFac_Tri() final=default

Nektar::Collections::BwdTrans_SumFac_Tri::m_nquad1
const int m_nquad1
Definition: BwdTrans.cpp:680

Nektar::Collections::BwdTrans_SumFac_Tri::m_sortTopVertex
bool m_sortTopVertex
Definition: BwdTrans.cpp:685

Nektar::Collections::BwdTrans_SumFac_Tri::CheckFactors
void CheckFactors(StdRegions::FactorMap factors, int coll_phys_offset) override
Check the validity of the supplied factor map.
Definition: BwdTrans.cpp:672

Nektar::Collections::BwdTrans_SumFac_Tri::m_nmodes1
const int m_nmodes1
Definition: BwdTrans.cpp:682

Nektar::Collections::BwdTrans_SumFac_Tri::BwdTrans_SumFac_Tri
BwdTrans_SumFac_Tri(vector< StdRegions::StdExpansionSharedPtr > pCollExp, CoalescedGeomDataSharedPtr pGeomData, StdRegions::FactorMap factors)
Definition: BwdTrans.cpp:688

Nektar::Collections::BwdTrans_SumFac_Tri::m_base0
Array< OneD, const NekDouble > m_base0
Definition: BwdTrans.cpp:683

Nektar::Collections::BwdTrans_SumFac_Tri::m_base1
Array< OneD, const NekDouble > m_base1
Definition: BwdTrans.cpp:684

Nektar::Collections::BwdTrans_SumFac_Tri::m_nmodes0
const int m_nmodes0
Definition: BwdTrans.cpp:681

Nektar::Collections::BwdTrans_SumFac_Tri::m_nquad0
const int m_nquad0
Definition: BwdTrans.cpp:679

Nektar::Collections::BwdTrans_SumFac_Tri::operator()
void operator()(int dir, const Array< OneD, const NekDouble > &input, Array< OneD, NekDouble > &output, Array< OneD, NekDouble > &wsp) final
Definition: BwdTrans.cpp:664

Nektar::Collections::MatrixFreeBase::m_nIn
unsigned int m_nIn
Definition: MatrixFreeBase.h:60

Nektar::Collections::MatrixFreeBase::m_isPadded
bool m_isPadded
flag for padding
Definition: MatrixFreeBase.h:57

Nektar::Collections::MatrixFreeBase::m_nElmtPad
unsigned int m_nElmtPad
size after padding
Definition: MatrixFreeBase.h:59

Nektar::Collections::MatrixFreeBase::m_nOut
unsigned int m_nOut
Definition: MatrixFreeBase.h:61

Nektar::Collections::MatrixFreeOneInOneOut
Definition: MatrixFreeBase.h:65

Nektar::Collections::MatrixFreeOneInOneOut::m_output
Array< OneD, NekDouble > m_output
Definition: MatrixFreeBase.h:89

Nektar::Collections::MatrixFreeOneInOneOut::m_input
Array< OneD, NekDouble > m_input
padded input/output vectors
Definition: MatrixFreeBase.h:89

Nektar::Collections::Operator
Base class for operators on a collection of elements.
Definition: Operator.h:133

Nektar::Collections::Operator::m_wspSize
unsigned int m_wspSize
Definition: Operator.h:192

Nektar::Collections::Operator::m_stdExp
StdRegions::StdExpansionSharedPtr m_stdExp
Definition: Operator.h:188

Nektar::Collections::Operator::m_numElmt
unsigned int m_numElmt
number of elements that the operator is applied on
Definition: Operator.h:190

Nektar::Collections::Operator::m_outputSize
unsigned int m_outputSize
number of modes or quadrature points that are taken as output from an operator
Definition: Operator.h:198

Nektar::Collections::Operator::m_inputSize
unsigned int m_inputSize
number of modes or quadrature points that are passed as input to an operator
Definition: Operator.h:195

Nektar::ErrorUtil::efatal
@ efatal
Definition: ErrorUtil.hpp:67

Nektar::LibUtilities::NekFactory::RegisterCreatorFunction
tKey RegisterCreatorFunction(tKey idKey, CreatorFunction classCreator, std::string pDesc="")
Register a class with the factory.
Definition: NekFactory.hpp:197

Nektar::LibUtilities::NekFactory::CreateInstance
tBaseSharedPtr CreateInstance(tKey idKey, tParam... args)
Create an instance of the class referred to by idKey.
Definition: NekFactory.hpp:143

Nektar::StdRegions::StdMatrixKey
Definition: StdMatrixKey.h:49

Blas::Dgemm
static void Dgemm(const char &transa, const char &transb, const int &m, const int &n, const int &k, const double &alpha, const double *a, const int &lda, const double *b, const int &ldb, const double &beta, double *c, const int &ldc)
BLAS level 3: Matrix-matrix multiply C = A x B where op(A)[m x k], op(B)[k x n], C[m x n] DGEMM perfo...
Definition: Blas.hpp:383

Blas::Daxpy
static void Daxpy(const int &n, const double &alpha, const double *x, const int &incx, const double *y, const int &incy)
BLAS level 1: y = alpha x plus y.
Definition: Blas.hpp:135

Nektar::Collections
Definition: BwdTrans.cpp:44

Nektar::Collections::eSumFac
@ eSumFac
Definition: Operator.h:87

Nektar::Collections::eIterPerExp
@ eIterPerExp
Definition: Operator.h:85

Nektar::Collections::eMatrixFree
@ eMatrixFree
Definition: Operator.h:88

Nektar::Collections::eNoCollection
@ eNoCollection
Definition: Operator.h:84

Nektar::Collections::eStdMat
@ eStdMat
Definition: Operator.h:86

Nektar::Collections::eBwdTrans
@ eBwdTrans
Definition: Operator.h:64

Nektar::Collections::OperatorKey
std::tuple< LibUtilities::ShapeType, OperatorType, ImplementationType, ExpansionIsNodal > OperatorKey
Key for describing an Operator.
Definition: Operator.h:115

Nektar::Collections::CoalescedGeomDataSharedPtr
std::shared_ptr< CoalescedGeomData > CoalescedGeomDataSharedPtr
Definition: CoalescedGeomData.h:88

Nektar::Collections::GetOperatorFactory
OperatorFactory & GetOperatorFactory()
Returns the singleton Operator factory object.
Definition: Operator.cpp:44

Nektar::LibUtilities::eTriangle
@ eTriangle
Definition: ShapeType.hpp:56

Nektar::LibUtilities::eTetrahedron
@ eTetrahedron
Definition: ShapeType.hpp:58

Nektar::LibUtilities::eQuadrilateral
@ eQuadrilateral
Definition: ShapeType.hpp:57

Nektar::LibUtilities::eHexahedron
@ eHexahedron
Definition: ShapeType.hpp:61

Nektar::LibUtilities::ePrism
@ ePrism
Definition: ShapeType.hpp:60

Nektar::LibUtilities::ePyramid
@ ePyramid
Definition: ShapeType.hpp:59

Nektar::LibUtilities::eSegment
@ eSegment
Definition: ShapeType.hpp:55

Nektar::LibUtilities::eModified_A
@ eModified_A
Principle Modified Functions .
Definition: BasisType.h:48

Nektar::StdRegions::eBwdTrans
@ eBwdTrans
Definition: StdRegions.hpp:108

Nektar::StdRegions::FactorMap
ConstFactorMap FactorMap
Definition: StdRegions.hpp:406

Nektar::VarcoeffHashingTest::factors
StdRegions::ConstFactorMap factors
Definition: TestVarcoeffHashing.cpp:51

Nektar::DNekMatSharedPtr
std::shared_ptr< DNekMat > DNekMatSharedPtr
Definition: NekTypeDefs.hpp:75

Nektar::NekDouble
double NekDouble
Definition: NektarUnivTypeDefs.hpp:43

Vmath::Zero
void Zero(int n, T *x, const int incx)
Zero vector.
Definition: Vmath.hpp:273

Vmath::Vcopy
void Vcopy(int n, const T *x, const int incx, T *y, const int incy)
Definition: Vmath.hpp:825

Nektar::OneD
Definition: NektarUnivTypeDefs.hpp:54