doxygen/latest/scalar_8hpp_source.html

///////////////////////////////////////////////////////////////////////////////

//

// File: scalar.hpp

//

// For more information, please see: http://www.nektar.info

//

// The MIT License

//

// Copyright (c) 2006 Division of Applied Mathematics, Brown University (USA),

// Department of Aeronautics, Imperial College London (UK), and Scientific

// Computing and Imaging Institute, University of Utah (USA).

//

// Permission is hereby granted, free of charge, to any person obtaining a

// copy of this software and associated documentation files (the "Software"),

// to deal in the Software without restriction, including without limitation

// the rights to use, copy, modify, merge, publish, distribute, sublicense,

// and/or sell copies of the Software, and to permit persons to whom the

// Software is furnished to do so, subject to the following conditions:

//

// The above copyright notice and this permission notice shall be included

// in all copies or substantial portions of the Software.

//

// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS

// OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

// FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL

// THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

// LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING

// FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER

// DEALINGS IN THE SOFTWARE.

//

// Description: Scalar type used when a vector type is needed, but no SIMD

// extension is available.

//

///////////////////////////////////////////////////////////////////////////////


#ifndef NEKTAR_LIB_LIBUTILITES_SIMDLIB_SCALAR_H

#define NEKTAR_LIB_LIBUTILITES_SIMDLIB_SCALAR_H


#include "allocator.hpp"

#include "traits.hpp"

#include <cmath>

#include <cstdint>

#include <type_traits>

#include <vector>


namespace tinysimd

{


namespace abi

{


template <typename scalarType> struct scalar

{

    using type = void;

};


} // namespace abi


// forward declaration of concrete types

// makes default type available for all arithmetic types

template <typename T,

          typename = typename std::enable_if<std::is_arithmetic_v<T>>::type>

struct scalarT;

struct scalarMask;


namespace abi

{


// mapping between abstract types and concrete types


template <> struct scalar<double>

{

    using type = scalarT<double>;

};


template <> struct scalar<float>

{

    using type = scalarT<float>;

};


template <> struct scalar<std::int64_t>

{

    using type = scalarT<std::int64_t>;

};


template <> struct scalar<std::uint64_t>

{

    using type = scalarT<std::uint64_t>;

};


template <> struct scalar<std::int32_t>

{

    using type = scalarT<std::int32_t>;

};


template <> struct scalar<std::uint32_t>

{

    using type = scalarT<std::uint32_t>;

};


template <> struct scalar<bool>

{

    using type = scalarMask;

};


#ifdef __APPLE__ // for apple size_t is recognised as uint64_t

template <> struct scalar<size_t>

{

    using type = scalarT<size_t>;

};

#endif


} // namespace abi


// concrete types


template <typename T, typename> struct scalarT

{

    static constexpr unsigned int width     = 1;

    static constexpr unsigned int alignment = sizeof(T);


    using scalarType  = T;

    using vectorType  = scalarType;

    using scalarArray = scalarType[width];


    // storage

    vectorType _data{0};


    // ctors

    inline scalarT()                   = default;

    inline scalarT(const scalarT &rhs) = default;


    inline scalarT(const vectorType &rhs) : _data(rhs)

    {

    }


    // copy assignment

    inline scalarT &operator=(const scalarT &) = default;


    // store


    inline void store(scalarType *p) const

    {

        *p = _data;

    }


    template <class flag> inline void store(scalarType *p, flag) const

    {

        *p = _data;

    }


    // load


    inline void load(const scalarType *p)

    {

        _data = *p;

    }


    template <class flag> inline void load(const scalarType *p, flag)

    {

        _data = *p;

    }


    inline void broadcast(const scalarType rhs)

    {

        _data = rhs;

    }


    template <typename U,

              typename = typename std::enable_if<std::is_integral_v<U>>::type>


    inline void gather(const scalarType *p, const scalarT<U> &indices)

    {

        _data = *(p + indices._data);

    }


    template <typename U,

              typename = typename std::enable_if<std::is_integral_v<U>>::type>


    inline void scatter(scalarType *p, const scalarT<U> &indices) const

    {

        p += indices._data;

        *p = _data;

    }


    // fma

    // this = this + a * b


    inline void fma(const scalarT<T> &a, const scalarT<T> &b)

    {

        _data += a._data * b._data;

    }


    // subscript


    inline scalarType operator[](size_t) const

    {

        return _data;

    }


    inline scalarType &operator[](size_t)

    {

        return _data;

    }


    // unary ops


    inline void operator+=(scalarT<T> rhs)

    {

        _data += rhs._data;

    }


    inline void operator-=(scalarT<T> rhs)

    {

        _data -= rhs._data;

    }


    inline void operator*=(scalarT<T> rhs)

    {

        _data *= rhs._data;

    }


    inline void operator/=(scalarT<T> rhs)

    {

        _data /= rhs._data;

    }


};


template <typename T>


inline scalarT<T> operator+(scalarT<T> lhs, scalarT<T> rhs)

{

    return lhs._data + rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator+(U lhs, scalarT<T> rhs)

{

    return lhs + rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator+(scalarT<T> lhs, U rhs)

{

    return lhs._data + rhs;

}


template <typename T>


inline scalarT<T> operator-(scalarT<T> lhs, scalarT<T> rhs)

{

    return lhs._data - rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator-(U lhs, scalarT<T> rhs)

{

    return lhs - rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator-(scalarT<T> lhs, U rhs)

{

    return lhs._data - rhs;

}


template <typename T> inline scalarT<T> operator-(scalarT<T> in)

{

    return -in._data;

}


template <typename T>


inline scalarT<T> operator*(scalarT<T> lhs, scalarT<T> rhs)

{

    return lhs._data * rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator*(U lhs, scalarT<T> rhs)

{

    return lhs * rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator*(scalarT<T> lhs, U rhs)

{

    return lhs._data * rhs;

}


template <typename T>


inline scalarT<T> operator/(scalarT<T> lhs, scalarT<T> rhs)

{

    return lhs._data / rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator/(U lhs, scalarT<T> rhs)

{

    return lhs / rhs._data;

}


template <typename T, typename U,

          typename = typename std::enable_if<std::is_arithmetic_v<U>>::type>


inline scalarT<T> operator/(scalarT<T> lhs, U rhs)

{

    return lhs._data / rhs;

}


template <typename T> inline scalarT<T> sqrt(scalarT<T> in)

{

    return std::sqrt(in._data);

}


template <typename T> inline scalarT<T> abs(scalarT<T> in)

{

    return std::abs(in._data);

}


template <typename T> inline scalarT<T> min(scalarT<T> lhs, scalarT<T> rhs)

{

    return std::min(lhs._data, rhs._data);

}


template <typename T> inline scalarT<T> max(scalarT<T> lhs, scalarT<T> rhs)

{

    return std::max(lhs._data, rhs._data);

}


template <typename T> inline scalarT<T> log(scalarT<T> in)

{

    return std::log(in._data);

}


template <typename T>


inline void load_unalign_interleave(

    const T *in, const size_t dataLen,

    std::vector<scalarT<T>, allocator<scalarT<T>>> &out)

{

    for (size_t i = 0; i < dataLen; ++i)

    {

        out[i] = in[i];

    }

}


template <typename T>


inline void load_interleave(const T *in, const size_t dataLen,

                            std::vector<scalarT<T>, allocator<scalarT<T>>> &out)

{

    for (size_t i = 0; i < dataLen; ++i)

    {

        out[i] = in[i];

    }

}


template <typename T>


inline void deinterleave_unalign_store(

    const std::vector<scalarT<T>, allocator<scalarT<T>>> &in,

    const size_t dataLen, T *out)

{

    for (size_t i = 0; i < dataLen; ++i)

    {

        out[i] = in[i]._data;

    }

}


template <typename T>


inline void deinterleave_store(

    const std::vector<scalarT<T>, allocator<scalarT<T>>> &in,

    const size_t dataLen, T *out)

{

    for (size_t i = 0; i < dataLen; ++i)

    {

        out[i] = in[i]._data;

    }

}


////////////////////////////////////////////////////////////////////////////////


// mask type

// mask is a int type that uses boolean promotion

//

// VERY LIMITED SUPPORT...just enough to make cubic eos work...

//


struct scalarMask : public scalarT<std::uint64_t>

{

    // bring in ctors

    using scalarT::scalarT;


    static constexpr scalarType true_v  = true;

    static constexpr scalarType false_v = false;


    // needs to be able to work with std::uint32_t

    // for single precision overload

    // usually using 32 or 64 bits would result in a different number of lanes

    // this is not the case for a scalar


    // store


    inline void store(std::uint32_t *p) const

    {

        *p = static_cast<std::uint32_t>(_data);

    }


    // load


    inline void load(const std::uint32_t *p)

    {

        _data = static_cast<std::uint32_t>(*p);

    }


    // make base implementations visible

    using scalarT<std::uint64_t>::store;

    using scalarT<std::uint64_t>::load;

};


inline scalarMask operator>(scalarT<double> lhs, scalarT<double> rhs)

{

    return lhs._data > rhs._data;

}


inline scalarMask operator>(scalarT<float> lhs, scalarT<float> rhs)

{

    return lhs._data > rhs._data;

}


inline bool operator&&(scalarMask lhs, bool rhs)

{

    return lhs._data && rhs;

}


} // namespace tinysimd

#endif

allocator.hpp

std
STL namespace.

tinysimd
Definition allocator.hpp:44

tinysimd::load_interleave
void load_interleave(const T *in, const size_t dataLen, std::vector< scalarT< T >, allocator< scalarT< T > > > &out)
Definition scalar.hpp:327

tinysimd::abs
scalarT< T > abs(scalarT< T > in)
Definition scalar.hpp:295

tinysimd::deinterleave_unalign_store
void deinterleave_unalign_store(const std::vector< scalarT< T >, allocator< scalarT< T > > > &in, const size_t dataLen, T *out)
Definition scalar.hpp:337

tinysimd::operator-
scalarT< T > operator-(scalarT< T > lhs, scalarT< T > rhs)
Definition scalar.hpp:232

tinysimd::operator/
scalarT< T > operator/(scalarT< T > lhs, scalarT< T > rhs)
Definition scalar.hpp:273

tinysimd::max
scalarT< T > max(scalarT< T > lhs, scalarT< T > rhs)
Definition scalar.hpp:305

tinysimd::allocator
boost::alignment::aligned_allocator< T, T::alignment > allocator
Definition allocator.hpp:48

tinysimd::log
scalarT< T > log(scalarT< T > in)
Definition scalar.hpp:310

tinysimd::operator*
scalarT< T > operator*(scalarT< T > lhs, scalarT< T > rhs)
Definition scalar.hpp:255

tinysimd::operator>
scalarMask operator>(scalarT< double > lhs, scalarT< double > rhs)
Definition scalar.hpp:395

tinysimd::operator&&
bool operator&&(scalarMask lhs, bool rhs)
Definition scalar.hpp:405

tinysimd::load_unalign_interleave
void load_unalign_interleave(const T *in, const size_t dataLen, std::vector< scalarT< T >, allocator< scalarT< T > > > &out)
Definition scalar.hpp:316

tinysimd::deinterleave_store
void deinterleave_store(const std::vector< scalarT< T >, allocator< scalarT< T > > > &in, const size_t dataLen, T *out)
Definition scalar.hpp:348

tinysimd::min
scalarT< T > min(scalarT< T > lhs, scalarT< T > rhs)
Definition scalar.hpp:300

tinysimd::sqrt
scalarT< T > sqrt(scalarT< T > in)
Definition scalar.hpp:290

tinysimd::operator+
scalarT< T > operator+(scalarT< T > lhs, scalarT< T > rhs)
Definition scalar.hpp:214

tinysimd::abi::scalar
Definition scalar.hpp:53

tinysimd::abi::scalar::type
void type
Definition scalar.hpp:54

tinysimd::scalarMask
Definition scalar.hpp:366

tinysimd::scalarMask::false_v
static constexpr scalarType false_v
Definition scalar.hpp:371

tinysimd::scalarMask::load
void load(const std::uint32_t *p)
Definition scalar.hpp:385

tinysimd::scalarMask::store
void store(std::uint32_t *p) const
Definition scalar.hpp:379

tinysimd::scalarMask::true_v
static constexpr scalarType true_v
Definition scalar.hpp:370

tinysimd::scalarT
Definition scalar.hpp:110

tinysimd::scalarT::store
void store(scalarType *p) const
Definition scalar.hpp:132

tinysimd::scalarT::scalarT
scalarT(const scalarT &rhs)=default

tinysimd::scalarT::gather
void gather(const scalarType *p, const scalarT< U > &indices)
Definition scalar.hpp:160

tinysimd::scalarT::_data
vectorType _data
Definition scalar.hpp:119

tinysimd::scalarT::alignment
static constexpr unsigned int alignment
Definition scalar.hpp:112

tinysimd::scalarT::broadcast
void broadcast(const scalarType rhs)
Definition scalar.hpp:153

tinysimd::scalarT::operator[]
scalarType operator[](size_t) const
Definition scalar.hpp:181

tinysimd::scalarT::operator/=
void operator/=(scalarT< T > rhs)
Definition scalar.hpp:207

tinysimd::scalarT::scalarArray
scalarType[width] scalarArray
Definition scalar.hpp:116

tinysimd::scalarT::load
void load(const scalarType *p, flag)
Definition scalar.hpp:148

tinysimd::scalarT::scalarT
scalarT()=default

tinysimd::scalarT::operator+=
void operator+=(scalarT< T > rhs)
Definition scalar.hpp:192

tinysimd::scalarT::operator[]
scalarType & operator[](size_t)
Definition scalar.hpp:186

tinysimd::scalarT::scalarT
scalarT(const vectorType &rhs)
Definition scalar.hpp:124

tinysimd::scalarT::width
static constexpr unsigned int width
Definition scalar.hpp:111

tinysimd::scalarT::scalarType
T scalarType
Definition scalar.hpp:114

tinysimd::scalarT::vectorType
scalarType vectorType
Definition scalar.hpp:115

tinysimd::scalarT::fma
void fma(const scalarT< T > &a, const scalarT< T > &b)
Definition scalar.hpp:175

tinysimd::scalarT::operator-=
void operator-=(scalarT< T > rhs)
Definition scalar.hpp:197

tinysimd::scalarT::load
void load(const scalarType *p)
Definition scalar.hpp:143

tinysimd::scalarT::operator*=
void operator*=(scalarT< T > rhs)
Definition scalar.hpp:202

tinysimd::scalarT::store
void store(scalarType *p, flag) const
Definition scalar.hpp:137

tinysimd::scalarT::operator=
scalarT & operator=(const scalarT &)=default

tinysimd::scalarT::scatter
void scatter(scalarType *p, const scalarT< U > &indices) const
Definition scalar.hpp:167

traits.hpp