doxygen/latest/_test_simd_lib_double_8cpp_source.html

///////////////////////////////////////////////////////////////////////////////

//

// File: TestSimdLibDouble.cpp

//

// For more information, please see: http://www.nektar.info

//

// The MIT License

//

// Copyright (c) 2006 Division of Applied Mathematics, Brown University (USA),

// Department of Aeronautics, Imperial College London (UK), and Scientific

// Computing and Imaging Institute, University of Utah (USA).

//

// Permission is hereby granted, free of charge, to any person obtaining a

// copy of this software and associated documentation files (the "Software"),

// to deal in the Software without restriction, including without limitation

// the rights to use, copy, modify, merge, publish, distribute, sublicense,

// and/or sell copies of the Software, and to permit persons to whom the

// Software is furnished to do so, subject to the following conditions:

//

/// The above copyright notice and this permission notice shall be included

// in all copies or substantial portions of the Software.

//

// THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS

// OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

// FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL

// THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

// LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING

// FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER

// DEALINGS IN THE SOFTWARE.

//

// Description:

//

///////////////////////////////////////////////////////////////////////////////


#include <LibUtilities/SimdLib/io.hpp>

#include <LibUtilities/SimdLib/tinysimd.hpp>


#include <boost/test/tools/floating_point_comparison.hpp>

#include <boost/test/unit_test.hpp>


#include <array>

#include <cmath>

#include <iostream>


// define types in use and number of lanes

#define NUM_LANES_64BITS 1

#define ALIGNMENT 8

#define USING_SCALAR

#if defined(__x86_64__)

#if defined(__AVX512F__) && defined(NEKTAR_ENABLE_SIMD_AVX512)

#define USING_AVX512

#undef NUM_LANES_64BITS

#define NUM_LANES_64BITS 8

#undef ALIGNMENT

#define ALIGNMENT 64

#undef USING_SCALAR

#elif defined(__AVX2__) && defined(NEKTAR_ENABLE_SIMD_AVX2)

#define USING_AVX2

#undef NUM_LANES_64BITS

#define NUM_LANES_64BITS 4

#undef ALIGNMENT

#define ALIGNMENT 32

#undef USING_SCALAR

#elif defined(__SSE2__) && defined(NEKTAR_ENABLE_SIMD_SSE2)

#define USING_SSE2

#undef NUM_LANES_64BITS

#define NUM_LANES_64BITS 2

#undef ALIGNMENT

#define ALIGNMENT 16

#undef USING_SCALAR

#endif

#endif

#if defined(__ARM_FEATURE_SVE) && defined(NEKTAR_ENABLE_SIMD_SVE)

#define USING_SVE

#undef NUM_LANES_64BITS

#define NUM_LANES_64BITS __ARM_FEATURE_SVE_BITS / 64

#undef ALIGNMENT

#define ALIGNMENT __ARM_FEATURE_SVE_BITS / 8

#undef USING_SCALAR

#endif


namespace Nektar::SimdLibTests

{

using namespace tinysimd;

using vec_t = simd<double>;


BOOST_AUTO_TEST_CASE(SimdLibDouble_width_alignment)

{

    std::size_t width, alignment;


#if defined(USING_SCALAR)

    std::cout << "scalar double" << std::endl;

#endif

#if defined(USING_AVX2)

    std::cout << "avx2 double" << std::endl;

#endif

#if defined(USING_AVX512)

    std::cout << "avx512 double" << std::endl;

#endif

#if defined(USING_SVE)

    std::cout << "sve double" << std::endl;

#endif


    // double

    width     = simd<double>::width;

    alignment = simd<double>::alignment;

    BOOST_CHECK_EQUAL(width, NUM_LANES_64BITS);

    BOOST_CHECK_EQUAL(alignment, ALIGNMENT);

    // std::int32_t index forcing # of lanes

    width     = simd<std::int32_t, vec_t::width>::width;

    alignment = simd<std::int32_t, vec_t::width>::alignment;

    BOOST_CHECK_EQUAL(width, NUM_LANES_64BITS);

    // std::int64_t index forcing # of lanes

    width     = simd<std::int64_t, vec_t::width>::width;

    alignment = simd<std::int64_t, vec_t::width>::alignment;

    BOOST_CHECK_EQUAL(width, NUM_LANES_64BITS);

    BOOST_CHECK_EQUAL(alignment, ALIGNMENT);

    // std::int64_t default index

    width     = simd<std::int64_t>::width;

    alignment = simd<std::int64_t>::alignment;

    BOOST_CHECK_EQUAL(width, NUM_LANES_64BITS);

    BOOST_CHECK_EQUAL(alignment, ALIGNMENT);

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_type_traits)

{

    {

        using namespace details;


        BOOST_CHECK_EQUAL(has_width<double>::value, false);

        BOOST_CHECK_EQUAL(has_width<vec_t>::value, true);


        BOOST_CHECK_EQUAL(has_alignment<double>::value, false);

        BOOST_CHECK_EQUAL(has_alignment<vec_t>::value, true);


        BOOST_CHECK_EQUAL(has_scalarType<double>::value, false);

        BOOST_CHECK_EQUAL(has_scalarType<vec_t>::value, true);

    }


    BOOST_CHECK_EQUAL(is_vector_v<double>, false);

    BOOST_CHECK_EQUAL(is_vector_v<vec_t>, true);


    BOOST_CHECK_EQUAL(is_vector_floating_point_v<double>, false);

    BOOST_CHECK_EQUAL(is_vector_floating_point_v<simd<int>>, false);

    BOOST_CHECK_EQUAL(is_vector_floating_point_v<vec_t>, true);

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_mem_size)

{

    BOOST_CHECK_EQUAL(sizeof(vec_t), sizeof(double) * vec_t::width);

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_ctors)

{

    [[maybe_unused]] vec_t avec1;


    vec_t::scalarType ascalar = 0;

    vec_t avec2(ascalar);

    [[maybe_unused]] vec_t avec3{ascalar};

    vec_t avec4 = ascalar;


    [[maybe_unused]] vec_t avec5(avec2);

    [[maybe_unused]] vec_t avec6{avec4};


    [[maybe_unused]] vec_t avec7(avec2._data);

    [[maybe_unused]] vec_t avec8{avec2._data};


    vec_t::vectorType anative;

    [[maybe_unused]] vec_t avec9(anative);

    [[maybe_unused]] vec_t avec10{anative};

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_load)

{

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    vec_t avec;

    avec.load(ascalararr.data());

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_load_implicit)

{

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    vec_t avec;

    avec = *(reinterpret_cast<vec_t *>(ascalararr.data()));

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_load_aligned)

{

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    vec_t avec;

    avec.load(ascalararr.data(), is_aligned);

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_load_unaligned)

{

    std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    vec_t avec;

    avec.load(ascalararr.data(), is_not_aligned);

}


BOOST_AUTO_TEST_CASE(SimdLibInt64_load)

{

    alignas(vec_t::alignment) std::array<std::uint64_t, vec_t::width>

        ascalararr{{}}; // double brace to deal with gcc 4.8.5 ...

    simd<std::uint64_t, vec_t::width> aindex;

    aindex.load(ascalararr.data());

}


BOOST_AUTO_TEST_CASE(SimdLibInt64_load_aligned)

{

    alignas(vec_t::alignment) std::array<std::uint64_t, vec_t::width>

        ascalararr{{}}; // double brace to deal with gcc 4.8.5 ...

    simd<std::uint64_t, vec_t::width> aindex;

    aindex.load(ascalararr.data(), is_aligned);

}


BOOST_AUTO_TEST_CASE(SimdLibInt64_load_unaligned)

{

    std::array<std::uint64_t, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    simd<std::uint64_t, vec_t::width> aindex;

    aindex.load(ascalararr.data(), is_not_aligned);

}


BOOST_AUTO_TEST_CASE(SimdLibInt32_load)

{

    alignas(vec_t::alignment) std::array<std::uint32_t, vec_t::width>

        ascalararr{{}}; // double brace to deal with gcc 4.8.5 ...

    simd<std::uint32_t, vec_t::width> aindex;

    aindex.load(ascalararr.data());

}


BOOST_AUTO_TEST_CASE(SimdLibInt32_load_aligned)

{

    alignas(vec_t::alignment) std::array<std::uint32_t, vec_t::width>

        ascalararr{{}}; // double brace to deal with gcc 4.8.5 ...

    simd<std::uint32_t, vec_t::width> aindex;

    aindex.load(ascalararr.data(), is_aligned);

}


BOOST_AUTO_TEST_CASE(SimdLibInt32_load_unaligned)

{

    std::array<std::uint32_t, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    simd<std::uint32_t, vec_t::width> aindex;

    aindex.load(ascalararr.data(), is_not_aligned);

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_store)

{

    double val = 4.0;

    vec_t avec(val);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    avec.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_store_aligned)

{

    double val = 4.0;

    vec_t avec(val);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    avec.store(ascalararr.data(), is_aligned);


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_store_unaligned)

{

    double val = 4.0;

    vec_t avec(val);

    std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    avec.store(ascalararr.data(), is_not_aligned);


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_store_non_temporal)

{

    double val = 4.0;

    vec_t avec(val);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    avec.store(ascalararr.data(), is_not_reused);


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_broadcast)

{

    vec_t::scalarType ascalar{3.333};

    vec_t avec;

    avec.broadcast(ascalar);

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_subscript_assign_read)

{

    vec_t avec;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        ascalararr[i] = i;

    }


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        avec[i] = ascalararr[i];

    }


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], avec[i]);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_gather64)

{

    vec_t avec;

    using index_t = simd<size_t>;

    index_t aindexvec;


    // create and fill index

    std::array<size_t, vec_t::width> aindex;

    aindex[0] = 0;

    if (vec_t::width > 2)

    {

        aindex[1] = 3;

        aindex[2] = 5;

        aindex[3] = 6;

    }

    if (vec_t::width > 4)

    {

        aindex[4] = 8;

        aindex[5] = 15;

        aindex[6] = 16;

        aindex[7] = 20;

    }


    // load index

    aindexvec.load(aindex.data(), is_not_aligned);


    // create and fill scalar array

    constexpr size_t scalarArraySize = 32;

    std::array<double, scalarArraySize> ascalararr;

    for (size_t i = 0; i < scalarArraySize; ++i)

    {

        ascalararr[i] = i;

    }


    avec.gather(ascalararr.data(), aindexvec);


    // check

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[aindex[i]], avec[i]);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_gather32)

{

    vec_t avec;

    using index_t = simd<std::uint32_t, vec_t::width>;

    index_t aindexvec;


    // create and fill index

    std::array<std::uint32_t, vec_t::width> aindex;

    aindex[0] = 0;

    if (vec_t::width > 2)

    {

        aindex[1] = 3;

        aindex[2] = 5;

        aindex[3] = 6;

    }

    if (vec_t::width > 4)

    {

        aindex[4] = 8;

        aindex[5] = 15;

        aindex[6] = 16;

        aindex[7] = 20;

    }


    // load index

    aindexvec.load(aindex.data(), is_not_aligned);


    // create and fill scalar array

    constexpr size_t scalarArraySize = 32;

    std::array<double, scalarArraySize> ascalararr;

    for (size_t i = 0; i < scalarArraySize; ++i)

    {

        ascalararr[i] = i;

    }


    avec.gather(ascalararr.data(), aindexvec);


    // check

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[aindex[i]], avec[i]);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_scatter64)

{

    vec_t avec;

    using index_t = simd<size_t>;

    index_t aindexvec;


    // create and fill index

    std::array<size_t, vec_t::width> aindex;

    aindex[0] = 1;

    if (vec_t::width > 1)

    {

        aindex[1] = 3;

    }

    if (vec_t::width > 2)

    {

        aindex[2] = 5;

        aindex[3] = 6;

    }

    if (vec_t::width > 4)

    {

        aindex[4] = 8;

        aindex[5] = 15;

        aindex[6] = 20;

        aindex[7] = 30;

    }


    // load index

    aindexvec.load(aindex.data(), is_not_aligned);


    // create scalar array

    constexpr size_t scalarArraySize = 32;

    std::array<double, scalarArraySize> ascalararr;


    // fill vector

    alignas(vec_t::alignment) std::array<double, vec_t::width> avecarr{{}};

    avecarr[0] = 10;

    if (vec_t::width > 1)

    {

        avecarr[1] = 9;

    }


    if (vec_t::width > 2)

    {

        avecarr[2] = 8;

        avecarr[3] = 7;

    }

    if (vec_t::width > 4)

    {

        avecarr[4] = 4;

        avecarr[5] = 3;

        avecarr[6] = 2;

        avecarr[7] = 1;

    }

    avec.load(avecarr.data());


    avec.scatter(ascalararr.data(), aindexvec);


    // check

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(avec[i], ascalararr[aindex[i]]);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_add_unary)

{

    double val1 = -4.0;

    double val2 = 2.0;

    vec_t res(val1);

    vec_t avec(val2);

    res += avec;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 + val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_sub_unary)

{

    double val1 = -4.0;

    double val2 = 2.0;

    vec_t res(val1);

    vec_t avec(val2);

    res -= avec;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 - val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_mul_unary)

{

    double val1 = -4.0;

    double val2 = 2.0;

    vec_t res(val1);

    vec_t avec(val2);

    res *= avec;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 * val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_div_unary)

{

    double val1 = -4.0;

    double val2 = 2.0;

    vec_t res(val1);

    vec_t avec(val2);

    res /= avec;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 / val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_add_binary)

{

    double val1 = -4.0;

    double val2 = 2.5;

    vec_t avec1(val1);

    vec_t avec2(val2);

    vec_t res = avec1 + avec2;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 + val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_sub_binary)

{

    double val1 = -4.0;

    double val2 = 2.5;

    vec_t avec1(val1);

    vec_t avec2(val2);

    vec_t res = avec1 - avec2;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 - val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_mul_binary)

{

    double val1 = -4.0;

    double val2 = 2.5;

    vec_t avec1(val1);

    vec_t avec2(val2);

    vec_t res = avec1 * avec2;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 * val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_div_binary)

{

    double val1 = -4.0;

    double val2 = 2.5;

    vec_t avec1(val1);

    vec_t avec2(val2);

    vec_t res = avec1 / avec2;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 / val2);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_add_mul)

{

    double val1 = -4.0;

    double val2 = 1.5;

    double val3 = 5.0;

    vec_t avec1(val1);

    vec_t avec2(val2);

    vec_t avec3(val3);

    vec_t res = avec1 + avec2 * avec3;

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    res.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 + val2 * val3);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_fused_add_mul)

{

    double val1 = -4.0;

    double val2 = 1.5;

    double val3 = 5.0;

    vec_t avec1(val1);

    vec_t avec2(val2);

    vec_t avec3(val3);

    avec1.fma(avec2, avec3);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    avec1.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], val1 + val2 * val3);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_sqrt)

{

    double val = 4.0;

    vec_t avec(val);

    vec_t asqrt = sqrt(avec);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    asqrt.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], std::sqrt(val));

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_abs)

{

    double val = -4.0;

    vec_t avec(val);

    vec_t aabs = abs(avec);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    aabs.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], std::abs(val));

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_log)

{

    double val = 4.0;

    vec_t avec(val);

    vec_t alog = log(avec);

    alignas(vec_t::alignment) std::array<double, vec_t::width> ascalararr{

        {}}; // double brace to deal with gcc 4.8.5 ...

    alog.store(ascalararr.data());


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        BOOST_CHECK_EQUAL(ascalararr[i], std::log(val));

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_greater)

{

    double aval = 4.0;

    vec_t avec(aval);

    using mask_t = simd<bool, vec_t::width>;

    mask_t amask;


    amask = avec > avec;

    // check

    alignas(vec_t::alignment) std::array<std::uint64_t, vec_t::width>

        ascalararr{{}}; // double brace to deal with gcc 4.8.5 ...

    amask.store(ascalararr.data());

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        // type conversion make lvalue in rvalue, needed pre-c++17

        BOOST_CHECK_EQUAL(ascalararr[i], (std::uint64_t)mask_t::false_v);

    }


    double bval = 3.0;

    vec_t bvec(bval);


    amask = avec > bvec;

    // check

    amask.store(ascalararr.data());

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        // type conversion make lvalue in rvalue, needed pre-c++17

        BOOST_CHECK_EQUAL(ascalararr[i], (std::uint64_t)mask_t::true_v);

    }


    double cval = 5.0;

    vec_t cvec(cval);


    amask = avec > cvec;

    // check

    amask.store(ascalararr.data());

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        // type conversion make lvalue in rvalue, needed pre-c++17

        BOOST_CHECK_EQUAL(ascalararr[i], (std::uint64_t)mask_t::false_v);

    }


    if (vec_t::width == 4)

    {

        alignas(vec_t::alignment) std::array<double, 4> ascalararr2{

            {1.0, 2.0, 3.0, 4.0}}; // double brace to deal with gcc 4.8.5 ...

        double dval = 2.0;

        vec_t dvec(dval);

        vec_t evec;

        evec.load(ascalararr2.data());


        amask = dvec > evec;

        // check

        for (size_t i = 0; i < vec_t::width; ++i)

        {

            BOOST_CHECK_EQUAL(static_cast<bool>(amask[i]),

                              dval > ascalararr2[i]);

        }

    }


    if (vec_t::width == 8)

    {

        alignas(vec_t::alignment) std::array<double, 8> ascalararr2{

            {1.0, 2.0, 3.0, 4.0, 3.0, 2.0,

             1.0}}; // double brace to deal with gcc 4.8.5 ...

        double dval = 2.0;

        vec_t dvec(dval);

        vec_t evec;

        evec.load(ascalararr2.data());


        amask = dvec > evec;

        // check

        for (size_t i = 0; i < vec_t::width; ++i)

        {

            BOOST_CHECK_EQUAL(static_cast<bool>(amask[i]),

                              dval > ascalararr2[i]);

        }

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_logic_and)

{

    double aval = 4.0;

    vec_t avec(aval);

    using mask_t = simd<bool, vec_t::width>;

    mask_t amask;


    alignas(vec_t::alignment) std::array<std::uint64_t, vec_t::width>

        ascalararr{{}}; // double brace to deal with gcc 4.8.5 ...

    for (size_t i = 0; i < vec_t::width; ++i)

    {

        ascalararr[i] = mask_t::true_v;

    }

    amask.load(ascalararr.data());


    // check

    BOOST_CHECK_EQUAL(amask && false, false);

    BOOST_CHECK_EQUAL(amask && true, true);


    for (size_t i = 0; i < vec_t::width; ++i)

    {

        ascalararr[i] = mask_t::false_v;

    }

    amask.load(ascalararr.data());


    // check

    BOOST_CHECK_EQUAL(amask && false, false);

    BOOST_CHECK_EQUAL(amask && true, false);


    if (vec_t::width > 1)

    {

        ascalararr[0] = mask_t::true_v;

        // check

        BOOST_CHECK_EQUAL(amask && false, false);

        BOOST_CHECK_EQUAL(amask && true, false);

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_load_interleave_unload)

{

    constexpr size_t nDof{5};

    // no padding in load_interleave deinterleave_store

    constexpr size_t nEle{vec_t::width * 5};

    constexpr size_t nDofBlock = nDof * vec_t::width;


    constexpr size_t size{nDof * nEle};

    std::array<double, size> dofScalarArr{{}};

    for (size_t i = 0; i < size; ++i)

    {

        dofScalarArr[i] = i;

    }


    // number of blocks

    size_t nBlock = nEle / vec_t::width;


    // aligned vector

    std::vector<vec_t, allocator<vec_t>> dofVectorArr(nDof);


    double *dataPtr = dofScalarArr.data();

    // loop over blocks vec_t::width elements at the time

    for (size_t b = 0; b < nBlock; ++b)

    {

        // load

        load_interleave(dataPtr, nDof, dofVectorArr);


        // manipulate each block

        for (size_t j = 0; j < nDof; ++j)

        {

            dofVectorArr[j] = dofVectorArr[j] + j;

        }


        // store

        deinterleave_store(dofVectorArr, nDof, dataPtr);

        dataPtr += nDofBlock;

    }


    // check

    for (size_t b = 0, i = 0; b < nBlock; ++b)

    {

        for (size_t j = 0; j < nDof; ++j, ++i)

        {

            BOOST_CHECK_EQUAL(dofScalarArr[i], i + j);

        }

    }

}


BOOST_AUTO_TEST_CASE(SimdLibDouble_io)

{

    vec_t avec(3.14);

    std::cout << avec << std::endl;

}


} // namespace Nektar::SimdLibTests

ALIGNMENT
#define ALIGNMENT
Definition: TestSimdLibDouble.cpp:47

NUM_LANES_64BITS
#define NUM_LANES_64BITS
The above copyright notice and this permission notice shall be included.
Definition: TestSimdLibDouble.cpp:46

io.hpp

Nektar::SimdLibTests
Definition: TestSimdLibDouble.cpp:83

Nektar::SimdLibTests::BOOST_AUTO_TEST_CASE
BOOST_AUTO_TEST_CASE(SimdLibDouble_width_alignment)
Definition: TestSimdLibDouble.cpp:87

Nektar::SimdLibTests::vec_t
simd< double > vec_t
Definition: TestSimdLibDouble.cpp:85

Nektar::uint64_t
std::uint64_t uint64_t
Definition: NektarUnivTypeDefs.hpp:51

tinysimd
Definition: allocator.hpp:44

tinysimd::load_interleave
void load_interleave(const T *in, const size_t dataLen, std::vector< scalarT< T >, allocator< scalarT< T > > > &out)
Definition: scalar.hpp:311

tinysimd::is_vector_floating_point_v
constexpr bool is_vector_floating_point_v
Definition: traits.hpp:161

tinysimd::abs
scalarT< T > abs(scalarT< T > in)
Definition: scalar.hpp:289

tinysimd::is_aligned
static constexpr struct tinysimd::is_aligned_t is_aligned

tinysimd::is_not_aligned
static constexpr struct tinysimd::is_not_aligned_t is_not_aligned

tinysimd::simd
typename abi< ScalarType, width >::type simd
Definition: tinysimd.hpp:80

tinysimd::log
scalarT< T > log(scalarT< T > in)
Definition: scalar.hpp:294

tinysimd::deinterleave_store
void deinterleave_store(const std::vector< scalarT< T >, allocator< scalarT< T > > > &in, const size_t dataLen, T *out)
Definition: scalar.hpp:332

tinysimd::sqrt
scalarT< T > sqrt(scalarT< T > in)
Definition: scalar.hpp:285

tinysimd::is_not_reused
static constexpr struct tinysimd::is_not_reused_t is_not_reused

tinysimd.hpp