#include <KoStreamedMath.h>

Public Types
using	float_v = xsimd::batch<float, _impl>

using	int_v = xsimd::batch<int, _impl>

using	uint_v = xsimd::batch<unsigned int, _impl>

Static Public Member Functions
template<bool aligned>
static float_v	fetch_alpha_32 (const void *data)

template<bool aligned>
static void	fetch_colors_32 (const void *data, float_v &c1, float_v &c2, float_v &c3)

static float_v	fetch_mask_8 (const quint8 *data)

template<bool useMask, bool useFlow, class Compositor , int pixelSize>
static void	genericComposite (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor >
static void	genericComposite128 (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor >
static void	genericComposite128_novector (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor >
static void	genericComposite32 (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor >
static void	genericComposite32_novector (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor >
static void	genericComposite64 (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor >
static void	genericComposite64_novector (const KoCompositeOp::ParameterInfo &params)

template<bool useMask, bool useFlow, class Compositor , int pixelSize>
static void	genericComposite_novector (const KoCompositeOp::ParameterInfo &params)

static quint8	lerp_mixed_u8_float (quint8 a, quint8 b, float alpha)

static quint8	round_float_to_u8 (float x)

static void	write_channels_32 (void *data, const float_v alpha, const float_v c1, const float_v c2, const float_v c3)

static void	write_channels_32_unaligned (void *data, const float_v alpha, const float_v c1, const float_v c2, const float_v c3)

Detailed Description

template<typename _impl>
struct KoStreamedMath< _impl >

Definition at line 154 of file KoStreamedMath.h.

Member Typedef Documentation

◆ float_v

template<typename _impl >

using KoStreamedMath< _impl >::float_v = xsimd::batch<float, _impl>

Definition at line 157 of file KoStreamedMath.h.

◆ int_v

template<typename _impl >

using KoStreamedMath< _impl >::int_v = xsimd::batch<int, _impl>

Definition at line 155 of file KoStreamedMath.h.

◆ uint_v

template<typename _impl >

using KoStreamedMath< _impl >::uint_v = xsimd::batch<unsigned int, _impl>

Definition at line 156 of file KoStreamedMath.h.

Member Function Documentation

◆ fetch_alpha_32()

template<typename _impl >

template<bool aligned>

static float_v KoStreamedMath< _impl >::fetch_alpha_32 ( const void * data )

inlinestatic

Get an alpha values from float_v::size pixels 32-bit each (4 channels, 8 bit per channel). The alpha value is considered to be stored in the most significant byte of the pixel

aligned controls whether the data is fetched using aligned instruction or not. 1) Fetching aligned data with unaligned instruction degrades performance. 2) Fetching unaligned data with aligned instruction causes #GP (General Protection Exception)

Definition at line 256 of file KoStreamedMath.h.

    {
        using U = typename std::conditional<aligned, xsimd::aligned_mode, xsimd::unaligned_mode>::type;
        const auto data_i = uint_v::load(static_cast<const typename uint_v::value_type *>(data), U{});
        return xsimd::to_float(xsimd::bitwise_cast_compat<int>(data_i >> 24));
    }

◆ fetch_colors_32()

template<typename _impl >

template<bool aligned>

static void KoStreamedMath< _impl >::fetch_colors_32	(	const void *	data,
		float_v &	c1,
		float_v &	c2,
		float_v &	c3 )

inlinestatic

Get color values from float_v::size pixels 32-bit each (4 channels, 8 bit per channel). The color data is considered to be stored in the 3 least significant bytes of the pixel.

aligned controls whether the data is fetched using aligned instruction or not. 1) Fetching aligned data with unaligned instruction degrades performance. 2) Fetching unaligned data with aligned instruction causes #GP (General Protection Exception)

Definition at line 276 of file KoStreamedMath.h.

    {
        using U = typename std::conditional<aligned, xsimd::aligned_mode, xsimd::unaligned_mode>::type;
 
        const auto data_i = uint_v::load(static_cast<const typename uint_v::value_type *>(data), U{});
 
        const uint_v mask(0xFF);
 
        c1 = xsimd::to_float(xsimd::bitwise_cast_compat<int>((data_i >> 16) & mask));
        c2 = xsimd::to_float(xsimd::bitwise_cast_compat<int>((data_i >> 8) & mask));
        c3 = xsimd::to_float(xsimd::bitwise_cast_compat<int>((data_i) & mask));
    }

◆ fetch_mask_8()

template<typename _impl >

static float_v KoStreamedMath< _impl >::fetch_mask_8 ( const quint8 * data )

inlinestatic

Get a vector containing first float_v::size values of mask. Each source mask element is considered to be a 8-bit integer

Definition at line 238 of file KoStreamedMath.h.

    {
        return xsimd::batch_cast<float>(xsimd::load_and_extend<int_v>(data));
    }

◆ genericComposite()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor , int pixelSize>

static void KoStreamedMath< _impl >::genericComposite ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Composes src pixels into dst pixels. Is optimized for 32-bit-per-pixel colorspaces. Uses Compositor strategy parameter for doing actual math of the composition

Definition at line 327 of file KoStreamedMath.h.

    {
        const int vectorSize = static_cast<int>(float_v::size);
        const qint32 vectorInc = pixelSize * vectorSize;
        const qint32 linearInc = pixelSize;
        qint32 srcVectorInc = vectorInc;
        qint32 srcLinearInc = pixelSize;
 
        quint8 *dstRowStart = params.dstRowStart;
        const quint8 *maskRowStart = params.maskRowStart;
        const quint8 *srcRowStart = params.srcRowStart;
        typename Compositor::ParamsWrapper paramsWrapper(params);
 
        if (!params.srcRowStride) {
            if (pixelSize == 4) {
                auto *buf = reinterpret_cast<uint_v *>(xsimd::vector_aligned_malloc<typename uint_v::value_type>(vectorSize));
                *buf = uint_v(*(reinterpret_cast<const quint32 *>(srcRowStart)));
                srcRowStart = reinterpret_cast<quint8 *>(buf);
                srcLinearInc = 0;
                srcVectorInc = 0;
            } else {
                auto *buf = xsimd::vector_aligned_malloc<quint8>(vectorInc);
                quint8 *ptr = buf;
 
                for (size_t i = 0; i < vectorSize; i++) {
                    memcpy(ptr, params.srcRowStart, pixelSize);
                    ptr += pixelSize;
                }
 
                srcRowStart = buf;
                srcLinearInc = 0;
                srcVectorInc = 0;
            }
        }
#if BLOCKDEBUG
        int totalBlockAlign = 0;
        int totalBlockAlignedVector = 0;
        int totalBlockUnalignedVector = 0;
        int totalBlockRest = 0;
#endif
 
        for (qint32 r = params.rows; r > 0; --r) {
            // Hint: Mask is allowed to be unaligned
            const quint8 *mask = maskRowStart;
 
            const quint8 *src = srcRowStart;
            quint8 *dst = dstRowStart;
 
            const int pixelsAlignmentMask = vectorSize * sizeof(float) - 1;
            auto srcPtrValue = reinterpret_cast<uintptr_t>(src);
            auto dstPtrValue = reinterpret_cast<uintptr_t>(dst);
            uintptr_t srcAlignment = srcPtrValue & pixelsAlignmentMask;
            uintptr_t dstAlignment = dstPtrValue & pixelsAlignmentMask;
 
            // Uncomment if facing problems with alignment:
            // Q_ASSERT_X(!(dstAlignment & 3), "Compositing",
            //            "Pixel data must be aligned on pixels borders!");
 
            int blockAlign = params.cols;
            int blockAlignedVector = 0;
            int blockUnalignedVector = 0;
            int blockRest = 0;
 
            int *vectorBlock =
                srcAlignment == dstAlignment || !srcVectorInc ? &blockAlignedVector : &blockUnalignedVector;
 
            if (!dstAlignment) {
                blockAlign = 0;
                *vectorBlock = params.cols / vectorSize;
                blockRest = params.cols % vectorSize;
            } else if (params.cols > 2 * vectorSize) {
                blockAlign = (vectorInc - dstAlignment) / pixelSize;
                const int restCols = params.cols - blockAlign;
                if (restCols > 0) {
                    *vectorBlock = restCols / vectorSize;
                    blockRest = restCols % vectorSize;
                } else {
                    blockAlign = params.cols;
                    *vectorBlock = 0;
                    blockRest = 0;
                }
            }
#if BLOCKDEBUG
            totalBlockAlign += blockAlign;
            totalBlockAlignedVector += blockAlignedVector;
            totalBlockUnalignedVector += blockUnalignedVector;
            totalBlockRest += blockRest;
#endif
 
            for (int i = 0; i < blockAlign; i++) {
                Compositor::template compositeOnePixelScalar<useMask, _impl>(src,
                                                                             dst,
                                                                             mask,
                                                                             params.opacity,
                                                                             paramsWrapper);
                src += srcLinearInc;
                dst += linearInc;
 
                if (useMask) {
                    mask++;
                }
            }
 
            for (int i = 0; i < blockAlignedVector; i++) {
                Compositor::template compositeVector<useMask, true, _impl>(src,
                                                                           dst,
                                                                           mask,
                                                                           params.opacity,
                                                                           paramsWrapper);
                src += srcVectorInc;
                dst += vectorInc;
 
                if (useMask) {
                    mask += vectorSize;
                }
            }
 
            for (int i = 0; i < blockUnalignedVector; i++) {
                Compositor::template compositeVector<useMask, false, _impl>(src,
                                                                            dst,
                                                                            mask,
                                                                            params.opacity,
                                                                            paramsWrapper);
                src += srcVectorInc;
                dst += vectorInc;
 
                if (useMask) {
                    mask += vectorSize;
                }
            }
 
            for (int i = 0; i < blockRest; i++) {
                Compositor::template compositeOnePixelScalar<useMask, _impl>(src,
                                                                             dst,
                                                                             mask,
                                                                             params.opacity,
                                                                             paramsWrapper);
                src += srcLinearInc;
                dst += linearInc;
 
                if (useMask) {
                    mask++;
                }
            }
 
            srcRowStart += params.srcRowStride;
            dstRowStart += params.dstRowStride;
 
            if (useMask) {
                maskRowStart += params.maskRowStride;
            }
        }
 
#if BLOCKDEBUG
        dbgPigment << "I"
                   << "rows:" << params.rows << "\tpad(S):" << totalBlockAlign << "\tbav(V):" << totalBlockAlignedVector
                   << "\tbuv(V):" << totalBlockUnalignedVector << "\tres(S)"
                   << totalBlockRest; // << srcAlignment << dstAlignment;
#endif
 
        if (!params.srcRowStride) {
            xsimd::vector_aligned_free(srcRowStart);
        }
    }

References KoCompositeOp::ParameterInfo::cols, dbgPigment, KoCompositeOp::ParameterInfo::dstRowStart, KoCompositeOp::ParameterInfo::dstRowStride, KoCompositeOp::ParameterInfo::maskRowStart, KoCompositeOp::ParameterInfo::maskRowStride, KoCompositeOp::ParameterInfo::opacity, KoCompositeOp::ParameterInfo::rows, KoCompositeOp::ParameterInfo::srcRowStart, KoCompositeOp::ParameterInfo::srcRowStride, and xsimd::vector_aligned_free().

◆ genericComposite128()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor >

static void KoStreamedMath< _impl >::genericComposite128 ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Definition at line 499 of file KoStreamedMath.h.

    {
        genericComposite<useMask, useFlow, Compositor, 16>(params);
    }

◆ genericComposite128_novector()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor >

static void KoStreamedMath< _impl >::genericComposite128_novector ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Definition at line 213 of file KoStreamedMath.h.

    {
        genericComposite_novector<useMask, useFlow, Compositor, 16>(params);
    }

◆ genericComposite32()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor >

static void KoStreamedMath< _impl >::genericComposite32 ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Definition at line 493 of file KoStreamedMath.h.

    {
        genericComposite<useMask, useFlow, Compositor, 4>(params);
    }

◆ genericComposite32_novector()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor >

static void KoStreamedMath< _impl >::genericComposite32_novector ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Definition at line 207 of file KoStreamedMath.h.

    {
        genericComposite_novector<useMask, useFlow, Compositor, 4>(params);
    }

◆ genericComposite64()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor >

static void KoStreamedMath< _impl >::genericComposite64 ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Definition at line 505 of file KoStreamedMath.h.

    {
        genericComposite<useMask, useFlow, Compositor, 8>(params);
    }

◆ genericComposite64_novector()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor >

static void KoStreamedMath< _impl >::genericComposite64_novector ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Definition at line 219 of file KoStreamedMath.h.

    {
        genericComposite_novector<useMask, useFlow, Compositor, 8>(params);
    }

◆ genericComposite_novector()

template<typename _impl >

template<bool useMask, bool useFlow, class Compositor , int pixelSize>

static void KoStreamedMath< _impl >::genericComposite_novector ( const KoCompositeOp::ParameterInfo & params )

inlinestatic

Composes src into dst without using vector instructions

Definition at line 166 of file KoStreamedMath.h.

    {
        const qint32 linearInc = pixelSize;
        qint32 srcLinearInc = params.srcRowStride ? pixelSize : 0;
 
        quint8 *dstRowStart = params.dstRowStart;
        const quint8 *maskRowStart = params.maskRowStart;
        const quint8 *srcRowStart = params.srcRowStart;
        typename Compositor::ParamsWrapper paramsWrapper(params);
 
        for (qint32 r = params.rows; r > 0; --r) {
            const quint8 *mask = maskRowStart;
            const quint8 *src = srcRowStart;
            quint8 *dst = dstRowStart;
 
            int blockRest = params.cols;
 
            for (int i = 0; i < blockRest; i++) {
                Compositor::template compositeOnePixelScalar<useMask, _impl>(src,
                                                                             dst,
                                                                             mask,
                                                                             params.opacity,
                                                                             paramsWrapper);
                src += srcLinearInc;
                dst += linearInc;
 
                if (useMask) {
                    mask++;
                }
            }
 
            srcRowStart += params.srcRowStride;
            dstRowStart += params.dstRowStride;
 
            if (useMask) {
                maskRowStart += params.maskRowStride;
            }
        }
    }

References KoCompositeOp::ParameterInfo::cols, KoCompositeOp::ParameterInfo::dstRowStart, KoCompositeOp::ParameterInfo::dstRowStride, KoCompositeOp::ParameterInfo::maskRowStart, KoCompositeOp::ParameterInfo::maskRowStride, KoCompositeOp::ParameterInfo::opacity, KoCompositeOp::ParameterInfo::rows, KoCompositeOp::ParameterInfo::srcRowStart, and KoCompositeOp::ParameterInfo::srcRowStride.

◆ lerp_mixed_u8_float()

template<typename _impl >

static quint8 KoStreamedMath< _impl >::lerp_mixed_u8_float	(	quint8	a,
		quint8	b,
		float	alpha )

inlinestatic

Definition at line 229 of file KoStreamedMath.h.

    {
        return round_float_to_u8(float(b - a) * alpha + float(a));
    }

References KoStreamedMath< _impl >::round_float_to_u8().

◆ round_float_to_u8()

template<typename _impl >

static quint8 KoStreamedMath< _impl >::round_float_to_u8 ( float x )

inlinestatic

Definition at line 224 of file KoStreamedMath.h.

    {
        return OptiRound<_impl, quint8>::roundScalar(x);
    }

References OptiRound< _impl, result_type >::roundScalar().

◆ write_channels_32()

template<typename _impl >

static void KoStreamedMath< _impl >::write_channels_32	(	void *	data,
		const float_v	alpha,
		const float_v	c1,
		const float_v	c2,
		const float_v	c3 )

inlinestatic

Pack color and alpha values to float_v::size pixels 32-bit each (4 channels, 8 bit per channel). The color data is considered to be stored in the 3 least significant bytes of the pixel, alpha - in the most significant byte

NOTE: data must be aligned pointer!

Definition at line 298 of file KoStreamedMath.h.

    {
        const int_v mask(0xFF);
 
        const auto v1 = (xsimd::nearbyint_as_int(alpha)) << 24;
        const auto v2 = (xsimd::nearbyint_as_int(c1) & mask) << 16;
        const auto v3 = (xsimd::nearbyint_as_int(c2) & mask) << 8;
        const auto v4 = (xsimd::nearbyint_as_int(c3) & mask);
        xsimd::store_aligned(static_cast<typename int_v::value_type *>(data), (v1 | v2) | (v3 | v4));
    }

◆ write_channels_32_unaligned()

template<typename _impl >

static void KoStreamedMath< _impl >::write_channels_32_unaligned	(	void *	data,
		const float_v	alpha,
		const float_v	c1,
		const float_v	c2,
		const float_v	c3 )

inlinestatic

Definition at line 310 of file KoStreamedMath.h.

    {
        const int_v mask(0xFF);
 
        const auto v1 = (xsimd::nearbyint_as_int(alpha)) << 24;
        const auto v2 = (xsimd::nearbyint_as_int(c1) & mask) << 16;
        const auto v3 = (xsimd::nearbyint_as_int(c2) & mask) << 8;
        const auto v4 = (xsimd::nearbyint_as_int(c3) & mask);
        xsimd::store_unaligned(static_cast<typename int_v::value_type *>(data), (v1 | v2) | (v3 | v4));
    }

The documentation for this struct was generated from the following file:

libs/pigment/compositeops/KoStreamedMath.h

Public Types

Static Public Member Functions

Detailed Description

Member Typedef Documentation

◆ float_v

◆ int_v

◆ uint_v

Member Function Documentation

◆ fetch_alpha_32()

◆ fetch_colors_32()

◆ fetch_mask_8()

◆ genericComposite()

◆ genericComposite128()

◆ genericComposite128_novector()

◆ genericComposite32()

◆ genericComposite32_novector()

◆ genericComposite64()

◆ genericComposite64_novector()

◆ genericComposite_novector()

◆ lerp_mixed_u8_float()

◆ round_float_to_u8()

◆ write_channels_32()

◆ write_channels_32_unaligned()