numerics/api/vector_8cpp_source.html

/// @file core/vector.cpp

/// @brief Backend dispatch for real-vector ops, and sequential complex-vector

/// ops.

///

/// BasicVector<T> member functions are defined inline in vector.hpp (template).

/// This file only provides:

///   1. Backend-dispatched free functions for Vector (= BasicVector<real>)

///   2. Sequential free functions for CVector (= BasicVector<cplx>)

///

/// Adding a new backend:

///   1. Add the enumerator to enum class Backend in include/core/policy.hpp

///   2. Create src/core/backends/<name>/ with impl.hpp and vector.cpp

///   3. Add `case Backend::<name>:` to each switch below

///   4. Register the .cpp in cmake/sources.cmake


#include "core/vector.hpp"

#include <cmath>


#include "backends/seq/impl.hpp"

#include "backends/blas/impl.hpp"

#include "backends/omp/impl.hpp"

#include "backends/gpu/impl.hpp"


namespace num {


// -- Real-vector dispatch

// ------------------------------------------------------


void scale(Vector& v, real alpha, Backend b) {

    switch (b) {

        case Backend::seq:

        case Backend::blocked:

        case Backend::simd:

            backends::seq::scale(v, alpha);

            break;

        case Backend::lapack:

            [[fallthrough]];

        case Backend::blas:

            backends::blas::scale(v, alpha);

            break;

        case Backend::omp:

            backends::omp::scale(v, alpha);

            break;

        case Backend::gpu:

            backends::gpu::scale(v, alpha);

            break;

    }

}


void add(const Vector& x, const Vector& y, Vector& z, Backend b) {

    if (b == Backend::gpu) {

        cuda::add(x.gpu_data(), y.gpu_data(), z.gpu_data(), x.size());

    } else {

        backends::seq::add(x, y, z);

    }

}


void axpy(real alpha, const Vector& x, Vector& y, Backend b) {

    switch (b) {

        case Backend::seq:

        case Backend::blocked:

        case Backend::simd:

            backends::seq::axpy(alpha, x, y);

            break;

        case Backend::lapack:

            [[fallthrough]];

        case Backend::blas:

            backends::blas::axpy(alpha, x, y);

            break;

        case Backend::omp:

            backends::omp::axpy(alpha, x, y);

            break;

        case Backend::gpu:

            backends::gpu::axpy(alpha, x, y);

            break;

    }

}


real dot(const Vector& x, const Vector& y, Backend b) {

    switch (b) {

        case Backend::seq:

        case Backend::blocked:

        case Backend::simd:

            return backends::seq::dot(x, y);

        case Backend::lapack:

            [[fallthrough]];

        case Backend::blas:

            return backends::blas::dot(x, y);

        case Backend::omp:

            return backends::omp::dot(x, y);

        case Backend::gpu:

            return backends::gpu::dot(x, y);

    }

    return backends::seq::dot(x, y);

}


real norm(const Vector& x, Backend b) {

    switch (b) {

        case Backend::seq:

        case Backend::blocked:

        case Backend::simd:

            return backends::seq::norm(x);

        case Backend::lapack:

            [[fallthrough]];

        case Backend::blas:

            return backends::blas::norm(x);

        case Backend::omp:

            return backends::seq::norm(x); // no OMP norm

        case Backend::gpu:

            return backends::gpu::norm(x);

    }

    return backends::seq::norm(x);

}


// -- Complex-vector (sequential)

// -----------------------------------------------


void scale(CVector& v, cplx alpha) {

    for (idx i = 0; i < v.size(); ++i)

        v[i] *= alpha;

}


void axpy(cplx alpha, const CVector& x, CVector& y) {

    for (idx i = 0; i < x.size(); ++i)

        y[i] += alpha * x[i];

}


cplx dot(const CVector& x, const CVector& y) {

    cplx sum{0, 0};

    for (idx i = 0; i < x.size(); ++i)

        sum += std::conj(x[i]) * y[i];

    return sum;

}


real norm(const CVector& x) {

    real sum = 0;

    for (idx i = 0; i < x.size(); ++i)

        sum += std::norm(x[i]);

    return std::sqrt(sum);

}


} // namespace num

num::BasicVector< real >

num::BasicVector::gpu_data
real * gpu_data()
Definition vector.hpp:118

num::BasicVector::size
constexpr idx size() const noexcept
Definition vector.hpp:80

impl.hpp
Private declarations for the BLAS backend. Only included by src/core/vector.cpp and src/core/matrix....

impl.hpp
Private declarations for the GPU (CUDA) backend. Only included by src/core/vector....

num::backends::blas::dot
real dot(const Vector &x, const Vector &y)
Definition vector.cpp:51

num::backends::blas::axpy
void axpy(real alpha, const Vector &x, Vector &y)
Definition vector.cpp:42

num::backends::blas::norm
real norm(const Vector &x)
Definition vector.cpp:60

num::backends::blas::scale
void scale(Vector &v, real alpha)
Definition vector.cpp:33

num::backends::gpu::axpy
void axpy(real alpha, const Vector &x, Vector &y)
Definition vector.cpp:22

num::backends::gpu::dot
real dot(const Vector &x, const Vector &y)
Definition vector.cpp:30

num::backends::gpu::norm
real norm(const Vector &x)
Definition vector.cpp:38

num::backends::gpu::scale
void scale(Vector &v, real alpha)
Definition vector.cpp:14

num::backends::omp::dot
real dot(const Vector &x, const Vector &y)
Definition vector.cpp:31

num::backends::omp::scale
void scale(Vector &v, real alpha)
Definition vector.cpp:9

num::backends::omp::axpy
void axpy(real alpha, const Vector &x, Vector &y)
Definition vector.cpp:20

num::backends::seq::dot
real dot(const Vector &x, const Vector &y)
Definition vector.cpp:24

num::backends::seq::scale
void scale(Vector &v, real alpha)
Definition vector.cpp:9

num::backends::seq::norm
real norm(const Vector &x)
Definition vector.cpp:31

num::backends::seq::add
void add(const Vector &x, const Vector &y, Vector &z)
Definition vector.cpp:14

num::backends::seq::axpy
void axpy(real alpha, const Vector &x, Vector &y)
Definition vector.cpp:19

num::cuda::add
void add(const real *x, const real *y, real *z, idx n)
z = x + y
Definition cuda_stubs.cpp:25

num
Definition quadrature.hpp:8

num::real
double real
Definition types.hpp:10

num::Backend
Backend
Selects which backend handles a linalg operation.
Definition policy.hpp:19

num::Backend::gpu
@ gpu
CUDA – custom kernels or cuBLAS.

num::Backend::omp
@ omp
OpenMP parallel blocked loops.

num::Backend::blocked
@ blocked
Cache-blocked; compiler auto-vectorizes inner loops.

num::Backend::simd
@ simd
Hand-written SIMD intrinsics (AVX2 or NEON)

num::Backend::blas
@ blas
cblas – OpenBLAS, MKL, Apple Accelerate (Level-1/2/3)

num::Backend::lapack
@ lapack
LAPACKE – industry-standard factorizations, SVD, eigen.

num::Backend::seq
@ seq
Naive textbook loops – always available.

num::idx
std::size_t idx
Definition types.hpp:11

num::scale
void scale(Vector &v, real alpha, Backend b=default_backend)
v *= alpha
Definition vector.cpp:29

num::dot
real dot(const Vector &x, const Vector &y, Backend b=default_backend)
dot product
Definition vector.cpp:79

num::norm
real norm(const Vector &x, Backend b=default_backend)
Euclidean norm.
Definition vector.cpp:97

num::cplx
std::complex< real > cplx
Definition types.hpp:12

num::axpy
void axpy(real alpha, const Vector &x, Vector &y, Backend b=default_backend)
y += alpha * x
Definition vector.cpp:58

num::add
void add(const Vector &x, const Vector &y, Vector &z, Backend b=default_backend)
z = x + y
Definition vector.cpp:50

vector.hpp
Vector operations.