numerics/api/thomas_8cpp_source.html

/// @file linalg/factorization/thomas.cpp

/// @brief Thomas tridiagonal solver dispatcher.

///

/// Backend routing:

///   Backend::lapack  -> backends::lapack::thomas  (LAPACKE_dgtsv with

///   pivoting) Backend::gpu     -> CUDA batched Thomas kernel everything else

///   -> backends::seq::thomas     (forward elimination + back sub)


#include "linalg/factorization/thomas.hpp"

#include "core/parallel/cuda_ops.hpp"

#include "backends/seq/impl.hpp"

#include "backends/lapack/impl.hpp"

#include <stdexcept>


namespace num {


void thomas(const Vector& a,

            const Vector& b,

            const Vector& c,

            const Vector& d,

            Vector&       x,

            Backend       backend) {

    idx n = b.size();

    if (a.size() != n - 1 || c.size() != n - 1 || d.size() != n

        || x.size() != n)

        throw std::invalid_argument("Dimension mismatch in Thomas solver");


    switch (backend) {

        case Backend::lapack:

            backends::lapack::thomas(a, b, c, d, x);

            return;

        case Backend::gpu:

#ifdef NUMERICS_HAS_CUDA

        {

            Vector ag = a;

            ag.to_gpu();

            Vector bg = b;

            bg.to_gpu();

            Vector cg = c;

            cg.to_gpu();

            Vector dg = d;

            dg.to_gpu();

            x = Vector(n);

            x.to_gpu();

            cuda::thomas_batched(ag.gpu_data(),

                                 bg.gpu_data(),

                                 cg.gpu_data(),

                                 dg.gpu_data(),

                                 x.gpu_data(),

                                 n,

                                 1);

            x.to_cpu();

            return;

        }

#endif

            [[fallthrough]];

        default:

            backends::seq::thomas(a, b, c, d, x);

            return;

    }

}


} // namespace num

num::BasicVector< real >

num::BasicVector::to_gpu
void to_gpu()
Definition vector.hpp:99

num::BasicVector::gpu_data
real * gpu_data()
Definition vector.hpp:118

num::BasicVector::size
constexpr idx size() const noexcept
Definition vector.hpp:80

num::BasicVector::to_cpu
void to_cpu()
Definition vector.hpp:108

cuda_ops.hpp
CUDA kernel wrappers.

num::backends::lapack::thomas
void thomas(const Vector &a, const Vector &b, const Vector &c, const Vector &d, Vector &x)
Definition thomas.cpp:15

num::backends::seq::thomas
void thomas(const Vector &a, const Vector &b, const Vector &c, const Vector &d, Vector &x)
Definition thomas.cpp:8

num::cuda::thomas_batched
void thomas_batched(const real *a, const real *b, const real *c, const real *d, real *x, idx n, idx batch_size)
Batched Thomas algorithm for tridiagonal systems.
Definition cuda_stubs.cpp:40

num
Definition quadrature.hpp:8

num::Backend
Backend
Selects which backend handles a linalg operation.
Definition policy.hpp:19

num::Backend::gpu
@ gpu
CUDA – custom kernels or cuBLAS.

num::Backend::lapack
@ lapack
LAPACKE – industry-standard factorizations, SVD, eigen.

num::idx
std::size_t idx
Definition types.hpp:11

num::thomas
void thomas(const Vector &a, const Vector &b, const Vector &c, const Vector &d, Vector &x, Backend backend=lapack_backend)
Thomas algorithm (LU for tridiagonal systems), O(n).
Definition thomas.cpp:17

num::Vector
BasicVector< real > Vector
Real-valued dense vector with full backend dispatch (CPU + GPU)
Definition vector.hpp:130

num::cg
SolverResult cg(const Matrix &A, const Vector &b, Vector &x, real tol=1e-10, idx max_iter=1000, Backend backend=default_backend)
Conjugate gradient solver for Ax = b.
Definition cg.cpp:8

thomas.hpp
Thomas algorithm – direct O(n) tridiagonal solver.