numerics/api/backends_2seq_2matrix_8cpp_source.html

/// @file core/backends/seq/matrix.cpp

/// @brief Sequential and blocked C++ matrix operations


#include "core/matrix.hpp"

#include "kernel/raw.hpp"

#include <algorithm>


namespace num::backends::seq {


void matmul(const Matrix& A, const Matrix& B, Matrix& C) {

    const idx M = A.rows(), K = A.cols(), N = B.cols();

    for (idx i = 0; i < M; ++i)

        for (idx j = 0; j < N; ++j) {

            C(i, j) = 0;

            for (idx k = 0; k < K; ++k)

                C(i, j) += A(i, k) * B(k, j);

        }

}


void matvec(const Matrix& A, const Vector& x, Vector& y) {

    kernel::raw::matvec(y.data(), A.data(), x.data(), A.rows(), A.cols());

}


void matadd(real alpha, const Matrix& A, real beta, const Matrix& B, Matrix& C) {

    kernel::raw::axpbyz(C.data(), A.data(), B.data(), alpha, beta, A.size());

}


void matmul_blocked(const Matrix& A, const Matrix& B, Matrix& C, idx block_size) {

    const idx M = A.rows(), K = A.cols(), N = B.cols();

    std::fill_n(C.data(), M * N, real(0));


    for (idx ii = 0; ii < M; ii += block_size) {

        const idx i_end = std::min(ii + block_size, M);

        for (idx jj = 0; jj < N; jj += block_size) {

            const idx j_end = std::min(jj + block_size, N);

            for (idx kk = 0; kk < K; kk += block_size) {

                const idx k_end = std::min(kk + block_size, K);

                for (idx i = ii; i < i_end; ++i) {

                    for (idx k = kk; k < k_end; ++k) {

                        const real a_ik = A(i, k);

                        for (idx j = jj; j < j_end; ++j)

                            C(i, j) += a_ik * B(k, j);

                    }

                }

            }

        }

    }

}


void matmul_register_blocked(const Matrix& A,

                             const Matrix& B,

                             Matrix& C,

                             idx block_size,

                             idx reg_size) {

    const idx M = A.rows(), K = A.cols(), N = B.cols();

    std::fill_n(C.data(), M * N, real(0));


    for (idx ii = 0; ii < M; ii += block_size) {

        const idx i_lim = std::min(ii + block_size, M);

        for (idx jj = 0; jj < N; jj += block_size) {

            const idx j_lim = std::min(jj + block_size, N);

            for (idx kk = 0; kk < K; kk += block_size) {

                const idx k_lim = std::min(kk + block_size, K);

                for (idx ir = ii; ir < i_lim; ir += reg_size) {

                    const idx ri = std::min(ir + reg_size, i_lim);

                    for (idx jr = jj; jr < j_lim; jr += reg_size) {

                        const idx rj = std::min(jr + reg_size, j_lim);

                        real c[4][4] = {};

                        for (idx i = ir; i < ri; ++i)

                            for (idx j = jr; j < rj; ++j)

                                c[i - ir][j - jr] = C(i, j);

                        for (idx k = kk; k < k_lim; ++k) {

                            for (idx i = ir; i < ri; ++i) {

                                const real a_ik = A(i, k);

                                for (idx j = jr; j < rj; ++j)

                                    c[i - ir][j - jr] += a_ik * B(k, j);

                            }

                        }

                        for (idx i = ir; i < ri; ++i)

                            for (idx j = jr; j < rj; ++j)

                                C(i, j) = c[i - ir][j - jr];

                    }

                }

            }

        }

    }

}


} // namespace num::backends::seq

num::BasicMatrix< real >

num::BasicMatrix::rows
constexpr idx rows() const noexcept
Definition matrix.hpp:87

num::BasicMatrix::data
T * data()
Definition matrix.hpp:91

num::BasicMatrix::size
constexpr idx size() const noexcept
Definition matrix.hpp:89

num::BasicMatrix::cols
constexpr idx cols() const noexcept
Definition matrix.hpp:88

num::BasicVector< real >

num::BasicVector::data
T * data()
Definition vector.hpp:88

matrix.hpp
Dense row-major matrix templated over scalar type T.

num::backends::seq
Definition impl.hpp:8

num::backends::seq::matmul_register_blocked
void matmul_register_blocked(const Matrix &A, const Matrix &B, Matrix &C, idx block_size, idx reg_size)
Definition matrix.cpp:50

num::backends::seq::matmul
void matmul(const Matrix &A, const Matrix &B, Matrix &C)
Definition matrix.cpp:10

num::backends::seq::matvec
void matvec(const Matrix &A, const Vector &x, Vector &y)
Definition matrix.cpp:20

num::backends::seq::matmul_blocked
void matmul_blocked(const Matrix &A, const Matrix &B, Matrix &C, idx block_size)
Definition matrix.cpp:28

num::backends::seq::matadd
void matadd(real alpha, const Matrix &A, real beta, const Matrix &B, Matrix &C)
Definition matrix.cpp:24

num::kernel::raw::matvec
NUM_K_AINLINE void matvec(T *NUM_K_RESTRICT y, const T *NUM_K_RESTRICT A, const T *NUM_K_RESTRICT x, idx m, idx n) noexcept
y[i] = sum_j A[i*n + j] * x[j] (m x n row-major matrix)
Definition raw.hpp:140

num::kernel::raw::axpbyz
NUM_K_AINLINE void axpbyz(T *NUM_K_RESTRICT z, const T *NUM_K_RESTRICT x, const T *NUM_K_RESTRICT y, T a, T b, idx n) noexcept
z[i] = a*x[i] + b*y[i].
Definition raw.hpp:59

num::real
double real
Definition types.hpp:10

num::beta
real beta(real a, real b)
B(a, b) – beta function.
Definition math.hpp:248

num::idx
std::size_t idx
Definition types.hpp:11

raw.hpp
Tier-1 kernel: raw-pointer, inline, zero-overhead inner loops.