`cagpjax.solvers.pseudoinverse`

`PseudoInverse`

Bases: AbstractLinearSolverMethod

Solve a linear system using the Moore-Penrose pseudoinverse.

This solver computes the least-squares solution \(x = A^+ b\) for any \(A\), where \(A^+\) is the Moore-Penrose pseudoinverse. This is equivalent to the exact solution for non-singular \(A\) but generalizes to singular \(A\) and improves stability for almost-singular \(A\); note, however, that if the rank of \(A\) is dependent on hyperparameters being optimized, because the pseudoinverse is discontinuous, the optimization problem may be ill-posed.

Note that if \(A\) is (almost-)degenerate (some eigenvalues repeat), then the gradient of its solves in JAX may be non-computable or numerically unstable (see jax#669). For degenerate operators, it may be necessary to increase grad_rtol to improve stability of gradients. See cagpjax.linalg.eigh for more details.

Attributes:

Name	Type	Description
`rtol`	`ScalarFloat \| None`	Specifies the cutoff for small eigenvalues. Eigenvalues smaller than `rtol * largest_nonzero_eigenvalue` are treated as zero. The default is determined based on the floating point precision of the dtype of the operator (see `jax.numpy.linalg.pinv`).
`grad_rtol`	`float \| None`	Specifies the cutoff for similar eigenvalues, used to improve gradient computation for (almost-)degenerate matrices. If not provided, the default is 0.0. If None or negative, all eigenvalues are treated as distinct.
`alg`	`Algorithm`	Algorithm for eigenvalue decomposition passed to `cagpjax.linalg.eigh`.

Source code in src/cagpjax/solvers/pseudoinverse.py

class PseudoInverse(AbstractLinearSolverMethod):
    """
    Solve a linear system using the Moore-Penrose pseudoinverse.

    This solver computes the least-squares solution $x = A^+ b$ for any $A$,
    where $A^+$ is the Moore-Penrose pseudoinverse. This is equivalent to
    the exact solution for non-singular $A$ but generalizes to singular $A$
    and improves stability for almost-singular $A$; note, however, that if the
    rank of $A$ is dependent on hyperparameters being optimized, because the
    pseudoinverse is discontinuous, the optimization problem may be ill-posed.

    Note that if $A$ is (almost-)degenerate (some eigenvalues repeat), then
    the gradient of its solves in JAX may be non-computable or numerically unstable
    (see [jax#669](https://github.com/jax-ml/jax/issues/669)).
    For degenerate operators, it may be necessary to increase `grad_rtol` to improve
    stability of gradients.
    See [`cagpjax.linalg.eigh`][] for more details.

    Attributes:
        rtol: Specifies the cutoff for small eigenvalues.
              Eigenvalues smaller than `rtol * largest_nonzero_eigenvalue` are treated as zero.
              The default is determined based on the floating point precision of the dtype
              of the operator (see [`jax.numpy.linalg.pinv`][]).
        grad_rtol: Specifies the cutoff for similar eigenvalues, used to improve
            gradient computation for (almost-)degenerate matrices.
            If not provided, the default is 0.0.
            If None or negative, all eigenvalues are treated as distinct.
        alg: Algorithm for eigenvalue decomposition passed to [`cagpjax.linalg.eigh`][].
    """

    rtol: ScalarFloat | None
    grad_rtol: float | None
    alg: cola.linalg.Algorithm

    def __init__(
        self,
        rtol: ScalarFloat | None = None,
        grad_rtol: float | None = None,
        alg: cola.linalg.Algorithm = Eigh(),
    ):
        self.rtol = rtol
        self.grad_rtol = grad_rtol
        self.alg = alg

    @override
    def __call__(self, A: LinearOperator) -> AbstractLinearSolver:
        return PseudoInverseSolver(
            A, rtol=self.rtol, grad_rtol=self.grad_rtol, alg=self.alg
        )

`PseudoInverseSolver`

Bases: AbstractLinearSolver

Solve a linear system using the Moore-Penrose pseudoinverse.

Source code in src/cagpjax/solvers/pseudoinverse.py

class PseudoInverseSolver(AbstractLinearSolver):
    """
    Solve a linear system using the Moore-Penrose pseudoinverse.
    """

    A: LinearOperator
    eigh_result: EighResult
    eigenvalues_safe: Float[Array, "N"]

    def __init__(
        self,
        A: LinearOperator,
        rtol: ScalarFloat | None = None,
        grad_rtol: float | None = None,
        alg: cola.linalg.Algorithm = Eigh(),
    ):
        n = A.shape[0]
        # select rtol using same heuristic as jax.numpy.linalg.lstsq
        if rtol is None:
            rtol = float(jnp.finfo(A.dtype).eps) * n
        self.eigh_result = eigh(A, alg=alg, grad_rtol=grad_rtol)
        svdmax = jnp.max(jnp.abs(self.eigh_result.eigenvalues))
        cutoff = jnp.array(rtol * svdmax, dtype=svdmax.dtype)
        mask = self.eigh_result.eigenvalues >= cutoff
        self.eigvals_safe = jnp.where(mask, self.eigh_result.eigenvalues, 1)
        self.eigvals_inv = jnp.where(mask, jnp.reciprocal(self.eigvals_safe), 0)
        self.A = A

    @override
    def solve(self, b: Float[Array, "N #K"]) -> Float[Array, "N #K"]:
        # return jnp.linalg.lstsq(self.A.to_dense(), b)[0]
        b_ndim = b.ndim
        b = b if b_ndim == 2 else b[:, None]
        with jax.default_matmul_precision("highest"):
            x = self.eigh_result.eigenvectors.T @ b
        x = x * self.eigvals_inv[:, None]
        with jax.default_matmul_precision("highest"):
            x = self.eigh_result.eigenvectors @ x
        x = x if b_ndim == 2 else x.squeeze(axis=1)
        return x

    @override
    def logdet(self) -> ScalarFloat:
        return jnp.sum(jnp.log(self.eigvals_safe))

    @override
    def inv_quad(self, b: Float[Array, "N #1"]) -> ScalarFloat:
        z = self.eigh_result.eigenvectors.T @ b
        return jnp.dot(jnp.square(z), self.eigvals_inv).squeeze()

    @override
    def inv_congruence_transform(
        self, B: LinearOperator | Float[Array, "K N"]
    ) -> LinearOperator | Float[Array, "K K"]:
        eigenvectors = self.eigh_result.eigenvectors
        z = eigenvectors.T @ B
        z = z.T @ cola.ops.Diagonal(self.eigvals_inv) @ z
        return z

    @override
    def trace_solve(self, B: Self) -> ScalarFloat:
        if isinstance(B.eigh_result.eigenvectors, cola.ops.Dense):
            vectors_mat = self.eigh_result.eigenvectors.to_dense()
            return jnp.einsum(
                "ij,j,kj,ik",
                vectors_mat,
                self.eigvals_inv,
                vectors_mat,
                B.A.to_dense(),
            )
        else:
            W = B.eigh_result.eigenvectors.T @ self.eigh_result.eigenvectors.to_dense()
            return jnp.einsum(
                "ij,j,ij,i", W, self.eigvals_inv, W, B.eigh_result.eigenvalues
            )