arborx · aprokop · Sep 27, 2023 · Sep 11, 2023 · Sep 11, 2023 · Sep 11, 2023
diff --git a/.gitignore b/.gitignore
@@ -2,3 +2,4 @@
 *.swp
 .#*
 /build*
+.vscode
diff --git a/src/interpolation/details/ArborX_InterpDetailsSymmetricPseudoInverseSVD.hpp b/src/interpolation/details/ArborX_InterpDetailsSymmetricPseudoInverseSVD.hpp
@@ -0,0 +1,231 @@
+/****************************************************************************
+ * Copyright (c) 2023 by the ArborX authors                                 *
+ * All rights reserved.                                                     *
+ *                                                                          *
+ * This file is part of the ArborX library. ArborX is                       *
+ * distributed under a BSD 3-clause license. For the licensing terms see    *
+ * the LICENSE file in the top-level directory.                             *
+ *                                                                          *
+ * SPDX-License-Identifier: BSD-3-Clause                                    *
+ ****************************************************************************/
+
+#pragma once
+
+#include <ArborX_DetailsKokkosExtAccessibilityTraits.hpp>
+
+#include <Kokkos_Core.hpp>
+
+namespace ArborX::Interpolation::Details
+{
+
+// Pseudo-inverse of symmetric matrices using SVD
+// We must find U, E (diagonal and positive) and V such that A = U.E.V^T
+// We also know that A is symmetric (by construction), so U = SV where S is
+// a sign matrix (only 1 or -1 in the diagonal, 0 elsewhere).
+// Thus A = U.E.S.U^T and A^-1 = U.[ E^-1.S ].U^T
+// Here we have IO = A/A^-1, S = E.S/E^-1.S and U = U
+template <typename InOutMatrix, typename SMatrix, typename UMatrix>
+KOKKOS_FUNCTION void
+symmetricPseudoInverseSVDSerialKernel(InOutMatrix &io, SMatrix &s, UMatrix &u)
+{
+  using value_t = typename InOutMatrix::non_const_value_type;
+  std::size_t const size = io.extent(0);
+
+  // We first initialize u as the identity matrix and copy io to s
+  for (std::size_t i = 0; i < size; i++)
+    for (std::size_t j = 0; j < size; j++)
+    {
+      u(i, j) = value_t(i == j);
+      s(i, j) = io(i, j);
+    }
+
+  // We define the "norm" that will return where to perform the elimination
+  auto argmaxUpperTriangle = [=](std::size_t &p, std::size_t &q) {
+    value_t max = 0;
+    p = q = 0;
+
+    for (std::size_t i = 0; i < size; i++)
+      for (std::size_t j = i + 1; j < size; j++)
+      {
+        value_t val = Kokkos::abs(s(i, j));
+        if (max < val)
+        {
+          max = val;
+          p = i;
+          q = j;
+        }
+      }
+
+    return max;
+  };
+
+  std::size_t p, q;
+  value_t norm = argmaxUpperTriangle(p, q);
+
+  // What value of epsilon is acceptable? Too small and we falsely inverse 0.
+  // Too big and we are not accurate enough. The float's epsilon seems to be an
+  // accurate epsilon for both calculations (maybe use 2 different epsilons?)
+  static constexpr value_t epsilon = Kokkos::Experimental::epsilon_v<float>;
+  while (norm > epsilon)
+  {
+    value_t const a = s(p, p);
+    value_t const b = s(p, q);
+    value_t const c = s(q, q);
+
+    // Our submatrix is now
+    // +---------+---------+   +---+---+
+    // | s(p, p) | s(p, q) |   | a | b |
+    // +---------+---------+ = +---+---+
+    // | s(q, p) | s(q, q) |   | b | c |
+    // +---------+---------+   +---+---+
+
+    // Lets compute x, y and theta such that
-    // Lets compute x, y and theta such that
+    // Let's compute x, y and theta such that
-    // Lets compute x, y and theta such that
+    // Let's compute x, y and theta such that
+    // +---+---+              +---+---+
+    // | a | b |              | x | 0 |
+    // +---+---+ = R(theta) * +---+---+ * R(theta)^T
+    // | b | c |              | 0 | y |
+    // +---+---+              +---+---+
+
+    value_t cos, sin, x, y;
+    if (a == c)
+    {
+      cos = Kokkos::sqrt(value_t(2)) / 2;
+      sin = Kokkos::sqrt(value_t(2)) / 2;
-      sin = Kokkos::sqrt(value_t(2)) / 2;
+      sin = cos;
-      sin = Kokkos::sqrt(value_t(2)) / 2;
+      sin = cos;
+      x = a + b;
+      y = a - b;
+    }
+    else
+    {
+      value_t const u = (2 * b) / (a - c);
+      value_t const v = 1 / Kokkos::sqrt(u * u + 1);
-      value_t const u = (2 * b) / (a - c);
-      value_t const v = 1 / Kokkos::sqrt(u * u + 1);
+      auto const u = (2 * b) / (a - c);
+      auto const v = 1 / Kokkos::sqrt(u * u + 1);
-      value_t const u = (2 * b) / (a - c);
-      value_t const v = 1 / Kokkos::sqrt(u * u + 1);
+      auto const u = (2 * b) / (a - c);
+      auto const v = 1 / Kokkos::sqrt(u * u + 1);
+      cos = Kokkos::sqrt((1 + v) / 2);
+      sin = Kokkos::copysign(Kokkos::sqrt((1 - v) / 2), u);
+      x = (a + c + (a - c) / v) / 2;
+      y = a + c - x;
+    }
+
+    // Now lets compute the following new values for U amd E.S
+    // M <- R'(theta)^T . S . R'(theta)
+    // U <- U . R'(theta)
+
+    // R'(theta)^T . S . R'(theta)
+    std::size_t i = 0;
+    for (; i < p; i++)
+    {
+      value_t const s_ip = s(i, p);
+      value_t const s_iq = s(i, q);
+      s(i, p) = cos * s_ip + sin * s_iq;
+      s(i, q) = -sin * s_ip + cos * s_iq;
+    }
+    s(p, p) = x;
+    i++;
+    for (; i < q; i++)
-    i++;
-    for (; i < q; i++)
+    for (int i = p + 1; i < q; i++)
-    i++;
-    for (; i < q; i++)
+    for (int i = p + 1; i < q; i++)
+    {
+      value_t const s_pi = s(p, i);
+      value_t const s_iq = s(i, q);
+      s(p, i) = cos * s_pi + sin * s_iq;
+      s(i, q) = -sin * s_pi + cos * s_iq;
+    }
+    s(q, q) = y;
+    i++;
+    for (; i < size; i++)
-    i++;
-    for (; i < size; i++)
+    for (int i = q + 1; i < size; i++)
-    i++;
-    for (; i < size; i++)
+    for (int i = q + 1; i < size; i++)
+    {
+      value_t const s_pi = s(p, i);
+      value_t const s_qi = s(q, i);
+      s(p, i) = cos * s_pi + sin * s_qi;
+      s(q, i) = -sin * s_pi + cos * s_qi;
+    }
+    s(p, q) = 0;
+
+    // U . R'(theta)
+    for (std::size_t i = 0; i < size; i++)
+    {
+      value_t const u_ip = u(i, p);
+      value_t const u_iq = u(i, q);
+      u(i, p) = cos * u_ip + sin * u_iq;
+      u(i, q) = -sin * u_ip + cos * u_iq;
+    }
+
+    norm = argmaxUpperTriangle(p, q);
+  }
+
+  // We compute the max to get a range of the invertible eigen values
-  // We compute the max to get a range of the invertible eigen values
+  // We compute the max to get a range of the invertible eigenvalues
-  // We compute the max to get a range of the invertible eigen values
+  // We compute the max to get a range of the invertible eigenvalues
+  value_t max = epsilon;
+  for (std::size_t i = 0; i < size; i++)
+    max = Kokkos::max(Kokkos::abs(s(i, i)), max);
+
+  // We inverse the diagonal of S, except if "0" is found
+  for (std::size_t i = 0; i < size; i++)
+    s(i, i) = (Kokkos::abs(s(i, i)) < max * epsilon) ? 0 : 1 / s(i, i);
+
+  // Then we fill out IO as the pseudo inverse
+  for (std::size_t i = 0; i < size; i++)
+    for (std::size_t j = 0; j < size; j++)
+    {
+      value_t tmp = 0;
+      for (std::size_t k = 0; k < size; k++)
+        tmp += s(k, k) * u(i, k) * u(j, k);
+      io(i, j) = tmp;
+    }
+}
+
+template <typename ExecutionSpace, typename InOutMatrices>
+void symmetricPseudoInverseSVD(ExecutionSpace const &space, InOutMatrices &ios)
+{
+  // InOutMatrices is a single or list of matrices (i.e 2 or 3D view)
+  static_assert(Kokkos::is_view_v<InOutMatrices>, "In-out data must be a view");
+  static_assert(InOutMatrices::rank == 3 || InOutMatrices::rank == 2,
+                "In-out view must be a matrix or a list of matrices");
+  static_assert(
+      KokkosExt::is_accessible_from<typename InOutMatrices::memory_space,
+                                    ExecutionSpace>::value,
+      "In-out view must be accessible from the execution space");
+  using view_t = Kokkos::View<typename InOutMatrices::non_const_data_type,
+                              typename InOutMatrices::memory_space>;
+
+  if constexpr (view_t::rank == 3)
+  {
+    assert(ios.extent(1) == ios.extent(2)); // Matrices must be square
+
+    view_t s_matrices(
+        Kokkos::view_alloc(space, Kokkos::WithoutInitializing,
+                           "ArborX::SymmetricPseudoInverseSVD::sigma_list"),
+        ios.extent(0), ios.extent(1), ios.extent(2));
+    view_t u_matrices(
+        Kokkos::view_alloc(space, Kokkos::WithoutInitializing,
+                           "ArborX::SymmetricPseudoInverseSVD::givens_list"),
+        ios.extent(0), ios.extent(1), ios.extent(2));
+
+    Kokkos::parallel_for(
+        "ArborX::SymmetricPseudoInverseSVD::computation_list",
+        Kokkos::RangePolicy<ExecutionSpace>(space, 0, ios.extent(0)),
+        KOKKOS_LAMBDA(int const i) {
+          auto io = Kokkos::subview(ios, i, Kokkos::ALL, Kokkos::ALL);
+          auto s = Kokkos::subview(s_matrices, i, Kokkos::ALL, Kokkos::ALL);
+          auto u = Kokkos::subview(u_matrices, i, Kokkos::ALL, Kokkos::ALL);
+          symmetricPseudoInverseSVDSerialKernel(io, s, u);
+        });
+  }
+  else if constexpr (view_t::rank == 2)
+  {
+    assert(ios.extent(0) == ios.extent(1)); // Matrix must be square
+
+    view_t s_matrices(
+        Kokkos::view_alloc(space, Kokkos::WithoutInitializing,
+                           "ArborX::SymmetricPseudoInverseSVD::sigma"),
+        ios.extent(0), ios.extent(1));
+    view_t u_matrices(
+        Kokkos::view_alloc(space, Kokkos::WithoutInitializing,
+                           "ArborX::SymmetricPseudoInverseSVD::givens"),
+        ios.extent(0), ios.extent(1));
+
+    Kokkos::parallel_for(
+        "ArborX::SymmetricPseudoInverseSVD::computation",
+        Kokkos::RangePolicy<ExecutionSpace>(space, 0, 1),
+        KOKKOS_LAMBDA(int const) {
+          symmetricPseudoInverseSVDSerialKernel(ios, s_matrices, u_matrices);
+        });
+  }
+}
+
+} // namespace ArborX::Interpolation::Details
diff --git a/test/ArborX_EnableViewComparison.hpp b/test/ArborX_EnableViewComparison.hpp
@@ -19,6 +19,62 @@
 #include "BoostTest_CUDA_clang_workarounds.hpp"
 #include <boost/test/utils/is_forward_iterable.hpp>
 
+template <typename T>
+struct KokkosViewIterator;
+
+template <typename T, typename... P>
+struct KokkosViewIterator<Kokkos::View<T, P...>>
+{
+  using self_t = KokkosViewIterator<Kokkos::View<T, P...>>;
+  using view_t = Kokkos::View<T, P...>;
+  using value_t = typename view_t::value_type;
+
+  value_t &operator*()
+  {
+    return view.access(index[0], index[1], index[2], index[3], index[4],
+                       index[5], index[6], index[7]);
+  }
+
+  value_t *operator->() { return &operator*(); }
+
+  self_t &operator++()
+  {
+    index[7]++;
+    auto const layout = view.layout();
+
+    for (std::size_t i = 7; i > 0; i--)
+      if (index[i] == layout.dimension[i] ||
+          layout.dimension[i] == KOKKOS_INVALID_INDEX)
+      {
+        index[i] = 0;
+        index[i - 1]++;
+      }
+
+    return *this;
+  }
+
+  self_t operator++(int)
+  {
+    self_t old = *this;
+    operator++();
+    return old;
+  }
+
+  static self_t begin(view_t const &view)
+  {
+    return {view, {{0, 0, 0, 0, 0, 0, 0, 0}}};
+  }
+
+  static self_t end(view_t const &view)
+  {
+    auto const layout = view.layout();
+    return {view, {{layout.dimension[0], 0, 0, 0, 0, 0, 0, 0}}};
+  }
+
+  view_t view;
+  Kokkos::Array<std::size_t, 8> index;
+};
+
 // Enable element-wise comparison for views that are accessible from the host
 namespace boost
 {
@@ -31,22 +87,27 @@ struct is_forward_iterable<Kokkos::View<T, P...>> : public boost::mpl::true_
   // NOTE Prefer static assertion to SFINAE because error message about no
   // operator== for the operands is not as clear.
   static_assert(
-      Kokkos::View<T, P...>::rank == 1 &&
-          !std::is_same<typename Kokkos::View<T, P...>::array_layout,
-                        Kokkos::LayoutStride>::value &&
-          KokkosExt::is_accessible_from_host<Kokkos::View<T, P...>>::value,
-      "Restricted to contiguous rank-one host-accessible views");
+      KokkosExt::is_accessible_from_host<Kokkos::View<T, P...>>::value,
+      "Restricted to host-accessible views");
 };
 
 template <typename T, typename... P>
 struct bt_iterator_traits<Kokkos::View<T, P...>, true>
 {
   using view_type = Kokkos::View<T, P...>;
   using value_type = typename view_type::value_type;
-  using const_iterator =
-      typename std::add_pointer<typename view_type::const_value_type>::type;
-  static const_iterator begin(view_type const &v) { return v.data(); }
-  static const_iterator end(view_type const &v) { return v.data() + v.size(); }
+  using const_iterator = KokkosViewIterator<view_type>;
+
+  static const_iterator begin(view_type const &v)
+  {
+    return const_iterator::begin(v);
+  }
+
+  static const_iterator end(view_type const &v)
+  {
+    return const_iterator::end(v);
+  }
+
   static std::size_t size(view_type const &v) { return v.size(); }
 };
 

diff --git a/test/CMakeLists.txt b/test/CMakeLists.txt
@@ -235,6 +235,12 @@ target_link_libraries(ArborX_Test_BoostAdapters.exe PRIVATE ArborX Boost::unit_t
 target_compile_definitions(ArborX_Test_BoostAdapters.exe PRIVATE BOOST_TEST_DYN_LINK)
 add_test(NAME ArborX_Test_BoostAdapters COMMAND ArborX_Test_BoostAdapters.exe)
 
+add_executable(ArborX_Test_InterpDetailsSymmPInvSVD.exe tstInterpDetailsSymmPInvSVD.cpp utf_main.cpp)
+target_link_libraries(ArborX_Test_InterpDetailsSymmPInvSVD.exe PRIVATE ArborX Boost::unit_test_framework)
+target_compile_definitions(ArborX_Test_InterpDetailsSymmPInvSVD.exe PRIVATE BOOST_TEST_DYN_LINK)
+target_include_directories(ArborX_Test_InterpDetailsSymmPInvSVD.exe PRIVATE ${CMAKE_CURRENT_BINARY_DIR})
+add_test(NAME ArborX_Test_InterpDetailsSymmPInvSVD COMMAND ArborX_Test_InterpDetailsSymmPInvSVD.exe)
+
 if(ARBORX_ENABLE_HEADER_SELF_CONTAINMENT_TESTS)
   add_subdirectory(headers_self_contained)
 endif()
-Original file line number
+Diff line change
@@ Expand Up / @@ -2,3 +2,4 @@ @@
     *.swp
     .#*
     /build*
+    .vscode