From 512024e8804df8d6323de3d6818b625f087d42f0 Mon Sep 17 00:00:00 2001
From: andrewpeng02 <andrewpeng02@gmail.com>
Date: Tue, 9 Apr 2024 15:16:39 -0400
Subject: [PATCH] upload train results to s3, add endpoint to get train
 results, frontend request from endpoint

---
 dlp-terraform/ecs/s3.tf                       |  15 +
 dlp-terraform/ecs/sqs.tf                      |   9 +
 .../src/features/Train/redux/trainspaceApi.ts |   8 +
 .../src/features/Train/types/trainTypes.ts    |  49 ++-
 frontend/src/pages/train/[train_space_id].tsx | 400 +++++++-----------
 training/poetry.lock                          | 285 ++++++++++++-
 training/pyproject.toml                       |   1 +
 training/tests/test_imports.py                |  10 +-
 training/tests/test_loss_function.py          |   2 +-
 training/tests/test_model.py                  |   2 +-
 ...est_sk_learn_default_dataset_train_test.py |   2 +-
 training/training/celery_app.py               |  15 +
 training/training/celeryconfig.py             |  11 +
 training/training/core/authenticator.py       |   6 +-
 training/training/core/celery/__init__.py     |   0
 .../training/core/{ => celery}/criterion.py   |   0
 .../training/core/{ => celery}/dataset.py     |   0
 .../training/core/{ => celery}/dl_model.py    |   0
 .../training/core/{ => celery}/optimizer.py   |   0
 .../training/core/{ => celery}/trainer.py     |   2 +-
 training/training/core/celery/worker.py       | 226 ++++++++++
 .../routes/datasets/default/columns.py        |   3 +-
 training/training/routes/image/image.py       |  45 +-
 training/training/routes/tabular/tabular.py   |  67 +--
 .../routes/training/results/__init__.py       |   0
 .../routes/training/results/results.py        |  41 ++
 .../routes/training/results/schemas.py        |  67 +++
 training/training/urls.py                     |   2 +
 28 files changed, 912 insertions(+), 356 deletions(-)
 create mode 100644 dlp-terraform/ecs/s3.tf
 create mode 100644 dlp-terraform/ecs/sqs.tf
 create mode 100644 training/training/celery_app.py
 create mode 100644 training/training/celeryconfig.py
 create mode 100644 training/training/core/celery/__init__.py
 rename training/training/core/{ => celery}/criterion.py (100%)
 rename training/training/core/{ => celery}/dataset.py (100%)
 rename training/training/core/{ => celery}/dl_model.py (100%)
 rename training/training/core/{ => celery}/optimizer.py (100%)
 rename training/training/core/{ => celery}/trainer.py (99%)
 create mode 100644 training/training/core/celery/worker.py
 create mode 100644 training/training/routes/training/results/__init__.py
 create mode 100644 training/training/routes/training/results/results.py
 create mode 100644 training/training/routes/training/results/schemas.py

diff --git a/dlp-terraform/ecs/s3.tf b/dlp-terraform/ecs/s3.tf
new file mode 100644
index 000000000..2631fc1d5
--- /dev/null
+++ b/dlp-terraform/ecs/s3.tf
@@ -0,0 +1,15 @@
+resource "aws_s3_bucket" "s3bucket_executions" {
+  bucket = "dlp-executions"
+
+  tags = {
+    Name = "Execution data"
+  }
+}
+resource "aws_s3_bucket_public_access_block" "access_block_uploads" {
+  bucket = aws_s3_bucket.s3bucket_executions.id
+
+  block_public_acls       = true
+  block_public_policy     = true
+  ignore_public_acls      = true
+  restrict_public_buckets = true
+}
diff --git a/dlp-terraform/ecs/sqs.tf b/dlp-terraform/ecs/sqs.tf
new file mode 100644
index 000000000..0e64d39f0
--- /dev/null
+++ b/dlp-terraform/ecs/sqs.tf
@@ -0,0 +1,9 @@
+resource "aws_sqs_queue" "training_queue" {
+  name       = "training-queue.fifo"
+  fifo_queue = true
+  message_retention_seconds = 60*24
+}
+
+output "sqs_queue_url" {
+  value = aws_sqs_queue.training_queue.url
+}
\ No newline at end of file
diff --git a/frontend/src/features/Train/redux/trainspaceApi.ts b/frontend/src/features/Train/redux/trainspaceApi.ts
index e9dad9959..d502e2fab 100644
--- a/frontend/src/features/Train/redux/trainspaceApi.ts
+++ b/frontend/src/features/Train/redux/trainspaceApi.ts
@@ -2,6 +2,7 @@ import { backendApi } from "@/common/redux/backendApi";
 import {
   DATA_SOURCE,
   DatasetData,
+  DetailedTrainResultsData,
   FileUploadData,
 } from "@/features/Train/types/trainTypes";
 import { fetchBaseQuery } from "@reduxjs/toolkit/dist/query";
@@ -10,6 +11,12 @@ const trainspaceApi = backendApi
   .enhanceEndpoints({ addTagTypes: ["UserDatasetFilesData"] })
   .injectEndpoints({
     endpoints: (builder) => ({
+      getTrainResultsData: builder.query<DetailedTrainResultsData, { trainspaceId: string }>({
+        query: ( {trainspaceId}) => ({
+          url: `/api/training/training/results/${trainspaceId}`
+        })
+      }
+      ),
       getDatasetFilesData: builder.query<
         FileUploadData[],
         { dataSource: DATA_SOURCE }
@@ -95,6 +102,7 @@ const trainspaceApi = backendApi
   });
 
 export const {
+  useGetTrainResultsDataQuery,
   useGetDatasetFilesDataQuery,
   useUploadDatasetFileMutation,
   useLazyGetColumnsFromDatasetQuery,
diff --git a/frontend/src/features/Train/types/trainTypes.ts b/frontend/src/features/Train/types/trainTypes.ts
index 886c796db..20f8e0bcf 100644
--- a/frontend/src/features/Train/types/trainTypes.ts
+++ b/frontend/src/features/Train/types/trainTypes.ts
@@ -1,5 +1,6 @@
 import { DATA_SOURCE_ARR } from "../constants/trainConstants";
 
+// keep in sync with worker.py
 export type DATA_SOURCE = typeof DATA_SOURCE_ARR[number];
 
 export type TRAIN_STATUS =
@@ -16,9 +17,10 @@ export interface BaseTrainspaceData {
   step: number;
 }
 
+// basic information, used on dashboard
 export interface TrainResultsData {
   name: string;
-  trainspaceId: number;
+  trainspaceId: string;
   dataSource: DATA_SOURCE;
   status: TRAIN_STATUS;
   created: Date;
@@ -26,6 +28,51 @@ export interface TrainResultsData {
   uid: string;
 }
 
+export type CHART_TYPE = "LINE" | "AUC/ROC" | "CONFUSION_MATRIX"
+
+export type Chart = TimeSeriesChart | AucRocChart | ConfusionMatrixChart
+
+export interface TimeSeriesMetric {
+  x_name: string;
+  y_name: string;
+
+  x_values: number[];
+  y_values: number[];
+}
+
+export interface TimeSeriesChart {
+  name: string;
+
+  time_series: TimeSeriesMetric[]
+  chart_type: "LINE" 
+  graph_index: number;
+}
+
+export interface AucRocChart {
+  name: string;
+
+  values: [number[], number[], number][];
+
+  chart_type: "AUC/ROC"
+  graph_index: number;
+}
+
+export interface ConfusionMatrixChart {
+  name: string;
+  
+  values: number[][];
+
+  chart_type: "CONFUSION_MATRIX"
+  graph_index: number;
+}
+
+// more detailed information, used when viewing a run
+export interface DetailedTrainResultsData {
+  basicInfo: TrainResultsData
+
+  allMetrics: Chart[]
+}
+
 export interface FileUploadData {
   name: string;
   lastModified: string;
diff --git a/frontend/src/pages/train/[train_space_id].tsx b/frontend/src/pages/train/[train_space_id].tsx
index e228cb8b4..43375763a 100644
--- a/frontend/src/pages/train/[train_space_id].tsx
+++ b/frontend/src/pages/train/[train_space_id].tsx
@@ -2,6 +2,8 @@ import Footer from "@/common/components/Footer";
 import NavbarMain from "@/common/components/NavBarMain";
 import { useAppSelector } from "@/common/redux/hooks";
 import { isSignedIn } from "@/common/redux/userLogin";
+import { useGetTrainResultsDataQuery } from "@/features/Train/redux/trainspaceApi";
+import { DetailedTrainResultsData } from "@/features/Train/types/trainTypes";
 import Container from "@mui/material/Container";
 import Grid from "@mui/material/Grid";
 import Paper from "@mui/material/Paper";
@@ -11,88 +13,149 @@ import { Data, XAxisName, YAxisName } from "plotly.js";
 import React, { useEffect } from "react";
 const Plot = dynamic(() => import("react-plotly.js"), { ssr: false });
 
+const LINE_CHART_COLORS = ["red", "blue", "green"];
+
+const mapTrainResultsDataToCharts = (
+  detailedTrainResultsData: DetailedTrainResultsData
+) => {
+  // sort by graph_index asc and ignore negative graph indices
+  const sortedData = detailedTrainResultsData.allMetrics
+    .filter((metric) => metric.graph_index >= 0)
+    .sort((a, b) => a.graph_index - b.graph_index);
+  const charts = [];
+  let i = 0;
+  while (i < sortedData.length) {
+    const metric = sortedData[i];
+    if (metric.chart_type === "LINE") {
+      const data = [];
+      for (let i = 0; i < metric.time_series.length; i++) {
+        const time_series = metric.time_series[i];
+        data.push({
+          name: time_series.y_name,
+          x: time_series.x_values,
+          y: time_series.y_values,
+          type: "scatter",
+          mode: "markers",
+          marker: { color: LINE_CHART_COLORS[i], size: 10 },
+        });
+      }
+      charts.push(
+        <Plot
+          data={data as Data[]}
+          layout={{
+            height: 350,
+            width: 525,
+            xaxis: { title: metric.time_series[0].x_name },
+            // yaxis: { title: "Y axis" },
+            title: metric.name,
+            showlegend: true,
+            paper_bgcolor: "rgba(0,0,0,0)",
+            plot_bgcolor: "rgba(0,0,0,0)",
+          }}
+          config={{ responsive: true }}
+        />
+      );
+    } else if (metric.chart_type === "AUC/ROC") {
+      charts.push(
+        <Plot
+          data={[
+            {
+              name: "baseline",
+              x: [0, 1],
+              y: [0, 1],
+              type: "scatter",
+              marker: { color: "grey" },
+              line: {
+                dash: "dash",
+              },
+            },
+            ...(metric.values.map((x) => ({
+              name: `(AUC: ${x[2]})`,
+              x: x[0] as number[],
+              y: x[1] as number[],
+              type: "scatter",
+            })) as Data[]),
+          ]}
+          layout={{
+            height: 350,
+            width: 525,
+            xaxis: { title: "False Positive Rate" },
+            yaxis: { title: "True Positive Rate" },
+            title: "AUC/ROC Curves for your Deep Learning Model",
+            showlegend: true,
+            paper_bgcolor: "rgba(0,0,0,0)",
+            plot_bgcolor: "rgba(0,0,0,0)",
+          }}
+          config={{ responsive: true }}
+        />
+      );
+    } else if (metric.chart_type === "CONFUSION_MATRIX") {
+      charts.push(
+        <Plot
+          data={[
+            {
+              z: metric.values,
+              type: "heatmap",
+              colorscale: [
+                [0, "#e6f6fe"],
+                [1, "#003058"],
+              ],
+            },
+          ]}
+          layout={{
+            height: 525,
+            width: 525,
+            title: "Confusion Matrix (Last Epoch)",
+            xaxis: {
+              title: "Predicted",
+            },
+            yaxis: {
+              title: "Actual",
+              autorange: "reversed",
+            },
+            showlegend: true,
+            annotations: metric.values
+              .map((row, i) =>
+                row.map((_, j) => ({
+                  xref: "x1" as XAxisName,
+                  yref: "y1" as YAxisName,
+                  x: j,
+                  y: (i + metric.values.length - 1) % metric.values.length,
+                  text: metric.values[
+                    (i + metric.values.length - 1) % metric.values.length
+                  ][j].toString(),
+                  font: {
+                    color:
+                      metric.values[
+                        (i + metric.values.length - 1) % metric.values.length
+                      ][j] > 0
+                        ? "white"
+                        : "black",
+                  },
+                  showarrow: false,
+                }))
+              )
+              .flat(),
+            paper_bgcolor: "rgba(0,0,0,0)",
+            plot_bgcolor: "rgba(0,0,0,0)",
+          }}
+        />
+      );
+    } else {
+      throw Error("Undefined chart type received");
+    }
+    i += 1;
+  }
+
+  return charts;
+};
+
 const TrainSpace = () => {
   const { train_space_id } = useRouter().query;
-  const data = {
-    success: true,
-    message: "Dataset trained and results outputted successfully",
-    dl_results: [
-      {
-        epoch: 1,
-        train_time: 0.029964923858642578,
-        train_loss: 1.1126993695894878,
-        test_loss: 1.1082043647766113,
-        train_acc: 0.3333333333333333,
-        "val/test acc": 0.3,
-      },
-      {
-        epoch: 2,
-        train_time: 0.0221712589263916,
-        train_loss: 1.1002190907796223,
-        test_loss: 1.100191593170166,
-        train_acc: 0.3333333333333333,
-        "val/test acc": 0.3,
-      },
-      {
-        epoch: 3,
-        train_time: 0.0680840015411377,
-        train_loss: 1.0896958708763123,
-        test_loss: 1.0933666229248047,
-        train_acc: 0.3333333333333333,
-        "val/test acc": 0.3,
-      },
-      {
-        epoch: 4,
-        train_time: 0.007375478744506836,
-        train_loss: 1.0802951455116272,
-        test_loss: 1.0868618488311768,
-        train_acc: 0.3333333333333333,
-        "val/test acc": 0.3,
-      },
-      {
-        epoch: 5,
-        train_time: 0.008754491806030273,
-        train_loss: 1.071365197499593,
-        test_loss: 1.080164909362793,
-        train_acc: 0.3333333333333333,
-        "val/test acc": 0.3,
-      },
-    ],
-    auxiliary_outputs: {
-      confusion_matrix: [
-        [0, 0, 6],
-        [0, 0, 8],
-        [0, 0, 6],
-      ],
-      AUC_ROC_curve_data: [
-        [
-          [0.0, 0.0, 0.0, 0.07142857142857142, 0.07142857142857142, 1.0],
-          [
-            0.0, 0.16666666666666666, 0.8333333333333334, 0.8333333333333334,
-            1.0, 1.0,
-          ],
-          0.9880952380952381,
-        ],
-        [
-          [
-            0.0, 0.08333333333333333, 0.5, 0.5, 0.5833333333333334,
-            0.5833333333333334, 0.6666666666666666, 0.6666666666666666, 1.0,
-          ],
-          [0.0, 0.0, 0.0, 0.75, 0.75, 0.875, 0.875, 1.0, 1.0],
-          0.46875,
-        ],
-        [
-          [0.0, 0.0, 0.0, 0.07142857142857142, 0.07142857142857142, 1.0],
-          [
-            0.0, 0.16666666666666666, 0.8333333333333334, 0.8333333333333334,
-            1.0, 1.0,
-          ],
-          0.9880952380952381,
-        ],
-      ],
-    },
-    status: 200,
-  };
+  const { data, isLoading } = useGetTrainResultsDataQuery({
+    trainspaceId: train_space_id,
+  });
+
   const user = useAppSelector((state) => state.currentUser.user);
   const router = useRouter();
   useEffect(() => {
@@ -100,183 +163,22 @@ const TrainSpace = () => {
       router.replace({ pathname: "/login" });
     }
   }, [user, router.isReady]);
-  if (!isSignedIn(user)) {
+  if (!isSignedIn(user) || !data || isLoading) {
     return <></>;
   }
+
+  const charts = mapTrainResultsDataToCharts(data);
   return (
     <div style={{ height: "100vh" }}>
       <NavbarMain />
       <Container>
         <h1>{train_space_id}</h1>
         <Grid container spacing={2}>
-          <Grid item>
-            <Paper>
-              <Plot
-                data={[
-                  {
-                    name: "Train accuracy",
-                    x: data.dl_results.map((x) => x.epoch),
-                    y: data.dl_results.map((x) => x["train_acc"]),
-                    type: "scatter",
-                    mode: "markers",
-                    marker: { color: "red", size: 10 },
-                  },
-                  {
-                    name: "Test accuracy",
-                    x: data.dl_results.map((x) => x.epoch),
-                    y: data.dl_results.map((x) => x["val/test acc"]),
-                    type: "scatter",
-                    mode: "markers",
-                    marker: { color: "blue", size: 10 },
-                  },
-                ]}
-                layout={{
-                  height: 350,
-                  width: 525,
-                  xaxis: { title: "Epoch Number" },
-                  yaxis: { title: "Accuracy" },
-                  title: "Train vs. Test Accuracy for your Deep Learning Model",
-                  showlegend: true,
-                  paper_bgcolor: "rgba(0,0,0,0)",
-                  plot_bgcolor: "rgba(0,0,0,0)",
-                }}
-                config={{ responsive: true }}
-              />
-            </Paper>
-          </Grid>
-          <Grid item>
-            <Paper>
-              <Plot
-                data={[
-                  {
-                    name: "Train loss",
-                    x: data.dl_results.map((x) => x.epoch),
-                    y: data.dl_results.map((x) => x.train_loss),
-                    type: "scatter",
-                    mode: "markers",
-                    marker: { color: "red", size: 10 },
-                  },
-                  {
-                    name: "Test loss",
-                    x: data.dl_results.map((x) => x.epoch),
-                    y: data.dl_results.map((x) => x.test_loss),
-                    type: "scatter",
-                    mode: "markers",
-                    marker: { color: "blue", size: 10 },
-                  },
-                ]}
-                layout={{
-                  height: 350,
-                  width: 525,
-                  xaxis: { title: "Epoch Number" },
-                  yaxis: { title: "Loss" },
-                  title: "Train vs. Test Loss for your Deep Learning Model",
-                  showlegend: true,
-                  paper_bgcolor: "rgba(0,0,0,0)",
-                  plot_bgcolor: "rgba(0,0,0,0)",
-                }}
-                config={{ responsive: true }}
-              />
-            </Paper>
-          </Grid>
-          <Grid item>
-            <Paper>
-              <Plot
-                data={[
-                  {
-                    name: "baseline",
-                    x: [0, 1],
-                    y: [0, 1],
-                    type: "scatter",
-                    marker: { color: "grey" },
-                    line: {
-                      dash: "dash",
-                    },
-                  },
-                  ...(data.auxiliary_outputs.AUC_ROC_curve_data.map((x) => ({
-                    name: `(AUC: ${x[2]})`,
-                    x: x[0] as number[],
-                    y: x[1] as number[],
-                    type: "scatter",
-                  })) as Data[]),
-                ]}
-                layout={{
-                  height: 350,
-                  width: 525,
-                  xaxis: { title: "False Positive Rate" },
-                  yaxis: { title: "True Positive Rate" },
-                  title: "AUC/ROC Curves for your Deep Learning Model",
-                  showlegend: true,
-                  paper_bgcolor: "rgba(0,0,0,0)",
-                  plot_bgcolor: "rgba(0,0,0,0)",
-                }}
-                config={{ responsive: true }}
-              />
-            </Paper>
-          </Grid>
-          <Grid item>
-            <Paper>
-              <Plot
-                data={[
-                  {
-                    z: data.auxiliary_outputs.confusion_matrix,
-                    type: "heatmap",
-                    colorscale: [
-                      [0, "#e6f6fe"],
-                      [1, "#003058"],
-                    ],
-                  },
-                ]}
-                layout={{
-                  height: 525,
-                  width: 525,
-                  title: "Confusion Matrix (Last Epoch)",
-                  xaxis: {
-                    title: "Predicted",
-                  },
-                  yaxis: {
-                    title: "Actual",
-                    autorange: "reversed",
-                  },
-                  showlegend: true,
-                  annotations: data.auxiliary_outputs.confusion_matrix
-                    .map((row, i) =>
-                      row.map((_, j) => ({
-                        xref: "x1" as XAxisName,
-                        yref: "y1" as YAxisName,
-                        x: j,
-                        y:
-                          (i +
-                            data.auxiliary_outputs.confusion_matrix.length -
-                            1) %
-                          data.auxiliary_outputs.confusion_matrix.length,
-                        text: data.auxiliary_outputs.confusion_matrix[
-                          (i +
-                            data.auxiliary_outputs.confusion_matrix.length -
-                            1) %
-                            data.auxiliary_outputs.confusion_matrix.length
-                        ][j].toString(),
-                        font: {
-                          color:
-                            data.auxiliary_outputs.confusion_matrix[
-                              (i +
-                                data.auxiliary_outputs.confusion_matrix.length -
-                                1) %
-                                data.auxiliary_outputs.confusion_matrix.length
-                            ][j] > 0
-                              ? "white"
-                              : "black",
-                        },
-                        showarrow: false,
-                      }))
-                    )
-                    .flat(),
-                  paper_bgcolor: "rgba(0,0,0,0)",
-                  plot_bgcolor: "rgba(0,0,0,0)",
-                }}
-              />
-            </Paper>
-          </Grid>
+          {charts.map((chart) => (
+            <Grid item>
+              <Paper>{chart}</Paper>
+            </Grid>
+          ))}
         </Grid>
       </Container>
       <Footer />
diff --git a/training/poetry.lock b/training/poetry.lock
index 75801b9bd..a28969916 100644
--- a/training/poetry.lock
+++ b/training/poetry.lock
@@ -1,5 +1,19 @@
 # This file is automatically @generated by Poetry 1.7.1 and should not be changed by hand.
 
+[[package]]
+name = "amqp"
+version = "5.2.0"
+description = "Low-level AMQP client for Python (fork of amqplib)."
+optional = false
+python-versions = ">=3.6"
+files = [
+    {file = "amqp-5.2.0-py3-none-any.whl", hash = "sha256:827cb12fb0baa892aad844fd95258143bce4027fdac4fccddbc43330fd281637"},
+    {file = "amqp-5.2.0.tar.gz", hash = "sha256:a1ecff425ad063ad42a486c902807d1482311481c8ad95a72694b2975e75f7fd"},
+]
+
+[package.dependencies]
+vine = ">=5.0.0,<6.0.0"
+
 [[package]]
 name = "appdirs"
 version = "1.4.4"
@@ -28,6 +42,28 @@ typing-extensions = {version = ">=4", markers = "python_version < \"3.11\""}
 [package.extras]
 tests = ["mypy (>=0.800)", "pytest", "pytest-asyncio"]
 
+[[package]]
+name = "async-timeout"
+version = "4.0.3"
+description = "Timeout context manager for asyncio programs"
+optional = false
+python-versions = ">=3.7"
+files = [
+    {file = "async-timeout-4.0.3.tar.gz", hash = "sha256:4640d96be84d82d02ed59ea2b7105a0f7b33abe8703703cd0ab0bf87c427522f"},
+    {file = "async_timeout-4.0.3-py3-none-any.whl", hash = "sha256:7405140ff1230c310e51dc27b3145b9092d659ce68ff733fb0cefe3ee42be028"},
+]
+
+[[package]]
+name = "billiard"
+version = "4.2.0"
+description = "Python multiprocessing fork with improvements and bugfixes"
+optional = false
+python-versions = ">=3.7"
+files = [
+    {file = "billiard-4.2.0-py3-none-any.whl", hash = "sha256:07aa978b308f334ff8282bd4a746e681b3513db5c9a514cbdd810cbbdc19714d"},
+    {file = "billiard-4.2.0.tar.gz", hash = "sha256:9a3c3184cb275aa17a732f93f65b20c525d3d9f253722d26a82194803ade5a2c"},
+]
+
 [[package]]
 name = "boto3"
 version = "1.28.57"
@@ -97,6 +133,68 @@ files = [
     {file = "cachetools-5.3.1.tar.gz", hash = "sha256:dce83f2d9b4e1f732a8cd44af8e8fab2dbe46201467fc98b3ef8f269092bf62b"},
 ]
 
+[[package]]
+name = "celery"
+version = "5.3.6"
+description = "Distributed Task Queue."
+optional = false
+python-versions = ">=3.8"
+files = [
+    {file = "celery-5.3.6-py3-none-any.whl", hash = "sha256:9da4ea0118d232ce97dff5ed4974587fb1c0ff5c10042eb15278487cdd27d1af"},
+    {file = "celery-5.3.6.tar.gz", hash = "sha256:870cc71d737c0200c397290d730344cc991d13a057534353d124c9380267aab9"},
+]
+
+[package.dependencies]
+billiard = ">=4.2.0,<5.0"
+boto3 = {version = ">=1.26.143", optional = true, markers = "extra == \"sqs\""}
+click = ">=8.1.2,<9.0"
+click-didyoumean = ">=0.3.0"
+click-plugins = ">=1.1.1"
+click-repl = ">=0.2.0"
+kombu = [
+    {version = ">=5.3.4,<6.0"},
+    {version = ">=5.3.0", extras = ["sqs"], optional = true, markers = "extra == \"sqs\""},
+]
+pycurl = {version = ">=7.43.0.5", optional = true, markers = "sys_platform != \"win32\" and platform_python_implementation == \"CPython\" and extra == \"sqs\""}
+python-dateutil = ">=2.8.2"
+redis = {version = ">=4.5.2,<4.5.5 || >4.5.5,<6.0.0", optional = true, markers = "extra == \"redis\""}
+tzdata = ">=2022.7"
+urllib3 = {version = ">=1.26.16", optional = true, markers = "extra == \"sqs\""}
+vine = ">=5.1.0,<6.0"
+
+[package.extras]
+arangodb = ["pyArango (>=2.0.2)"]
+auth = ["cryptography (==41.0.5)"]
+azureblockblob = ["azure-storage-blob (>=12.15.0)"]
+brotli = ["brotli (>=1.0.0)", "brotlipy (>=0.7.0)"]
+cassandra = ["cassandra-driver (>=3.25.0,<4)"]
+consul = ["python-consul2 (==0.1.5)"]
+cosmosdbsql = ["pydocumentdb (==2.3.5)"]
+couchbase = ["couchbase (>=3.0.0)"]
+couchdb = ["pycouchdb (==1.14.2)"]
+django = ["Django (>=2.2.28)"]
+dynamodb = ["boto3 (>=1.26.143)"]
+elasticsearch = ["elastic-transport (<=8.10.0)", "elasticsearch (<=8.11.0)"]
+eventlet = ["eventlet (>=0.32.0)"]
+gevent = ["gevent (>=1.5.0)"]
+librabbitmq = ["librabbitmq (>=2.0.0)"]
+memcache = ["pylibmc (==1.6.3)"]
+mongodb = ["pymongo[srv] (>=4.0.2)"]
+msgpack = ["msgpack (==1.0.7)"]
+pymemcache = ["python-memcached (==1.59)"]
+pyro = ["pyro4 (==4.82)"]
+pytest = ["pytest-celery (==0.0.0)"]
+redis = ["redis (>=4.5.2,!=4.5.5,<6.0.0)"]
+s3 = ["boto3 (>=1.26.143)"]
+slmq = ["softlayer-messaging (>=1.0.3)"]
+solar = ["ephem (==4.1.5)"]
+sqlalchemy = ["sqlalchemy (>=1.4.48,<2.1)"]
+sqs = ["boto3 (>=1.26.143)", "kombu[sqs] (>=5.3.0)", "pycurl (>=7.43.0.5)", "urllib3 (>=1.26.16)"]
+tblib = ["tblib (>=1.3.0)", "tblib (>=1.5.0)"]
+yaml = ["PyYAML (>=3.10)"]
+zookeeper = ["kazoo (>=1.3.1)"]
+zstd = ["zstandard (==0.22.0)"]
+
 [[package]]
 name = "certifi"
 version = "2023.7.22"
@@ -281,6 +379,55 @@ files = [
 [package.dependencies]
 colorama = {version = "*", markers = "platform_system == \"Windows\""}
 
+[[package]]
+name = "click-didyoumean"
+version = "0.3.0"
+description = "Enables git-like *did-you-mean* feature in click"
+optional = false
+python-versions = ">=3.6.2,<4.0.0"
+files = [
+    {file = "click-didyoumean-0.3.0.tar.gz", hash = "sha256:f184f0d851d96b6d29297354ed981b7dd71df7ff500d82fa6d11f0856bee8035"},
+    {file = "click_didyoumean-0.3.0-py3-none-any.whl", hash = "sha256:a0713dc7a1de3f06bc0df5a9567ad19ead2d3d5689b434768a6145bff77c0667"},
+]
+
+[package.dependencies]
+click = ">=7"
+
+[[package]]
+name = "click-plugins"
+version = "1.1.1"
+description = "An extension module for click to enable registering CLI commands via setuptools entry-points."
+optional = false
+python-versions = "*"
+files = [
+    {file = "click-plugins-1.1.1.tar.gz", hash = "sha256:46ab999744a9d831159c3411bb0c79346d94a444df9a3a3742e9ed63645f264b"},
+    {file = "click_plugins-1.1.1-py2.py3-none-any.whl", hash = "sha256:5d262006d3222f5057fd81e1623d4443e41dcda5dc815c06b442aa3c02889fc8"},
+]
+
+[package.dependencies]
+click = ">=4.0"
+
+[package.extras]
+dev = ["coveralls", "pytest (>=3.6)", "pytest-cov", "wheel"]
+
+[[package]]
+name = "click-repl"
+version = "0.3.0"
+description = "REPL plugin for Click"
+optional = false
+python-versions = ">=3.6"
+files = [
+    {file = "click-repl-0.3.0.tar.gz", hash = "sha256:17849c23dba3d667247dc4defe1757fff98694e90fe37474f3feebb69ced26a9"},
+    {file = "click_repl-0.3.0-py3-none-any.whl", hash = "sha256:fb7e06deb8da8de86180a33a9da97ac316751c094c6899382da7feeeeb51b812"},
+]
+
+[package.dependencies]
+click = ">=7.0"
+prompt-toolkit = ">=3.0.36"
+
+[package.extras]
+testing = ["pytest (>=7.2.1)", "pytest-cov (>=4.0.0)", "tox (>=4.4.3)"]
+
 [[package]]
 name = "colorama"
 version = "0.4.6"
@@ -933,6 +1080,42 @@ files = [
     {file = "joblib-1.3.2.tar.gz", hash = "sha256:92f865e621e17784e7955080b6d042489e3b8e294949cc44c6eac304f59772b1"},
 ]
 
+[[package]]
+name = "kombu"
+version = "5.3.5"
+description = "Messaging library for Python."
+optional = false
+python-versions = ">=3.8"
+files = [
+    {file = "kombu-5.3.5-py3-none-any.whl", hash = "sha256:0eac1bbb464afe6fb0924b21bf79460416d25d8abc52546d4f16cad94f789488"},
+    {file = "kombu-5.3.5.tar.gz", hash = "sha256:30e470f1a6b49c70dc6f6d13c3e4cc4e178aa6c469ceb6bcd55645385fc84b93"},
+]
+
+[package.dependencies]
+amqp = ">=5.1.1,<6.0.0"
+boto3 = {version = ">=1.26.143", optional = true, markers = "extra == \"sqs\""}
+pycurl = {version = ">=7.43.0.5", optional = true, markers = "sys_platform != \"win32\" and platform_python_implementation == \"CPython\" and extra == \"sqs\""}
+typing-extensions = {version = "*", markers = "python_version < \"3.10\""}
+urllib3 = {version = ">=1.26.16", optional = true, markers = "extra == \"sqs\""}
+vine = "*"
+
+[package.extras]
+azureservicebus = ["azure-servicebus (>=7.10.0)"]
+azurestoragequeues = ["azure-identity (>=1.12.0)", "azure-storage-queue (>=12.6.0)"]
+confluentkafka = ["confluent-kafka (>=2.2.0)"]
+consul = ["python-consul2"]
+librabbitmq = ["librabbitmq (>=2.0.0)"]
+mongodb = ["pymongo (>=4.1.1)"]
+msgpack = ["msgpack"]
+pyro = ["pyro4"]
+qpid = ["qpid-python (>=0.26)", "qpid-tools (>=0.26)"]
+redis = ["redis (>=4.5.2,!=4.5.5,<6.0.0)"]
+slmq = ["softlayer-messaging (>=1.0.3)"]
+sqlalchemy = ["sqlalchemy (>=1.4.48,<2.1)"]
+sqs = ["boto3 (>=1.26.143)", "pycurl (>=7.43.0.5)", "urllib3 (>=1.26.16)"]
+yaml = ["PyYAML (>=3.10)"]
+zookeeper = ["kazoo (>=2.8.0)"]
+
 [[package]]
 name = "markupsafe"
 version = "2.1.3"
@@ -1365,6 +1548,20 @@ nodeenv = ">=0.11.1"
 pyyaml = ">=5.1"
 virtualenv = ">=20.10.0"
 
+[[package]]
+name = "prompt-toolkit"
+version = "3.0.43"
+description = "Library for building powerful interactive command lines in Python"
+optional = false
+python-versions = ">=3.7.0"
+files = [
+    {file = "prompt_toolkit-3.0.43-py3-none-any.whl", hash = "sha256:a11a29cb3bf0a28a387fe5122cdb649816a957cd9261dcedf8c9f1fef33eacf6"},
+    {file = "prompt_toolkit-3.0.43.tar.gz", hash = "sha256:3527b7af26106cbc65a040bcc84839a3566ec1b051bb0bfe953631e704b0ff7d"},
+]
+
+[package.dependencies]
+wcwidth = "*"
+
 [[package]]
 name = "proto-plus"
 version = "1.22.3"
@@ -1440,6 +1637,51 @@ files = [
     {file = "pycparser-2.21.tar.gz", hash = "sha256:e644fdec12f7872f86c58ff790da456218b10f863970249516d60a5eaca77206"},
 ]
 
+[[package]]
+name = "pycurl"
+version = "7.45.3"
+description = "PycURL -- A Python Interface To The cURL library"
+optional = false
+python-versions = ">=3.5"
+files = [
+    {file = "pycurl-7.45.3-cp310-cp310-macosx_10_9_universal2.whl", hash = "sha256:86f66d334deaaab20a576fb785587566081407adc703318203fe26e43277ef12"},
+    {file = "pycurl-7.45.3-cp310-cp310-macosx_10_9_x86_64.whl", hash = "sha256:205983e87d6aa0b6e93ec7320060de44efaa905ecc5d13f70cbe38c65684c5c4"},
+    {file = "pycurl-7.45.3-cp310-cp310-macosx_11_0_arm64.whl", hash = "sha256:fbd4a6b8654b779089c5a44af1c65c1419c2cd60718780df6d8f354eb35d6d55"},
+    {file = "pycurl-7.45.3-cp310-cp310-manylinux_2_28_aarch64.whl", hash = "sha256:5ebc6a0ac60c371a9efaf7d55dec5820f76fdafb43a3be1e390011339dc329ae"},
+    {file = "pycurl-7.45.3-cp310-cp310-manylinux_2_28_x86_64.whl", hash = "sha256:2facab1c35600088cb82b5b093bd700bfbd1e3191deab24f7d1803d9dc5b76fc"},
+    {file = "pycurl-7.45.3-cp310-cp310-win32.whl", hash = "sha256:7cfca02d70579853041063e53ca713d31161b8831b98d4f68c3554dc0448beec"},
+    {file = "pycurl-7.45.3-cp310-cp310-win_amd64.whl", hash = "sha256:8451e8475051f16eb4776380384699cb8ddd10ea8410bcbfaee5a6fc4c046de6"},
+    {file = "pycurl-7.45.3-cp311-cp311-macosx_10_9_universal2.whl", hash = "sha256:1610cc45b5bc8b39bc18b981d0473e59ef41226ee467eaa8fbfc7276603ef5af"},
+    {file = "pycurl-7.45.3-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:c854885398410fa6e88fc29f7a420a3c13b88bae9b4e10a804437b582e24f58b"},
+    {file = "pycurl-7.45.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:921c9db0c3128481954f625b3b1bc10c730100aa944d54643528f716676439ee"},
+    {file = "pycurl-7.45.3-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:483f3aa5d1bc8cff5657ad96f68e1d89281f971a7b6aa93408a31e3199981ea9"},
+    {file = "pycurl-7.45.3-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:1e0d32d6ed3a7ba13dbbd3a6fb50ca76c40c70e6bc6fe347f90677478d3422c7"},
+    {file = "pycurl-7.45.3-cp311-cp311-win32.whl", hash = "sha256:beaaa4450e23d41dd0c2f2f47a4f8a171210271543550c2c556090c7eeea88f5"},
+    {file = "pycurl-7.45.3-cp311-cp311-win_amd64.whl", hash = "sha256:dd33fd9de8907a6275c70113124aeb7eea672c1324f5d5423f203738b341697d"},
+    {file = "pycurl-7.45.3-cp312-cp312-macosx_10_9_universal2.whl", hash = "sha256:0c41a172d5e8a5cdd8328cc8134f47b2a57960ac677f7cda8520eaa9fbe7d990"},
+    {file = "pycurl-7.45.3-cp312-cp312-macosx_10_9_x86_64.whl", hash = "sha256:13006b62c157bb4483c58e1abdced6df723c9399255a4f5f6bb7f8e425106679"},
+    {file = "pycurl-7.45.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:27f4c5c20c86a9a823677316724306fb1ce3b25ec568efd52026dc6c563e5b29"},
+    {file = "pycurl-7.45.3-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:c2c246bc29e8762ff4c8a833ac5b4da4c797d16ab138286e8aec9b0c0a0da2d4"},
+    {file = "pycurl-7.45.3-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:3d07c5daef2d0d85949e32ec254ee44232bb57febb0634194379dd14d1ff4f87"},
+    {file = "pycurl-7.45.3-cp312-cp312-win32.whl", hash = "sha256:9f7afe5ef0e4750ac4515baebc251ee94aaefe5de6e2e8a24668473128d69904"},
+    {file = "pycurl-7.45.3-cp312-cp312-win_amd64.whl", hash = "sha256:3648ed9a57a6b704673faeab3dc64d1469cc69f2bc1ed8227ffa0f84e147c500"},
+    {file = "pycurl-7.45.3-cp38-cp38-macosx_10_9_universal2.whl", hash = "sha256:c0915ea139f66a289edc4f9de10cb45078af1bb950491c5612969864236a2e7e"},
+    {file = "pycurl-7.45.3-cp38-cp38-macosx_10_9_x86_64.whl", hash = "sha256:43c5e61a58783ddf78ef84949f6bb6e52e092a13ec67678e9a9e21071ecf5b80"},
+    {file = "pycurl-7.45.3-cp38-cp38-macosx_11_0_arm64.whl", hash = "sha256:bf613844a1647fe3d2bba1f5c9c96a62a85280123a57a8a0c8d2f37d518bc10a"},
+    {file = "pycurl-7.45.3-cp38-cp38-manylinux_2_28_aarch64.whl", hash = "sha256:936afd9c5ff7fe7457065e878a279811787778f472f9a4e8c5df79e7728358e2"},
+    {file = "pycurl-7.45.3-cp38-cp38-manylinux_2_28_x86_64.whl", hash = "sha256:dbf816a6d0cb71e7fd06609246bbea4eaf100649d9decf49e4eb329594f70be7"},
+    {file = "pycurl-7.45.3-cp38-cp38-win32.whl", hash = "sha256:2c8a2ce568193f9f84763717d8961cec0db4ec1aa08c6bcf4d90da5eb72bec86"},
+    {file = "pycurl-7.45.3-cp38-cp38-win_amd64.whl", hash = "sha256:80ac7c17e69ca6b76ccccb4255f7c29a2a36e5b69eb10c2adba82135d43afe8c"},
+    {file = "pycurl-7.45.3-cp39-cp39-macosx_10_9_universal2.whl", hash = "sha256:fa7751b614d9aa82d7a0f49ca90924c29c6cedf85a2f8687fb6a772dbfe48711"},
+    {file = "pycurl-7.45.3-cp39-cp39-macosx_10_9_x86_64.whl", hash = "sha256:b129e9ee07f80b4af957607917af46ab517b0c4e746692f6d9e50e973edba8d8"},
+    {file = "pycurl-7.45.3-cp39-cp39-macosx_11_0_arm64.whl", hash = "sha256:a0f920582b8713ca87d5a288a7532607bc4454275d733fc880650d602dbe3c67"},
+    {file = "pycurl-7.45.3-cp39-cp39-manylinux_2_28_aarch64.whl", hash = "sha256:c7c13e4268550cde14a6f4743cc8bd8c035d4cd36514d58eff70276d68954b6f"},
+    {file = "pycurl-7.45.3-cp39-cp39-manylinux_2_28_x86_64.whl", hash = "sha256:0f0e1251a608ffd75fc502f4014442e554c67d3d7a1b0a839c35efb6ad2f8bf8"},
+    {file = "pycurl-7.45.3-cp39-cp39-win32.whl", hash = "sha256:51a40a56c58e63dac6145829f9e9bd66e5867a9f0741bcb9ffefab619851d44f"},
+    {file = "pycurl-7.45.3-cp39-cp39-win_amd64.whl", hash = "sha256:e08a06802c8c8a9d04cf3319f9230ec09062c55d2550bd48f8ada1df1431adcf"},
+    {file = "pycurl-7.45.3.tar.gz", hash = "sha256:8c2471af9079ad798e1645ec0b0d3d4223db687379d17dd36a70637449f81d6b"},
+]
+
 [[package]]
 name = "pydantic"
 version = "1.10.13"
@@ -1661,7 +1903,6 @@ files = [
     {file = "PyYAML-6.0.1-cp311-cp311-win_amd64.whl", hash = "sha256:bf07ee2fef7014951eeb99f56f39c9bb4af143d8aa3c21b1677805985307da34"},
     {file = "PyYAML-6.0.1-cp312-cp312-macosx_10_9_x86_64.whl", hash = "sha256:855fb52b0dc35af121542a76b9a84f8d1cd886ea97c84703eaa6d88e37a2ad28"},
     {file = "PyYAML-6.0.1-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:40df9b996c2b73138957fe23a16a4f0ba614f4c0efce1e9406a184b6d07fa3a9"},
-    {file = "PyYAML-6.0.1-cp312-cp312-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:a08c6f0fe150303c1c6b71ebcd7213c2858041a7e01975da3a99aed1e7a378ef"},
     {file = "PyYAML-6.0.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:6c22bec3fbe2524cde73d7ada88f6566758a8f7227bfbf93a408a9d86bcc12a0"},
     {file = "PyYAML-6.0.1-cp312-cp312-musllinux_1_1_x86_64.whl", hash = "sha256:8d4e9c88387b0f5c7d5f281e55304de64cf7f9c0021a3525bd3b1c542da3b0e4"},
     {file = "PyYAML-6.0.1-cp312-cp312-win32.whl", hash = "sha256:d483d2cdf104e7c9fa60c544d92981f12ad66a457afae824d146093b8c294c54"},
@@ -1696,6 +1937,24 @@ files = [
     {file = "PyYAML-6.0.1.tar.gz", hash = "sha256:bfdf460b1736c775f2ba9f6a92bca30bc2095067b8a9d77876d1fad6cc3b4a43"},
 ]
 
+[[package]]
+name = "redis"
+version = "5.0.3"
+description = "Python client for Redis database and key-value store"
+optional = false
+python-versions = ">=3.7"
+files = [
+    {file = "redis-5.0.3-py3-none-any.whl", hash = "sha256:5da9b8fe9e1254293756c16c008e8620b3d15fcc6dde6babde9541850e72a32d"},
+    {file = "redis-5.0.3.tar.gz", hash = "sha256:4973bae7444c0fbed64a06b87446f79361cb7e4ec1538c022d696ed7a5015580"},
+]
+
+[package.dependencies]
+async-timeout = {version = ">=4.0.3", markers = "python_full_version < \"3.11.3\""}
+
+[package.extras]
+hiredis = ["hiredis (>=1.0.0)"]
+ocsp = ["cryptography (>=36.0.1)", "pyopenssl (==20.0.1)", "requests (>=2.26.0)"]
+
 [[package]]
 name = "requests"
 version = "2.31.0"
@@ -2015,6 +2274,17 @@ brotli = ["brotli (==1.0.9)", "brotli (>=1.0.9)", "brotlicffi (>=0.8.0)", "brotl
 secure = ["certifi", "cryptography (>=1.3.4)", "idna (>=2.0.0)", "ipaddress", "pyOpenSSL (>=0.14)", "urllib3-secure-extra"]
 socks = ["PySocks (>=1.5.6,!=1.5.7,<2.0)"]
 
+[[package]]
+name = "vine"
+version = "5.1.0"
+description = "Python promises."
+optional = false
+python-versions = ">=3.6"
+files = [
+    {file = "vine-5.1.0-py3-none-any.whl", hash = "sha256:40fdf3c48b2cfe1c38a49e9ae2da6fda88e4794c810050a728bd7413811fb1dc"},
+    {file = "vine-5.1.0.tar.gz", hash = "sha256:8b62e981d35c41049211cf62a0a1242d8c1ee9bd15bb196ce38aefd6799e61e0"},
+]
+
 [[package]]
 name = "virtualenv"
 version = "20.24.5"
@@ -2035,6 +2305,17 @@ platformdirs = ">=3.9.1,<4"
 docs = ["furo (>=2023.7.26)", "proselint (>=0.13)", "sphinx (>=7.1.2)", "sphinx-argparse (>=0.4)", "sphinxcontrib-towncrier (>=0.2.1a0)", "towncrier (>=23.6)"]
 test = ["covdefaults (>=2.3)", "coverage (>=7.2.7)", "coverage-enable-subprocess (>=1)", "flaky (>=3.7)", "packaging (>=23.1)", "pytest (>=7.4)", "pytest-env (>=0.8.2)", "pytest-freezer (>=0.4.8)", "pytest-mock (>=3.11.1)", "pytest-randomly (>=3.12)", "pytest-timeout (>=2.1)", "setuptools (>=68)", "time-machine (>=2.10)"]
 
+[[package]]
+name = "wcwidth"
+version = "0.2.13"
+description = "Measures the displayed width of unicode strings in a terminal"
+optional = false
+python-versions = "*"
+files = [
+    {file = "wcwidth-0.2.13-py2.py3-none-any.whl", hash = "sha256:3da69048e4540d84af32131829ff948f1e022c1c6bdb8d6102117aac784f6859"},
+    {file = "wcwidth-0.2.13.tar.gz", hash = "sha256:72ea0c06399eb286d978fdedb6923a9eb47e1c486ce63e9b4e64fc18303972b5"},
+]
+
 [[package]]
 name = "werkzeug"
 version = "3.0.1"
@@ -2066,4 +2347,4 @@ files = [
 [metadata]
 lock-version = "2.0"
 python-versions = ">=3.9, <3.10"
-content-hash = "8b1b00589461cdf8f8de272ee9d28bf234ff5cac75ba2b58251e3d53da8dee4a"
+content-hash = "5d7b6e8d8537c86f95644d45a0c3f7cf08c25d658da1819c80a5ee201dab7a71"
diff --git a/training/pyproject.toml b/training/pyproject.toml
index b2175726f..48cba4d72 100644
--- a/training/pyproject.toml
+++ b/training/pyproject.toml
@@ -19,6 +19,7 @@ requests = "^2.31.0"
 django-cors-headers = "^4.2.0"
 gunicorn = "^21.2.0"
 pytest = "^7.4.0"
+celery = {extras = ["redis", "sqs"], version = "^5.3.6"}
 
 
 [tool.poetry.group.dev.dependencies]
diff --git a/training/tests/test_imports.py b/training/tests/test_imports.py
index cddba8b47..3651fe2fc 100644
--- a/training/tests/test_imports.py
+++ b/training/tests/test_imports.py
@@ -1,6 +1,6 @@
 def test_all_imports():
-    import training.core.dataset
-    import training.core.criterion
-    import training.core.optimizer
-    import training.core.dl_model
-    import training.core.trainer
+    import training.core.celery.dataset
+    import training.core.celery.criterion
+    import training.core.celery.optimizer
+    import training.core.celery.dl_model
+    import training.core.celery.trainer
diff --git a/training/tests/test_loss_function.py b/training/tests/test_loss_function.py
index 98f06e975..5c39b70d7 100644
--- a/training/tests/test_loss_function.py
+++ b/training/tests/test_loss_function.py
@@ -1,7 +1,7 @@
 import pytest
 import torch
 import torch.nn as nn
-from training.core.criterion import getCriterionHandler
+from training.core.celery.criterion import getCriterionHandler
 
 
 """
diff --git a/training/tests/test_model.py b/training/tests/test_model.py
index 7883a4d35..4951144cd 100644
--- a/training/tests/test_model.py
+++ b/training/tests/test_model.py
@@ -1,7 +1,7 @@
 import pytest
 import torch.nn as nn
 from torch.autograd import Variable
-from training.core.dl_model import DLModel
+from training.core.celery.dl_model import DLModel
 
 
 @pytest.mark.parametrize(
diff --git a/training/tests/test_sk_learn_default_dataset_train_test.py b/training/tests/test_sk_learn_default_dataset_train_test.py
index 2ed58a47d..c45388059 100644
--- a/training/tests/test_sk_learn_default_dataset_train_test.py
+++ b/training/tests/test_sk_learn_default_dataset_train_test.py
@@ -1,4 +1,4 @@
-from training.core.dataset import SklearnDatasetCreator
+from training.core.celery.dataset import SklearnDatasetCreator
 from torch.utils.data import DataLoader
 
 
diff --git a/training/training/celery_app.py b/training/training/celery_app.py
new file mode 100644
index 000000000..b7c78c5f8
--- /dev/null
+++ b/training/training/celery_app.py
@@ -0,0 +1,15 @@
+from celery import Celery
+
+from training import celeryconfig
+
+celery_app = Celery("training")
+celery_app.config_from_object(celeryconfig)
+
+@celery_app.task(name="tabularTrainTask")
+def tabularTrainTask(tabularParams: dict, trainspaceId: str, uid: str):
+    pass
+
+
+@celery_app.task(name="imageTrainTask")
+def imageTrainTask(imageParams: dict, trainspaceId: str, uid: str):
+    pass
diff --git a/training/training/celeryconfig.py b/training/training/celeryconfig.py
new file mode 100644
index 000000000..b61825f06
--- /dev/null
+++ b/training/training/celeryconfig.py
@@ -0,0 +1,11 @@
+broker_url = "sqs://"  # "redis://localhost:6379"
+
+broker_transport_options = {
+    "predefined_queues": {
+        "training-queue.fifo": {
+            "url": "https://sqs.us-east-1.amazonaws.com/521654603461/training-queue.fifo",
+        }
+    }
+}
+
+task_default_queue = 'training-queue.fifo'
\ No newline at end of file
diff --git a/training/training/core/authenticator.py b/training/training/core/authenticator.py
index a250215f2..e4f457517 100644
--- a/training/training/core/authenticator.py
+++ b/training/training/core/authenticator.py
@@ -13,14 +13,14 @@ def authenticate(self, request, token):
             return
         app = init_firebase()
         try:
-            firebase_admin.auth.verify_id_token(token)
+            user = firebase_admin.auth.verify_id_token(token)
         except Exception as e:
             logger.info(e)
             return
         finally:
             firebase_admin.delete_app(app)
-        return token
+        return user
 
 
 class Request(HttpRequest):
-    auth: str
+    auth: dict
diff --git a/training/training/core/celery/__init__.py b/training/training/core/celery/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/training/training/core/criterion.py b/training/training/core/celery/criterion.py
similarity index 100%
rename from training/training/core/criterion.py
rename to training/training/core/celery/criterion.py
diff --git a/training/training/core/dataset.py b/training/training/core/celery/dataset.py
similarity index 100%
rename from training/training/core/dataset.py
rename to training/training/core/celery/dataset.py
diff --git a/training/training/core/dl_model.py b/training/training/core/celery/dl_model.py
similarity index 100%
rename from training/training/core/dl_model.py
rename to training/training/core/celery/dl_model.py
diff --git a/training/training/core/optimizer.py b/training/training/core/celery/optimizer.py
similarity index 100%
rename from training/training/core/optimizer.py
rename to training/training/core/celery/optimizer.py
diff --git a/training/training/core/trainer.py b/training/training/core/celery/trainer.py
similarity index 99%
rename from training/training/core/trainer.py
rename to training/training/core/celery/trainer.py
index 02ce1567f..dd4b85e07 100644
--- a/training/training/core/trainer.py
+++ b/training/training/core/celery/trainer.py
@@ -6,7 +6,7 @@
 import torch
 from torch.utils.data import DataLoader
 import torch.nn as nn
-from training.core.criterion import CriterionHandler
+from training.core.celery.criterion import CriterionHandler
 
 
 @dataclass
diff --git a/training/training/core/celery/worker.py b/training/training/core/celery/worker.py
new file mode 100644
index 000000000..dd8b13315
--- /dev/null
+++ b/training/training/core/celery/worker.py
@@ -0,0 +1,226 @@
+from datetime import date
+from celery import Celery
+import django
+from django.conf import settings
+
+settings.configure()
+django.setup()
+
+import boto3
+
+
+from training.core.celery.criterion import getCriterionHandler
+from training.core.celery.dataset import SklearnDatasetCreator
+from training.core.celery.dataset import ImageDefaultDatasetCreator
+from training.core.celery.dl_model import DLModel
+from torch.utils.data import DataLoader
+from training.core.celery.optimizer import getOptimizer
+from training.core.celery.trainer import ClassificationTrainer, RegressionTrainer
+from training.routes.tabular.schemas import TabularParams
+from training.routes.image.schemas import ImageParams
+from training.routes.training.results.schemas import (
+    DetailedTrainResultsData,
+    TrainResultsData,
+)
+
+from training import celeryconfig
+
+celery_app = Celery("celery")
+celery_app.config_from_object(celeryconfig)
+
+
+def saveDetailedTrainResultsDataToS3(
+    detailedTrainResultsData: DetailedTrainResultsData,
+):
+    s3 = boto3.resource("s3")
+    s3.Object(
+        "dlp-executions", f"{detailedTrainResultsData.basicInfo.trainspaceId}.json"
+    ).put(Body=detailedTrainResultsData.json())
+
+
+def collectClassificationTrainingResults(trainer, basicInfo):
+    trainTestLoss = [
+        {
+            "x_name": "Epoch",
+            "y_name": "Train loss",
+            "x_values": [],
+            "y_values": [],
+        },
+        {
+            "x_name": "Epoch",
+            "y_name": "Test loss",
+            "x_values": [],
+            "y_values": [],
+        },
+    ]
+    for epoch_result in trainer:
+        trainTestLoss[0]["x_values"].append(epoch_result.epoch_num)
+        trainTestLoss[0]["y_values"].append(epoch_result.train_loss)
+        trainTestLoss[1]["x_values"].append(epoch_result.epoch_num)
+        trainTestLoss[1]["y_values"].append(epoch_result.test_loss)
+    confusionMatrix = trainer.generate_confusion_matrix()
+    aucRocCurve = trainer.generate_AUC_ROC_CURVE()
+
+    detailedTrainResultsData = DetailedTrainResultsData(
+        **{
+            "basicInfo": basicInfo,
+            "allMetrics": [
+                {
+                    "name": "Train and test loss vs epoch",
+                    "time_series": trainTestLoss,
+                    "graph_index": 0,
+                    "chart_type": "LINE",
+                },
+                {
+                    "name": "Confusion matrix",
+                    "values": confusionMatrix.tolist(),
+                    "chart_type": "CONFUSION_MATRIX",
+                    "graph_index": 1,
+                },
+                {
+                    "name": "AUC/ROC curve",
+                    "values": aucRocCurve,
+                    "chart_type": "AUC/ROC",
+                    "graph_index": 2,
+                },
+            ],
+        }
+    )
+    return detailedTrainResultsData
+
+
+@celery_app.task(name="tabularTrainTask")
+def tabularTrainTask(input: dict, trainspaceId: str, uid: str):
+    tabularParams = TabularParams(**input)
+    basicInfo = TrainResultsData(
+        **{
+            "name": tabularParams.name,
+            "trainspaceId": trainspaceId,
+            "dataSource": "TABULAR",
+            "status": "SUCCESS",
+            "created": date.today(),
+            "step": "step",
+            "uid": uid,
+        }
+    )
+
+    if tabularParams.default:
+        dataCreator = SklearnDatasetCreator.fromDefault(
+            tabularParams.default, tabularParams.test_size, tabularParams.shuffle
+        )
+        train_loader = DataLoader(
+            dataCreator.createTrainDataset(),
+            batch_size=tabularParams.batch_size,
+            shuffle=False,
+            drop_last=True,
+        )
+
+        test_loader = DataLoader(
+            dataCreator.createTestDataset(),
+            batch_size=tabularParams.batch_size,
+            shuffle=False,
+            drop_last=True,
+        )
+
+        model = DLModel.fromLayerParamsList(tabularParams.user_arch)
+        optimizer = getOptimizer(model, tabularParams.optimizer_name, 0.05)
+        criterionHandler = getCriterionHandler(tabularParams.criterion)
+        if tabularParams.problem_type == "CLASSIFICATION":
+            trainer = ClassificationTrainer(
+                train_loader,
+                test_loader,
+                model,
+                optimizer,
+                criterionHandler,
+                tabularParams.epochs,
+                dataCreator.getCategoryList(),
+            )
+
+            detailedTrainResultsData = collectClassificationTrainingResults(trainer, basicInfo)
+
+            # save detailedTrainResultsData
+            saveDetailedTrainResultsDataToS3(detailedTrainResultsData)
+        else:
+            trainer = RegressionTrainer(
+                train_loader,
+                test_loader,
+                model,
+                optimizer,
+                criterionHandler,
+                tabularParams.epochs,
+            )
+
+            trainTestLoss = [
+                {
+                    "x_name": "Epoch",
+                    "y_name": "Train loss",
+                    "x_values": [],
+                    "y_values": [],
+                },
+                {
+                    "x_name": "Epoch",
+                    "y_name": "Test loss",
+                    "x_values": [],
+                    "y_values": [],
+                },
+            ]
+            for epoch_result in trainer:
+                trainTestLoss[0]["x_values"].append(epoch_result.epoch_num)
+                trainTestLoss[0]["y_values"].append(epoch_result.train_loss)
+                trainTestLoss[1]["x_values"].append(epoch_result.epoch_num)
+                trainTestLoss[1]["y_values"].append(epoch_result.test_loss)
+
+            detailedTrainResultsData = DetailedTrainResultsData(
+                **{
+                    "basicInfo": basicInfo,
+                    "allMetrics": [
+                        {
+                            "name": "Train and test loss vs epoch",
+                            "time_series": trainTestLoss,
+                            "graph_index": 0,
+                            "chart_type": "LINE",
+                        }
+                    ],
+                }
+            )
+
+            # save detailedTrainResultsData
+            saveDetailedTrainResultsDataToS3(detailedTrainResultsData)
+
+
+@celery_app.task(name="imageTrainTask")
+def imageTrainTask(input: dict, trainspaceId: str, uid: str):
+    imageParams = ImageParams(**input)
+    basicInfo = TrainResultsData(
+        **{
+            "name": imageParams.name,
+            "trainspaceId": trainspaceId,
+            "dataSource": "IMAGE",
+            "status": "SUCCESS",
+            "created": date.today(),
+            "step": "step",
+            "uid": uid,
+        }
+    )
+
+    if imageParams.default:
+        dataCreator = ImageDefaultDatasetCreator.fromDefault(imageParams.default)
+        train_loader = dataCreator.createTrainDataset()
+        test_loader = dataCreator.createTestDataset()
+        model = DLModel.fromLayerParamsList(imageParams.user_arch)
+        optimizer = getOptimizer(model, imageParams.optimizer_name, 0.05)
+        criterionHandler = getCriterionHandler(imageParams.criterion)
+        if imageParams.problem_type == "CLASSIFICATION":
+            trainer = ClassificationTrainer(
+                train_loader,
+                test_loader,
+                model,
+                optimizer,
+                criterionHandler,
+                imageParams.epochs,
+                dataCreator.getCategoryList(),
+            )
+            detailedTrainResultsData = collectClassificationTrainingResults(trainer, basicInfo)
+
+            # save detailedTrainResultsData
+            saveDetailedTrainResultsDataToS3(detailedTrainResultsData)
diff --git a/training/training/routes/datasets/default/columns.py b/training/training/routes/datasets/default/columns.py
index 22aae3c03..2c1687ec0 100644
--- a/training/training/routes/datasets/default/columns.py
+++ b/training/training/routes/datasets/default/columns.py
@@ -2,7 +2,7 @@
 from ninja import Router, Schema
 from ninja.security import HttpBearer
 from training.core.authenticator import FirebaseAuth, Request
-from training.core.dataset import SklearnDatasetCreator
+from training.core.celery.dataset import SklearnDatasetCreator
 from training.routes.datasets.default.schemas import DefaultDatasetResponse
 from training.routes.schemas import NotFoundError
 
@@ -21,5 +21,4 @@ def defaultDatasets(request: Request, name: str):
     return 200, {
         "data": dataset.columns.tolist(),
         "message": "Success",
-        "token": request.auth,
     }
diff --git a/training/training/routes/image/image.py b/training/training/routes/image/image.py
index 92ccc3690..4411e3862 100644
--- a/training/training/routes/image/image.py
+++ b/training/training/routes/image/image.py
@@ -1,40 +1,17 @@
-from typing import Literal, Optional
-from django.http import HttpRequest
-from ninja import Router, Schema
-from training.core.criterion import getCriterionHandler
-from training.core.dl_model import DLModel
-from training.core.dataset import ImageDefaultDatasetCreator
-from torch.utils.data import DataLoader
-from training.core.optimizer import getOptimizer
-from training.core.trainer import ClassificationTrainer
+from ninja import Router
 from training.routes.image.schemas import ImageParams
-from training.core.authenticator import FirebaseAuth
+from training.core.authenticator import FirebaseAuth, Request
+from training.celery_app import celery_app
 
+import uuid
 router = Router()
 
 
 @router.post("", auth=FirebaseAuth())
-def imageTrain(request: HttpRequest, imageParams: ImageParams):
-    if imageParams.default:
-        dataCreator = ImageDefaultDatasetCreator.fromDefault(imageParams.default)
-        train_loader = dataCreator.createTrainDataset()
-        test_loader = dataCreator.createTestDataset()
-        model = DLModel.fromLayerParamsList(imageParams.user_arch)
-        optimizer = getOptimizer(model, imageParams.optimizer_name, 0.05)
-        criterionHandler = getCriterionHandler(imageParams.criterion)
-        if imageParams.problem_type == "CLASSIFICATION":
-            trainer = ClassificationTrainer(
-                train_loader,
-                test_loader,
-                model,
-                optimizer,
-                criterionHandler,
-                imageParams.epochs,
-                dataCreator.getCategoryList(),
-            )
-            for epoch_result in trainer:
-                print(epoch_result)
-            print(trainer.labels_last_epoch, trainer.y_pred_last_epoch)
-            print(trainer.generate_confusion_matrix())
-            print(trainer.generate_AUC_ROC_CURVE())
-            return trainer.generate_AUC_ROC_CURVE()
+def imageTrain(request: Request, imageParams: ImageParams):
+    trainspaceId = str(uuid.uuid4())
+    task = celery_app.send_task("imageTrainTask", [imageParams.dict(), trainspaceId, request.auth['uid']])
+
+    return 200, {
+        "trainspace_id": trainspaceId
+    }
diff --git a/training/training/routes/tabular/tabular.py b/training/training/routes/tabular/tabular.py
index b2b3a6e79..732fc8b25 100644
--- a/training/training/routes/tabular/tabular.py
+++ b/training/training/routes/tabular/tabular.py
@@ -1,65 +1,20 @@
 from typing import Literal, Optional
-from django.http import HttpRequest
 from ninja import Router, Schema
-from training.core.criterion import getCriterionHandler
-from training.core.dataset import SklearnDatasetCreator
-from training.core.dl_model import DLModel
-from torch.utils.data import DataLoader
-from training.core.optimizer import getOptimizer
-from training.core.trainer import ClassificationTrainer, RegressionTrainer
+
 from training.routes.tabular.schemas import TabularParams
-from training.core.authenticator import FirebaseAuth
+from training.core.authenticator import FirebaseAuth, Request
+from training.celery_app import celery_app
+import uuid
 
 router = Router()
 
 
 @router.post("", auth=FirebaseAuth())
-def tabularTrain(request: HttpRequest, tabularParams: TabularParams):
-    if tabularParams.default:
-        dataCreator = SklearnDatasetCreator.fromDefault(
-            tabularParams.default, tabularParams.test_size, tabularParams.shuffle
-        )
-        train_loader = DataLoader(
-            dataCreator.createTrainDataset(),
-            batch_size=tabularParams.batch_size,
-            shuffle=False,
-            drop_last=True,
-        )
-        print("hi")
-        test_loader = DataLoader(
-            dataCreator.createTestDataset(),
-            batch_size=tabularParams.batch_size,
-            shuffle=False,
-            drop_last=True,
-        )
+def tabularTrain(request: Request, tabularParams: TabularParams):
+    trainspaceId = str(uuid.uuid4())
+    task = celery_app.send_task("tabularTrainTask", [tabularParams.dict(), trainspaceId, request.auth['uid']])
+
+    return 200, {
+        "trainspace_id": trainspaceId
+    }
 
-        model = DLModel.fromLayerParamsList(tabularParams.user_arch)
-        optimizer = getOptimizer(model, tabularParams.optimizer_name, 0.05)
-        criterionHandler = getCriterionHandler(tabularParams.criterion)
-        if tabularParams.problem_type == "CLASSIFICATION":
-            trainer = ClassificationTrainer(
-                train_loader,
-                test_loader,
-                model,
-                optimizer,
-                criterionHandler,
-                tabularParams.epochs,
-                dataCreator.getCategoryList(),
-            )
-            for epoch_result in trainer:
-                print(epoch_result)
-            print(trainer.labels_last_epoch, trainer.y_pred_last_epoch)
-            print(trainer.generate_confusion_matrix())
-            print(trainer.generate_AUC_ROC_CURVE())
-            return trainer.generate_AUC_ROC_CURVE()
-        else:
-            trainer = RegressionTrainer(
-                train_loader,
-                test_loader,
-                model,
-                optimizer,
-                criterionHandler,
-                tabularParams.epochs,
-            )
-            for epoch_result in trainer:
-                print(epoch_result)
diff --git a/training/training/routes/training/results/__init__.py b/training/training/routes/training/results/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/training/training/routes/training/results/results.py b/training/training/routes/training/results/results.py
new file mode 100644
index 000000000..2c9606d00
--- /dev/null
+++ b/training/training/routes/training/results/results.py
@@ -0,0 +1,41 @@
+from datetime import date
+from typing import Literal, Optional
+from ninja import Router, Schema
+from ninja.errors import AuthenticationError, ValidationError
+import boto3, botocore.exceptions
+import json
+
+from training.routes.tabular.schemas import TabularParams
+from training.core.authenticator import FirebaseAuth, Request
+from training.celery_app import celery_app
+from training.routes.training.results.schemas import (
+    DetailedTrainResultsData,
+    TrainResultsData,
+)
+
+router = Router()
+
+
+@router.get(
+    "/results/{trainspace_id}", auth=FirebaseAuth(), response=DetailedTrainResultsData
+)
+def getDetailedTrainResultsData(request: Request, trainspace_id: str):
+    s3 = boto3.resource("s3")
+
+    try:
+        content_object = s3.Object("dlp-executions", f"{trainspace_id}.json")
+        file_content = content_object.get()["Body"].read().decode("utf-8")
+        json_content = json.loads(file_content)
+        detailedTrainResultsData = DetailedTrainResultsData(**json_content)
+        if request.auth["uid"] != detailedTrainResultsData.basicInfo.uid:
+            raise AuthenticationError("Invalid authorization")
+
+    except botocore.exceptions.ClientError as e:
+        if e.response["Error"]["Code"] == "NoSuchKey":
+            raise ValidationError("Trainspace id is invalid")
+        elif e.response["Error"]["Code"] == 403:
+            raise AuthenticationError("Invalid authorization")
+        else:
+            raise
+
+    return 200, detailedTrainResultsData
diff --git a/training/training/routes/training/results/schemas.py b/training/training/routes/training/results/schemas.py
new file mode 100644
index 000000000..8ef677072
--- /dev/null
+++ b/training/training/routes/training/results/schemas.py
@@ -0,0 +1,67 @@
+import datetime
+from dataclasses import dataclass
+from typing import List, Literal, Tuple, Union
+
+from ninja import Schema
+
+# keep in sync with trainTypes.ts
+DATA_SOURCE = Literal[
+    "TABULAR",
+    "PRETRAINED",
+    "IMAGE",
+    "AUDIO",
+    "TEXTUAL",
+    "CLASSICAL_ML",
+    "OBJECT_DETECTION",
+]
+
+TRAIN_STATUS = Literal[
+    "QUEUED", "STARTING", "UPLOADING", "TRAINING", "SUCCESS", "ERROR"
+]
+
+class TrainResultsData(Schema):
+    name: str
+    trainspaceId: str
+    dataSource: DATA_SOURCE
+    status: TRAIN_STATUS
+    created: datetime.date
+    step: str
+    uid: str
+
+CHART_TYPE = Literal["LINE", "AUC/ROC", "CONFUSION_MATRIX"]
+
+class TimeSeriesMetric(Schema):
+    x_name: str
+    y_name: str
+
+    x_values: List[float]
+    y_values: List[float]
+
+class TimeSeriesChart(Schema):
+    name: str
+
+    time_series: List[TimeSeriesMetric]
+    chart_type = "LINE"
+    graph_index: int
+
+class AucRocChart(Schema):
+    name: str
+
+    values: List[Tuple[List[float], List[float], float]]
+    chart_type = "AUC/ROC"
+    graph_index: int
+
+class ConfusionMatrixChart(Schema):
+    name: str
+
+    values: List[List[float]]
+
+    chart_type = "CONFUSION_MATRIX"
+    graph_index: int
+
+
+Chart = Union[TimeSeriesChart, AucRocChart, ConfusionMatrixChart]
+class DetailedTrainResultsData(Schema):
+    basicInfo: TrainResultsData
+
+    allMetrics: List[Chart]
\ No newline at end of file
diff --git a/training/training/urls.py b/training/training/urls.py
index e34755f18..babb42248 100644
--- a/training/training/urls.py
+++ b/training/training/urls.py
@@ -22,6 +22,7 @@
 from training.routes.datasets.default.columns import router as default_dataset_router
 from training.routes.tabular.tabular import router as tabular_router
 from training.routes.image.image import router as image_router
+from training.routes.training.results.results import router as training_router
 
 api = NinjaAPI()
 
@@ -34,6 +35,7 @@ def test(request: HttpRequest):
 api.add_router("/datasets/default/", default_dataset_router)
 api.add_router("/tabular", tabular_router)
 api.add_router("/image", image_router)
+api.add_router("/training", training_router)
 
 urlpatterns = [
     path("admin/", admin.site.urls),