fix: add Merlin project as config to observation publisher (#563)

# Description  This PR addresses two bugs found in the observation publisher: 1. The model id config field in observation publisher is wrongly assumed to be in the form of (project)-(model id), instead of just (model id) . This affect the bigquery table write location for BigQuerySink, and arize model id for ArizeSink. 2. Prediction log from standard model does not contain the "columns" field, but this is not handled by the observation publisher. # Modifications  - API service will now supply model project as an input to the deployer. - Observation publisher will have a new config field, project. This is going to be passed to the observation sink as well. - Observation publisher will now use the feature_orders field in inference schema when trying to construct the pandas dataframe from the prediction log, if the field value is non null # Tests  # Checklist - [ ] Added PR label - [ ] Added unit test, integration, and/or e2e tests - [ ] Tested locally - [ ] Updated documentation - [ ] Update Swagger spec if the PR introduce API changes - [ ] Regenerated Golang and Python client if the PR introduces API changes # Release Notes  ```release-note ```
caraml-dev · Apr 2, 2024 · 5f70094 · 5f70094
1 parent ce2b447
commit 5f70094
Show file tree

Hide file tree

Showing 11 changed files with 168 additions and 21 deletions.
diff --git a/api/pkg/observability/deployment/config.go b/api/pkg/observability/deployment/config.go
@@ -5,6 +5,7 @@ import (
 )
 
 type ConsumerConfig struct {
+	Project           string             `yaml:"project"`
 	ModelID           string             `yaml:"model_id"`
 	ModelVersion      string             `yaml:"model_version"`
 	InferenceSchema   *models.SchemaSpec `yaml:"inference_schema"`

diff --git a/api/pkg/observability/deployment/deployment.go b/api/pkg/observability/deployment/deployment.go
@@ -253,6 +253,7 @@ func (c *deployer) applySecret(ctx context.Context, data *models.WorkerData) (se
 
 func (c *deployer) createSecretSpec(data *models.WorkerData) (*corev1.Secret, error) {
 	consumerCfg := &ConsumerConfig{
+		Project:         data.Project,
 		ModelID:         data.ModelName,
 		ModelVersion:    data.ModelVersion,
 		InferenceSchema: data.ModelSchemaSpec,

diff --git a/api/pkg/observability/deployment/deployment_test.go b/api/pkg/observability/deployment/deployment_test.go
@@ -293,7 +293,7 @@ func Test_deployer_Deploy(t *testing.T) {
 							},
 						},
 						StringData: map[string]string{
-							"config.yaml": "model_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
+							"config.yaml": "project: project-1\nmodel_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
 						},
 					}}, nil, false)
 				deploymentAPI := clientSet.AppsV1().Deployments(namespace).(*fakeappsv1.FakeDeployments)
@@ -365,7 +365,7 @@ func Test_deployer_Deploy(t *testing.T) {
 							},
 						},
 						StringData: map[string]string{
-							"config.yaml": "model_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
+							"config.yaml": "project: project-1\nmodel_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
 						},
 					}}, fmt.Errorf("deployment control plane is down"), false)
 				return clientSet
@@ -417,7 +417,7 @@ func Test_deployer_Deploy(t *testing.T) {
 							},
 						},
 						StringData: map[string]string{
-							"config.yaml": "model_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
+							"config.yaml": "project: project-1\nmodel_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
 						},
 					}}, nil, false)
 				deploymentAPI := clientSet.AppsV1().Deployments(namespace).(*fakeappsv1.FakeDeployments)
@@ -485,7 +485,7 @@ func Test_deployer_Deploy(t *testing.T) {
 						},
 					},
 					StringData: map[string]string{
-						"config.yaml": "model_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
+						"config.yaml": "project: project-1\nmodel_id: model-1\nmodel_version: \"1\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-1-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
 					},
 				}, nil)
 				prependUpsertSecretReactor(t, secretAPI, []*corev1.Secret{
@@ -503,7 +503,7 @@ func Test_deployer_Deploy(t *testing.T) {
 							},
 						},
 						StringData: map[string]string{
-							"config.yaml": "model_id: model-1\nmodel_version: \"2\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-2-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
+							"config.yaml": "project: project-1\nmodel_id: model-1\nmodel_version: \"2\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-2-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
 						},
 					}}, nil, true)
 				deploymentAPI := clientSet.AppsV1().Deployments(namespace).(*fakeappsv1.FakeDeployments)
@@ -591,7 +591,7 @@ func Test_deployer_Deploy(t *testing.T) {
 							},
 						},
 						StringData: map[string]string{
-							"config.yaml": "model_id: model-1\nmodel_version: \"2\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-2-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
+							"config.yaml": "project: project-1\nmodel_id: model-1\nmodel_version: \"2\"\ninference_schema:\n  session_id_column: session_id\n  row_id_column: row_id\n  model_prediction_output:\n    actual_score_column: \"\"\n    negative_class_label: negative\n    prediction_score_column: prediction_score\n    prediction_label_column: prediction_label\n    positive_class_label: positive\n    score_threshold: null\n    output_class: BinaryClassificationOutput\n  tag_columns:\n  - tag\n  feature_types:\n    featureA: float64\n    featureB: float64\n    featureC: int64\n    featureD: boolean\n  feature_orders: []\nobservation_sinks:\n- type: ARIZE\n  config:\n    api_key: api-key\n    space_key: space-key\n- type: BIGQUERY\n  config:\n    project: bq-project\n    dataset: dataset\n    ttl_days: 10\nobservation_source:\n  type: KAFKA\n  config:\n    topic: caraml-project-1-model-1-2-prediction-log\n    bootstrap_servers: broker-1\n    group_id: group-id\n    batch_size: 100\n    additional_consumer_config:\n      auto.offset.reset: latest\n      fetch.min.bytes: \"1024000\"\n",
 						},
 					}, {
 						ObjectMeta: metav1.ObjectMeta{

diff --git a/python/observation-publisher/conf/environment/example-override.yaml b/python/observation-publisher/conf/environment/example-override.yaml
@@ -1,3 +1,4 @@
+project: "test-project"
 model_id: "test-model"
 model_version: "0.1.0"
 inference_schema:

diff --git a/python/observation-publisher/publisher/__main__.py b/python/observation-publisher/publisher/__main__.py
@@ -26,6 +26,7 @@ def start_consumer(cfg: PublisherConfig) -> None:
     observation_sinks = [
         new_observation_sink(
             sink_config=sink_config,
+            project=cfg.environment.project,
             inference_schema=inference_schema,
             model_id=cfg.environment.model_id,
             model_version=cfg.environment.model_version,

diff --git a/python/observation-publisher/publisher/config.py b/python/observation-publisher/publisher/config.py
@@ -30,6 +30,7 @@ class ObservationSourceConfig:
 
 @dataclass
 class Environment:
+    project: str
     model_id: str
     model_version: str
     inference_schema: dict

diff --git a/python/observation-publisher/publisher/observation_sink.py b/python/observation-publisher/publisher/observation_sink.py
@@ -31,10 +31,12 @@ class ObservationSink(abc.ABC):
 
     def __init__(
         self,
+        project: str,
         inference_schema: InferenceSchema,
         model_id: str,
         model_version: str,
     ):
+        self._project = project
         self._inference_schema = inference_schema
         self._model_id = model_id
         self._model_version = model_version
@@ -65,18 +67,20 @@ class ArizeSink(ObservationSink):
 
     def __init__(
         self,
+        project: str,
         inference_schema: InferenceSchema,
         model_id: str,
         model_version: str,
         arize_client: ArizeClient,
     ):
         """
+        :param project: CaraML project
         :param inference_schema: Inference schema for the ingested model
         :param model_id: Merlin model id
         :param model_version: Merlin model version
         :param arize_client: Arize Pandas Logger client
         """
-        super().__init__(inference_schema, model_id, model_version)
+        super().__init__(project, inference_schema, model_id, model_version)
         self._client = arize_client
 
     def _common_arize_schema_attributes(self) -> dict:
@@ -121,7 +125,7 @@ def write(self, df: pd.DataFrame):
                 dataframe=df,
                 environment=Environments.PRODUCTION,
                 schema=arize_schema,
-                model_id=self._model_id,
+                model_id=f"{self._project}-{self._model_id}",
                 model_type=model_type,
                 model_version=self._model_version,
             )
@@ -176,27 +180,26 @@ class BigQuerySink(ObservationSink):
 
     def __init__(
         self,
+        project: str,
         inference_schema: InferenceSchema,
         model_id: str,
         model_version: str,
         config: BigQueryConfig,
     ):
         """
+        :param project: CaraML project
         :param inference_schema: Inference schema for the ingested model
         :param model_id: Merlin model id
         :param model_version: Merlin model version
         :param config: Configuration to write to bigquery sink
         """
-        super().__init__(inference_schema, model_id, model_version)
+        super().__init__(project, inference_schema, model_id, model_version)
         self._client = BigQueryClient()
-        self._inference_schema = inference_schema
-        self._model_id = model_id
-        self._model_version = model_version
         self._config = config
         self._table = self.create_or_update_table()
 
     @property
-    def project(self) -> str:
+    def bq_project(self) -> str:
         return self._config.project
 
     @property
@@ -275,10 +278,15 @@ def schema_fields(self) -> List[SchemaField]:
 
     @property
     def write_location(self) -> str:
-        table_name = f"prediction_log_{self._model_id}".replace("-", "_").replace(
+        """
+        Returns the BigQuery table location to write the prediction logs, which will be unique
+        for each CaraML project / model pair. Different versions of a model share the same table.
+        :return:
+        """
+        table_name = f"prediction_log_{self._project}_{self._model_id}".replace("-", "_").replace(
             ".", "_"
         )
-        return f"{self.project}.{self.dataset}.{table_name}"
+        return f"{self.bq_project}.{self.dataset}.{table_name}"
 
     def write(self, dataframe: pd.DataFrame):
         for i in range(0, self.retry.retry_attempts + 1):
@@ -308,6 +316,7 @@ def write(self, dataframe: pd.DataFrame):
 
 def new_observation_sink(
     sink_config: ObservationSinkConfig,
+    project: str,
     inference_schema: InferenceSchema,
     model_id: str,
     model_version: str,
@@ -317,6 +326,7 @@ def new_observation_sink(
             bq_config: BigQueryConfig = BigQueryConfig.from_dict(sink_config.config)  # type: ignore[attr-defined]
 
             return BigQuerySink(
+                project=project,
                 inference_schema=inference_schema,
                 model_id=model_id,
                 model_version=model_version,
@@ -328,6 +338,7 @@ def new_observation_sink(
                 space_key=arize_config.space_key, api_key=arize_config.api_key
             )
             return ArizeSink(
+                project=project,
                 inference_schema=inference_schema,
                 model_id=model_id,
                 model_version=model_version,