Skip to content

Trabajo práctico final de la materia "Infraestructura para Ciencia de Datos" de la Licenciatura en Ciencia de Datos (UNSAM). 1C-2024

Notifications You must be signed in to change notification settings

Gerardo1909/Argentina_Ideal_Infra

Repository files navigation

Trabajo Práctico Final - Infraestructura para la Ciencia de Datos

Integrantes

Enunciado

La empresa de producción y venta de productos masivos llamada “Argentina Ideal”, organiza sus ventas en el territorio argentino con lo que en el mercado se denomina venta indirecta.

En esta modalidad de venta la toma del pedido, el reparto y facturación se encuentra a cargo de empresas distribuidoras. De esta forma “Argentina Ideal” llega a los comercios minoristas (almacenes, supermercados, free-shops, etc.) mediante los distribuidores (compañía -> distribuidor/mayorista -> comercio minorista). Los productos que se fabrican se encuentran acopiados en los distintos almacenes del único centro logístico que tiene “Argentina Ideal” ubicado en Capital Federal.

Las ventas se encuentran organizadas en 4 regiones a lo largo de todo el país, CABA, Norte, Centro, y Sur. Un distribuidor podría vender y distribuir en más de una región, y podría tener más de una sucursal por región. La modalidad de venta es lo que se denomina “pre-venta”: un vendedor sale el día n a tomar los pedidos y los repartidores al día siguiente (n+1) se encargan de llevar la mercadería a los distintos comercios.

¿Cuál es nuestra meta como grupo?

Nosotros nos encargaremos de crear la infraestructura necesaria para gestionar la información que "Argentina Ideal" recibe diariamente de los distribuidores. Esto nos permitirá responder preguntas de negocio, comprender sus necesidades y tomar acciones adecuadas.

Para lograrlo, utilizaremos Google Cloud Platform (GCP), el lenguaje de programación Python y el lenguaje para la manipulación de bases de datos SQL. Seguiremos varias fases: desde la generación de la información de los distribuidores y su carga en GCP, hasta el modelado de un datawarehouse, la creación de datamarts específicos para distintas áreas del negocio y, finalmente, la visualización de la información relevante a través de dashboards.

¿Cómo clonar y correr este repositorio?

Antes de seguir estos pasos es importante que tengas instalado 'python' y 'pip' en tu sistema.

Primero, clona el repositorio en tu máquina local:

git clone https://github.com/Gerardo1909/Argentina_Ideal_Infra.git
cd Argentina_Ideal_Infra #Me cambio al directorio que contiene el repositorio

Crea un entorno virtual llamado "arg_ideal_infra":

python -m venv arg_ideal_infra

Ahora, activa el entorno:

#En Windows:
arg_ideal_infra\Scripts\activate

#En macOS o Linux:
source arg_ideal_infra/bin/activate

Finalmente, instala las dependencias para que puedas empezar a usar el código:

pip install -r requirements.txt

About

Trabajo práctico final de la materia "Infraestructura para Ciencia de Datos" de la Licenciatura en Ciencia de Datos (UNSAM). 1C-2024

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published