Trabajo Práctico Final - Infraestructura para la Ciencia de Datos

Integrantes

Gerardo Toboso - getobosobarrios@estudiantes.unsam.edu.ar
Santino Semec - sesemec@estudiantes.unsam.edu.ar
Agustín Rebechi - asrebechi@estudiantes.unsam.edu.ar
Bruno Sidelsky - bsidelsky@estudiantes.unsam.edu.ar
Nicolás Hurtado - nhurtado@estudiantes.unsam.edu.ar

Enunciado

La empresa de producción y venta de productos masivos llamada “Argentina Ideal”, organiza sus ventas en el territorio argentino con lo que en el mercado se denomina venta indirecta.

En esta modalidad de venta la toma del pedido, el reparto y facturación se encuentra a cargo de empresas distribuidoras. De esta forma “Argentina Ideal” llega a los comercios minoristas (almacenes, supermercados, free-shops, etc.) mediante los distribuidores (compañía -> distribuidor/mayorista -> comercio minorista). Los productos que se fabrican se encuentran acopiados en los distintos almacenes del único centro logístico que tiene “Argentina Ideal” ubicado en Capital Federal.

Las ventas se encuentran organizadas en 4 regiones a lo largo de todo el país, CABA, Norte, Centro, y Sur. Un distribuidor podría vender y distribuir en más de una región, y podría tener más de una sucursal por región. La modalidad de venta es lo que se denomina “pre-venta”: un vendedor sale el día n a tomar los pedidos y los repartidores al día siguiente (n+1) se encargan de llevar la mercadería a los distintos comercios.

¿Cuál es nuestra meta como grupo?

Nosotros nos encargaremos de crear la infraestructura necesaria para gestionar la información que "Argentina Ideal" recibe diariamente de los distribuidores. Esto nos permitirá responder preguntas de negocio, comprender sus necesidades y tomar acciones adecuadas.

Para lograrlo, utilizaremos Google Cloud Platform (GCP), el lenguaje de programación Python y el lenguaje para la manipulación de bases de datos SQL. Seguiremos varias fases: desde la generación de la información de los distribuidores y su carga en GCP, hasta el modelado de un datawarehouse, la creación de datamarts específicos para distintas áreas del negocio y, finalmente, la visualización de la información relevante a través de dashboards.

¿Cómo clonar y correr este repositorio?

Antes de seguir estos pasos es importante que tengas instalado 'python' y 'pip' en tu sistema.

Primero, clona el repositorio en tu máquina local:

git clone https://github.com/Gerardo1909/Argentina_Ideal_Infra.git
cd Argentina_Ideal_Infra #Me cambio al directorio que contiene el repositorio

Crea un entorno virtual llamado "arg_ideal_infra":

python -m venv arg_ideal_infra

Ahora, activa el entorno:

#En Windows:
arg_ideal_infra\Scripts\activate

#En macOS o Linux:
source arg_ideal_infra/bin/activate

Finalmente, instala las dependencias para que puedas empezar a usar el código:

pip install -r requirements.txt

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
Generacion_datos		Generacion_datos
modelado_informacion		modelado_informacion
presentacion_trabajo		presentacion_trabajo
utils		utils
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Trabajo Práctico Final - Infraestructura para la Ciencia de Datos

Integrantes

Enunciado

¿Cuál es nuestra meta como grupo?

¿Cómo clonar y correr este repositorio?

About

Releases

Packages

Contributors 2

Languages

Gerardo1909/Argentina_Ideal_Infra

Folders and files

Latest commit

History

Repository files navigation

Trabajo Práctico Final - Infraestructura para la Ciencia de Datos

Integrantes

Enunciado

¿Cuál es nuestra meta como grupo?

¿Cómo clonar y correr este repositorio?

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages