Skip to content

Scripts en Python que descarga información de webs de mercados.

Notifications You must be signed in to change notification settings

JosemiGT/Rastrea-Mercado

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation


Este repositorio muestra el proyecto realizado para la entrega de la Práctica 1 de la asignatura Tipología y Ciclo de Vida de los Datos (M2.851) del Máster universitario de Ciencia de Datos (UOC).


Práctica 1 - Tipología y Ciclo de Vida de los Datos

Asignatura: M2.851 / Semestre: 2023-2 / Fecha: 15-04-2023

URL del sitio web elegido: https://tienda.mercadona.es/

Autores

Descripción del repositorio

Breve desripción de la práctica/sitio web elegido.

  • memoria.pdf: Documento de respuestas.
  • /source/scraper/MercadonaScraper.py: Clase para controlar la nevegación en la página de mercadona mediante selenium para obtener información.
  • /source/models/product.py: Clase modelo de producto para guardar la información.
  • /source/repository/CSVProductRepository.py: Clase de repositorio para guardar los productos en un fichero CSV.
  • /source/scraper_api/scraper.py: Módulo que contiene la lógica para obtener datos de productos desde la API.
  • /source/scraper_api/scraper_aux.py: Módulo que contiene funciones auxiliares que se utilizan en scraper.py para obtener información mediante la API de mercadonaI.
  • /source/requirements.txt: Lista de paquetes utilizados (Python 3.10).
  • /dataset/20230425_datos_mercadona.csv: DataSet con todos el conjunto de datos obtenido de los productos de la web de mercadona.
  • /dataset/20230424_datos_mercadona_api.csv: DataSet con todos el conjunto de datos obtenido de los productos de la api de mercadona.

Publicación en Zenodo

El dataset ha sido publicado en Zenodo con DOI 10.5281/zenodo.7864711.

DOI

Vídeo de presentación

Enlace al vídeo de presentación de la práctica: https://drive.google.com/file/d/1t9pVGXzJNzeS9a2oXhKAN6pbT0CDFsNP/view?usp=share_link

About

Scripts en Python que descarga información de webs de mercados.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages