WordCloud-Generator es un proyecto de automatización que realiza webscraping de los portales de noticias INFOBAE y EL PAIS para generar una nube de palabras con las palabras más utilizadas en las noticias de ambos sitios. La nube de palabras se actualiza automáticamente todos los días a las 00:00hs UTC-3 y se muestra en la siguiente página: WordCloud Page.
La generación de nubes de palabras a partir de noticias proporciona una visualización efectiva de las palabras clave utilizadas en los medios de comunicación. Al automatizar este proceso, podemos obtener una representación gráfica actualizada a diario de las tendencias en los artículos de ambos portales.
- Python
- Beautiful Soup
- Scrapy
- NLTK
- WordCloud
- GitHub Actions
- Clona este repositorio en tu máquina local:
git clone https://github.com/ggomez0/WordCloud-Generator.git
cd WordCloud-Generator
Ejecuta el script generatewordcloud.py para generar la nube de palabras:
python wordcloudgenerator.py
La imagen de la nube de palabras se generará automáticamente y se guarda en la carpeta wordcloud como "Wordcloud - 2023-08-04".
El repositorio está configurado con GitHub Actions para que el script se ejecute automáticamente todos los días a las 00:00hs UTC-3. La imagen de la nube de palabras se actualizará en la WordCloud Page cada vez que se ejecute el script.