Skip to content

Телеграмм-бот рекомендаций анимационных фильмов

Notifications You must be signed in to change notification settings

miscanth/world_art_scrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Python CSS3 Telegram Postgres

Телеграмм-бот рекомендаций анимационных фильмов

Описание проекта

В проекте реализован парсинг анимационных фильмов, а именно асинхронный парсер на базе специализированного фреймворка Scrapy. Результаты парсинга можно сохранять в формате CSV.

В парсере прописан единственный паук world_art. В его методах использованы как CSS-селекторы, так и ХPath-селекторы. В качестве домена для парсинга установлен www.world-art.ru.

При запуске паука world_art парсер выводит csv-файл - выводится список анимационных фильмов: название, год выпуска, рейтинг, жанры, ссылка на основную страницу фильма, количество комментариев в чате-обсуждении.

Используемые технологии:

  • Scrapy
  • SqlAlchemy
  • python-telegram-bot
  • PostgreSQL

Как запустить проект:

Клонировать репозиторий и перейти в него в командной строке:

git clone git@github.com:miscanth/world_art_scrapy.git

Cоздать и активировать виртуальное окружение:

python3.9 -m venv venv 
  • Если у вас Linux/macOS

    source env/bin/activate
    
  • Если у вас windows

    source env/scripts/activate 
    
python3.9 -m pip install --upgrade pip

Установить зависимости из файла requirements.txt:

pip install -r requirements.txt

Запустить паука world_art

scrapy crawl world_art

Разработчик (исполнитель):

👩🏼‍💻 Юлия: https://github.com/miscanth

About

Телеграмм-бот рекомендаций анимационных фильмов

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages