Skip to content
This repository has been archived by the owner on Mar 5, 2023. It is now read-only.

🗑 Implement an outlier removal method [👨‍🏫 Teacher: Бернгардт Олег Игоревич] {5️⃣ Semester} (Data analysis)

Notifications You must be signed in to change notification settings

xitowzys-ISU/Removing-Outliers

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Зачетная работа по анализу данных (Вариант #4)

Задача

Написать программу для удаления выбросов и удалить выбросы.

Требования

  1. Программа для обработки
  2. Описание на страницу - как работает, какие результаты

Структура проекта

  1. data - Папка с датасетами
  2. raw - Папка для файла README.md
  3. exam.ipynb - Реализация функционала удаление выбросов из датасета

Краткое описание блокнота

  1. Импорт необходимых библиотек
  2. Загружает датасет в массив и визуализируем его
  3. Чтобы увидеть более хошоро, где могут быть выбросы вырезаем линейный тренд
  4. Визуализируем полученный результат
  5. Делим датасет на ровные части. В данном примере датасет поделен по 1%
  6. Ищем среднее крадратичное отклонение и выявляем отклонения для каждой части датасета
  7. Отделяет отдельно выбросы и датасет без выбросов
  8. Заносим все в массивы
     outliers = [] # Выбросы
     outliers_removed = [] # Чистые данные
  9. Визуализируем полученные результаты

Дополнительно

Были попытки найти выборосы кластеризатор DBScan

Результаты

Чистый датасет
demo_1
Датасет с отмеченными точками которые попали под выброс
demo_2
Датасет без выбросов
demo_3
Датасет с выбросами
demo_4
Попытка использовать кластеризатор DBScan
demo_5

About

🗑 Implement an outlier removal method [👨‍🏫 Teacher: Бернгардт Олег Игоревич] {5️⃣ Semester} (Data analysis)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages