Skip to content

Proyek ini merupakan proyek pengembangan model time series berbasis LSTM dan CNN untuk memprediksi kadar PM2.5 30 jam ke depan, sehingga dapat membantu memantau dan mengendalikan tingkat polusi udara demi melindungi kesehatan dan lingkungan.

Notifications You must be signed in to change notification settings

millatatasyakhanifa/PM2.5-Pollutant-Value-Prediction-to-Monitor-Air-Quality-and-Air-Pollution-Level

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

39 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📈 PM2.5 Pollutant Value Prediction to Monitor Air Quality and Air Pollution Levels

Introduction

Polusi udara merupakan masalah serius yang menyebabkan banyak efek buruk pada kesehatan dan lingkungan. Oleh karena itu, proyek ini dibuat dengan tujuan untuk membuat model yang dapat memprediksi kadar PM2.5 30 jam ke depan untuk membantu memonitor kualitas udara dan tingkat polusi udara dalam upaya mencegah pencemaran udara yang semakin parah. Model yang dibuat berupa model time series menggunakan algoritma LSTM (Long Short-Term Memory) dan CNN (Convolutional Neural Network). LSTM digunakan karena mampu memproses data time series, sedangkan CNN efektif dalam mengekstrak fitur dari data time series.

Dataset

Dataset yang digunakan pada proyek ini adalah Air Pollution in Seoul dari Kaggle. Dataset ini berisi informasi pengukuran polusi udara di Seoul, Korea Selatan, termasuk kadar PM2.5. Dataset ini terdiri dari 647511 baris data dengan 11 kolom variabel yang mencakup tanggal pengukuran, kode stasiun, alamat, lintang, bujur, dan nilai rata-rata polutan lainnya.

Data Preparation

Tahap persiapan data melibatkan:

  • Feature selection: Menghapus variabel yang tidak digunakan.
  • Data cleaning: Menghapus outlier pada data PM2.5.
  • Train-test split: Membagi data menjadi 90% data pelatihan dan 10% data pengujian.
  • Data transforms: Melakukan scaling data dan menggunakan TimeseriesGenerator untuk mengelola data time series.

Modeling

Dibuat dua model:

  1. Model LSTM dengan 2 layer LSTM dan 3 layer dense.
  2. Model CNN dengan 1 layer Conv1D, 1 layer MaxPooling1D, 1 layer Flatten, dan 3 layer dense.

Evaluation

Metrik evaluasi yang digunakan pada proyek ini adalah Mean Absolute Error (MAE).

How to Use

  1. Unduh dataset Air Pollution in Seoul dari Kaggle.
  2. Jalankan notebook proyek ini.
  3. Ikuti langkah-langkah dalam notebook untuk melatih dan mengevaluasi model.

Kesimpulan

Proyek ini menghasilkan model yang dapat memprediksi kadar PM2.5 untuk memantau kualitas udara dan tingkat polusi udara. Pada proyek ini model CNN memiliki kinerja lebih baik dibandingkan model LSTM. Informasi lebih detail mengenai projek ini dapat dibaca pada Laporan Proyek Machine Learning.

About

Proyek ini merupakan proyek pengembangan model time series berbasis LSTM dan CNN untuk memprediksi kadar PM2.5 30 jam ke depan, sehingga dapat membantu memantau dan mengendalikan tingkat polusi udara demi melindungi kesehatan dan lingkungan.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published