Kaggle sitesinde bulduğum Netflix'teki içerikler hakkında değişik verileri tutan veri setini kullanarak birkaç veri görselleştirmesi yaptım. İlgili veri setine ulaşmak için tıklayınız.
İlk olarak gerekli kütüphaneleri aktif hale getirdim (import ettim). Daha sonrasında Kaggle'dan indirmiş olduğum ".csv" uzantılı veri setimi okuyup bir değişkene atadım. Ondan sonra da veri setimi inceledim ve bazı verilerin kayıp olduğunu fark ettim. Sayısal bir veri olmadığı için ortalama alarak veya benzeri bir uygulama ile boş verileri doldurmak yerine bütün boş girdi içeren verileri sildim.
Daha sonrasındaysa artık veri görüntüleme işlemlerine başladım. İlk olarak kayıt türüne göre içerik miktarını görüntülemek istedim. Çıkan sonuç:
Ondan sonra da rating derecelerin göre yani "PG-13", "TV-MA" gibi içeriğin uygun olduğu kitleyi belirten etiketlere göre içerik miktarını görüntüledim. Çıkan sonuç:
Ondan sonra da bu iki veri türü hakkında ortak bir görselleştirme yapma adına içerik ve reyting türüne göre içerik miktarını görselleştirdim. Çıkan sonuç:
Bir sonraki aşamada da içerik türlerinin pasta grafiğini gösterdim. Çıkan sonuç:
Bir başka pasta grafiğinde de reyting türlerine göre içerik miktarını gösterdim. Çıkan sonuç:
Son gösterim tarzı olarak da WordCloud kütüphanesinin sunmuş olduğu kelime bulutu haritasını kullanarak ülkelerin sahip olduğu film miktarına göre bir harita görselleştirdim. Çıkan sonuç:
En son olarak da projemi film yönetmenleri adlarının miktarına göre bir kelime bulutu haritası çizdirerek sonlandırdım. Çıkan sonuç: