Esse é um projeto guiado, parte do curso Data Analyst em Python, do Dataquest.io
O dataset foi originalmente criado no Kaggle por orgesleka.
O dataset original não está mais disponível no Kaggle, mas você pode encontrá-lo clicando aqui.
Para efeitos de estudos foram feitas algumas modificações no Dataset:
Serão utilizados 50000 amostras desses dados para garantir que o código seja executado rapidamente.
O dataset foi ligeiramente bagunçado, para se parecer mais com um conjunto de dados da vida real, pois os dados do Kaggle podem ser um pouco mais fáceis de trabalhar.
dateCrawled
- Quando este anúncio foi rastreado pela primeira vez. (Todos os valores de campo são obtidos a partir desta data.)
name
- Modelo e marca do carro.
seller
- Se o vendedor é particular ou revendedor.
offerType
- O tipo do anúncio.
price
- O preço de venda do veículo.
abtest
- Se o anúncio foi incluído ou não no test A/B.
vehicleType
- O tipo do veículo.
yearOfRegistration
- O ano de registro do veículo.
gearbox
- O tipo de transmissão do carro (manual, automático).
powerPS
- A potência do carro.
model
- O nome do modelo do carro.
kilometer
- A quilometragem do veículo.
monthOfRegistration
- O mês de registro do carro.
fuelType
- O tipo de combustível.
brand
- A marca do carro.
notRepairedDamage
- Se o carro apresenta algum dano que não foi consertado.
dateCreated
- A data de criação do anúncio.
nrOfPictures
- O número de fotos no anúncio.
postalCode
- O código postal da localização do veículo.
lastSeenOnline
- Quando o anúncio foi visto pela última vez online.